Umělá inteligence jako předkladatel informace

Před lety jsem napsal příspěvek o umělé inteligenci, která zpracovává data a konkretizuje je podle cílového uživatele. Aby to bylo v příkladu snazší, byl předmětem zpracování text a informace v něm.
Dnes mám za sebou testy s neurálním kolegou ve vícečetném projevu, z nichž nejvýraznější jsou Technik a Právník.

Díky své práci CAT specialisty jsem měl možnost testovat několik neurálních datových korpusů, z nichž některé prioritizovaly technický jazyk a některé byly v základu vyučené na právních textech. Aby to neměl korpus neurální sítě jednoduché, jako zátěžový srovnávací test používám texty z mých zájmových oborů energetiky, enviromentální zprávy a data o přírodě obecně. Témata, která by se měla vyjádřením zásadně lišit když o nich mluví právník, technik, marketingový prodejce, nebo osoba zainteresová, a zároveň témata která mám rád já.
K mému údivu se zpracovaný výstup chová přesně podle předpokladu v mém článku k věci interpretací http://mujkolegaui.cz/josef-chapu-a-rozumim/.

Primárním cílem těchto testování je ověření správnosti jazykového podání.
V ověření jazykové správnosti, které překračuje danou strukturu jazyka, je důležitým bodem také obsah použitých slov a součet obrazů, které daný neural produkuje. Totiž v hodnocení subjektivity podání je jedno zda věta interpretace má podle pravidel podmět a přísudek a správně větné oddělovače, je důležité, zda podání odpovídá obsahem sdělení a jak moc se liší limita v neprospěch zavádějících podnětů. Jak jsou použitá klíčová slova vůči obecnému návyku v jazyce a jejich vazba na oborovou terminologii pro dohledání kontextových informací.

Mezi dalšími cíly jsou konzistence informačních bloků a vzorce použití sdělovacích slov napříč informačním blokem i v textu obecně.
Konzistenci ustáleného informačního bloku tvoří celky pohledů na konkrétní stav a jeho popis oborově výraznými, ale v jiném naplnění kontextu v popisu rozdílu těchto konkrétních stavů.
Povoleně se může lišit popis obraznými slovy v pohledu na jaderné a fotovoltaické elektrárny, stejně jako popsaný pohled využití mokřadě pro ptáky obecně a pro lokálně se vystytující druh žab konkrétně. Jemné nuance jazyka, které se mohou lišit obecně v rámci ustáleného informačního bloku, ale nesmí být v rozporu s textem okolním a v celkovém kontextu musí působit nerušivě v popisovaném obsahu jako celkovém obrazu daných informací.
Použitá slova pak vytváří vzorce a mapy užití vzhledem k okolnímu textu a vedou k různým stavům posilování, měkčení, fragmentaci,…, podávané informace. Nu a tyto vzorce pak mohou doslova stavět „vzdušné zámky“ nebo také vytvářet naprosto jiný informační vesmír. Záleží na obsahu využitých slov a jejich postavení v kontextu.

Dnešní neurální sítě pracují v multispektrálním systému If/Then, kde jednotlivé hranice rozhodování jsou dané limitním vzorcem, jehož obsah vyplývá ze samotného učení se neurální sítě.
Tedy jak se nad poskytnutými daty neurální síť vyučí, tak jsou využívány obsahy limit které si učením vytvořila.
V jazyce to pak odpovídá stavu, že některé fragmenty vět a frází jsou deklarované a běžně se nemění, další jsou hodnocené využitím v určitém kontextu a jsou hodnocené obsáhlým parametrickým korpusem v režii neurální sítě. Obsáhlá skupina malých fragmentů až trojsloví jsou podkladem pro bobtnání korpusů, protože jejich využití v jazyce je běžné, ale jejich forma je nestálá a kontext vyplývá pouze ze zpracování většího bloku informací. A nakonec rozhodně neméně výrazná skupina kontextově neznámých slov, jejichž užití není s přímou podporou textu, ale jazyk jejich užití v rozsahu limity shodného rozsahu obsahu umožnuje (Každá informace má strukturu a index použití).

V pohledu testování umělé inteligence pak jde o posouzení, jak do kontextu textu zapracuje především poslední kategorii slov a frází, protože tyto především určují subjektivizaci obsahu podané informace. Ačkoliv sdělení může být jazykově platné, již se zde objevuje intonanční zkreslení v podání informace. Rozhodně by se mělo projevit mezi Technikem a Právníkem.
Struktura podané informace zůstane zachována, ale pozice pohledu při popisu informace se liší.
V testu mi pak pomáhají lidské výstupy a typové neurální korpusy s převažujícím pohledem technika a pohledem právníka.
Ve zpracování tak mám zdroj obsahu čtyř sloupců a zvýrazněné rozdíly podání větných informací.
K mému údivu byl poměr podání informací dosti konzistentní ve všech případech. V základu textu, který nebyl příliš oborově subjektivní (zaujatý) byly informace ve shodě napříč předkladateli. Jakmile text přešel do výrazné subjektivity v omezené skupině jazyka oboru NATU, lépe si se sdělením poradil technický jazyk než výklad pomocí právního podání. V mnoha podáních však plaval i člověk a některé bloky sdělení byly podkresleny více osobně, jako když machr v oboru jaderných elektráren popisuje nestabilitu střešních fotovoltaických elektráren. Tyto jinak zabarvené informace jsou jako forma překlepu v textu kde se místo chyby ve slově ukazuje vychýlení v obsahu fráze nebo fragmentu věty. Jinak zabarvená nuance sdělení. (http://mujkolegaui.cz/josef-chapu-ale-nerozumim/.

Zajímavostí byla shoda neurálních korpusů v určitých frázích spadajících do subjektivity oboru, ale bez obsahu klíčových slov. Obecně podpůrná sdělení pro rozšíření popisu významu jiné fráze, nebo běžná textová plnidla v podobě oslích můstků. V mnoha případech neurální korpusy umělé inteligence vykazovaly v použitých slovech silnější význam než lidský předkladatel s oborovou neutrálností použitých slov. Často jsem měl pocit shody s předkládanou informací od neurální sítě než od lidského předkladatele, který použil sice běžná, ale příliš obecná slova v popisu, kdežto neurální sítě ve shodě použily slova v kontextu formou neběžná, ale obsahem sdílnější.

Obecně tak mohu říct, že při předkládání informací z oboru NATU, a kreativních textů obecně, je jako předkladatel silnější umělá inteligence s odklony od běžného návyku obecného jazyka a je čtivější její kontextové zabarvení podaných informací se zachováním podstaty předkládané informace… a já se těším na další limity v testech…

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *