Texty sa dajú „písať“ aj skenovaním hlavy, tvrdia štúdie od Meta

Magnetické pole mozgu dokáže až s 81-percentnou úspešnosťou odhaliť text zadávaný na klávesnici.

Spoločnosť prevádzkujúca sociálne siete Facebook a Instagram zverejnila 5. februára 2025 dve vedecké práce.

Prvá z nich ukázala komplexnú hierarchiu neurónových signálov v mozgu súvisiacich s vytváraním reči. Výskumníci zistili, že z nameraných údajov je možné čiastočne zrekonštruovať jednotlivé gramatické kategórie, akými sú slová, slabiky a dokonca aj konkrétne písmená.

Druhá štúdia sa zamerala na praktickejší aspekt. Analýzou týchto signálov sa vedci pokúsili implementovať „písanie mysľou“, teda spôsob, keď počítač „zapisuje myšlienky“ skúmanej osoby čisto na základe meraní signálov produkovaných jej mozgom.

Obidve vedecké práce vykonali v laboratóriu Meta určenom na základný výskum umelej inteligencie (FAIR) v spolupráci s Baskickým centrom pre poznávanie, mozog a jazyk.

Merajú sa magnetické polia aj elektrické napätia vytvárané mozgami

Výskum vychádza z experimentov uskutočnených s pomocou 35 dobrovoľníkov. Každý z účastníkov pokusu mal za úlohu zapamätať si krátky text s dĺžkou päť až osem slov, chvíľu počkať a následne frázu napísať na klávesnici.

Počas tejto činnosti umiestnili dobrovoľníkov do zariadenia, ktoré meralo magnetické pole vyžarované ich mozgom. Ide o proces odborne označovaný ako magnetoencelografia (MEG).

Účastníci experimentu mali tiež na hlavách pripevnené elektródy, merajúce slabé elektrické prúdy vytvárané v ich mozgoch. V tomto prípade sa postup nazýva elektroencelografia (EEG).

https://youtu.be/wmTXTErjlyY

Namerané signály boli spracúvané rôznymi systémami umelej inteligencie v snahe „vytiahnuť“ z dát čo najviac užitočných informácií.

Cez GPT-2 od OpenAI sa skúmal kontext, v ktorom bolo slovo použité. Spracovanie na úrovni slov zabezpečoval model spaCy. Na klasifikáciu slabík použili softvérovú knižnicu fastText. Rozoznávať jednotlivé písmená mal za úlohu One Hot Encoder (OHE) zo softvérového balíka scikit-learn určeného na strojové učenie.

Na praktickú aplikáciu s „myšlienkovým písaním“ bol vyvinutý špeciálny model AI nazvaný Brain2Querty.

Viacfázová súhra signálov jazyka

Výskumníci objavili, že dokážu s určitou mierou presnosti analyzovať, čo prebieha v hlavách pokusných subjektov. Zistili, že počas procesu tvorby reči aj jej zápisu v mozgu prebieha viacfázová súhra signálov.

Jednotlivé štádiá, symbolizujúce vetu, slovo, slabiku či konkrétne písmeno, sa v signáloch vyžarovaných mozgom dajú nájsť spoločne, vedci však pozorovali aj postupný nástup príslušných signálov.

Zjednodušene povedané, keď osoba začne písať, najskôr jej hlava „vyžaruje“ signál reprezentujúci vetu, potom sa pridá signál charakteristický pre konkrétne slovo, následne pre slabiku a v okamihu, keď stláča kláves, vo výslednom signáli sa dajú nájsť znaky všetkých jazykových kategórií.

Z mozgu sa dá „vyčítať“ písaný text

Okrem teoretických úvah, nutných pre lepšie pochopenie mechanizmov nášho myslenia, sa výskumníci zamerali aj na praktický aspekt. Snažili sa z nameraných signálov zrekonštruovať písaný text.

Zistili, že magnetické pole mozgu poskytuje spoľahlivejšie signály. Priemerná chybovosť sa pohybovala okolo 32 percent, kým pri elektrických signáloch stúpala až k 67 percentám.

Pri niektorých účastníkoch sa však podarilo dosiahnuť iba 19-percentnú chybovosť, teda 81 percent napísaných znakov bolo detegovaných správne. Na druhej strane, najhoršia chybovosť v prípade MEG presahovala 45 percent, keď správne dekódované znaky dosahovali iba 55-percentný podiel.

Dáta spracovával už zmienený model AI Brain2Querty, ktorý natrénovali 146-tisícmi znakov pri EEG a 193-tisícmi na signáloch MEG.

Vedci zistili, že čím častejšie sa znak v natrénovaných textoch vyskytuje, tým je umelá inteligencia schopná ho detegovať presnejšie. Vysoká miera chybovosti sa preto prejavila pri písmenách „z“, „k“ a „w“, ktoré sa v španielčine, jazyku použitom v experimentoch, vyskytujú zriedkavo.

Praktickej aplikácii bráni rozmerný prístroj

Metóda popísaná v štúdiách, umožňujúca vytvárať text iba na základe magnetických a elektrických signálov vytváraných mozgom, dáva nádej pacientom neschopným komunikovať bežnými metódami.

Technické prostriedky na takúto komunikáciu už síce existujú, vyžadujú však komplikovanú prípravu pacienta. Hlavným problémom ostáva nutnosť implantovať stovky elektród do mozgu. Pre pacienta to je nielen nepríjemné, ale, vzhľadom k riziku infekcie, aj potenciálne ohrozujúce zdravie.

Meranie magnetických a elektrických polí mozgu je však bezkontaktné, do tela skúmanej osoby sa nijako nezasahuje. Mierne sklamanie prináša fakt, že využitie elektrických napätí na povrchu hlavy nie je až také spoľahlivé, ako princíp magnetického poľa vytváraného mozgom.

Na to, aby sme takéto slabé polia odmerali, potrebujeme detektor založený na princípe supravodivej kvantovej interferencie (SQUID). Toto zariadenie, použité aj v týchto experimentoch, je však rozmerné a ťažké, vyžaduje chladenie kvapalným héliom.

Alternatívnou technológiou na meranie slabých magnetických polí je SERF. Tá nevyžaduje kryogenické chladenie, ide však o relatívne novú metódu, nedostupnú v priemyselnom rozsahu.

V obidvoch prípadoch je potrebné odtieniť okolité magnetické polia, nielen to prirodzené, ktoré je vytvárané samotnou planétou Zem, ale aj tie, ktoré sú produkované všadeprítomnými elektrickými zariadeniami.

Na „prilby“ či „klobúky“ schopné „čítať myšlienky“ a zapisovať texty bez dotyku rúk, si teda ešte počkáme. Na druhej strane netreba zabúdať na fakt, že hlavným zdrojom príjmov spoločnosti Meta je reklama. Jej poskytovanie na základe „tajne prečítaných myšlienok“ je určite snom každého marketingového mága.