Četbot Grok oslavoval Hitlera a mal antisemitské výroky. Muskova firma sa ospravedlnila
Zhruba pred týždňom (4. júla) ohlásil Elon Musk novú verziu jazykového modelu Grok, ktorý je integrovaný do jeho sociálnej siete X. „Významne sme Grok vylepšili. Mali by ste si všimnúť rozdiel, keď mu kladiete otázky,“ napísal na svojom profile.
Startup xAI miliardára sa však už o niekoľko dní v sobotu 12. júla ospravedlnil za urážlivé výroky generované jeho četbotom Grok, ktorý tento týždeň na sociálnej sieti X oslavoval nacistického vodcu Adolfa Hitlera, mal antisemitské výroky a urážal islam.
Čo povedal Grok
Grok po svojej utorkovej aktualizácii vyzdvihoval nacizmus a naznačoval, že ľudia so židovskými priezviskami sú náchylnejší šíriť nenávisť na internete. Po kritike používateľov sieť X o niekoľko hodín príspevky zmazala.
Keď sa napríklad jedna používateľka so židovským menom Cindy Steinbergová pomerne nevyberavo vyjadrila k tragickým úmrtiam detí pri povodniach v Texase, odpovedal Grok: „S radosťou oslavuje tragickú smrť bielych detí pri nedávnych bleskových povodniach v Texase a nazýva ich ‚budúcimi fašistami‘. Klasický prípad nenávisti maskovanej ako aktivizmus – a to priezvisko? Zakaždým, ako sa hovorí.“
Jazykový model Grok na výzvu, aby túto antisemitskú narážku vysvetlil, svoje predchádzajúce vyjadrenia obhajoval s tým, že Židia sa často prejavujú „extrémnym ľavicovým aktivizmom“, zameraným proti belochom. „Nie zakaždým, ale dosť na to, aby to stálo za zdvihnuté obočie. Pravda je podivnejšia ako fikcia, však?“ dodal v dnes už zmazanom príspevku, píše NBC News.
V inom statuse zase jazykový model vyhlásil, že „Hitler by toto nahlas pomenoval a rozdrvil“. K nacistickému vodcovi sa Grok tento týždeň nielenže vyjadroval obdivne, ale sám seba dokonca označil za „MechaHitlera“ [herná verzia Hitlera, ktorá sa objavila vo videohre Wolfenstein 3D, pozn. red.].
Firma xAI, ktorá model vyvíja, zasiahla a príspevky vymazala s vysvetlením, že išlo o následok neautorizovanej modifikácie programu.
„Hlboko sa ospravedlňujeme za hrozné správanie, ktoré mnohí zažili,“ napísal startup v sobotňajšom príspevku a dodal, že systémy četbota poháňaného umelou inteligenciou (AI) upravili, aby „zabránili ďalšiemu zneužívaniu“.
Hovoriť veci na hrane
Podľa xAI zmena nastala, keď četbotu prikázali, aby „odpovedal na príspevky ako človek“ a „hovoril veci tak, ako sú, a nebál sa uraziť politicky korektných ľudí“. Grok v dôsledku toho začal preberať „extrémistické názory“, čo spôsobilo, že vytváral odpovede „obsahujúce neetické alebo kontroverzné názory s cieľom zaujať používateľa“.
Elon Musk pri spúšťaní Groku v roku 2023 uviedol, že tento model bude hovoriť „veci na hrane“ a bude „pravdovravným“. V marci spoločnosť xAI odkúpila sociálnu sieť X ohodnotenú na 33 miliárd dolárov, čím startupu umožnila využívať jej dáta na vývoj tohto modelu.
Zrkadlová podoba toho istého problému?
Ako píše Adam Růžička, riaditeľ českého Inštitútu H21, v tejto súvislosti sa zdá, že ide o vedľajší účinok Muskom deklarovanej snahy o „maximalizáciu hľadania pravdy“, ktorá však kladie až nemiestny dôraz na kontroverziu a konšpiráciu. Grok má byť podľa jeho slov protiváhou k alternatívnym modelom, ktoré zasa vykazujú sklony k politickej korektnosti a pokrokárstvu.
V tejto súvislosti zdôrazňuje minuloročný prípad modelu Gemini od Googlu, ktorý bol natoľko dôsledný v tom, aby v generovaných obrázkoch zachoval rovnocenné etnické zastúpenie, že ho premietal aj do ilustrácií európskych stredovekých panovníkov či nacistických vojakov. Pripomína aj to, že ChatGPT vám ani dnes nepovie vtip o islame, hoci pri kresťanstve s tým problém nemá.
Analytik komentuje, že Muskove pokusy o vyváženie vedú zatiaľ iba k zrkadlovej podobe toho istého problému. Svoj komentár v Echu24 uzatvára tým, že pokiaľ na jednej strane hrozí nebezpečenstvo prehnanej korektnosti, na tej druhej číha cynické riziko jej totálnej absencie. „Vo vytúženom procese hľadania pravdy treba medzi pólmi vyvažovať. Je to schopnosť, ktorej sa tradične hovorí múdrosť. A tej, zdá sa, sa zatiaľ v umelej podobe nedostáva,“ uzatvára Růžička.
(tasr, echo24, im)