OpenAI chce vo vyhľadávaní konkurovať Googlu. Existujú však aj iné alternatívy

V úvodnej informácii napísanej samotnou umelou inteligenciou sa uvádza, že spočiatku bude projekt obmedzený na malú skupinu vybraných používateľov. Cieľom je skombinovať jazykové modely umelej inteligencie s informáciami pochádzajúcimi z internetu.

Tvorcovia nového prístupu k vyhľadávaniu dúfajú, že konverzačné schopnosti súčasnej umelej inteligencie umožnia v spolupráci s okamžitými informáciami z internetu priniesť výsledky vyhľadávania rýchlejšie a efektívnejšie. Hlavným nástrojom bude upresňovanie cieľa hľadania dialógom.

Predpokladá sa, že tento model bude v konečnom dôsledku zaintegrovaný aj do konverzačného módu ChatGPT.   

Jeden google vládne všetkým

V súčasnosti dominuje internetovému vyhľadávaniu google. Na trhu USA má v počítačoch skoro 80-percentné zastúpenie. V mobilných zariadeniach, a to aj vďaka tomu, že Android, jeden z operačných systémov pre telefóny, je priamo od Googlu, dosahuje viac ako 95 percent.

Slovo „gúgliť“ sa tak ako ekvivalent „vyhľadať na internete“ dostáva pomaly aj do kodifikovanej slovnej zásoby slovenčiny.

Toto postavenie umožňuje firme Alphabet vlastniacej značku Google nielen zarábať zaujímavé sumy, v prvom kvartáli to bolo skoro päťdesiat miliárd dolárov, ale aj výrazne ovplyvňovať tón verejnej diskusie.

Napríklad tým, že sa utlmia informácie o atentáte na bývalého prezidenta USA a súčasného kandidáta na túto funkciu.

Prezident Donald Duck? Google čelí kritike za vymazávanie Trumpa a pokusu o jeho vraždu

Mohlo by Vás zaujímať Prezident Donald Duck? Google čelí kritike za vymazávanie Trumpa a pokusu o jeho vraždu

Určitú mieru „ohýbania“ výsledkov googlu riešili súdy vo Francúzsku. Stálo ho to „iba“ 65-tisíc dolárov. Zneužívanie dominantného postavenia v oblasti reklamných služieb mu vyslúžilo od inštitúcií EÚ astronomickú pokutu vo výške 1,49 miliardy eur. Vo Francúzsku bol 250-miliónovou pokutou potrestaný za zneužívanie autorských práv.

Svoju dominanciu si google stále posilňuje. Komunikačná platforma Reddit uzatvorila s touto vyhľadávacou službou dohodu, ktorá neumožňuje na jeho prehľadávanie použiť iné vyhľadávače. Úsmevne v tomto kontexte pripadá jedno z fór Redditu, zaoberajúce sa zbavenia závislosti od Googlu.

Ako vyhľadávače fungujú

Vo všeobecnosti je základom každej vyhľadávacej služby takzvaný „web crawler“. Ide o program, ktorý prechádza jednotlivé stránky internetu, kopíruje časť ich obsahu a ukladá ho do databázy vyhľadávacej služby. Získané dáta sa spracovávajú, hľadajú sa v nich ďalšie odkazy, na ktoré sa znovu posielajú „crawlery“.

Ak internetová lokalita nechce, aby bol jej obsah prehľadávaný vyhľadávacími službami, môže si vytvoriť súbor „robots.txt“. V ňom zakáže či povolí stránky, ktoré sa môžu indexovať, teda zapisovať do databázy vyhľadávača. Tento mechanizmus však funguje len na princípe džentlmenskej dohody, nedá sa zaručiť, že ho vyhľadávacia služba bude rešpektovať.  

Google využíva sadu programov nazývaných „Googlebot“. Existujú rôzne verzie používané na skenovanie obsahu pre počítače, mobilné zariadenia alebo na sledovanie účinnosti reklamy.

Detaily vyhľadávacích algoritmov googlu sú prísne stráženým tajomstvom. Hoci firmy zaoberajúce sa optimalizáciou výsledkov vyhľadávania (SEO) niečo tušia, skutočná pravda občas vyjde na povrch až pri únikoch interných dát.

Únik z Googlu: Vyhľadávanie zrejme zvýhodňuje volebné a pandemické autority

Mohlo by Vás zaujímať Únik z Googlu: Vyhľadávanie zrejme zvýhodňuje volebné a pandemické autority

Existujú aj alternatívy

Šťastím v nešťastí je, že hoci je google dominantnou vyhľadávacou službou, nie je jedinou. Povedzme si o tých najzaujímavejších.

Službu Bing, ktorá sa vo vyhľadávaní na počítačoch umiestnila na druhom mieste, poskytuje Microsoft. Ďalšou možnosťou je DuckDuckGo prevádzkovaný rovnomennou firmou. Tento vyhľadávač sa sústreďuje na súkromie, za čo ho chvália aj odborníci na bezpečnosť.

Zaujímavý prístup má StartPage. Nevyužíva vlastnú databázu, vyhľadávacie otázky smeruje do googlu. Predtým z nich však odstráni všetky identifikačné znaky pôvodného zadávateľa, a tak sa snaží zachovať jeho súkromie.

Qwant je vyhľadávač pochádzajúci z Francúzska. Jeho cieľom sa opäť stáva zabezpečenie súkromia používateľov.

V našom prostredí sa používa český vyhľadávač Seznam. Ako zoznam.sk existuje aj v slovenskej mutácii.

Z „praveku internetu“, polovice deväťdesiatych rokov minulého storočia, pochádza Yahoo! Search. Z rovnakej doby prežili do súčasnosti aj WebCrawler a Lycos.

Experiment

Urobme si drobný pokus. Budeme sa snažiť rôznymi vyhľadávačmi nájsť na základe prvej vety titulku článok zo Štandardu. Zadajme teda do vyhľadávacieho políčka „Únik z Googlu“ a sledujme, čo nám vyhľadávač poskytne.

Google zobrazí hľadaný článok na štvrtom mieste. Správa sa rovnako, ak je používateľ prihlásený do konta spoločnosti Google alebo je vyhľadávač zobrazený v anonymnom okne bez prihlásenia.

Je jasné, že v druhom prípade google na základe internetovej adresy počítača vie, v akej krajine sa počítač nachádza. Tajomstvom zostáva, či google používa aj takzvaný „fingerprinting“ na jednoznačnú identifikáciu počítača.

Bing ukáže článok zo Štandardu na prvom mieste. Rovnaký výsledok poskytne aj Qwant. Takisto sa správa aj DuckDuckGo. Yahoo! Search tiež umiestni článok zo Štandardu vo výsledkoch na prvé miesto.

Vo výsledkoch z Lycosu sa odkaz na článok objaví na druhom mieste. Predbehol ho iba samotný google.   

Startpage článok nenašiel. Hoci google, cez ktorý Startpage hľadá, informáciu o ňom vo svojej databáze určite má. Vo výsledkoch sa pritom zobrazí aj množstvo článkov z iných českých a slovenských médií na rovnakú tému.

Rovnaký výsledok, teda neschopnosť nájsť článok, dostávame aj zo Seznamu a Zoznamu. Slovenská verzia aj oznámi, že vo vlastnej databáze sa článok nenašiel, a preto pokračuje s googlom.

Výsledok z WebCrawleru, v ktorom sa hľadaný článok nenachádza, indikuje, že tento vyhľadávač tiež využíva databázu googlu.

Nie je jedno, cez čo vyhľadávame

Je možné, že ak rovnaký pokus zopakuje niekto iný, dostane aj iné výsledky. Vyhľadávače, ktoré sledujú správanie svojich používateľov a monitorujú aj históriu ich vyhľadávania a správania sa na internete, dokážu výsledky prispôsobiť oveľa intenzívnejšie. V prípade googlu ide hlavne o nastavenie súkromia a rozsahu údajov, ktoré používateľ dovolí zbierať.

Uvidíme, do akej miery sa do tohto vzorca správania dostane nová vyhľadávacia služba SearchGPT. Dúfame, že sa jej nepodarí rýchlo „zgúglovatieť“.