Az OpenAI GPT-4.5 modellje meggyőzőbb volt, mint egy valódi ember – állítják a kutatók.
Egy vezető AI csevegőrobot a legújabb kutatás szerint meggyőzőbben teljesítette a Turing-tesztet, mint egy ember. A vakteszt résztvevői az OpenAI GPT-4.5 modelljét, amely a legújabb ChatGPT verzióját hajtja, gyakrabban ítélték emberinek, mint a valódi embereket.
A Turing-tesztet először Alan Turing brit számítástechnikai tudós javasolta 1950-ben, és azt hivatott mérni, hogy a mesterséges intelligencia képes-e felérni az emberi intelligenciával. A teszt során egy szöveges alapú beszélgetés történik egy emberi kérdezővel, aki meg kell, hogy állapítsa, hogy az interakció egy másik emberrel zajlik-e, vagy egy géppel.
A legújabb kutatásban közel 300 résztvevő vett részt, akik különböző csevegőrobotokat és nagy nyelvi modelleket (LLM-eket) teszteltek.
Az OpenAI GPT-4.5-öt 73%-ban ítélték embernek, amikor arra kérték, hogy egy személyiséget öltsön magára.
„Úgy gondoljuk, hogy ez elég erős bizonyíték arra, hogy az AI csevegőrobotok valóban átmennek a Turing-teszten” – írta Dr. Cameron Jones, a kutatás vezetője, a San Diego-i Kaliforniai Egyetem posztdoktori kutatója az X-en. „És a 4.5-öt sokkal gyakrabban ítélték emberinek, mint a valódi embereket.”
Ez nem az első alkalom, hogy egy AI program teljesítette a Turing-tesztet, bár a kutatók, akik a San Diego-i Egyetemen végezték a kutatást, azt állítják, hogy ez a legátfogóbb bizonyíték arra, hogy a tesztet sikeresen teljesítettek.
A legújabb kutatásban tesztelt modellek között volt a Meta Llama-3.1 modellje, amely kevésbé meggyőző eredményt hozott, és egy korai csevegőrobot, az ELIZA, amely nem teljesítette a tesztet.
Bár a Turing-tesztet sikeresen teljesítette, a kutatók felhívták a figyelmet arra, hogy ez nem jelenti azt, hogy az AI robotok emberi szintű intelligenciával rendelkeznek, más néven mesterséges általános intelligenciával (AGI). Ennek oka, hogy az LLM-eket nagy adatállományokkal képezik ki, hogy megjósolják, mi lehet a helyes válasz, ami lényegében egy fejlett mintafelismerési formát jelent.
„Ez azt jelenti, hogy az LLM-ek intelligensek? Szerintem ez egy nagyon bonyolult kérdés, amelyet nehéz lenne egy cikkben (vagy egy tweetben) megválaszolni” – mondta Dr. Jones.
„Általánosságban azt gondolom, hogy ezt inkább egy másik bizonyítékaként kell értékelni arra, hogy az LLM-ek milyen típusú intelligenciát mutatnak.
„Fontosabb, hogy úgy gondolom, az eredmények újabb bizonyítékot adnak arra, hogy az LLM-ek képesek lehetnek helyettesíteni az embereket rövid interakciókban anélkül, hogy bárki észrevenné. Ez potenciálisan a munkahelyek automatizálásához, a társadalmi manipulációs támadások javulásához, és egyéb társadalmi zűrzavart okozhat.”
A kutatás a „Large language models pass the Turing Test” című előzetes tanulmányban található. – írja az Independent.
Kép forrása: AI-PRO
