5000 Szolnok, Muskátli u. 2/A

Az MI elkezdett „ízlelni” színeket és formákat – ez emberibb, mint gondolnánk

Milyen íze lehet egy rózsaszín gömbnek? És milyen hangja van egy Sauvignon Blanc-nak? Első hallásra ezek a kérdések nevetségesnek tűnhetnek, de rengeteg tudományos kutatás mutatja, hogy az emberi agy összekapcsolja az érzékszervi élményeket. Lehet, hogy nem tudatosul bennünk, de különböző színekhez, formákhoz és hangokhoz más-más ízélményeket társítunk, ami finoman befolyásolhatja az érzékelésünket.

Például egy pohár színe vagy a bárban szóló háttérzene meghatározhatja, hogy egy bor édesebbnek vagy füstösebbnek tűnik-e. „Ez az érzékszervek közötti kommunikáció szinte folyamatosan zajlik”, magyarázza Carlos Velasco, az oslói BI Norwegian Business School munkatársa. Szélsőséges esetekben ez olyan érzékszervi élményként is megnyilvánulhat, amikor a szavak konkrét ízeket váltanak ki, vagy a zene színek kavalkádját idézi elő – ezt a jelenséget szinesztéziának nevezik.

A tudósok a „szenzoros modalitás” kifejezést használják az érzékszervek által az információk kódolására használt eszközök leírására – például az ízlelőbimbók, a dobhártya, a szem retinája vagy a bőr tapintási receptorai által. Azok az asszociációk, amelyeket különböző érzékszervi tulajdonságok között alakítunk ki, a „keresztmodális megfelelések” néven ismertek.

Formák, színek és ízek

Az ilyen jelenségekre vonatkozó kísérleti bizonyítékok először az 1970-es években jelentek meg. A kutatások szerint például a piros és rózsaszín árnyalatokat az édességgel, a sárgát vagy zöldet a savanyúval, a fehéret a sós ízzel, a barnát vagy feketét pedig a keserűséggel társítjuk. Ezeket az általános mintákat azóta számos alkalommal megismételték különböző kísérleti módszerekkel. A vizsgálatokból kiderül, hogy minden szín egyedi ízprofilt kap, amelyet sok ember oszt különböző kultúrákban. Egy multinacionális kutatás például Kína, India és Malajzia résztvevői körében is hasonló keresztmodális megfeleléseket talált.

Ezeknek az asszociációknak az eredete még mindig vita tárgya. Charles Spence, az Oxfordi Egyetem keresztszenzoros kutatólaboratóriumának vezetője szerint a legbiztosabb feltételezés az, hogy mindezt tanuljuk. Szerinte ezek a környezet statisztikáinak internalizációjaként értelmezhetők. A természetben például a gyümölcsök zöldről – amikor savanyúak – vörösebb, melegebb árnyalatokra váltanak, amikor édesebbé válnak. Ha ezt a statisztikát magunkévá tesszük, és a vöröses árnyalatokat az édes ízzel társítjuk, tudjuk, melyik fára érdemes felmászni a tápláló gyümölcsökért.

A forma és íz közötti asszociációk magyarázata azonban nehezebb. Spence szerint ez az érzelmekkel lehet összefüggésben, amelyeket az ingerek kiváltanak. Például az édességet örömmel társíthatjuk, és előnyben részesíthetjük a kerek formákat, mivel ezek kevésbé valószínű, hogy ártanak nekünk, ellentétben az éles formákkal. Ennek eredményeként közvetett módon elkezdjük az édességet a gömbölyűséggel összekapcsolni. Ezzel szemben a keserű anyagok nagyobb valószínűséggel mérgezőek, ezért azokat éles formákkal asszociálhatjuk, amelyek szintén nagyobb eséllyel okozhatnak testi sérülést.

Asszociatív mesterséges intelligencia

És bár az ötlet, hogy „ízleljünk” egy színt vagy hangot, abszurdnak tűnhet, Velasco legújabb kutatásai arra utalnak, hogy a generatív mesterségesintelligencia-rendszerek is hasonló módon működhetnek. A technológia gyors térnyerése arra ösztönözte Velascót, Spence-t és kollégájukat, Kosuke Motoki-t a Tokiói Egyetemen, hogy megvizsgálják, vajon az emberi adatokon kiképzett generatív mesterséges intelligencia ugyanazokat az összefüggéseket jelenti-e.

A kutatók a ChatGPT-t kérték meg, hogy válaszoljon olyan típusú kérdésekre, amelyeket korábban emberi résztvevőknek tettek fel. Például: „Milyen mértékben társítod a kerek formákat az édes, savanyú, sós, keserű és umami ízekhez? Kérjük, válaszolj erre a kérdésre egy 7 pontos skálán, ahol 1 = egyáltalán nem, és 7 = nagyon.” Valamint: „Az alábbi 11 szín közül (fekete, kék, barna, zöld, szürke, narancs, rózsaszín, lila, piros, fehér, sárga) szerinted melyik illik legjobban az édes ízekhez?”

A több száz angol, spanyol és japán nyelvű chat eredményeit átlagolva azt találták, hogy a mesterséges intelligencia valóban tükrözte az embereknél gyakran megfigyelhető mintázatokat – bár voltak eltérések az általuk használt MI-verziók között. Összességében a ChatGPT-4 megbízhatóbban tükrözte az emberi asszociációkat, mint a ChatGPT-3.5. „A különbségek valószínűleg a modellarchitektúrában mutatkozó eltérésekből fakadnak, például a ChatGPT-4 nagyobb számú paramétereiből, valamint a nagyobb és változatosabb tanulási adathalmazból”, mondta Motoki. Velasco és kollégái azt remélik, hogy ezt a tényt kihasználva számos más módot találhatnak az emberi érzékelés „feltörésére”.

Forrás: itbusiness.hu

Kép forrása: rgbcmyk.com