A generatív MI-modellek nemcsak népszerűségükben robbantak be az elmúlt két évben, hanem méretük is ugrásszerűen nőtt, egyre nagyobb számítási kapacitást igényelve. Mivel a gépi tanulás területén még nem történt radikális áttörés, és az energiaellátás egyre szűkösebbé válik, az MI fejlődésének folytatása egy teljesen új típusú szuperszámítógépen múlhat – olyanon, amely országokon vagy akár kontinenseken ível át.
A generatív MI-modellek az elmúlt években robbanásszerűen növekedtek, egyre több számítási kapacitást és energiát igényelve. Mivel a nagyobb adatközpontok építése egyre kevésbé fenntartható, az iparág egy új megoldás felé fordul: a meglévő adatközpontok összekapcsolása.
Gilad Shainer, az Nvidia hálózati részlegének alelnöke szerint a következő generációban már lehetőség lesz távoli adatközpontokat egyetlen virtuális egységként működtetni. A nagy teljesítményű számítástechnika (HPC) területén az ilyen megoldások nem újak: az InfiniBand és más nagy sebességű interkonnekt rendszerek már ma is összekötnek több ezer számítási egységet.
Infrastruktúra és technológiai kihívások
A nagy sebességű adatközponti összeköttetések (DCI) már léteznek, és a nagy felhőszolgáltatók széles körben alkalmazzák őket. Az Nvidia korábbi MetroX technológiája például 40 km-es távolságot hidalt át, de az MI robbanás előtt fejlesztették ki, így nem az óriási MI-modellek tréningjére optimalizálták.
A távolság növelése több kihívást is felvet:
- Késleltetés: az adatok továbbítása kilométerenként 4,9 mikroszekundumot vesz igénybe, ami nagyobb távolságokon jelentős késleltetést okozhat.
- Sávszélesség: egy modern MI-adatközpont akár több petabitnyi adatot is kezel, ami rendkívül nagy hálózati kapacitást igényel.
Az új technológiák, például az üreges magú optikai szálak és az MI-optimalizált hálózati rendszerek segíthetnek a problémák enyhítésében.
Gyakorlati megoldások
A hálózati optimalizáció segíthet a sávszélesség csökkentésében: ha az adatközpontok helyben végeznek számításokat, és csak az eredményeket osztják meg, jelentősen csökkenthető a hálózati terhelés. Az egységes hardverkörnyezet is fontos lenne, de ha ez nem megoldható, a régebbi eszközök korlátozhatják az újabbak teljesítményét. Emellett több adatközpontot is érdemes összekötni egy redundáns, intelligens hálózatba, amely proaktívan reagál a hálózati problémákra.
A GPU-k energiaigénye és az MI-modellek exponenciális növekedése miatt előbb-utóbb szükségessé válik az adatközpontok összekapcsolása. Bár a nagyobb modellek tréningje egyetlen adatközponton belül is megoldható, az időtartam és a rendszerhibák egyre nagyobb kockázatot jelentenek. Mivel az MI-modellek mérete évente 4-5-szörösére nő, egyetlen adatközpont már hamarosan nem lesz elég – így a globálisan összekapcsolt MI-szuperszámítógépek válhatnak a következő nagy áttöréssé.
Forrás: itbusiness.hu
Kép forrása: trgdatacenters.com