5000 Szolnok, Muskátli u. 2/A

Mi történik, amikor már nem tudunk nagyobb MI-adatközpontokat építeni?

A generatív MI-modellek nemcsak népszerűségükben robbantak be az elmúlt két évben, hanem méretük is ugrásszerűen nőtt, egyre nagyobb számítási kapacitást igényelve. Mivel a gépi tanulás területén még nem történt radikális áttörés, és az energiaellátás egyre szűkösebbé válik, az MI fejlődésének folytatása egy teljesen új típusú szuperszámítógépen múlhat – olyanon, amely országokon vagy akár kontinenseken ível át.

A generatív MI-modellek az elmúlt években robbanásszerűen növekedtek, egyre több számítási kapacitást és energiát igényelve. Mivel a nagyobb adatközpontok építése egyre kevésbé fenntartható, az iparág egy új megoldás felé fordul: a meglévő adatközpontok összekapcsolása.

Gilad Shainer, az Nvidia hálózati részlegének alelnöke szerint a következő generációban már lehetőség lesz távoli adatközpontokat egyetlen virtuális egységként működtetni. A nagy teljesítményű számítástechnika (HPC) területén az ilyen megoldások nem újak: az InfiniBand és más nagy sebességű interkonnekt rendszerek már ma is összekötnek több ezer számítási egységet.

Infrastruktúra és technológiai kihívások

A nagy sebességű adatközponti összeköttetések (DCI) már léteznek, és a nagy felhőszolgáltatók széles körben alkalmazzák őket. Az Nvidia korábbi MetroX technológiája például 40 km-es távolságot hidalt át, de az MI robbanás előtt fejlesztették ki, így nem az óriási MI-modellek tréningjére optimalizálták.

A távolság növelése több kihívást is felvet:

  • Késleltetés: az adatok továbbítása kilométerenként 4,9 mikroszekundumot vesz igénybe, ami nagyobb távolságokon jelentős késleltetést okozhat.
  • Sávszélesség: egy modern MI-adatközpont akár több petabitnyi adatot is kezel, ami rendkívül nagy hálózati kapacitást igényel.

Az új technológiák, például az üreges magú optikai szálak és az MI-optimalizált hálózati rendszerek segíthetnek a problémák enyhítésében.

Gyakorlati megoldások

A hálózati optimalizáció segíthet a sávszélesség csökkentésében: ha az adatközpontok helyben végeznek számításokat, és csak az eredményeket osztják meg, jelentősen csökkenthető a hálózati terhelés. Az egységes hardverkörnyezet is fontos lenne, de ha ez nem megoldható, a régebbi eszközök korlátozhatják az újabbak teljesítményét. Emellett több adatközpontot is érdemes összekötni egy redundáns, intelligens hálózatba, amely proaktívan reagál a hálózati problémákra.

A GPU-k energiaigénye és az MI-modellek exponenciális növekedése miatt előbb-utóbb szükségessé válik az adatközpontok összekapcsolása. Bár a nagyobb modellek tréningje egyetlen adatközponton belül is megoldható, az időtartam és a rendszerhibák egyre nagyobb kockázatot jelentenek. Mivel az MI-modellek mérete évente 4-5-szörösére nő, egyetlen adatközpont már hamarosan nem lesz elég – így a globálisan összekapcsolt MI-szuperszámítógépek válhatnak a következő nagy áttöréssé.

Forrás: itbusiness.hu

Kép forrása: trgdatacenters.com