Változatos alkalmazások jóvoltából, a mesterséges intelligencia évek óta mindennapjaink szereplője, ráadásul úgy, hogy gyakran nem is tudunk róla. Ezt a gépi tanulás, azon belül is a mélytanulás (deep learning) gyors fejlődése alapozta meg. Egy 2020-as előrejelzés alapján az MI szoftverek piaca 2025-re eléri a 126 milliárd dollárt.
Mindezek ismeretében semmi meglepő nincs abban, hogy a mesterséges intelligencia 3D modellek készítésére is használható. A Google DreamFusion szolgáltatásával például szöveg, szöveges utasítások (promptok) alakíthatók át ilyen modellekké. Generálásuk azonban órákig eltarthat.
A mostani mesterségesintelligencia-kutatások egyik élharcosa, a San Franciscói OpenAI december végén piacra dobott Point-E rendszere (amelyben az E az efficiency, azaz a „hatékonyság” rövidítése) felgyorsítja a folyamatot, órák helyett percek alatt elvégzi a munkát.
A rendszert használva – 3D formákat megjelenítő – nagyszámú térbeli pontfelhő létrehozásával alkothatunk 3D objektumokat. De hiába generálhatók gyorsan pontfelhők, nem ragadják meg a tárgyak formájának, textúrájának apróságait, a finom részleteket.
Szerencsére az OpenAI gondolt erre, és egy másik MI-megoldással a pontfelhők a tárgyakat (csúcsaikat, éleiket stb.) sokkal pontosabban reprezentáló hálókká alakíthatók. A modell persze még így sem tökéletes, de sokkal közelebb van hozzá.
A Point-E a képet 3D modellé alakító megoldás mellett szövegből képet generáló modellt is tartalmaz. Utóbbit a szavak és a kapcsolódó képek összefüggéseinek megértésére gyakoroltatták, míg 3D objektumok létrehozásával a rendszer jobban megérti az egész folyamatot.
Használatához egyelőre nagy adatbázis kell, és az OpenAI el is mondta, hogy technológiájuk hiába gyorsabb az eddigieknél, még mindig „work in progress”, viszont állandóan dolgoznak rajta, finomítják. Másrészt, valódi tárgyak készítéséhez, tehát pont a 3D nyomtatáshoz ideális.