Nvidia is op dreef. Na de onthulling van zijn Blackwell-superchip, die is ontworpen om krachtigere AI-modellen zoals GPT, Claude en Gemini te trainen, heeft het zijn eigen AI-tool geplaagd voor het converteren van tekst naar 3D (zie onze gids voor de beste grafische kaarten voor consumentenopties).
De grafische kaartgigant sloot de GTC-week af met de presentatie van LATTE3D, een tekst-naar-3D generatief AI-model dat het beschrijft als een ‘virtuele 3D-printer’. Het kan tekstprompts binnen één seconde omzetten in 3D-weergaven van objecten en dieren.
Nvidia zegt dat 3D-vormen gemaakt door LATTE3D “gemakkelijk kunnen worden weergegeven in virtuele omgevingen voor de ontwikkeling van videogames, reclamecampagnes, ontwerpprojecten of virtuele trainingsruimtes voor robots.” We hebben eerder tekst-naar-3D-conversietools gezien, en online lof suggereert dat sommigen niet zo onder de indruk zijn van de kwaliteit van de resultaten van LATTE3Ds. Maar het nieuwe model betekent een grote vooruitgang, vooral op het gebied van snelheid.
Nvidia zegt dat het vrijwel onmiddellijk 3D-vormen produceert bij het uitvoeren van inferentie op een enkele GPU, zoals de NVIDIA RTX A6000 die in de onderzoeksdemonstratie werd gebruikt. Dit betekent dat een maker die helemaal opnieuw aan een ontwerp begint of door een bibliotheek met 3D-middelen zoekt, LATTE3D kan gebruiken om gedetailleerde objecten te maken, net zo snel als hij met ideeën komt.
Het formulier creëert verschillende 3D-vormopties op basis van elke tekstprompt. De gewenste objecten kunnen worden geoptimaliseerd voor een hogere kwaliteit en vervolgens worden geëxporteerd naar grafische softwareapplicaties of platforms zoals Nvidia Omniversumwat mogelijk maakt Beschrijving van het mondiale landschap (OpenUSD)– 3D-workflow en applicaties.
“Een jaar geleden kostte het AI-modellen een uur om 3D-beelden van deze kwaliteit te maken – de huidige stand van de techniek is nu ongeveer 10 tot 12 seconden”, zegt Sanja Fiedler, vice-president van AI-onderzoek. Het produceren van resultaten gaat veel sneller, waardoor het maken van bijna realtime 3D-tekst toegankelijk wordt voor creatieven uit alle sectoren.
LATTE3D is ontwikkeld door Nvidia's AI Lab-team uit Toronto en getraind met behulp van tekstprompts gegenereerd met behulp van ChatGPT om het vermogen van het model te verbeteren om verschillende uitdrukkingen te verwerken die een gebruiker kan bedenken om een bepaald 3D-object te beschrijven. Terwijl de onderzoekers LATTE3D trainden op twee specifieke datasets, dieren en alledaagse voorwerpen, kan dezelfde architectuur worden gebruikt om AI te trainen op andere datatypen. Het blijft uitsluitend een onderzoeksproject en is niet beschikbaar voor openbaar gebruik.
schreef AI-maker Bilawal Sidhu X: “Dit is een enorme sprong. DreamFusion rond 2022 was traag en van lage kwaliteit, maar het lanceerde deze generatieve 3D-revolutie. Inspanningen zoals ATT3D (Autized Object Texture to 3D) joegen snelheid na ten koste van de kwaliteit. Nu met LATTE3D van hoge kwaliteit en verwerkt in minder dan een seconde! Dit betekent dat u snel een 3D-wereld kunt dupliceren en deze kunt vullen met tekst of een afbeelding om deze in 3D om te zetten.
Samen met video is 3D de volgende grens voor het genereren van AI-beelden. Deze week kondigde Adobe ook de integratie aan van zijn eerste Firefly AI-gebaseerde tools in Substance 3D.
More Stories
Apple kondigt uitbreiding van Vision Pro naar nog twee landen aan
Hoe u de Apple Gehoortest doet met AirPods Pro 2
Apple kondigt MacBook Pro-modellen aan met M4 Pro- en M4 Max-chips, Thunderbolt 5-ondersteuning en meer