Ana Ryu/Visual China Group/Getty Images
Op 19 maart 2023 in Seattle, Washington is een Microsoft-bord te zien op het hoofdkantoor van het bedrijf.
New York
CNN
—
De Mona Lisa kan nu meer dan alleen glimlachen, dankzij nieuwe AI-technologie van Microsoft.
Vorige week hebben Microsoft-onderzoekers een nieuw AI-model gedetailleerd beschreven dat ze hebben ontwikkeld en dat een stilstaand beeld kan maken van een gezicht en een audiofragment van iemand die spreekt en automatisch een realistisch ogende video kan maken van die persoon die spreekt. De video's, die kunnen worden gemaakt van echte gezichten, maar ook van karikaturen of kunstwerken, zijn compleet met overtuigende lipsynchronisaties en natuurlijke gezichts- en hoofdbewegingen.
In een experimentele video lieten de onderzoekers zien hoe ze de Mona Lisa animeerden om een komisch rapnummer van actrice Anne Hathaway voor te dragen.
De uitgangen van het AI-model worden opgeroepen Vasa-1, zowel grappig als enigszins tegenstrijdig in hun realiteit. Microsoft zei dat de technologie kan worden gebruikt voor onderwijs, “het verbeteren van de toegankelijkheid voor mensen met communicatieproblemen”, of misschien om virtuele metgezellen voor mensen te creëren. Maar het is ook gemakkelijk in te zien hoe de tool kan worden misbruikt en gebruikt om zich voor te doen als echte mensen.
Het is een zorg die verder gaat dan Microsoft: naarmate er meer tools verschijnen om aantrekkelijke, door AI gegenereerde afbeeldingen, video's en audiofragmenten te maken, Deskundigen maken zich zorgen En het misbruik ervan kan leiden tot nieuwe vormen van verkeerde informatie. Sommigen zijn ook bezorgd dat technologie de creatieve industrie, van films tot reclame, verder zal ontwrichten.
Op dit moment zei Microsoft dat het niet van plan is het VASA-1-model onmiddellijk aan het publiek vrij te geven. De stap is vergelijkbaar met de manier waarop Microsoft-partner OpenAI de omliggende zorgen aanpakt Videotool gegenereerd door kunstmatige intelligentieSora: OpenAI plaagde Sora in februari, maar heeft het tot nu toe alleen voor testdoeleinden beschikbaar gesteld aan enkele professionele gebruikers en cybersecurity-professoren.
“Wij verzetten ons tegen elk gedrag dat misleidende of schadelijke inhoud voor echte mensen creëert”, aldus Microsoft-onderzoekers in een blogpost. Maar ze voegden eraan toe dat het bedrijf “geen plannen heeft om” het product publiekelijk vrij te geven “totdat we ervoor zorgen dat de technologie op verantwoorde wijze en in overeenstemming met de toepasselijke regelgeving wordt gebruikt.”
De onderzoekers zeiden dat het nieuwe AI-model van Microsoft is getraind op verschillende video's van de gezichten van mensen tijdens het spreken, en is ontworpen om natuurlijke gezichts- en hoofdbewegingen te herkennen, waaronder onder meer lipbewegingen, (niet-lip) uitdrukking, oogblik en knipperen. ” andere dingen”. Het resultaat is een realistischer videobeeld wanneer de VASA-1 een stilstaand beeld beweegt.
In een testvideo met een fragment van iemand die er opgewonden uitzag, blijkbaar tijdens het spelen van videogames, had het sprekende gezicht bijvoorbeeld gefronste wenkbrauwen en samengeknepen lippen.
De AI-tool kan ook worden aangestuurd om een video te produceren waarin het onderwerp in een bepaalde richting kijkt of een bepaalde emotie uitdrukt.
Als je goed kijkt, zijn er nog steeds tekenen dat de video’s door een machine zijn gegenereerd, zoals onregelmatig knipperen en overdreven wenkbrauwbewegingen. Maar Microsoft zei dat het gelooft dat zijn model “aanzienlijk beter presteert” dan andere vergelijkbare tools en “de weg vrijmaakt voor realtime interacties met levensechte avatars die menselijk gespreksgedrag nabootsen.”
“Hipster-Friendly Explorer. Award-Winning Coffee Fanatic. Analyst. Problem Solver. Troublemaker.”
More Stories
Apple kondigt uitbreiding van Vision Pro naar nog twee landen aan
Hoe u de Apple Gehoortest doet met AirPods Pro 2
Apple kondigt MacBook Pro-modellen aan met M4 Pro- en M4 Max-chips, Thunderbolt 5-ondersteuning en meer