De veelgebruikte chatbot ChatGPT is ontworpen om digitale tekst te creëren, van poëzie tot onderzoekspapers tot computerprogramma’s. Maar toen een team van kunstmatige intelligentie-onderzoekers van computerchipbedrijf Nvidia de onderliggende technologie van de chatbot in handen kreeg, beseften ze dat deze nog veel meer kon doen.
Binnen enkele weken leerden ze hem Minecraft spelen, een van de populairste videogames ter wereld. In de digitale wereld van Minecraft leerde ik zwemmen, planten verzamelen, op varkens jagen, goud delven en huizen bouwen.
“Hij kan de wereld van Minecraft betreden en zelf verkennen, zelf materialen verzamelen en beter worden in allerlei soorten vaardigheden”, zegt Linxi Fan, een senior onderzoeker bij Nvidia, beter bekend als Jim.
Het project Dit was een vroeg teken dat ’s werelds toonaangevende AI-onderzoekers chatbots veranderen in een nieuw type autonoom systeem dat een AI-agent wordt genoemd. Deze agenten kunnen meer dan alleen chatten. Ze kunnen softwareapplicaties, websites en andere online tools gebruiken, waaronder spreadsheets, online agenda’s, reiswebsites en meer.
Veel onderzoekers zeggen dat AI-agenten in de loop van de tijd veel geavanceerder kunnen worden, kantoorpersoneel kunnen vervangen en vrijwel elke administratieve functie kunnen automatiseren.
“Het is een enorme zakelijke kans, potentieel biljoenen dollars waard”, zegt Jeff Clune, hoogleraar computerwetenschappen aan de Universiteit van British Columbia, die eerder aan dit soort technologie werkte als onderzoeker bij OpenAI, een startup uit San Francisco die de technologie. ChatGPT. “Dit heeft een enorm voordeel – en ernstige gevolgen – voor de samenleving.”
Nvidia-agent die een spel speelt. Soortgelijke agenten kunnen vergaderingen plannen, bestanden bewerken, gegevens analyseren en veelkleurige staafdiagrammen maken. Het idee is dat deze geautomatiseerde systemen uiteindelijk zullen fungeren als persoonlijke assistenten die een breed scala aan online taken kunnen uitvoeren.
De agenten van vandaag zijn beperkt en kunnen je leven niet bepaald organiseren. ChatGPT kan op de reissite Expedia zoeken naar vluchten naar New York, maar u moet de reservering nog steeds zelf boeken.
Deze technologie zou, naarmate onderzoekers deze verbeteren, kantoorpersoneel en consumenten efficiënter kunnen maken. Het zou ook de aard van videogames kunnen veranderen en een nieuwe golf van bots kunnen opleveren waar spelers mee kunnen spelen en waarmee ze kunnen chatten.
GPT-4, de technologie die ChatGPT aandrijft, is wat onderzoekers een groots taalmodel noemen. Het is een kunstmatig intelligentiesysteem dat vaardigheden leert door enorme hoeveelheden gegevens te analyseren.
De afgelopen maanden heeft deze technologie honderden miljoenen mensen onder de indruk gebracht van de manier waarop het e-mails maakt, toespraken schrijft en liedjes zingt over vrijwel elk onderwerp. Maar zijn belangrijkste vaardigheid is misschien wel zijn talent voor het schrijven van computerprogramma’s.
Hij kan direct een programma maken dat een eenhoorn tekent of digitaal sneeuwvlokken op zijn laptopscherm laat vallen. Professionele softwareontwikkelaars kunnen code in opdracht geven die ze kunnen integreren in grotere programma’s, waaronder alles van sociale media-apps tot zoekmachines. Maar dit is slechts een deel van wat deze technologie kan doen. Het kan ook computercode genereren die in andere softwareapplicaties en websites kan worden gebruikt.
Dit is hoe Dr. Fan en andere Nvidia-onderzoekers GPT-4 leerden hoe ze Minecraft moesten spelen. “Het belangrijkste woord hier is code,” zei Dr. Fan. “Code kan actie ondernemen.”
Mensen gebruiken softwareapplicaties en websites door knoppen, menu’s en andere grafische hulpmiddelen aan te raken. AI-agenten gebruiken apps en websites door toegang te krijgen tot hun application programming interfaces, of API’s – de onderliggende softwarecode waarmee ze met andere online diensten kunnen communiceren.
Als u een agent bijvoorbeeld vraagt een video naar internet te uploaden, kan deze een code genereren die een Application Programming Interface (API) wordt genoemd en die wordt geleverd door YouTube. “Een API is niets anders dan tekst die wordt gebruikt om met een machine te praten”, zegt Selin Nayhin, een onderzoeker die helpt bij het uitvoeren van het autonome AI-agentproject AutoGPT.
In theorie kan een chatbot code schrijven om toegang te krijgen tot elke API op internet. Maar de huidige chatbots zijn niet bekwaam genoeg om meer te doen dan eenvoudige taken. Zelfs als dat het geval zou zijn, zou het een enorm veiligheidsrisico zijn als ze vrij online zouden kunnen rondlopen. De bedrijven zijn dus klein begonnen.
Een paar maanden nadat OpenAI ChatGPT onthulde, bracht het stilletjes een manier uit waarop een chatbot meer kan doen dan alleen tekst genereren. Na het installeren van verschillende plug-ins (software die de mogelijkheden van de bot vergroot) kunt u hem vragen om op reissites zoals Expedia te zoeken naar beschikbare vluchten, een kaart van uw stad op te halen uit Google Earth of zelfs een spreadsheet met uw jaarlijkse uitgaven om te zetten. .. Meerkleurig staafdiagram.
Omdat het wordt geleverd met een plug-in die een codecompiler wordt genoemd, kan ChatGPT niet alleen code schrijven, maar deze ook uitvoeren. Hierdoor kan de technologie onmiddellijk taken uitvoeren die voorheen niet mogelijk waren, zoals het bewerken van spreadsheets en het converteren van stilstaande beelden naar video’s. Google, Microsoft en andere bedrijven onderzoeken soortgelijke technologieën.
“Dit zijn projecten waarbij we ons voorstellen dat AI in essentie namens u samenwerkt met andere AI”, zegt Ashley Lawrence, vice-president bij Microsoft.
Onafhankelijke projecten zoals AutoGPT proberen dit soort dingen een aantal stappen verder te brengen. Het idee is om het systeem doelen te geven zoals ‘een bedrijf starten’ of ‘wat geld verdienen’. Vervolgens gaat het zoeken naar manieren om dat doel te bereiken door zichzelf vragen te stellen en verbinding te maken met andere internetdiensten.
Tegenwoordig werkt dit niet zo goed. Systemen als AutoGPT hebben de neiging vast te lopen in eindeloze lussen. Maar onderzoekers zoals Dr. Fan werken voortdurend aan het verbeteren van dit soort technologie in een poging het bruikbaarder en betrouwbaarder te maken.
Andere onderzoekers bouwen een nieuw type kunstmatige intelligentie-agent die is ontworpen om softwaretools te gebruiken. In de zomer van 2022 maakte Dr. Clune deel uit van een team van onderzoekers bij OpenAI die een agent bouwden die daartoe in staat was Gebruik computerprogramma’s net zoveel als mensen dat zouden doen – Muisklik na muisklik, toetsaanslag na toetsaanslag.
Dr. Clune en zijn collega’s voedden het systeem urenlang met online video’s waarin mensen Minecraft speelden. Door de manier te analyseren waarop mensen de muis en het toetsenbord gebruiken om door de digitale wereld van Minecraft te navigeren, leerde het systeem het spel zelfstandig te runnen.
Andere bedrijven zijn aan het bouwen, waaronder een startup genaamd Adept Soortgelijke agenten Die maakt gebruik van websites als Wikipedia, Redfin en Craigslist, en populaire kantoorapplicaties van bedrijven als Salesforce.
Dr. Clune zegt dat dit type agent AI uiteindelijk in staat zal stellen een veel breder scala aan softwareapplicaties en websites te gebruiken. Iedereen zal toegang hebben tot een digitale assistent die bijna alles op internet kan doen, zei hij. Dit zou het leven gemakkelijker maken, maar het zou ook talloze banen kunnen vervangen.
“Als AI alles kan wat wij ook kunnen, dan is het niet alleen het vervangen van saaie taken”, zei hij. “Het vervangt alle taken.”
“Hipster-Friendly Explorer. Award-Winning Coffee Fanatic. Analyst. Problem Solver. Troublemaker.”
More Stories
Apple kondigt uitbreiding van Vision Pro naar nog twee landen aan
Hoe u de Apple Gehoortest doet met AirPods Pro 2
Apple kondigt MacBook Pro-modellen aan met M4 Pro- en M4 Max-chips, Thunderbolt 5-ondersteuning en meer