Er zijn nieuwe AI-modellen ontwikkeld die zijn ontworpen om complexe problemen op te lossen. Deze modellen nemen meer tijd om na te denken voordat ze reageren, waardoor ze in staat zijn om moeilijkere taken aan te pakken op gebieden zoals wetenschap, programmeren en wiskunde.
Vandaag wordt de eerste versie van deze modellen vrijgegeven in ChatGPT en via de API. Dit is een voorlopige versie en er worden regelmatig updates en verbeteringen verwacht. Bovendien zijn er evaluaties in ontwikkeling voor de volgende update die volgt op deze lancering.
Belangrijke punten
- Nieuwe AI-modellen zijn ontwikkeld voor betere probleemoplossing.
- Een eerste versie is beschikbaar in ChatGPT en de API.
- Regelmatige updates en verbeteringen worden verwacht.
Hoe het werkt
Deze modellen zijn ontworpen om meer tijd te nemen om na te denken over problemen voordat ze een antwoord geven, net zoals een mens zou doen. Tijdens het trainen leren ze hun denkprocessen te verfijnen, verschillende strategieën uit te proberen en fouten te herkennen.
In de tests is vastgesteld dat de nieuwste modelupdate vergelijkbare prestaties levert als PhD-studenten op uitdagende benchmarks in natuurkunde, chemie en biologie. Bovendien blinken ze uit in wiskunde en programmeren. Bij een kwalificatietoets voor de Internationale Wiskunde Olympiade (IMO) loste GPT-4o slechts 13% van de problemen correct op, terwijl het redeneringsmodel 83% correct had. Hun programmeervaardigheden zijn beoordeeld in wedstrijden en behaalden een score in de 89ste percentiel in Codeforces-wedstrijden.
Als een vroege versie mist het nog veel van de functies die ChatGPT nuttig maken, zoals het zoeken op internet en het uploaden van bestanden en afbeeldingen. Voor veel gebruikelijke gevallen zal GPT-4o op korte termijn meer in staat zijn.
Voor complexe redeneertaken vertegenwoordigt dit een aanzienlijke vooruitgang en markeert het een nieuw niveau van AI-capaciteit. Hierdoor is de telling teruggezet naar 1 en is deze reeks OpenAI o1 genoemd.
Veiligheid
Bij de ontwikkeling van nieuwe modellen is er een innovatieve aanpak voor veiligheidstraining geïntroduceerd. Deze methode maakt gebruik van de redeneervaardigheden van de modellen om ervoor te zorgen dat zij zich aan veiligheids- en richtlijnen houden. Door de regels in de juiste context te begrijpen, kunnen de modellen effectiever worden toegepast.
Een manier om de veiligheid te beoordelen, is door te testen hoe goed een model zijn veiligheidsregels opvolgt wanneer een gebruiker probeert deze te omzeilen, ook wel “jailbreaking” genoemd. In een van de uitdagendste jailbreaking-tests behaalde GPT-4o een score van 22 op een schaal van 0-100. In contrast, het o1-preview model scoorde 84. Voor meer details zijn er rapporten beschikbaar.
Om de nieuwe mogelijkheden van deze modellen te ondersteunen, zijn er aanzienlijke versterkingen aangebracht in het veiligheidswerk en de interne governance. Dit omvat uitgebreide tests en evaluaties volgens de Preparedness Framework, met gebruik van geavanceerde red teaming en beoordelingsprocessen op bestuursniveau, waarbij ook de Safety & Security Committee betrokken is.
Ter versterking van de toezegging aan AI-veiligheid zijn recentelijke overeenkomsten gesloten met de AI Safety Institutes in de VS en het VK. Er is een begin gemaakt met de uitvoering van deze overeenkomsten, waaronder het geven van vroege toegang tot een onderzoeksversie van het model. Dit vormt een belangrijke stap in de samenwerking om een proces op te zetten voor onderzoek, evaluatie en testing van toekomstige modellen voordat zij openbaar worden gemaakt.
Voor wie het bedoeld is
Deze verbeterde redeneercapaciteiten zijn nuttig voor mensen die complexe problemen oplossen in vakgebieden zoals wetenschap, programmeren en wiskunde. Het kan worden gebruikt door gezondheidsonderzoekers om gegevens van cellen te annoteren, door fysici om ingewikkelde wiskundige formules voor quantumoptica te genereren, en door ontwikkelaars om multi-step workflows te bouwen en uit te voeren.
OpenAI o1-mini
De o1-serie blinkt uit in het nauwkeurig genereren en debuggen van complexe code. OpenAI heeft nu ook de o1-mini gelanceerd, een sneller en goedkoper model dat effectief is voor programmeertaken. Dit kleinere model kost 80% minder dan o1-preview, waardoor het een krachtige en kosteneffectieve keuze is voor toepassingen die redenering vereisen zonder uitgebreide wereldkennis.
Hoe OpenAI o1 te gebruiken
Gebruikers van ChatGPT Plus en Team hebben vanaf vandaag toegang tot de o1-modellen in ChatGPT. Ze kunnen kiezen voor de o1-preview of o1-mini in de modelkiezer. De wekelijkse limieten zijn 30 berichten voor o1-preview en 50 voor o1-mini. Er is een inspanning om deze limieten te verhogen, en in de toekomst kan ChatGPT automatisch het juiste model selecteren voor verschillende opdrachten.
Vanaf volgende week krijgen ook gebruikers van ChatGPT Enterprise en Edu toegang tot beide modellen. Ontwikkelaars die in aanmerking komen voor API-gebruiksniveau 5 kunnen nu al aan de slag met beide modellen in de API, met een limiet van 20 aanvragen per minuut. Er zijn plannen om deze limieten na verdere testen te verhogen.
De API ondersteunt momenteel geen functie-aanroepen, streaming of systeemberichten. Voor details over de API is het aan te raden om de API-documentatie te bekijken. ChatGPT Free-gebruikers zullen binnenkort ook toegang krijgen tot o1-mini.
Wat is de volgende stap
Er zijn nieuwe updates en verbeteringen voor de reasoning modellen in ChatGPT en de API. Toekomstige versies zullen ook functies zoals browsen, bestands- en afbeeldingsuploaden bevatten. Dit zal de functionaliteit verder verbeteren voor gebruikers.
Bovendien blijven ze werken aan nieuwe modellen in de GPT-serie, samen met de lancering van de nieuwe OpenAI o1-serie.
- Probeer het in ChatGPT Plus
- Probeer het in de API
Veelgestelde Vragen
Wat zijn de voornaamste verbeteringen van OpenAI’s nieuwe AI-model ten opzichte van eerdere versies?
OpenAI’s nieuwste AI-model biedt aanzienlijke vooruitgangen in verschillende gebieden. Dit omvat verbeterde taalbegrip, een grotere contextuele nauwkeurigheid en snellere respons tijden. Ook is er aandacht besteed aan het verminderen van vooroordelen in de output.
Hoe kan het nieuwe AI-model van OpenAI in een bedrijf worden geïntegreerd?
Bedrijven kunnen het AI-model van OpenAI implementeren via API’s die beschikbaar zijn gesteld. Dit stelt organisaties in staat om aangepaste applicaties te bouwen die profiteren van de mogelijkheden van het model. Training en ondersteuning zijn ook beschikbaar om een soepele integratie te waarborgen.
Welke trainingsmethoden gebruikt OpenAI voor het nieuwste AI-model?
OpenAI maakt gebruik van verschillende trainingsstrategieën, waaronder ongecontroleerd leren en gesuperviseerd leren. Grote datasets worden ingezet om het model te trainen op diverse taken en onderwerpen. Feedback van gebruikers speelt eveneens een rol in het verfijnen van de prestaties.
Wat zijn de kosten verbonden aan het gebruik van het nieuwe AI-model van OpenAI?
De kosten voor het gebruik van OpenAI’s nieuwste model variëren afhankelijk van het type gebruik en de nodige functies. Er zijn meestal verschillende abonnementsmodellen en prijsstructuren beschikbaar, die zijn ontworpen om tegemoet te komen aan zowel kleinere bedrijven als grotere ondernemingen.
Hoe waarborgt OpenAI veiligheid en ethische richtlijnen bij het nieuwste AI-model?
OpenAI zet zich in voor ethische richtlijnen en de veiligheid van hun AI-modellen. Dit gebeurt door kandidaatmodellen te evalueren op mogelijke risico’s voordat ze worden vrijgegeven. Regelmatige audits en updates helpen ook om de integriteit van het model op lange termijn te waarborgen.
Welke ondersteuning biedt OpenAI voor ontwikkelaars die met het nieuwe AI-model willen werken?
OpenAI biedt uitgebreide documentatie en tutorials voor ontwikkelaars. Er zijn ook community-forums waar zij vragen kunnen stellen en ervaringen kunnen delen. Daarnaast is er technische ondersteuning beschikbaar voor meer complexe integraties of problemen.