Nieuws Artificial Intelligence

26 oktober 2023 leestijd 2 minuten 0 reacties

Hallucinerende AI? Nieuwe tool moet dat oplossen, zonder AI-model opnieuw te trainen

Grote AI-modellen hallucineren met regelmaat: ze geven informatie die helemaal niet klopt en eigenlijk gewoon verzonnen lijkt. Wetenschappers aan de University of Science and Technology of China (USTC) en Tencent YouTu Lab hebben een framework gemaakt voor zogeheten 'multimodel large language models' waarmee dit probleem verholpen kan worden, zonder dat het model in kwestie helemaal opnieuw getraind moet worden.

Eveline MeijerRedacteurMeer van deze auteur

Multimodal large language models - ofwel MMLM's - zijn AI-modellen die tekst, video, audio en beelden snappen, ook in context met elkaar. Een voorbeeld daarvan is DALL-E, dat beelden kan genereren op basis van tekstuele beschrijvingen.

Maar net als veel andere AI-modellen willen MMLM's nogal eens hallucineren. Vraag je zo'n model of er bijvoorbeeld een schaal op een foto van een keuken staat, dan kan het model zomaar zeggen dat dit niet het geval is, ook al is dat wel zo. Dat corrigeren kan lastig zijn: veel bestaande oplossingen vereisen dat het model opnieuw getraind wordt met specifieke data, zegt Venturebeat. De nieuwe tool Woodpecker pakt dat anders aan.

Corrigeren op attribuutniveau

Woodpecker is een framework dat inconsistenties tussen beeldmateriaal en de gegenereerde tekst kan halen. Het framework is dus gemaakt voor MMLM's die beelden kunnen beschrijven.

Woodpecker corrigeert MMLM's via een uitgebreid proces. Allereerst identificeert het de belangrijkste objecten die in de tekst genoemd worden en stelt daar dan vragen over. Die vragen worden vervolgens beantwoord aan de hand van expert models, waardoor er een soort database van aannames over objecten bestaat, op attribuutniveau. Dat is de zogeheten visual knowledge base. Mochten bepaalde zaken niet kloppen, dan worden de hallucinaties in de visual knowledge base aangepast en wordt het bijbehorende bewijs toegevoegd.

Een voorbeeld: mocht een MMLM een beschrijving geven over een klassenfoto, dan kan Woodpecker bijvoorbeeld vragen hoeveel mensen er op die foto staan. Komt daar het verkeerde antwoord uit - bijvoorbeeld vijftien mensen in plaats van 38 - dan hoeft alleen het aantal aangepast te worden en kan er aangegeven worden waar al die mensen dan staan. Een model hoeft zo dus niet helemaal opnieuw getraind te worden.

Open source

De broncode van Woodpecker is door de onderzoekers open source gemaakt. Zij moedigen anderen dan ook aan om het framework verder te onderzoeken en hier verder aan te werken.

Daarnaast hebben de onderzoekers een interactieve demonstratie van het systeem gemaakt, die voor iedereen toegankelijk is.

ChatGPT hallucineert, maar Nederlandse startup kan helpen

Semantische neurale zoekmachine helpt GPT zijn redeneringen te onderbouwen

2 min

Nieuws Artificial Intelligence

Google waarschuwt voor misleidende AI-zoekresultaten

'Overtuigende, maar volledig fictieve antwoorden.'

2 min

Nieuws Artificial Intelligence

Rechter schrikt van niet-bestaande ChatGPT-gegenereerde zaken rond onder meer KLM

Rechtbank niet eerder geconfronteerd met ChatGPT-hallucinaties.

2 min 1

ChatGPT hallucineert, maar Nederlandse startup kan helpen

Semantische neurale zoekmachine helpt GPT zijn redeneringen te onderbouwen

2 min

Nieuws Artificial Intelligence

Google waarschuwt voor misleidende AI-zoekresultaten

'Overtuigende, maar volledig fictieve antwoorden.'

2 min

Nieuws Artificial Intelligence

Rechter schrikt van niet-bestaande ChatGPT-gegenereerde zaken rond onder meer KLM

Rechtbank niet eerder geconfronteerd met ChatGPT-hallucinaties.

2 min 1

Kennis over online veiligheid en wenselijk gedrag in Nederland is ver ondermaats

Weinig kennis over online veiligheid en wenselijk gedrag in Nederland blijkt uit KnowBe4-onderzoek.

2 min

Rubriek Security Partner

Expert Wouter Taal van Kyocera Document Solutions aan het woord!

'Het gebruik van een extra autorisatie komen we gelukkig meer en meer tegen'

4 min

Blog Compliance Partner

NIS2 niet belangrijk? Cyberweerbaarheid wel!

NIS2 is voor veel organisaties een verplichte oefening. Zie NIS2 als een opportuniteit om de cyberweerbaarheid eens grondig aan te pakken.

5 min

Meer whitepapers

Whitepaper Artificial Intelligence

AI in de cloud: de risico's en voordelen van deze snelle adoptie ontrafeld

De explosieve groei van AI-diensten en -tools zorgt ervoor dat bedrijven worstelen met veilige adoptie. Maar wat betekent dat nu eigenlijk?

Whitepaper Arbeidsmarkt

Salary Survey: zo gaat het met de positie van IT’ers op de arbeidsmarkt

Hoeveel verdient een IT’er? En wat is het belangrijkste voor hun werkgeluk? Je leest het in de whitepaper van de 24e Salary Survey.

Whitepaper Cloud

Dé ideale mix tussen cloud en on-premises

Download de infographic en ontdek de vier grootste misvattingen over on-premises en de cloud.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Hallucinerende AI? Nieuwe tool moet dat oplossen, zonder AI-model opnieuw te trainen

Corrigeren op attribuutniveau

Open source

ChatGPT hallucineert, maar Nederlandse startup kan helpen

Google waarschuwt voor misleidende AI-zoekresultaten

Rechter schrikt van niet-bestaande ChatGPT-gegenereerde zaken rond onder meer KLM

ChatGPT hallucineert, maar Nederlandse startup kan helpen

Google waarschuwt voor misleidende AI-zoekresultaten

Rechter schrikt van niet-bestaande ChatGPT-gegenereerde zaken rond onder meer KLM

Kennis over online veiligheid en wenselijk gedrag in Nederland is ver ondermaats

Expert Wouter Taal van Kyocera Document Solutions aan het woord!

NIS2 niet belangrijk? Cyberweerbaarheid wel!

AI in de cloud: de risico's en voordelen van deze snelle adoptie ontrafeld

Salary Survey: zo gaat het met de positie van IT’ers op de arbeidsmarkt

Dé ideale mix tussen cloud en on-premises

Reacties

Bevestig jouw e-mailadres

Er is iets mis gegaan

Maak een gratis account aan en geniet van alle voordelen:

Maak een gratis account aan en geniet van alle voordelen:

Hallucinerende AI? Nieuwe tool moet dat oplossen, zonder AI-model opnieuw te trainen

Corrigeren op attribuutniveau﻿

Open source﻿

ChatGPT hallucineert, maar Nederlandse startup kan helpen

Google waarschuwt voor misleidende AI-zoekresultaten

Rechter schrikt van niet-bestaande ChatGPT-gegenereerde zaken rond onder meer KLM

ChatGPT hallucineert, maar Nederlandse startup kan helpen

Google waarschuwt voor misleidende AI-zoekresultaten

Rechter schrikt van niet-bestaande ChatGPT-gegenereerde zaken rond onder meer KLM

Kennis over online veiligheid en wenselijk gedrag in Nederland is ver ondermaats

Expert Wouter Taal van Kyocera Document Solutions aan het woord!

NIS2 niet belangrijk? Cyberweerbaarheid wel!

AI in de cloud: de risico's en voordelen van deze snelle adoptie ontrafeld

Salary Survey: zo gaat het met de positie van IT’ers op de arbeidsmarkt

Dé ideale mix tussen cloud en on-premises

Reacties

Corrigeren op attribuutniveau

Open source