SVG Image
< Terug naar nieuws

23 Maart 2025

Waarom GPT Niet Zoals Mensen Kan Redeneren

In een studie van AI- en taalexperts Martha Lewis van de Universiteit van Amsterdam en Melanie Mitchell van het Santa Fe Institute werd de capaciteit van GPT-4 om analogieën te begrijpen getest in vergelijking met menselijke prestaties. Analogisch redeneren – het vermogen om vergelijkingen te maken tussen verschillende dingen op basis van gedeelde overeenkomsten – is een cruciale manier waarop mensen de wereld begrijpen. Bijvoorbeeld: "Kop is voor koffie zoals soep is voor ???" 

Hoewel GPT-4 goed presteert in standaard analogie-taken, bleek uit de studie dat het model moeite had wanneer de problemen licht werden aangepast. In tegenstelling tot mensen, die hun prestaties consistent hielden ondanks variaties in de analogieën, daalden de resultaten van GPT-4.

De Gebrek aan Flexibiliteit van GPT in Redeneren

De studie testte zowel AI- als menselijke prestaties op drie verschillende soorten analogieën:

  • Lettersequenties

  • Cijfer matrices

  • Verhaal-analogieën

GPT-4 presteerde goed op standaardtests, maar wanneer de problemen werden aangepast – zoals het veranderen van de positie van een ontbrekend cijfer of een lichte herformulering van een verhaal – daalde de prestaties van GPT-4 aanzienlijk. Mensen bleven echter consistent. Dit suggereert dat GPT-modellen niet over de flexibiliteit van menselijk redeneren beschikken en vaak afhankelijk zijn van patroonherkenning in plaats van echt begrip.

De Uitdagingen voor AI in Besluitvorming

Dit onderzoek toont aan dat AI-modellen zoals GPT-4 de analogieën die ze genereren niet echt "begrijpen". Hun redenering imiteert vaak patronen uit de trainingsdata in plaats van abstract begrip, wat een belangrijk kenmerk is van menselijke cognitie. De studie concludeert dat GPT-modellen zwakker zijn dan menselijke cognitie, vooral wanneer ze worden geconfronteerd met complexe redeneringstaken. Dit benadrukt de beperkingen van AI in kritieke besluitvormingsgebieden zoals gezondheidszorg, recht en onderwijs.

Dit is een belangrijke herinnering dat hoewel AI een krachtig hulpmiddel kan zijn, het nog niet in staat is om menselijk denken te vervangen in complexe, genuanceerde scenario’s.

Artikelgegevens:
Martha Lewis en Melanie Mitchell, 2025, ‘Evaluating the Robustness of Analogical Reasoning in Large Language Models’
Transactions on Machine Learning Research

Gepubliceerd door de UvA

Vergelijkbaar >

Vergelijkbare nieuwsitems

>Bekijk alle nieuwsitems >
Databricks neemt open-source database startup Neon over voor $1 miljard

14 mei 2025

Databricks neemt open-source database startup Neon over voor $1 miljard >

Het Amerikaanse softwarebedrijf Databricks, met sterke banden met Amsterdam en het Centrum Wiskunde & Informatica (CWI), heeft aangekondigd dat het de open-source database startup Neon overneemt voor $1 miljard.

Lees meer >

Amsterdamse Volta Ventures lanceert nieuw fonds van €20 miljoen voor tech-startups

14 mei 2025

Amsterdamse Volta Ventures lanceert nieuw fonds van €20 miljoen voor tech-startups >

Volta Ventures, an Amsterdam-based venture capital firm focused on tech startups in the Benelux, has announced a new €20 million fund. This third fund from Volta Ventures targets early-stage investments in technology companies with strong growth potential. The fund provides capital and strategic support to young companies working on innovative technologies, ranging from software development to artificial intelligence and deep tech.   The Volta Ventures team emphasizes that the new fund offers more than just capital—it provides strategic guidance and access to networks. "We want to help entrepreneurs realize their vision by providing them with the right resources and connections," the team stated.   As an established player in the Benelux region, Volta Ventures has built a portfolio of successful technology companies. With the new fund, the firm aims to meet the growing demand for funding from promising startups in the Netherlands, Belgium, and Luxembourg.   Read more about Volta Ventures' new fund on the Silicon Canals website .

Lees meer >

Roboat: autonome boten testen in de grachten van Amsterdam

14 mei 2025

Roboat: autonome boten testen in de grachten van Amsterdam >

Roboat is een innovatief project dat autonome boten test in de grachten van Amsterdam. Deze zelfvarende vaartuigen bieden oplossingen voor stedelijke logistiek, vervoer en afvalinzameling.

Lees meer >