Rychlost.cz Články Aktuality Proč ChatGPT neumí počítat? Tajemství matematických kiksů odhaleno

Proč ChatGPT neumí počítat? Tajemství matematických kiksů odhaleno

Autor článku: Jakub Janíček | 07.10.2024

ChatGPT a další chatboti sice dokážou psát texty a překládat, ale s matematikou si často neporadí. Důvodem jsou mimo jiné tokenizace, která rozbíjí čísla na nesrozumitelné části, a statistický přístup k učení, který v matematice selhává. Existuje však naděje na zlepšení – novější modely s logickým uvažováním dosahují lepších výsledků.

Proč ChatGPT neumí počítat? Tajemství matematických kiksů odhaleno

Umělá inteligence, včetně ChatGPT, dokáže psát básně, skládat hudbu a překládat texty. Přesto se často zadrhne u jednoduchých matematických úloh. Proč si chatbot, který zvládá komplexní jazykové úkoly, neporadí s matematikou na úrovni základní školy?

Tokenizace: Když se čísla rozpadnou na kusy

Jedním z klíčových problémů je tokenizace. Tento proces rozděluje data na menší části, tzv. tokeny. Představte si to jako skládání puzzle, kde se slova rozbíjejí na slabiky. Tokenizátor, model umělé inteligence odpovědný za tento proces, však nerozumí významu čísel.

Může se stát, že číslo 380 bude vnímáno jako jeden token, zatímco 381 jako dva (38 a 1). Tím se naruší vztahy mezi číslicemi a výpočet se zkomplikuje.

Statistický stroj, který tápe v číslech

Dalším důvodem matematických potíží ChatGPT je jeho statistická podstata. Chatbot se učí na základě obrovského množství příkladů a hledá v nich vzorce. Například se naučí, že fráze „Vážený pane" je často následována frází „obracíme se na Vás".

V matematice se však tento přístup setkává s problémy. ChatGPT sice dokáže odhadnout, že součin čísel končících na 2 bude končit na 4, ale s mezivýsledky si neporadí. Zjednodušeně řečeno, model ChatGPT se snaží uhádnout výsledek na základě naučených vzorců místo toho, aby provedl přesný výpočet.

Výzva jménem násobení

Studie provedená Yuntianem Dengem z University of Waterloo ukázala, že ChatGPT má problémy s násobením čísel větších než čtyři cifry. Důvodem je, že chyba v jakémkoli kroku výpočtu se projeví v konečném výsledku.

Představte si to jako dominový efekt – jedna chyba spustí řetězovou reakci a výsledek je úplně mimo. Existuje však naděje, že se ChatGPT v budoucnu zlepší. Deng a jeho kolegové testovali také model o1 od OpenAI, který se vyznačuje schopností logického uvažování.

Tento model dosáhl výrazně lepších výsledků než standardní GPT-4o a dokázal správně vyřešit i násobení devíticiferných čísel. Model o1 totiž přemýšlí nad problémem krok za krokem, což mu umožňuje dosáhnout přesnějších výsledků.

Hledáte rychlý a spolehlivý internet? Zadejte adresu a vyberte si.
Vyplňte adresu přípojky (ulice a č.p.):