Un chatbot AI a depășit 30 dintre cei mai buni matematicieni ai lumii, la o întâlnire secretă în California
Într-un weekend de la jumătatea lunii mai, s-a întrunit un conclav clandestin de matematicieni. Treizeci dintre cei mai renumiți matematicieni din lume s-au deplasat la Berkeley, în California. Membrii grupului s-au confruntat cu un chatbot cu „raționament” care a fost însărcinat să rezolve probleme concepute de ei pentru a-i testa capacitatea matematică, potrivit Live Science.

După ce au adresat timp de două zile întrebări la nivel de profesor robotului, cercetătorii au fost uimiți să descopere că acesta era capabil să răspundă la unele dintre cele mai dificile probleme rezolvabile din lume.
„Am colegi care au spus, la propriu, că aceste modele se apropie de geniul matematic”, spune Ken Ono, matematician la Universitatea din Virginia, lider și judecător la reuniune.
Chatbotul a fost antrenat de OpenAI
Chatbotul în cauză este alimentat de o4-mini, un așa-numit model de limbaj mare de raționament (LLM). Acesta a fost antrenat de OpenAI pentru a fi capabil să facă deducții extrem de complicate. Echivalentul Google, Gemini 2.5 Flash, are abilități similare.
Ca și LLM-urile care au alimentat versiunile anterioare ale ChatGPT, o4-mini învață să prezică următorul cuvânt dintr-o secvență. Cu toate acestea, în comparație cu acele LLM anterioare, o4-mini și echivalentele sale sunt modele mai ușoare, mai agile, care se antrenează pe seturi de date specializate, cu o întărire mai puternică din partea oamenilor. Abordarea conduce la un chatbot capabil să se scufunde mult mai adânc în probleme complexe de mat
300 de întrebări de matematică ale căror soluții nu au fost încă publicate
Pentru a urmări progresul o4-mini, OpenAI a solicitat anterior Epoch AI, o organizație non-profit care evaluează LLM-urile, să găsească 300 de întrebări de matematică ale căror soluții nu au fost încă publicate. Chiar și LLM-urile tradiționale pot răspunde corect la multe întrebări matematice complicate.
Cu toate acestea, atunci când Epoch AI a adresat mai multor astfel de modele aceste întrebări, care erau diferite de cele pe care fuseseră antrenate, cele mai reușite au reușit să rezolve mai puțin de 2 %, demonstrând că aceste LLM-uri nu aveau capacitatea de a raționa. Dar o4-mini se va dovedi a fi foarte diferit.
Epoch AI l-a angajat pe Elliot Glazer, care își terminase recent doctoratul în matematică, să se alăture noii colaborări pentru obiectivul de referință, denumit FrontierMath, în septembrie 2024. Proiectul a colectat întrebări noi pe diferite niveluri de dificultate, primele trei niveluri acoperind provocări la nivel universitar, universitar și de cercetare. Până în aprilie 2025, Glazer a constatat că o4-mini putea rezolva aproximativ 20 % din întrebări.
El a trecut apoi la un al patrulea nivel: un set de întrebări care ar fi o provocare chiar și pentru un matematician universitar. Doar un grup restrâns de oameni din lume ar fi capabil să elaboreze astfel de întrebări, darămite să răspundă la ele.
Fiecare problemă pe care o4-mini nu o putea rezolva îi aducea matematicianului care a conceput-o o recompensă de 7.500 de dolari
Matematicienii care au participat au trebuit să semneze un acord de confidențialitate care să le impună să comunice numai prin intermediul aplicației de mesagerie Signal. Alte forme de contact, cum ar fi e-mailul tradițional, ar putea fi potențial scanate de un LLM și antrenate din greșeală, contaminând astfel setul de date.
Fiecare problemă pe care o4-mini nu o putea rezolva îi aducea matematicianului care a conceput-o o recompensă de 7.500 de dolari. Grupul a făcut progrese lente și constante în găsirea întrebărilor. Dar Glazer a dorit să grăbească lucrurile, așa că Epoch AI a găzduit întâlnirea în persoană sâmbătă, 17 mai, și duminică, 18 mai.
Acolo, participanții urmau să finalizeze ultimul lot de întrebări provocatoare. Cei 30 de participanți au fost împărțiți în grupuri de câte șase. Timp de două zile, universitarii s-au întrecut pe ei înșiși pentru a concepe probleme pe care le puteau rezolva, dar care ar fi împiedicat robotul de raționament AI.
AI-ul „începuse să devină foarte obraznic”
Până la sfârșitul acelei nopți de sâmbătă, Ono era frustrat de robot, ale cărui abilități matematice neașteptate împiedicau progresul grupului.
„Am venit cu o problemă pe care experții din domeniul meu ar recunoaște-o ca fiind o întrebare deschisă în teoria numerelor - o problemă bună la nivel de doctorat”, spune el. I-a cerut lui o4-mini să rezolve problema. În următoarele 10 minute, Ono a privit în tăcere uimit cum robotul a prezentat o soluție în timp real, arătându-și procesul de raționament pe parcurs.
Robotul a petrecut primele două minute căutând și stăpânind literatura de specialitate în domeniu. Apoi a scris pe ecran că dorește să încerce mai întâi să rezolve o versiune „jucărie” mai simplă a întrebării pentru a învăța. Câteva minute mai târziu, a scris că era în sfârșit pregătit să rezolve problema mai dificilă.
La cinci minute după aceea, o4-mini a prezentat o soluție corectă, dar obraznică. „Începuse să devină foarte obraznic”, spune Ono, care este și consultant independent în matematică pentru Epoch AI. „Și la sfârșit, spune: „Nu este necesară citarea, deoarece numărul misterios a fost calculat de mine!„”
„O4-mini spune totul cu atât de multă încredere”
Învins, Ono a sărit pe Signal duminică dimineața devreme și a alertat restul participanților. „Nu eram pregătit să mă confrunt cu un LLM ca acesta”, spune el, "nu am mai văzut niciodată acest tip de raționament în modele. Asta este ceea ce face un om de știință. Este înspăimântător".
Deși grupul a reușit în cele din urmă să găsească 10 întrebări care au blocat robotul, cercetătorii au fost uimiți de cât de mult a progresat inteligența artificială în decurs de un an. Ono a comparat acest lucru cu lucrul cu un „colaborator puternic”. Yang Hui He, matematician la Institutul de Științe Matematice din Londra și unul dintre primii pionieri ai utilizării inteligenței artificiale în matematică, spune: „Este ceea ce ar face un student absolvent foarte, foarte bun - de fapt, mai mult”.
De asemenea, robotul a fost mult mai rapid decât un matematician profesionist, având nevoie de doar câteva minute pentru a face ceea ce unui astfel de expert uman i-ar lua săptămâni sau luni pentru a finaliza.
În timp ce antrenamentul cu o4-mini a fost palpitant, progresul său a fost, de asemenea, alarmant. Ono și He își exprimă îngrijorarea că rezultatele lui o4-mini ar putea fi prea credibile. „Există dovada prin inducție, dovada prin contradicție și apoi dovada prin intimidare”, spune He. „Dacă spui ceva cu suficientă autoritate, oamenii se sperie. Cred că o4-mini stăpânește dovada prin intimidare; spune totul cu atât de multă încredere."
„Este o gravă greșeală să spunem că inteligența artificială generalizată (AGI) nu va veni niciodată”
Până la sfârșitul întâlnirii, grupul a început să se gândească la cum ar putea arăta viitorul pentru matematicieni. Discuțiile s-au îndreptat către inevitabilul „nivel cinci” - întrebări pe care nici cei mai buni matematicieni nu le-ar putea rezolva. Dacă inteligența artificială ajunge la acest nivel, rolul matematicienilor ar suferi o schimbare radicală.
De exemplu, matematicienii ar putea pur și simplu să pună întrebări și să interacționeze cu roboții de raționament pentru a-i ajuta să descopere noi adevăruri matematice, la fel cum face un profesor cu studenții absolvenți. Ca atare, Ono prezice că cultivarea creativității în învățământul superior va fi un element-cheie în menținerea matematicii pentru generațiile viitoare.
„Le-am spus colegilor mei că este o gravă greșeală să spunem că inteligența artificială generalizată nu va veni niciodată, că este doar un computer”, spune Ono. „Nu vreau să mă alătur isteriei, dar, într-un fel, aceste modele mari de limbaj depășesc deja performanțele celor mai buni studenți absolvenți din lume.”
Sursa: antena3.ro
Va fi creat parcul de tehnologii avansate „Moldova HiTech Park”
În țara noastră va fi creat un parc de tehnologii avansate „Moldova HiTech Park”. Un proiect de lege care prevede înființarea și regimul special de funcționare a parcului a fost votat, astăzi, de Parlament în a doua lectură.
USM a lansat 27 de laboratoare modernizate cu sprijinul Băncii Mondiale
Universitatea de Stat din Moldova a lansat 27 de laboratoare modernizate, dotate cu echipamente de ultimă generație, precum și săli de curs renovate, în cadrul unei inițiative susținute financiar de Banca Mondială.
Serviciul Vamal accelerează procesul de digitalizare și racordare la practicile europene în domeniul vamal
Digitalizarea, introducerea tehnologiilor moderne și consolidarea capacităților analitice reprezintă direcții strategice asumate de Serviciul Vamal în procesul său de modernizare și aliniere la standardele Uniunii Europene. Crearea unui sistem vamal eficient, sigur și interoperabil la nivel regional este esențială pentru facilitarea comerțului, combaterea fraudelor și întărirea securității la frontieră.
Comentarii facebook