ChatGPT, OpenAI
ChatGPT, OpenAI
Ксения Мальцева Опубликована сегодня в 2:20

Математики в шоке: ИИ справился с докторской задачей по теории чисел

В середине мая в Беркли прошла закрытая встреча тридцати ведущих математиков мира, которые поставили перед собой амбициозную цель — проверить интеллектуальные пределы новой языковой модели o4-mini от OpenAI. Результаты эксперимента оказались неожиданными даже для самых опытных участников: искусственный интеллект продемонстрировал уровень, сравнимый с докторской подготовкой.

Инициатором эксперимента стала некоммерческая организация Epoch AI, занимающаяся мониторингом прогресса ИИ. Для испытания была подготовлена выборка из 300 оригинальных математических задач — от олимпиадных до исследовательских уровней.

Предыдущие модели ИИ решали менее 2% таких задач. o4-mini справилась почти с 20% — десятикратный рост точности. Финальным испытанием стало состязание: участники предложили 10 максимально сложных задач, пообещав $7500 за каждую нерешённую моделью.

Кульминацией эксперимента стал эпизод с участием Кена Оно, профессора Университета Вирджинии. Он дал модели открытую научную проблему из теории чисел, аналогичную тем, что встречаются в диссертациях.

За 10 минут модель:

  • изучила соответствующие публикации,
  • упростила задачу,
  • предложила оригинальное, корректное решение,
  • отметила, что не использовала внешние источники.

Это повергло участников в шок: ИИ начал действовать как самостоятельный исследователь, а не просто алгоритм.

Хотя десять задач всё же остались нерешёнными, эксперты сравнили работу с o4-mini с взаимодействием с гениальным аспирантом, который опережает своих наставников.

Однако возник и серьёзный риск: ИИ выдаёт рассуждения с такой уверенностью, что даже опытные математики рискуют поверить в ошибку, не подвергнув её проверке. Это явление прозвали: "доказательством через устрашение" — когда убедительная форма текста заставляет принять его за истину.

Подписывайтесь на Moneytimes.Ru

Читайте также

Угрозы закисления океанов: как стремительное изменение химии воды может разрушить жизнь на планете сегодня в 7:13

Ускоренное закисление Мирового океана угрожает морским экосистемам и благополучию человечества, требуя срочных мер по сокращению выбросов углекислого газа.

Читать полностью »
Уникальная радиотерапия с тербием-161 обещает революцию в лечении лимфомы сегодня в 7:11

Швейцарские учёные создали метод радиотерапии с тербием-161, который может кардинально повысить эффективность лечения лимфомы и снизить побочные эффекты.

Читать полностью »
Антибиотики у новорожденных могут навсегда ослабить иммунитет — ученые нашли способ восстановления сегодня в 6:03

Ученые выяснили, что антибиотики у новорожденных нарушают развитие иммунитета, снижая защиту от инфекций, но добавка инозина помогает восстановить иммунный ответ.

Читать полностью »
Как искусственный интеллект на рабочих местах усиливает дискриминацию — тревожный отчет профессора сегодня в 6:02

Отчет профессора Лины Денчик выявил, что использование искусственного интеллекта на рабочих местах усиливает дискриминацию пожилых, молодых, женщин, этнических меньшинств и инвалидов, угрожая социальному равенству. Профсоюзы требуют контроля и консультаций при внедрении ИИ.

Читать полностью »
Ученые нашли простой способ сбросить вес: порядок еды важнее калорийности сегодня в 5:58

Ученые доказали, что правильный порядок приема пищи помогает снизить скачки сахара в крови, улучшая чувство насыщения и ускоряя похудение.

Читать полностью »
Учёные создали растворимую пробиотическую батарею — революция в биоэлектронике сегодня в 5:57

Учёные разработали биоразлагаемую батарею на основе пробиотиков, которая вырабатывает электричество более 100 минут и полностью растворяется, не нанося вреда окружающей среде.

Читать полностью »
Китай отключил ключевые функции ИИ во время экзаменов гаокао — почему это важно сегодня в 5:56

Китайские технологические компании временно отключили функции ИИ для предотвращения мошенничества на вступительных экзаменах гаокао, усилив меры безопасности и сохранив честность тестирования.

Читать полностью »
Антарктида трещит по швам: экологи требуют запрета якорных стоянок сегодня в 5:51

Туризм находится под серьёзным ударом: круизные лайнеры разрушают дно Антарктики, а восстановление может занять столетия.

Читать полностью »

Новости

Туристический потенциал Хабаровского края будет представлен на международном форуме

Кошелёк начнёт радовать: в эти дни Венера переворачивает финансовую удачу

Приём с грунтом — и баклажаны снова пышут зеленью: секрет спасения при пожелтении листьев

ANS: учёные назвали фасоль оптимальным способом для борьбы с диабетом

Ноги не дают уснуть? Это не случайно — в теле запускается скрытый процесс восстановления

Рубль дешевеет, а вы платите больше: как это устроено на самом деле

Ученые установили рекорд, удержав плазму при 30 миллионах градусов целых 43 секунды

Российские и французские ученые научились редактировать митохондриальную ДНК и открывают путь к лечению редких болезней

// Яндекс.Метрика (function(m,e,t,r,i,k,a){ m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)}; m[i].l=1*new Date(); for (var j = 0; j < document.scripts.length; j++) { if (document.scripts[j].src === r) return; } k=e.createElement(t),a=e.getElementsByTagName(t)[0]; k.async=1;k.src=r;k.setAttribute('crossorigin','anonymous'); a.parentNode.insertBefore(k,a) })(window, document, "script", "https://mc.yandex.ru/metrika/tag.js", "ym"); ym(96824905, "init", { clickmap: true, trackLinks: true, accurateTrackBounce: true }); // LiveInternet new Image().src = "https://counter.yadro.ru/hit;pravdaru?r" + escape(document.referrer) + ((typeof(screen)=="undefined")?"":";s"+screen.width+"*"+screen.height+"*"+ (screen.colorDepth?screen.colorDepth:screen.pixelDepth)) + ";u" + escape(document.URL) + ";h" + escape(document.title.substring(0,150)) + ";" + Math.random(); // Top.Mail.ru var _tmr = window._tmr || (window._tmr = []); _tmr.push({id: "1117417", type: "pageView", start: (new Date()).getTime()}); var ts = document.createElement("script"); ts.type = "text/javascript"; ts.async = true; ts.src = "https://top-fwz1.mail.ru/js/code.js"; var f = document.getElementsByTagName("script")[0]; f.parentNode.insertBefore(ts, f); // Google Analytics