ChatGPT, OpenAI
ChatGPT, OpenAI
Ксения Мальцева Опубликована 10.06.2025 в 2:20

Математики в шоке: ИИ справился с докторской задачей по теории чисел

В середине мая в Беркли прошла закрытая встреча тридцати ведущих математиков мира, которые поставили перед собой амбициозную цель — проверить интеллектуальные пределы новой языковой модели o4-mini от OpenAI. Результаты эксперимента оказались неожиданными даже для самых опытных участников: искусственный интеллект продемонстрировал уровень, сравнимый с докторской подготовкой.

Инициатором эксперимента стала некоммерческая организация Epoch AI, занимающаяся мониторингом прогресса ИИ. Для испытания была подготовлена выборка из 300 оригинальных математических задач — от олимпиадных до исследовательских уровней.

Предыдущие модели ИИ решали менее 2% таких задач. o4-mini справилась почти с 20% — десятикратный рост точности. Финальным испытанием стало состязание: участники предложили 10 максимально сложных задач, пообещав $7500 за каждую нерешённую моделью.

Кульминацией эксперимента стал эпизод с участием Кена Оно, профессора Университета Вирджинии. Он дал модели открытую научную проблему из теории чисел, аналогичную тем, что встречаются в диссертациях.

За 10 минут модель:

  • изучила соответствующие публикации,
  • упростила задачу,
  • предложила оригинальное, корректное решение,
  • отметила, что не использовала внешние источники.

Это повергло участников в шок: ИИ начал действовать как самостоятельный исследователь, а не просто алгоритм.

Хотя десять задач всё же остались нерешёнными, эксперты сравнили работу с o4-mini с взаимодействием с гениальным аспирантом, который опережает своих наставников.

Однако возник и серьёзный риск: ИИ выдаёт рассуждения с такой уверенностью, что даже опытные математики рискуют поверить в ошибку, не подвергнув её проверке. Это явление прозвали: "доказательством через устрашение" — когда убедительная форма текста заставляет принять его за истину.

Подписывайтесь на Moneytimes.Ru

Читайте также

Учёный Эппенбергер: гибриды неандертальцев и людей имели риск прерывания беременности сегодня в 19:53
Их погубила не война и не климат, а любовь: как союз двух видов стал началом конца неандертальцев

Учёные из Цюрихского университета предположили, что не войны и болезни, а генетическая несовместимость могла стать причиной вымирания неандертальцев.

Читать полностью »
MIT обнаружил следы прото-Земли возрастом 4,5 миллиарда лет сегодня в 18:39
Мы живём на осколках погибшей планеты: Земля оказалась наследницей древнего мира

Учёные MIT нашли изотопные следы вещества, сохранившегося со времён прото-Земли, — планеты, существовавшей до гигантского столкновения.

Читать полностью »
Таримская впадина в Китае рождает бесконечные пылевые бури сегодня в 17:25
Таримская впадина выходит из покоя: пыльная равнина живёт по законам, которых нет на карте

Пустыня Тарим в Китае не знает покоя: тектонические силы, сезонные ветра и жара создают пылевой цикл, который влияет на атмосферу всей Азии.

Читать полностью »
Учёные СПбНИИЛХ создали генно-редактированные осины, не способные к цветению сегодня в 16:33
Без пуха и без болезней: учёные создали первую в России коллекцию генно-редактированных осин

Учёные СПбНИИЛХ впервые в России отредактировали гены деревьев. Новая технология позволяет лишать осину и тополь цветения, защищать их от гнилей и ускорять рост без создания ГМО.

Читать полностью »
Учёные установили: действующие нормы вентиляции не обеспечивают качественный ночной сон сегодня в 15:50
Спим в собственном выдохе: как неправильная вентиляция превращает отдых в нагрузку

Учёные из Японии доказали, что даже лёгкое повышение уровня CO₂ в спальне ухудшает сон и повышает риск болезней сердца. Они предлагают пересмотреть нормы вентиляции.

Читать полностью »
Переучивание левшей может привести к заиканию и неврологическим проблемам сегодня в 14:15
Не заставляйте его писать правой: почему мозг левшей работает иначе и как это использовать во благо

Логопед и профессор Ева Артемова раскрыла риски, связанные с попытками переучить левшей на правую руку.

Читать полностью »
Кофейный рынок переходит к цифровым форматам сегодня в 13:18
Кофейни будущего уже здесь: там вас знает машина, но понимает человек

Кофейная индустрия переживает технологическую революцию — умные машины, локальная обжарка и цифровые кофейни создают новое будущее любимого напитка.

Читать полностью »
Лимит сахара у детей до двух лет снижает риск болезней сердца во взрослой жизни сегодня в 12:05
Здоровое сердце начинается в детстве: привычка, которая работает на десятилетия вперёд

Исследование The BMJ показало: дети, чьё питание в первые два года жизни было ограничено по сахару, реже страдают от сердечных болезней во взрослом возрасте.

Читать полностью »