Математики в шоке: ИИ справился с докторской задачей по теории чисел

В середине мая в Беркли прошла закрытая встреча тридцати ведущих математиков мира, которые поставили перед собой амбициозную цель — проверить интеллектуальные пределы новой языковой модели o4-mini от OpenAI. Результаты эксперимента оказались неожиданными даже для самых опытных участников: искусственный интеллект продемонстрировал уровень, сравнимый с докторской подготовкой.

Инициатором эксперимента стала некоммерческая организация Epoch AI, занимающаяся мониторингом прогресса ИИ. Для испытания была подготовлена выборка из 300 оригинальных математических задач — от олимпиадных до исследовательских уровней.

Предыдущие модели ИИ решали менее 2% таких задач. o4-mini справилась почти с 20% — десятикратный рост точности. Финальным испытанием стало состязание: участники предложили 10 максимально сложных задач, пообещав $7500 за каждую нерешённую моделью.

Кульминацией эксперимента стал эпизод с участием Кена Оно, профессора Университета Вирджинии. Он дал модели открытую научную проблему из теории чисел, аналогичную тем, что встречаются в диссертациях.

За 10 минут модель:

изучила соответствующие публикации,
упростила задачу,
предложила оригинальное, корректное решение,
отметила, что не использовала внешние источники.

Это повергло участников в шок: ИИ начал действовать как самостоятельный исследователь, а не просто алгоритм.

Хотя десять задач всё же остались нерешёнными, эксперты сравнили работу с o4-mini с взаимодействием с гениальным аспирантом, который опережает своих наставников.

Однако возник и серьёзный риск: ИИ выдаёт рассуждения с такой уверенностью, что даже опытные математики рискуют поверить в ошибку, не подвергнув её проверке. Это явление прозвали: "доказательством через устрашение" — когда убедительная форма текста заставляет принять его за истину.

Подписывайтесь на Moneytimes.Ru

Математики в шоке: ИИ справился с докторской задачей по теории чисел

Читайте также

Новости