
Математики в шоке: ИИ справился с докторской задачей по теории чисел
В середине мая в Беркли прошла закрытая встреча тридцати ведущих математиков мира, которые поставили перед собой амбициозную цель — проверить интеллектуальные пределы новой языковой модели o4-mini от OpenAI. Результаты эксперимента оказались неожиданными даже для самых опытных участников: искусственный интеллект продемонстрировал уровень, сравнимый с докторской подготовкой.
Инициатором эксперимента стала некоммерческая организация Epoch AI, занимающаяся мониторингом прогресса ИИ. Для испытания была подготовлена выборка из 300 оригинальных математических задач — от олимпиадных до исследовательских уровней.
Предыдущие модели ИИ решали менее 2% таких задач. o4-mini справилась почти с 20% — десятикратный рост точности. Финальным испытанием стало состязание: участники предложили 10 максимально сложных задач, пообещав $7500 за каждую нерешённую моделью.
Кульминацией эксперимента стал эпизод с участием Кена Оно, профессора Университета Вирджинии. Он дал модели открытую научную проблему из теории чисел, аналогичную тем, что встречаются в диссертациях.
За 10 минут модель:
- изучила соответствующие публикации,
- упростила задачу,
- предложила оригинальное, корректное решение,
- отметила, что не использовала внешние источники.
Это повергло участников в шок: ИИ начал действовать как самостоятельный исследователь, а не просто алгоритм.
Хотя десять задач всё же остались нерешёнными, эксперты сравнили работу с o4-mini с взаимодействием с гениальным аспирантом, который опережает своих наставников.
Однако возник и серьёзный риск: ИИ выдаёт рассуждения с такой уверенностью, что даже опытные математики рискуют поверить в ошибку, не подвергнув её проверке. Это явление прозвали: "доказательством через устрашение" — когда убедительная форма текста заставляет принять его за истину.
Подписывайтесь на Moneytimes.Ru