Когда-то казалось, что машины никогда не смогут думать, как мы. Но всё меняется — и куда быстрее, чем ожидали даже оптимисты.
Недавно Стэнфорд опубликовал AI Index Report 2025. И там есть одна штука, от которой хочется сесть и задуматься: в большинстве технических заданий ИИ теперь объективно лучше людей. Да, уже сейчас.
🧠 Что именно измеряли
Брали восемь серьёзных направлений:
▫️Классификация изображений
▫️Визуальное рассуждение
▫️Понимание текстов средней сложности
▫️Понимание английского языка
▫️Мультизадачное языковое понимание
▫️Математика уровня соревнований
▫️Ответы на вопросы уровня PhD по естественным наукам
▫️Мультимодальное понимание (когда нужно работать с текстами, картинками и схемами одновременно)
Для оценки использовали специальные бенчмарки — стандартизированные тесты, которые проверяют, насколько хорошо ИИ справляется с задачами.
⚡ Где ИИ уже впереди
Сегодня топовые модели вроде ChatGPT и Gemini уверенно обходят среднестатистического человека почти везде.
Даже в математике уровня чемпионатов и в сложных научных тестах: теперь искусственный интеллект решает задачи не хуже выпускников престижных университетов.
🚀 Где ещё держимся
Только мультимодальное понимание пока остаётся за человеком. Обработать одновременно текст, картинку, график и сделать верные выводы — это пока трудная задача для ИИ.
Но отставание стремительно сокращается. Модель o1 от OpenAI в 2024 году набрала в мультимодальном тесте MMMU 78,2%, а человек — 82,6%. Разрыв — всего 4,4 процентных пункта!
Для сравнения: в конце 2023 года Google Gemini показывал на том же тесте всего 59,4%.
И о важном: у модели o1 один из самых низких уровней «галлюцинаций» — то есть она меньше других моделей фантазирует там, где не уверена в ответе.
🎯 Что это значит для нас
Искусственный интеллект становится не просто помощником, а полноценным игроком в сложных задачах. Причём в задачах, которые вчера казались «слишком человеческими».
Очень скоро конкурировать с ИИ в технических специальностях станет так же тяжело, как сегодня гоняться за компьютером в счёте или памяти.
Как думаете, через сколько лет ИИ догонит людей в понимании сложных мультимодальных задач — или это останется нашим последним бастионом?
Пишите своё мнение в комментариях и обязательно ставьте лайки!
