22.04.2025 15:26 Аркадий Бочаровский

Отчет OpenAI: новые модели нейросетей чаще искажают факты и "бредят"

Согласно отчетам OpenAI, новые, более продвинутые модели нейросетей искажают факты значительно чаще, чем их предшественники. К примеру, o3 и o4-mini генерируют больше “бреда”, чем более быстрые, основанные на поиске информации модели o1 и GPT-4o.

Модели оценивались с использованием теста PersonQA, проверяющим точность фактов, сообщает Ynet. Модель O3 “фантазировала” в 33% своих ответов, а более продвинутая O4-mini показала еще худшие результаты — она искажала информацию в 48% случаев. В это же время модель О1 ошибалась лишь в 16% случаев.

Прошлые исследования OpenAI показывали, что нейросети пытаются избежать штрафов, ищут незаслуженные вознаграждения и даже заметают следы.

Надав Коэн, исследователь в области компьютерных наук в Тель-Авивском университете, заявил, что искусственный интеллект еще рано использовать в медицине или производстве.

“Достижение интеллекта человеческого уровня требует прорывов, на которые уйдут годы. Я не думаю, что мы близки к этому”, — добавил он.

Отчет OpenAI: новые модели нейросетей чаще искажают факты и "бредят"

ПОДЕЛИТЬСЯ

ВСЕ ПО ТЕМЕ

КОММЕНТАРИИ

ВСЕ за 24 часа

Лента новостей

НОВОСТИ ПАРТНЕРОВ

ЗНАКОМСТВА

МЫ НА FACEBOOK

Опросы