Отчет OpenAI: новые модели нейросетей чаще искажают факты и "бредят"

Отчет OpenAI: новые модели нейросетей чаще искажают факты и "бредят"

Согласно отчетам OpenAI, новые, более продвинутые модели нейросетей искажают факты значительно чаще, чем их предшественники. К примеру, o3 и o4-mini генерируют больше “бреда”, чем более быстрые, основанные на поиске информации модели o1 и GPT-4o.

Модели оценивались с использованием теста PersonQA, проверяющим точность фактов, сообщает Ynet. Модель O3 “фантазировала” в 33% своих ответов, а более продвинутая O4-mini показала еще худшие результаты — она искажала информацию в 48% случаев. В это же время модель О1 ошибалась лишь в 16% случаев. 

Прошлые исследования OpenAI показывали, что нейросети пытаются избежать штрафов, ищут незаслуженные вознаграждения и даже заметают следы.

Надав Коэн, исследователь в области компьютерных наук в Тель-Авивском университете, заявил, что искусственный интеллект еще рано использовать в медицине или производстве. 

“Достижение интеллекта человеческого уровня требует прорывов, на которые уйдут годы. Я не думаю, что мы близки к этому”, — добавил он.

 

ПОДЕЛИТЬСЯ
ВСЕ ПО ТЕМЕ
КОММЕНТАРИИ
НОВОСТИ ПАРТНЕРОВ
ЗНАКОМСТВА
МЫ НА FACEBOOK