Поддержать команду Зеркала
Беларусы на войне
  1. Из-за украинского контрнаступления Россия стоит перед дилеммой — вот о чем речь
  2. Минчанка забронировала столик в престижном ресторане на 8 марта. В преддверии праздника ее попросили внести депозит — 800 рублей
  3. «Мы с адвокатом сидели в кабинете и все слышали». Экс-сотрудник Betera пришел судиться с бывшим работодателем, а тот устроил кол-центр
  4. В Могилеве и окрестностях — вспышка очень заразного вируса, особенно опасного для некоторых людей
  5. «Ни фига себе». В TikTok рассказали о курьезном случае по «тунеядству»: в истории — попадание в базу «иждивенцев» и звонки из милиции
  6. 8 марта в Дзержинской ЦРБ умерли роженица и ребенок
  7. Кто те девушки, которые «случайно» оказались в Mak.by во время визита Лукашенко? Узнали
  8. Влюбленная пара отправилась в поход по местам съемок «Властелина колец». Они не подозревали, что это закончится кошмаром
  9. Лукашенко предложил открыть заведения этой сети ресторанов в районных центрах
  10. Сын пропагандистки поступил в Москву — в Беларуси его считают уклонистом. Мать обратилась к Лукашенко
  11. Доллар стремительно дорожает: что будет с курсами в середине марта? Прогноз по валютам
  12. Беларусский акционист разослал по российским школам брошюры в стиле нацистской Германии с лицами пропагандистов — как отреагировали
  13. ГосСМИ Ирана назвали нового верховного лидера страны
  14. «Мне даже обидно». Лукашенко задался вопросом, зачем «создавал ПВТ, продвигал айтишников», и вспомнил 2020 год


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.