G

GPT‑5.4 mini and nano

Флагманская модель OpenAI с нативным управлением компьютером и контекстом до 1 млн токенов

🎁 Free Trial
G

Доступен в РФ

Доступ к сайту: Свободный
Оплата: Только зарубежные карты

GPT-5.4 от OpenAI — флагманская модель для профессиональной работы

5 марта 2026 года OpenAI выпустила GPT-5.4 — очередное поколение своей флагманской модели, которое стало доступно в ChatGPT (под названием GPT-5.4 Thinking), API и Codex. Компания позиционирует релиз как самую способную и эффективную модель для профессиональных задач, объединившую прорывы в рассуждении, программировании и агентных рабочих процессах.

Параллельно выпущена версия GPT-5.4 Pro для пользователей, которым нужна максимальная производительность на сложных задачах. Также для корпоративных клиентов запущен аддон ChatGPT for Excel.

Ключевые нововведения

  • Нативные возможности управления компьютером — первая универсальная модель OpenAI, способная напрямую управлять компьютером через скриншоты и команды мыши/клавиатуры
  • Контекст до 1 млн токенов — агенты могут планировать и выполнять задачи с горизонтом в тысячи действий
  • Tool Search — интеллектуальный поиск инструментов в больших экосистемах без перегрузки контекста
  • Улучшенная работа с документами — создание и редактирование таблиц, презентаций и документов на профессиональном уровне
  • Снижение галлюцинаций на 33% — модель на 18% реже содержит любые ошибки в ответах по сравнению с GPT-5.2
  • Повышенная токеновая эффективность — значительно меньше токенов на решение задач при одновременном увеличении скорости

Производительность на бенчмарках

OpenAI представила внушительные результаты тестирования:

  • GDPval (знания для 44 профессий): 83.0% побед или ничьих против экспертов (против 70.9% у GPT-5.2)
  • SWE-Bench Pro (программирование): 57.7% (улучшение с 55.6%)
  • OSWorld-Verified (управление рабочим столом): 75.0% — превышение человеческого уровня (72.4%) и рост с 47.3%
  • Toolathlon (использование инструментов): 54.6% (с 46.3%)
  • BrowseComp (веб-исследования): 82.7% (с 65.8%)

Возможности для разработчиков

Модель отлично справляется с комплексными фронтенд-задачами, создавая более эстетичные и функциональные результаты. Экспериментальный навык Codex «Playwright Interactive» позволяет визуально отлаживать веб-приложения и автоматически тестировать сборки прямо в процессе разработки.

Режим /fast в Codex обеспечивает до 1.5x ускорения генерации токенов без потери качества. В API доступен приоритетный процессинг для аналогичных скоростей.

Работа с визуальными данными

GPT-5.4 получил новый уровень детализации изображений «original» с поддержкой до 10.24 мегапикселей или 6000 пикселей по максимальному измерению. Улучшенное визуальное восприятие отразилось на точности парсинга документов и локализации элементов интерфейса.

Отзывы индустрии

Компании Mercor, Harvey, Cursor, Mainstay и другие подтвердили значительные улучшения. Harvey отметила 91% на внутреннем бенчмарке для юридической работы. Mainstay зафиксировала 95% успешных попыток на порталы HOA и налоговые системы — против 73-79% у предыдущих моделей.

Доступность

GPT-5.4 Thinking доступен в ChatGPT для пользователей платных тарифов. Pro-версия требует отдельной подписки. В API модель доступна по стандартным ценам токенов с дополнительной оплатой за priority processing.

Скриншоты интерфейса

Плюсы

  • Первая модель с нативным управлением компьютером — прорыв для автоматизации /n Контекст 1 млн токенов для сверхдлинных задач и агентных процессов /n На 33% меньше галлюцинаций по сравнению с GPT-5.2 /n Превышение человеческого уровня на бенчмарке OSWorld-Verified (75% vs 72.4%) /n Tool Search для эффективной работы с большими экосистемами инструментов /n Профессиональный уровень работы с таблицами, презентациями и документами /n Совместимость с API и Codex для разработчиков

Минусы

  • Доступен только в платных тарифах ChatGPT и API /n Заблокирован в России — требуется VPN для регистрации и использования /n Оплата только иностранными картами — высокая сложность для российских пользователей /n GPT-5.4 Pro стоит значительно дороже базовой версии /n SWE-Bench Pro результат (57.7%) показывает, что идеального кодирования ещё нет /n Требует глубокого понимания промпт-инженерии для раскрытия потенциала

Похожие нейросети

Официальный сайт

Перейти на сайт ↗

Характеристики

Язык
Английский
Free Trial
Есть
VPN
Не требуется

Мы используем файлы cookie для улучшения работы сайта Neirostack.ru. Продолжая пользоваться сайтом, вы соглашаетесь с нашей Политикой конфиденциальности и Политикой cookie.