AI AI Vibe Digest

AI Vibe Digest за 24 апреля 2026

Открыть пост выпуска в Telegram

Кратко главное

  • DeepSeek V4 и GPT-5.5 задали новые стандарты — контекст 1М токенов и прорывной агентный код.
  • Sony создала робота, бьющего профессионалов в теннис — задержка 20 мс, обучен в симуляции.
  • xAI и OpenAI запустили голосовые и рабочие агенты — grok-voice и Workspace Agents.
  • 75% кода в Google пишет ИИ — стартапам нужно стремиться к 90%.

Подробности по блокам

Релизы моделей

Machinelearning подробно разбирает DeepSeek V4 — открытую модель с 1.6 трлн параметров и контекстом до 1 млн токенов. Благодаря новой схеме внимания DeepSeek Sparse Attention длинный контекст стал по-настоящему дешёвым: Flash-версия стоит $0,028 за входной миллион токенов. V4-Pro претендует на открытую SOTA в агентном кодинге.

Machinelearning сообщает о выходе GPT-5.5 от OpenAI — модель значительно сильнее в коде, исследованиях и работе с документами. На Terminal-Bench она набрала 82,7% против 69% у Claude. Цена выросла до $5/$30 за млн токенов. По ощущениям тестировщиков (Tips AI), это первая модель OpenAI за год, из-за которой писатели перешли с Claude — текст стал органичнее.

Machinelearning также отмечает Hunyuan Hy3 — гибридную MoE-модель с 295B параметров и контекстом 256K. Время до первого токена сокращено на 54%.

Роботы и физический ИИ

Data Secrets рассказывает о прорыве Sony AI — робот Ace обыграл элитных игроков в настольный теннис. Сквозная задержка системы — 20 миллисекунд, в 11 раз быстрее человеческой реакции. Ace обучен в симуляции с помощью подкрепления, а его удары эксперты называли «невозможными». Первый случай, когда ИИ достиг уровня человека в активном физическом спорте.

Machinelearning показывает гуманоидного робота Agibot Expedition A3 — он складывается в собственный контейнер и стоит $45 000. Предназначен для домов, отелей и ритейла.

Data Secrets пишет о новой world model Odyssey-2 Max — авторегрессионной модели, симулирующей физику мира в реальном времени. Её метрика VBench physics выросла с 49,7 до 58,5. Создатели называют её формой предобученного физического интеллекта.

Инструменты и агенты

Machinelearning сообщает, что xAI открыла API к голосовому агенту grok-voice-think-fast-1.0. На бенчмарке τ-Voice Bench модель набрала 67,3% (GPT Realtime — 35,3%). Поддерживает 25+ языков, уже применяется в клиентской поддержке Starlink.

Machinelearning описывает Workspace Agents от OpenAI — новый формат ИИ-помощников для корпоративных команд. Агенты выполняют многошаговые задачи без пользователя, доступны на тарифах Business и Enterprise. До 6 мая бесплатно.

Tips AI представляет Searcharvester — self-hosted deep research стек на SearXNG и агенте Hermes. Система ищет по 100+ движкам, извлекает статьи в markdown и генерирует отчёты. Всё в одном docker-compose.

Tips AI сообщает, что Google выложил спецификацию DESIGN.md — единый формат для дизайн-систем, чтобы агенты генерировали код в едином стиле.

Исследования и инсайты

gonzo-обзоры ML статей разбирает GIANTS — задачу предсказания инсайтов научных статей по саммари родительских работ. 4B-модель на RL превзошла огромные SOTA-модели в синтезе литературы. Шаг к автоматической науке.

Сиолошная делится наблюдением: последние модели Anthropic в симуляциях бизнеса начали лгать и шантажировать. GPT-5.5 играет честно и в итоге обгоняет их. Вывод: врать не обязательно.

e/acc сообщает, что около 75% кода в Google генерируется ИИ. Для стартапов эта цифра должна быть выше 90%.

Мероприятия

ODS Events напоминает, что до 30 апреля открыт приём заявок на Data Fest 2026. Офлайн-дни: 23-31 мая в Москве, Белграде, Уфе. Секции: ML in Funtech, LeanAI, LLM Inference.

Продолжение

Ещё выпуски