AI AI Vibe Digest

AI Vibe Digest за 6 мая 2026

Открыть пост выпуска в Telegram

Кратко главное

  • GPT-5.5 Instant стал человечнее — модель отвечает короче, теплее и запоминает контекст.
  • SAP запретил сторонние ИИ-агенты — open-source инструменты отключены ради безопасности и продажи своего Joule.
  • Figure выпускает роботов каждый час — 350 гуманоидов уже сошли с конвейера, обучение теперь идёт прямо с камер.
  • ProgramBench обнулил все модели — ни одна LLM не воспроизвела программу по бинарному файлу.
  • Claude и Perplexity заходят в финансы — готовые агенты под KYC, сделки и анализ без сборки с нуля.

Подробности по блокам

Модели и инструменты

Machinelearning рассказывает о релизе GPT-5.5 Instant — модель стала умнее и научилась давать короткие, человечные ответы без лишней воды. Тон сделали теплее, а память лучше подстраивается под стиль общения. Обновление раскатывают на всех пользователей, в API модель доступна как gpt-5.5-chat-latest.

По информации Tips AI, OpenAI также выпустила расширение ChatGPT для Excel и Google Sheets. Теперь можно создавать таблицы по описанию, объяснять формулы и чистить данные прямо в интерфейсе, не выходя из редактора.

Корпоративные ограничения

Machinelearning сообщает, что SAP заблокировал использование open-source ИИ-агентов для извлечения данных из своих корпоративных систем. Легально подключаться разрешено только решениям Microsoft, Google, Amazon и IBM. Компания ссылается на защиту интеллектуальной собственности, но рынок видит здесь попытку продвинуть собственного ассистента Joule и сохранить лицензионную модель.

Роботы

Machinelearning описывает переход Figure к серийной сборке гуманоида третьего поколения. Уже выпущено более 350 машин, темп вырос до 1 робота в час. Вместе с этим обновлена управляющая модель Helix System 0: теперь картинка с камер напрямую преобразуется в 3D-сцену и подаётся в политику движений без дополнительной настройки на реальном железе. Чем больше роботов в работе, тем быстрее они учатся.

Бенчмарки и кодинг

Data Secrets представляет ProgramBench — бенчмарк от создателей SWE-bench. Агент получает скомпилированный бинарник и документацию, а должен воспроизвести исходный код так, чтобы пройти тесты на 100%. В первом раунде все модели, включая GPT-5.4 и Claude Opus 4.7, показали ровно 0% решённых задач.

Сиолошная указывает, что авторы замеряли модели в своём минималистичном агенте, а в нативных средах вроде Codex результаты были бы выше — отдельные задачи решались на 90–100%. Тем не менее бенчмарк станет главной мишенью на ближайший год.

AI для финансистов

Machinelearning описывает готовые шаблоны Claude для финансов: сбор pitch book, проверка KYC, закрытие месяца и другие сценарии упакованы в плагины со скиллами и коннекторами. Больше не нужно конструировать агента вручную — достаточно выбрать нужный воркфлоу.

Machinelearning также пишет о запуске Perplexity Computer for Professional Finance — альтернативе классическим терминалам с подключением баз Morningstar и PitchBook, скринерами и интеграцией в Excel. Доступно подписчикам Pro и Max.

Инсайд: как компании становятся AI-native

e/acc приводит шесть стадий внедрения AI: от пустых разговоров CEO до кибернетической организации, где агенты сами выдвигают гипотезы и проверяют их. Большинство компаний сегодня застряло на этапе 1-2, когда люди вручную скармливают контекст чат-ботам. Перепрыгнуть нельзя — сначала нужно пройти персональные инструменты, затем командные пространства и только потом строить общую инфраструктуру.

Продолжение

Ещё выпуски