AI AI Vibe Digest

AI Vibe Digest за 5 июня 2026

Открыть пост выпуска в Telegram

Кратко главное

  • Сбер показал первый в России оптический чип для ИИ — фотонный вычислитель ускоряет матричные операции и снижает энергопотребление.
  • DeepSeek привлекает $7,4 млрд инвестиций — китайский стартап впервые открывается внешнему капиталу при оценке до $59 млрд.
  • Microsoft встаёт на путь независимой frontier-лаборатории — компания выпустила 7 новых моделей и раскрыла детали архитектуры в техническом отчёте на 109 страниц.
  • Доказана линейная идентифицируемость мира внутри JEPA — латенты модели восстанавливают истинные переменные среды с точностью до поворота, что упрощает планирование.
  • Память ИИ-агентов деградирует при каждом обновлении — постоянные пересказы опыта ухудшают способность решать новые задачи почти вдвое.

Подробности по блокам

Кремниевая фотоника

Сергей Марков рассказывает об универсальном оптическом вычислителе Сбера — устройство заменяет самую энергоёмкую часть расчётов (умножение матриц) работой света, тратя на 30% меньше энергии электронных аналогов. Архитектуру чипа полностью разработали исследователи компании, а производство фотоники локализуется проще, чем электроники — это шаг к технологической независимости.

Инвестиции и рынок

Machinelearning пишет, что DeepSeek впервые привлекает внешние инвестиции — около $7,4 млрд при оценке в $52–59 млрд от Tencent, CATL и госфонда КНР. Сумма выглядит скромно на фоне раундов Anthropic и OpenAI, но подтверждает тренд: помимо капитала, компания активно осваивает рынок.

Анализ данных замечает, что DeepSeek занял первое место в списке быстрорастущих вендоров по данным Ramp — компании реально платят за более дешёвые альтернативы OpenAI и Anthropic. Причина проста: когда агентные задачи увеличивают число вызовов модели в десятки раз, цена токена становится критичной статьёй бюджета.

Модели и архитектуры

Data Secrets разбирает анонс семи новых моделей Microsoft, где главная — MAI-Thinking-1 на 35B активных параметров, набирающая 97% на AIME 2025 без дистилляции и синтетических данных на этапе претрейна. Аналитики подчёркивают, что компания больше не воспринимает себя как партнёра OpenAI и открыто описывает инфраструктуру, RL-обучение и данные — это один из самых содержательных техрепортов.

Machinelearning освещает релиз Gemma 4 12B от Google — мультимодальная модель понимает текст, изображения и аудио без отдельных энкодеров, работая локально на 16 ГБ ОЗУ с результатами моделей класса 26B и лицензией Apache 2.0. Новый Ideogram 4.0 получил нативное 2K-разрешение, прозрачный фон и работу с bounding boxes, заняв первое место среди открытых решений на DesignArena; API стоит от $0.03 за генерацию.

Tips AI делится впечатлениями от Reve 2.0 — генератор изображений на Large Layout модели представляет картинку как иерархию слоёв со своими промтами, позволяя двигать и точечно изменять элементы, не разрушая остальное. Модель заняла второе место на арене text-to-image, уступая по тексту флагманам от OpenAI и Google, но даёт 20 бесплатных генераций в день.

Исследования и инсайды

gonzo-обзоры ML статей пересказывает математическое доказательство от команды Яна Лекуна — LeJEPA линейно восстанавливает истинные латентные переменные мира с точностью до ортогонального поворота, причём именно гауссовское распределение гарантирует стабильность такого восстановления в больших масштабах. Для практиков это означает, что поверх предобученного энкодера можно напрямую запускать стандартные алгоритмы управления без сложной калибровки.

Инсайд: LLM не просто дают сбои — их память целенаправленно деградирует

Анализ данных описывает работу исследователей из Illinois и Tsinghua, которые показали: когда GPT-5.4 решала 100% небольшого набора ARC-AGI без памяти, построение памяти из правильных ответов уронило качество до 54%. Проблема в том, что LLM превращают конкретный успешный опыт в слишком общие советы, склеивают разные задачи в одну группу и теряют важные детали при пересказе — долгая память без сырых эпизодов скорее вредит, чем помогает.

Продолжение

Ещё выпуски