AI Vibe Digest за 5 июня 2026
Открыть пост выпуска в TelegramКратко главное
- Сбер показал первый в России оптический чип для ИИ — фотонный вычислитель ускоряет матричные операции и снижает энергопотребление.
- DeepSeek привлекает $7,4 млрд инвестиций — китайский стартап впервые открывается внешнему капиталу при оценке до $59 млрд.
- Microsoft встаёт на путь независимой frontier-лаборатории — компания выпустила 7 новых моделей и раскрыла детали архитектуры в техническом отчёте на 109 страниц.
- Доказана линейная идентифицируемость мира внутри JEPA — латенты модели восстанавливают истинные переменные среды с точностью до поворота, что упрощает планирование.
- Память ИИ-агентов деградирует при каждом обновлении — постоянные пересказы опыта ухудшают способность решать новые задачи почти вдвое.
Подробности по блокам
Кремниевая фотоника
Сергей Марков рассказывает об универсальном оптическом вычислителе Сбера — устройство заменяет самую энергоёмкую часть расчётов (умножение матриц) работой света, тратя на 30% меньше энергии электронных аналогов. Архитектуру чипа полностью разработали исследователи компании, а производство фотоники локализуется проще, чем электроники — это шаг к технологической независимости.
Инвестиции и рынок
Machinelearning пишет, что DeepSeek впервые привлекает внешние инвестиции — около $7,4 млрд при оценке в $52–59 млрд от Tencent, CATL и госфонда КНР. Сумма выглядит скромно на фоне раундов Anthropic и OpenAI, но подтверждает тренд: помимо капитала, компания активно осваивает рынок.
Анализ данных замечает, что DeepSeek занял первое место в списке быстрорастущих вендоров по данным Ramp — компании реально платят за более дешёвые альтернативы OpenAI и Anthropic. Причина проста: когда агентные задачи увеличивают число вызовов модели в десятки раз, цена токена становится критичной статьёй бюджета.
Модели и архитектуры
Data Secrets разбирает анонс семи новых моделей Microsoft, где главная — MAI-Thinking-1 на 35B активных параметров, набирающая 97% на AIME 2025 без дистилляции и синтетических данных на этапе претрейна. Аналитики подчёркивают, что компания больше не воспринимает себя как партнёра OpenAI и открыто описывает инфраструктуру, RL-обучение и данные — это один из самых содержательных техрепортов.
Machinelearning освещает релиз Gemma 4 12B от Google — мультимодальная модель понимает текст, изображения и аудио без отдельных энкодеров, работая локально на 16 ГБ ОЗУ с результатами моделей класса 26B и лицензией Apache 2.0. Новый Ideogram 4.0 получил нативное 2K-разрешение, прозрачный фон и работу с bounding boxes, заняв первое место среди открытых решений на DesignArena; API стоит от $0.03 за генерацию.
Tips AI делится впечатлениями от Reve 2.0 — генератор изображений на Large Layout модели представляет картинку как иерархию слоёв со своими промтами, позволяя двигать и точечно изменять элементы, не разрушая остальное. Модель заняла второе место на арене text-to-image, уступая по тексту флагманам от OpenAI и Google, но даёт 20 бесплатных генераций в день.
Исследования и инсайды
gonzo-обзоры ML статей пересказывает математическое доказательство от команды Яна Лекуна — LeJEPA линейно восстанавливает истинные латентные переменные мира с точностью до ортогонального поворота, причём именно гауссовское распределение гарантирует стабильность такого восстановления в больших масштабах. Для практиков это означает, что поверх предобученного энкодера можно напрямую запускать стандартные алгоритмы управления без сложной калибровки.
Инсайд: LLM не просто дают сбои — их память целенаправленно деградирует
Анализ данных описывает работу исследователей из Illinois и Tsinghua, которые показали: когда GPT-5.4 решала 100% небольшого набора ARC-AGI без памяти, построение памяти из правильных ответов уронило качество до 54%. Проблема в том, что LLM превращают конкретный успешный опыт в слишком общие советы, склеивают разные задачи в одну группу и теряют важные детали при пересказе — долгая память без сырых эпизодов скорее вредит, чем помогает.