AI Vibe Digest за 26 июня 2026
Кратко главное
- Субнанометровые чипы стали реальностью — IBM представила технологию 0,7 нм с 3D-укладкой транзисторов
- Google встроил «зрение» в свою основную модель — Gemini Flash теперь сам видит экран и кликает как человек
- Нейросеть учится предсказывать не слова, а миры — Qwen-AgentWorld симулирует окружение для обучения агентов
- Продолжается утечка мозгов из Google в стартапы — ключевые инженеры Gemini уходят к конкурентам ради долей перед IPO
- Калибровка переворачивает теорию «общего разума» ИИ — сходство моделей оказалось статистической иллюзией
Подробности по блокам
Железо и чипы
Анализ данных и Machinelearning рассказывают о прорывной технологии IBM. Инженерам удалось создать чип размерностью 0,7 нанометра — это почти атомный масштаб. Секрет не в уменьшении элементов, а в их вертикальной укладке: архитектура nanostack позволяет разместить до 100 миллиардов транзисторов на кристалле размером с ноготь, подняв энергоэффективность на 70%.
Это пока лабораторная разработка, а не коммерческий продукт. IBM говорит, что путь до заводского конвейера займёт около пяти лет. Прирост плотности SRAM на 40% делает технологию особенно интересной для будущих AI-ускорителей.
Компьютерное зрение и агенты
Анализ данных и Machinelearning пишут об интеграции Computer Use в основную Gemini Flash. Если раньше это был отдельный продукт, то теперь модель воспринимает интерфейс как часть своей архитектуры. Она может сама нажимать кнопки, понимать контекст экрана и проверять свои действия.
Встроили и защиту от взлома: модель обучали противостоять prompt injection, а для необратимых платежей или удаления данных потребуется подтверждение от живого пользователя. Посмотреть демо можно на специальной площадке.
Мир симуляций для обучения ИИ
Анализ данных объясняет идею Qwen-AgentWorld. Вместо натаскивания агента на работу с инструментами авторы учат модель предсказывать, как изменится среда после действия. Грубо говоря, нейросеть становится симулятором реальности, где можно безопасно тренировать других агентов.
Такой подход к миромоделированию дал неожиданный результат: обучение с подкреплением в контролируемой симуляции оказалось эффективнее, чем тренировки в реальных веб- или терминальных средах. Это потенциальный шаг к созданию универсального «тренажёра» для будущих AI-помощников.
Фундаментальные исследования
Гонзо-обзоры статей разбирает работу, которая ставит под сомнение гипотезу о едином внутреннем языке нейросетей. Оказалось, что видимое сходство представлений у разных моделей сильно завышено из-за размерности и глубины поиска. Как только применили строгую калибровку относительно случайного шума, глобальное «схождение» моделей исчезло.
Взамен предлагается более честная картина: при масштабировании сети сходятся не на общих абстрактных понятиях, а на локальной топологии данных. Для практиков из мультимодального обучения и AI-alignment это значит, что нужно аккуратнее сравнивать геометрию скрытых пространств разных моделей.
События и индустрия
Machinelearning сообщает об уходе ещё двух ключевых разработчиков Google в Anthropic. Инженеры, отвечавшие за инструменты кодинга и процессы тренировки Gemini, переходят к конкуренту накануне предполагаемого IPO. Главный магнит — опционы и доли в стартапе, которые могут озолотиться после выхода на биржу.
Machinelearning напоминает об открытии заявок на DevDay 2026 от OpenAI. Конференция пройдёт 29 сентября в Сан-Франциско, билет стоит $650. Крупные выступления обещают транслировать онлайн для тех, кто не сможет присутствовать лично. Крайний срок подачи — 10 июля.
Цифровой «серый» рынок
Data Secrets раскрывает схему китайских прокси-провайдеров, торгующих доступом к западным нейросетям втридешева. Иногда цена падает до 10% от официальной. Вариантов экономии три: простая перепродажа собранных запросов, подмена дорогой модели дешёвой или арбитраж на лимитах подписки вроде Claude Max. Прямой доступ в Китае закрыт без VPN и зарубежных карт, потому такой серый рынок процветает, и повлиять на него официальные сервисы практически не могут.