AI Vibe Digest за 22 июня 2026
Кратко главное
- Exa Agent API — поиск и парсинг данных в интернете, вдвое дешевле GPT-5.5.
- Локальная модель без цензуры — энтузиасты выпустили Huihui Fable 5 на базе Gemma 4.
- Tesla патентует MEGAPOD — модульные AI-вычисления на инфраструктуре Supercharger.
- Бесплатный курс по Python-парсингу — от HTTP до обхода антиботов и асинхронности.
Подробности по блокам
Инструменты и платформы
Анализ данных публикует продвинутый курс по веб-скрейпингу на Python. Охватывает всё: от основ HTTP до production-пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов — с рабочими примерами и разбором типовых ошибок.
Machinelearning рассказывает о запуске Agent API от Exa. Платформа для ресёрча и обогащения данных маршрутизирует запросы между разными LLM, а алгоритм Highlights вырезает со страниц только целевые фрагменты, что снижает расход токенов на 94%. Выполнение задач обходится вдвое дешевле GPT-5.5, стартовая цена — от $0,012 за запрос.
Модели и архитектуры
Анализ данных пишет, что энтузиасты сняли ограничения с Fable 5 и выпустили одну из самых жёстких локальных моделей без цензуры. Модель на базе Gemma 4 не отправляет запросы вовне и работает даже на не самом мощном железе. Разработчики предупреждают: встроенных гарантий безопасности нет, использование на свой риск.
gonzo-обзоры ML статей разбирает архитектуру топологических нейронных операторов (TNO). В отличие от обычных нейросетей, TNO встраивает геометрию и топологию прямо в архитектуру, распределяя данные по вершинам, рёбрам и граням. Это позволяет соблюдать физические законы сохранения «по умолчанию» и даёт высокую точность в задачах вроде аэродинамики или расчёта прочности.
Data Blog объясняет парадокс разреженных представлений. Разные модели могут сходиться к одной структуре реальности, но из-за возможности повернуть пространство признаков одни и те же данные раскладываются на совершенно разные наборы фич. Метрика CKA при этом фиксирует сходство геометрии, а не координат — как три человека, описывающих шар в разных системах координат, всё равно согласятся, что шар ближе к овалу, чем к квадрату.
Инфраструктура
Анализ данных сообщает о тихой заявке Tesla на MEGAPOD — модульные системы для AI-вычислений. Есть предположение, что компания планирует превратить сеть зарядок Supercharger в распределённую вычислительную инфраструктуру: днём — зарядка автомобилей, ночью — работа для ИИ.
Практика и кейсы
MLinside - школа ML публикует третью задачу рубрики «ML в реальной жизни». Ситуация: модель в продакшене перестала обновлять прогнозы, но логи в норме, пайплайн «зелёный», ошибок нет. Нужно определить первый шаг для диагностики тихого сбоя — зависшего джоба, нехватки места или изменения формата данных. Цель рубрики — научиться рассуждать, обсуждать подходы и учитывать риски.