researchsnapshotstack

Stack research — 2026-06-30

Свежий проход по интернету для верификации основных решений по стеку.

TL;DR — главные находки

PRICING WAS WRONG в нашем cost.py — реальная цена Gemini 2.5 Flash $0.30 input / $2.50 output (а не $0.075/$0.30 как я взял из training data). Поправлено. Гарантия что bug в budget enforcement не дал бы превысить — work as designed, просто оценки были слишком оптимистичные. Реальный месячный cost при нашем workload остаётся ~$2.5/мес (всё Gemini).
Claude подписки НЕ дают API-доступ для произвольных Python-скриптов (подтверждено Anthropic Help Center 2026-03-16). НО: Claude Code CLI с Pro/Max подпиской — да, через OAuth login без API key. Это не наш случай (нам нужен intel-collector скрипт, не CLI), но для будущего интересно.
LiteLLM имел плохой 2026 год по security:
- Март 2026 supply chain attack (PyPI пакет скомпрометирован 40 минут)
- CVE-2026-42208 SQL injection (май)
- CVE-2026-47101/47102/40217 privilege escalation chain (июнь)
- Все есть фиксы, но для маленького проекта стоит подумать о direct Google SDK
- Memory leaks тоже задокументированы
LangGraph 1.2.7 стабилен, но langgraph.prebuilt deprecated → новое в langchain.agents.create_agent. Нас не касается напрямую (мы не используем prebuilt).
Postgres checkpointer НЕ затронут SQLi/RCE уязвимостями (SQLite и Redis checkpointer'ы были — пропатчены). Но: open bugs про table growth (нет native TTL), serialization bloat. Нам пока не критично.
uv overtaken Poetry на PyPI downloads. OpenAI купили Astral (создателей uv) 19 марта 2026 — серьёзная корпоративная поддержка теперь. uv остался pre-1.0 но docs называют "stable production".
Для нашего use case (linear pipeline на 7 шагов, ~100 items/день):
- LangGraph технически overkill — лучше подойдут Burr 0.42 Apache или pydantic-graph 2.1 (свежие, легче, type-safe)
- LiteLLM можно заменить на direct google-generativeai SDK + Instructor для structured output — снижает blast radius (security) и dependency bloat

Файлы в этой подпапке

llm-pricing — актуальные цены Anthropic & Gemini, cost comparison для нашего workload, ситуация с подписками
langgraph-state — LangGraph 1.2.x состояние, breaking changes, Postgres checkpointer issues, security disclosures
langgraph-alternatives — Burr (Apache), pydantic-graph 2.1, LlamaIndex Workflows, что когда выбирать
litellm-concerns — security history 2026, memory leaks, structured output edge cases, альтернативы (OpenRouter, Instructor, Bifrost, direct SDKs)
observability — Phoenix vs Langfuse, простые альтернативы (Helicone, OpenLIT, OpenTelemetry)
uv-vs-poetry — текущая ситуация, OpenAI acquisition Astral, known issues
sqlmodel-vs-sqlalchemy — SQLModel status (всё ещё 0.0.x, медленный cadence)
cost-protection-patterns — что рекомендуют для защиты от runaway costs в 2026

Что менять в нашем стеке (рекомендации)

Что	Сейчас	Изменить?	Почему
Gemini pricing в cost.py	$0.075/$0.30	✅ ИСПРАВЛЕНО → $0.30/$2.50	Реальные цены 2026
LangGraph	LangGraph 1.2	Оставить пока	Работает, миграция не критична. Когда дойдём до 15k продукта — пересмотреть
LiteLLM	LiteLLM	Подумать о замене на direct google-generativeai + Instructor	Security history 2026, нам не нужен multi-provider abstraction для intel-collector специфично. Сэкономит deps + reduces blast radius. Решение оставлено за тобой
Postgres checkpointer	Не использовать (у нас linear)	n/a	Мы не используем checkpointing — наш граф не stateful между прогонами
Phoenix vs Langfuse	Не настраивали	Phoenix когда понадобится	Один docker container vs 6 сервисов
SQLModel	Не используем	Не переключаться	SQLModel 0.0.x, медленный cadence — SQLAlchemy 2.0 надёжнее
uv	uv	Оставить	Корпоративная поддержка OpenAI теперь, overtaken Poetry

Не нашли (NOT FOUND)

Точные current Gemini Free Tier RPM/TPM на официальной странице Google — спрятано за AI Studio login
Точные размеры RAM/CPU для Langfuse self-host — docs ссылаются на deployment-specific guides
2025/2026 full JetBrains Python Developers Survey — только 2024 числа и Aug 2025 summary

Metadata

title: Stack research — снимок 2026-06-30
tags: ['research', 'snapshot', 'stack']
created: 2026-06-30
note: Свежий веб-research по нашему стеку. Сделан 4 параллельными агентами через WebSearch + WebFetch. Все utверждения с URL'ами и датами источников. Если найдены "не нашёл" — это не выдумка, это явное отсутствие данных.