Stack research — 2026-06-30
Свежий проход по интернету для верификации основных решений по стеку.
TL;DR — главные находки
PRICING WAS WRONG в нашем cost.py — реальная цена Gemini 2.5 Flash $0.30 input / $2.50 output (а не $0.075/$0.30 как я взял из training data). Поправлено. Гарантия что bug в budget enforcement не дал бы превысить — work as designed, просто оценки были слишком оптимистичные. Реальный месячный cost при нашем workload остаётся ~$2.5/мес (всё Gemini).
Claude подписки НЕ дают API-доступ для произвольных Python-скриптов (подтверждено Anthropic Help Center 2026-03-16). НО: Claude Code CLI с Pro/Max подпиской — да, через OAuth login без API key. Это не наш случай (нам нужен intel-collector скрипт, не CLI), но для будущего интересно.
LiteLLM имел плохой 2026 год по security:
- Март 2026 supply chain attack (PyPI пакет скомпрометирован 40 минут)
- CVE-2026-42208 SQL injection (май)
- CVE-2026-47101/47102/40217 privilege escalation chain (июнь)
- Все есть фиксы, но для маленького проекта стоит подумать о direct Google SDK
- Memory leaks тоже задокументированы
LangGraph 1.2.7 стабилен, но
langgraph.prebuiltdeprecated → новое вlangchain.agents.create_agent. Нас не касается напрямую (мы не используем prebuilt).Postgres checkpointer НЕ затронут SQLi/RCE уязвимостями (SQLite и Redis checkpointer'ы были — пропатчены). Но: open bugs про table growth (нет native TTL), serialization bloat. Нам пока не критично.
uv overtaken Poetry на PyPI downloads. OpenAI купили Astral (создателей uv) 19 марта 2026 — серьёзная корпоративная поддержка теперь. uv остался pre-1.0 но docs называют "stable production".
Для нашего use case (linear pipeline на 7 шагов, ~100 items/день):
- LangGraph технически overkill — лучше подойдут Burr 0.42 Apache или pydantic-graph 2.1 (свежие, легче, type-safe)
- LiteLLM можно заменить на direct google-generativeai SDK + Instructor для structured output — снижает blast radius (security) и dependency bloat
Файлы в этой подпапке
- llm-pricing — актуальные цены Anthropic & Gemini, cost comparison для нашего workload, ситуация с подписками
- langgraph-state — LangGraph 1.2.x состояние, breaking changes, Postgres checkpointer issues, security disclosures
- langgraph-alternatives — Burr (Apache), pydantic-graph 2.1, LlamaIndex Workflows, что когда выбирать
- litellm-concerns — security history 2026, memory leaks, structured output edge cases, альтернативы (OpenRouter, Instructor, Bifrost, direct SDKs)
- observability — Phoenix vs Langfuse, простые альтернативы (Helicone, OpenLIT, OpenTelemetry)
- uv-vs-poetry — текущая ситуация, OpenAI acquisition Astral, known issues
- sqlmodel-vs-sqlalchemy — SQLModel status (всё ещё 0.0.x, медленный cadence)
- cost-protection-patterns — что рекомендуют для защиты от runaway costs в 2026
Что менять в нашем стеке (рекомендации)
| Что | Сейчас | Изменить? | Почему |
|---|---|---|---|
| Gemini pricing в cost.py | $0.075/$0.30 | ✅ ИСПРАВЛЕНО → $0.30/$2.50 | Реальные цены 2026 |
| LangGraph | LangGraph 1.2 | Оставить пока | Работает, миграция не критична. Когда дойдём до 15k продукта — пересмотреть |
| LiteLLM | LiteLLM | Подумать о замене на direct google-generativeai + Instructor | Security history 2026, нам не нужен multi-provider abstraction для intel-collector специфично. Сэкономит deps + reduces blast radius. Решение оставлено за тобой |
| Postgres checkpointer | Не использовать (у нас linear) | n/a | Мы не используем checkpointing — наш граф не stateful между прогонами |
| Phoenix vs Langfuse | Не настраивали | Phoenix когда понадобится | Один docker container vs 6 сервисов |
| SQLModel | Не используем | Не переключаться | SQLModel 0.0.x, медленный cadence — SQLAlchemy 2.0 надёжнее |
| uv | uv | Оставить | Корпоративная поддержка OpenAI теперь, overtaken Poetry |
Не нашли (NOT FOUND)
- Точные current Gemini Free Tier RPM/TPM на официальной странице Google — спрятано за AI Studio login
- Точные размеры RAM/CPU для Langfuse self-host — docs ссылаются на deployment-specific guides
- 2025/2026 full JetBrains Python Developers Survey — только 2024 числа и Aug 2025 summary
Metadata
- title
- Stack research — снимок 2026-06-30
- tags
- ['research', 'snapshot', 'stack']
- created
- 2026-06-30
- note
- Свежий веб-research по нашему стеку. Сделан 4 параллельными агентами через WebSearch + WebFetch. Все utверждения с URL'ами и датами источников. Если найдены "не нашёл" — это не выдумка, это явное отсутствие данных.