LLM pricing — снимок 2026-06-30
Anthropic API (Claude) — $/1M tokens
Источник: https://platform.claude.com/docs/en/about-claude/pricing (fetched 2026-06-30)
| Model | Input | Output | Cache write 5m | Cache write 1h | Cache read |
|---|---|---|---|---|---|
| Claude Opus 4.8 | $5 | $25 | $6.25 | $10 | $0.50 |
| Claude Opus 4.7 | $5 | $25 | $6.25 | $10 | $0.50 |
| Claude Opus 4.6 | $5 | $25 | $6.25 | $10 | $0.50 |
| Claude Opus 4.5 | $5 | $25 | $6.25 | $10 | $0.50 |
| Claude Opus 4.1 (DEPRECATED) | $15 | $75 | $18.75 | $30 | $1.50 |
| Claude Opus 4 (RETIRED) | $15 | $75 | $18.75 | $30 | $1.50 |
| Claude Sonnet 4.6 | $3 | $15 | $3.75 | $6 | $0.30 |
| Claude Sonnet 4.5 | $3 | $15 | $3.75 | $6 | $0.30 |
| Claude Haiku 4.5 | $1 | $5 | $1.25 | $2 | $0.10 |
| Claude Fable 5 | $10 | $50 | $12.50 | $20 | $1 |
Важные особенности:
- Opus 4.7+ использует новый tokenizer — может тратить до 35% больше токенов на тот же текст
- Batch API = 50% off на input + output
inference_geo: "us"(US data residency) = 1.1x множитель на все типы токенов- Fast mode только Opus 4.7/4.8: 4.8 = $10/$50, 4.7 = $30/$150 (deprecated после 24 июля 2026)
Gemini API (Google) — $/1M tokens
Источник: https://ai.google.dev/pricing (Last updated 2026-06-30 UTC, fetched 2026-06-30)
Gemini 2.5 Flash (paid tier)
| Тип | Цена |
|---|---|
| Input text/image/video | $0.30 |
| Input audio | $1.00 |
| Output | $2.50 |
| Context cache | $0.03 (text/image/video) / $0.10 (audio) + $1.00 storage per 1M/hour |
| Batch | 50% discount → $0.15 in / $1.25 out |
Gemini 2.5 Pro (paid tier, tiered)
| Тип | ≤200k prompt | >200k prompt |
|---|---|---|
| Input | $1.25 | $2.50 |
| Output | $10.00 | $15.00 |
| Cache | $0.125 | $0.25 |
| Cache storage | $4.50 per 1M / hour | $4.50 per 1M / hour |
Free Tier
NOT FOUND конкретные числа RPM/TPM на официальной странице Google — спрятано за AI Studio login.
Third-party reports (НЕ верифицировано на Google docs):
- Gemini 2.5 Flash free: 10 RPM, 250k TPM, 1500 RPD (некоторые источники — 250 RPD после апрельских cut'ов 2026)
- Gemini 2.5 Pro free tier убран в апреле 2026
Cost comparison для нашего workload
Наш ежедневный паттерн:
- Classify: 100 items × 200 input + 100 output tokens
- Score: 80 items × 250 input + 100 output tokens
- Synthesize: 1 раз × 5000 input + 2000 output
Вариант 1: Всё Gemini (наш текущий выбор)
| Stage | Input tokens | Output tokens | Cost |
|---|---|---|---|
| Classify (Flash) | 20k = $0.006 | 10k = $0.025 | $0.031 |
| Score (Flash) | 20k = $0.006 | 8k = $0.020 | $0.026 |
| Synthesize (Pro ≤200k) | 5k = $0.006 | 2k = $0.020 | $0.026 |
| Daily total | $0.083 | ||
| Monthly | ~$2.50 |
Вариант 2: Всё Claude
| Stage | Input | Output | Cost |
|---|---|---|---|
| Classify (Sonnet 4.6) | 20k × $3 = $0.060 | 10k × $15 = $0.150 | $0.210 |
| Score (Sonnet 4.6) | 20k × $3 = $0.060 | 8k × $15 = $0.120 | $0.180 |
| Synthesize (Opus 4.6) | 5k × $5 = $0.025 | 2k × $25 = $0.050 | $0.075 |
| Daily | $0.465 | ||
| Monthly | ~$14 |
Вариант 3: Mixed (Gemini classify/score + Opus synthesize)
| Stage | Cost |
|---|---|
| Classify+Score (Gemini Flash) | $0.057 |
| Synthesize (Claude Opus 4.6) | $0.075 |
| Daily | $0.132 |
| Monthly | ~$4 |
Вывод
- Gemini — ~$2.50/мес. Самый дешёвый
- Mixed — ~$4/мес. Если хочется лучшего качества именно синтеза, добавка $1.50/мес незначительна
- All Claude — ~$14/мес. Тоже подъёмно если хочется максимального качества
API доступ через подписку — ОТВЕТ НА ВАЖНЫЙ ВОПРОС
Claude Pro / Max / Team — НЕ дают API key для произвольных Python-скриптов
Прямая цитата Anthropic Help Center (2026-03-16):
"Claude paid plans and the Claude Console are separate products designed for different purposes."
"A paid Claude subscription enhances your chat experience but doesn't include access to the Claude API or Console."
Источник: https://support.claude.com/en/articles/9876003-...
Цены подписок:
- Claude Pro: $17/мес annual ($20/мес monthly)
- Claude Max 5x: $100/мес
- Claude Max 20x: $200/мес
- Claude Team: $20/seat annual ($25 monthly), Premium seats $100
Источник: https://claude.com/pricing (fetched 2026-06-30)
Claude Code (CLI) — особый случай
С Pro / Max подпиской можно использовать Claude Code CLI без отдельного API key, через OAuth.
- Usage limits общие между Claude и Claude Code
- НО: если у тебя установлен env var
ANTHROPIC_API_KEY— Claude Code будет использовать его, и пойдут отдельные API charges
Источник: https://support.claude.com/en/articles/11145838-...
Claude Agent SDK — можно через подписку
Существует Claude Agent SDK который может работать на подписке (через OAuth), включая headless mode claude -p.
- Был запланирован split на отдельные "Agent SDK credits" с 15 июня 2026 — paused на эту дату
- Сейчас (2026-06-30) Agent SDK +
claude -pheadless работают под подписку если залогинен OAuth иANTHROPIC_API_KEYunset - Это closest path "subscription → programmatic", но это специфично к Claude Agent SDK, не raw Anthropic Python SDK
Источник: https://support.claude.com/en/articles/15036540-...
Google Gemini подписки
- Google AI Pro (ex "Gemini Advanced") — $19.99/мес — НЕ включает API access (third-party источники единогласно подтверждают)
- Google AI Ultra — $100/мес (entry) или $200/мес — тоже только web/desktop
- API access — separate через AI Studio (free tier) или Google Cloud (paid)
NOT FOUND прямого подтверждения на gemini.google/subscriptions страницах (auth-walled).
Bottom line для нас
- Pro/Max подписка не подходит для intel-collector программных вызовов
- Остаёмся на Gemini API — дешевле всех, free tier есть, paid не страшный
- Если когда-то захочется Claude для synthesis — можно дополнить Mixed режимом, +$1.50/мес незначительно
Metadata
- title
- LLM pricing & подписки на 2026-06-30
- tags
- ['research', 'pricing', 'llm', 'gemini', 'anthropic', 'subscription']
- created
- 2026-06-30
- sources_fetched
- 2026-06-30