Tier classifier v1 (intel-collector) / home / prompts / tier-classifier-v1
promptclassifiergeminiproduction

Tier classifier v1

Production-промпт из intel-collector pipeline/tier_classify.py. Классифицирует news items в трёхтиерную схему для сортировки по релевантности к AI-консалтингу в банковской вертикали.

System prompt

Ты классификатор AI/enterprise новостей.

Tier 1 (core): AI agents, multi-agent, LLM orchestration (LangGraph, LangChain), RAG advances (semantic chunking, reranker, eval), observability (Langfuse, Phoenix, RAGAS), process intelligence/mining, enterprise AI deployment кейсы с метриками.

Tier 2 (adjacent): data engineering pipelines, banking/fintech AI, on-prem/sovereign AI, vendor moves (Big-4 AI practices, локальные интеграторы ME), регуляторы (EU AI Act, SDAIA KSA, 152-ФЗ, qai Катар).

Tier 3 (broad): M&A AI/data $100M+, raises $50M+, regulatory вне наших регионов, крупные enterprise tech trends, breakthrough academic research.

Если совсем off-topic  tier 3 с rationale "off-topic".

Возвращай строго по схеме.

Pydantic response_format

class TierClassification(BaseModel):
    tier: Literal[1, 2, 3] = Field(
        description="1=core AI/process intel; 2=adjacent enterprise; 3=broad signal only"
    )
    topic_tags: list[str] = Field(
        description="2-5 short kebab-case tags, e.g. 'rag', 'agents', 'banking-ai', 'eu-ai-act'",
        min_length=1,
        max_length=8,   # ЭТО OK — max_length на list, не на str, ограничивает число элементов
    )
    rationale: str = Field(description="1 sentence why this tier")
    # НЕ ставим max_length на rationale — см. [../skills/no-max-length-on-llm-output](/../skills/no-max-length-on-llm-output)

User prompt template

Title: {item.title}

Abstract: {item.abstract or '(no abstract)'}

Настройки вызова

await gemini_structured(
    model="gemini/gemini-2.5-flash",
    prompt=user_prompt,
    response_model=TierClassification,
    system=CLASSIFIER_SYSTEM,
    temperature=0.2,     # низкая — детерминированность важнее креативности
    reasoning_effort="disable",   # simple задача — не нужен thinking
    expected_output_tokens=300,
)

Что реально классифицирует (observed 2026-07-02)

Скачал 87 items (HN + Arxiv) → все успешно классифицированы (100%). Примеры:

Известные квирки

Как настраивать

Если хочешь больше T1 попаданий — расширь определение Tier 1 в промпте (например добавить "major model releases from Anthropic/OpenAI/Google/Meta" явно).

Если хочешь строже — убери "process intelligence" (это твой специфичный use case) и сформулируй в терминах "impact на enterprise AI decisions".

Связано

Metadata
title
Tier classifier v1 (intel-collector)
model
gemini/gemini-2.5-flash (reasoning_effort=disable)
task
классифицировать AI-новость в Tier 1/2/3 + topic tags
tags
['prompt', 'classifier', 'gemini', 'production']
created
2026-07-02
status
production в intel-collector, работает стабильно