Files
tech/3_извлечение_тегов/README.md
2026-02-01 17:01:21 +03:00

33 lines
2.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Извлечение тегов (шаг 3)
Отдельный шаг пайплайна после финальной валидации согласованности (2b). ИИ использует уже структурированный анализ главы (каркас, инсайты, применение) и оригинальный текст для извлечения тегов по категориям.
## Промпт
| Файл | Назначение |
|------------------|-------------------------------------------------|
| extract_tags.txt | Извлечение тегов по категориям из валидированного анализа |
## Подстановки
- `{book_title}` — название книги
- `{chapter_title}` — название главы
- `{framework}` — JSON блока framework
- `{insights}` — JSON блока insights
- `{application}` — JSON блока application
- `{limitations}` — JSON блока limitations (опционально)
- `{chapter_text}` — оригинальный текст главы (можно обрезать по лимиту токенов)
- `{allowed_tags_json}` — актуальный список допустимых тегов по категориям (из БД `tags`)
## Вход
Валидированный анализ главы (все блоки) + оригинальный текст главы + словарь допустимых тегов.
## Выход
JSON с тегами по категориям (ключи на английском: `principle`, `psychology`, `method`, `result`, `context`) и confidence score для каждого тега; при необходимости — кандидаты в `proposed` с полем `category` из того же набора. Маппинг категорий: ARCHITECTURE_SUMMARY.md → раздел «Хранение данных» → таблица `tags`.
## Использование
Вызывается после шага 2b (финальная валидация). Модель: qwen3-14b:8bit (или аналог). Перед вызовом в промпт подставляется актуальный список тегов из БД.