Files
tech/3_извлечение_тегов/README.md
2026-02-01 17:01:21 +03:00

2.3 KiB
Raw Blame History

Извлечение тегов (шаг 3)

Отдельный шаг пайплайна после финальной валидации согласованности (2b). ИИ использует уже структурированный анализ главы (каркас, инсайты, применение) и оригинальный текст для извлечения тегов по категориям.

Промпт

Файл Назначение
extract_tags.txt Извлечение тегов по категориям из валидированного анализа

Подстановки

  • {book_title} — название книги
  • {chapter_title} — название главы
  • {framework} — JSON блока framework
  • {insights} — JSON блока insights
  • {application} — JSON блока application
  • {limitations} — JSON блока limitations (опционально)
  • {chapter_text} — оригинальный текст главы (можно обрезать по лимиту токенов)
  • {allowed_tags_json} — актуальный список допустимых тегов по категориям (из БД tags)

Вход

Валидированный анализ главы (все блоки) + оригинальный текст главы + словарь допустимых тегов.

Выход

JSON с тегами по категориям (ключи на английском: principle, psychology, method, result, context) и confidence score для каждого тега; при необходимости — кандидаты в proposed с полем category из того же набора. Маппинг категорий: ARCHITECTURE_SUMMARY.md → раздел «Хранение данных» → таблица tags.

Использование

Вызывается после шага 2b (финальная валидация). Модель: qwen3-14b:8bit (или аналог). Перед вызовом в промпт подставляется актуальный список тегов из БД.