fix

2026-02-01 22:02:49 +03:00
parent 65d7be8795
commit 2d4eff6c3f
18 changed files with 1321 additions and 419 deletions
--- a/1_анализ_главы/run_chapter_analysis_ollama.py
+++ b/1_анализ_главы/run_chapter_analysis_ollama.py
@@ -19,8 +19,8 @@ DIR = Path(__file__).resolve().parent
 OLLAMA_OPTIONS = {
    "temperature": 0.3,
-    "num_ctx": 8500,
+    "num_ctx": 9000,
-    "num_predict": 4096,
+    "num_predict": 8500,
    "repeat_penalty": 1.1,
 }
--- a/2_валидация_анализа_по_блокам/README.md
+++ b/2_валидация_анализа_по_блокам/README.md
@@ -22,3 +22,27 @@
 - `{limitations_json}` — JSON блока `limitations`
 Промпты рассчитаны на тестирование по одному; доработка — по результатам прогонов.
 ## Скрипт валидации через Ollama
 `run_validation_ollama.py` — последовательная валидация всех четырёх блоков через Ollama. На выходе один JSON-файл со статусами по каждому блоку.
 **Вход (по умолчанию):**
 - `../1_анализ_главы/merge.json` — результат этапа 1 (framework, insights, application, limitations)
 - `../1_анализ_главы/вход_главы.json` — текст главы и метаданные (book_title, chapter_title, chapter_text)
 **Выход:** `validation_status.json` в каталоге скрипта (или путь через `-o`).
 **Формат выхода:** по одному ключу на блок (`framework`, `insights`, `application`, `limitations`). Каждое значение:
 - `verdict` — `ok` | `needs_review` | `bad` | `skipped` | `error`
 - `score` — число 0.0 или `null`
 - `hallucinations` — список замечаний по галлюцинациям
 - `missing_key_points` — список пропущенных ключевых моментов
 **Запуск:**
 ```bash
 cd 2_валидация_анализа_по_блокам
 python3 run_validation_ollama.py
 # с указанием путей:
 python3 run_validation_ollama.py --merge /path/to/merge.json --chapter /path/to/вход_главы.json -o validation_status.json
 ```
--- a/2_валидация_анализа_по_блокам/run_validation_ollama.py
+++ b/2_валидация_анализа_по_блокам/run_validation_ollama.py
@@ -0,0 +1,236 @@
 #!/usr/bin/env python3
 """
 Валидация анализа главы по блокам через Ollama: framework → insights → application → limitations.
 Вход: merge.json (анализ из этапа 1), вход_главы.json (текст главы и метаданные).
 Выход: один JSON-файл со статусами по каждому блоку (verdict, score, hallucinations, missing_key_points).
 """
 import argparse
 import json
 import re
 import sys
 import time
 import urllib.request
 from pathlib import Path
 OLLAMA_URL = "http://localhost:11434"
 MODEL = "qwen3:14b"
 DIR = Path(__file__).resolve().parent
 DEFAULT_MERGE = DIR.parent / "1_анализ_главы" / "merge.json"
 DEFAULT_CHAPTER = DIR.parent / "1_анализ_главы" / "вход_главы.json"
 OLLAMA_OPTIONS = {
    "temperature": 0.2,
    "num_ctx": 8500,
    "num_predict": 2048,
    "repeat_penalty": 1.1,
 }
 BLOCKS = [
    ("framework", "validate_framework.txt", "framework_json"),
    ("insights", "validate_insights.txt", "insights_json"),
    ("application", "validate_application.txt", "application_json"),
    ("limitations", "validate_limitations.txt", "limitations_json"),
 ]
 def load_json(path: Path) -> dict:
    """Загружает JSON из файла."""
    with open(path, encoding="utf-8") as f:
        return json.load(f)
 def load_prompt(filename: str) -> str:
    """Загружает шаблон промпта из файла."""
    with open(DIR / filename, encoding="utf-8") as f:
        return f.read()
 def substitute_prompt(
    prompt: str,
    book_title: str,
    chapter_title: str,
    chapter_text: str,
    block_json: str,
    block_placeholder: str,
 ) -> str:
    """Подставляет в промпт поля главы и JSON блока. block_placeholder — например {framework_json}."""
    return (
        prompt.replace("{book_title}", book_title)
        .replace("{chapter_title}", chapter_title)
        .replace("{chapter_text}", chapter_text)
        .replace(block_placeholder, block_json)
    )
 def extract_json_from_response(text: str) -> dict:
    """Достаёт JSON из ответа модели (может быть обёрнут в ```json ... ```)."""
    text = text.strip()
    match = re.search(r"```(?:json)?\s*([\s\S]*?)\s*```", text)
    if match:
        text = match.group(1).strip()
    return json.loads(text)
 def call_ollama(prompt: str) -> str:
    """Вызывает Ollama /api/chat и возвращает content ответа."""
    body = json.dumps(
        {
            "model": MODEL,
            "messages": [{"role": "user", "content": prompt}],
            "stream": False,
            "format": "json",
            "options": OLLAMA_OPTIONS,
            "keep_alive": 0,
        },
        ensure_ascii=False,
    ).encode("utf-8")
    req = urllib.request.Request(
        f"{OLLAMA_URL}/api/chat",
        data=body,
        headers={"Content-Type": "application/json"},
        method="POST",
    )
    try:
        with urllib.request.urlopen(req, timeout=None) as resp:
            data = json.load(resp)
        return data.get("message", {}).get("content", "")
    except urllib.error.HTTPError as e:
        body_b = b""
        if e.fp:
            try:
                body_b = e.fp.read()[:1000]
            except Exception:
                pass
        raise RuntimeError(
            f"Ollama HTTP {e.code}: {e.reason}. Body: {body_b.decode('utf-8', errors='replace')}"
        ) from e
 def main() -> int:
    """Последовательно валидирует 4 блока и пишет один JSON со статусами."""
    parser = argparse.ArgumentParser(
        description="Валидация анализа главы по блокам через Ollama. Выход — JSON со статусами."
    )
    parser.add_argument(
        "--merge",
        type=Path,
        default=DEFAULT_MERGE,
        help=f"Путь к merge.json (по умолчанию: {DEFAULT_MERGE})",
    )
    parser.add_argument(
        "--chapter",
        type=Path,
        default=DEFAULT_CHAPTER,
        help=f"Путь к вход_главы.json (по умолчанию: {DEFAULT_CHAPTER})",
    )
    parser.add_argument(
        "-o",
        "--output",
        type=Path,
        default=DIR / "validation_status.json",
        help="Путь к выходному JSON со статусами (по умолчанию: validation_status.json)",
    )
    args = parser.parse_args()
    if not args.merge.is_file():
        print(f"Файл не найден: {args.merge}", file=sys.stderr)
        return 1
    if not args.chapter.is_file():
        print(f"Файл не найден: {args.chapter}", file=sys.stderr)
        return 1
    print("Загрузка merge.json и вход_главы.json...")
    merge = load_json(args.merge)
    chapter = load_json(args.chapter)
    book_title = chapter.get("book_title", "")
    chapter_title = chapter.get("chapter_title", "")
    chapter_text = chapter.get("chapter_text", "")
    results: dict = {}
    for block_name, prompt_file, json_placeholder in BLOCKS:
        block_data = merge.get(block_name)
        if block_data is None:
            print(f"Блок «{block_name}» отсутствует в merge.json, пропуск.", file=sys.stderr)
            results[block_name] = {
                "verdict": "skipped",
                "score": None,
                "hallucinations": [],
                "missing_key_points": [],
                "error": "block not found in merge",
            }
            continue
        prompt_tpl = load_prompt(prompt_file)
        block_json_str = json.dumps(block_data, ensure_ascii=False, indent=2)
        placeholder = "{" + json_placeholder + "}"  # {framework_json}, {insights_json}, ...
        prompt = substitute_prompt(
            prompt_tpl,
            book_title,
            chapter_title,
            chapter_text,
            block_json_str,
            placeholder,
        )
        print(f"Валидация блока «{block_name}»...")
        t0 = time.monotonic()
        try:
            raw = call_ollama(prompt)
        except Exception as e:
            print(f"Ошибка вызова Ollama на блоке «{block_name}»: {e}", file=sys.stderr)
            results[block_name] = {
                "verdict": "error",
                "score": None,
                "hallucinations": [],
                "missing_key_points": [],
                "error": str(e),
            }
            continue
        elapsed = time.monotonic() - t0
        print(f"  Ответ за {elapsed:.1f} сек ({elapsed / 60:.1f} мин)")
        try:
            block_result = extract_json_from_response(raw)
        except json.JSONDecodeError as e:
            print(
                f"Не удалось распарсить JSON в блоке «{block_name}»: {e}",
                file=sys.stderr,
            )
            print("Первые 500 символов ответа:", raw[:500], file=sys.stderr)
            results[block_name] = {
                "verdict": "error",
                "score": None,
                "hallucinations": [],
                "missing_key_points": [],
                "error": f"JSON decode: {e}",
            }
            continue
        if not isinstance(block_result, dict):
            results[block_name] = {
                "verdict": "error",
                "score": None,
                "hallucinations": [],
                "missing_key_points": [],
                "error": f"expected dict, got {type(block_result).__name__}",
            }
            continue
        results[block_name] = {
            "verdict": block_result.get("verdict", "unknown"),
            "score": block_result.get("score"),
            "hallucinations": block_result.get("hallucinations", []),
            "missing_key_points": block_result.get("missing_key_points", []),
        }
    args.output.parent.mkdir(parents=True, exist_ok=True)
    with open(args.output, "w", encoding="utf-8") as f:
        json.dump(results, f, ensure_ascii=False, indent=2)
    print(f"Записано: {args.output}")
    return 0
 if __name__ == "__main__":
    sys.exit(main())
--- a/2b_финальная_валидация_согласованности/README.md
+++ b/2b_финальная_валидация_согласованности/README.md
@@ -14,7 +14,27 @@
 - `{chapter_title}` — название главы
 - `{full_analysis_json}` — полный JSON анализа (склейка блоков framework + insights + application + limitations)
-## Использование
+## Скрипт через Ollama
 `run_consistency_ollama.py` — один вызов Ollama для проверки согласованности блоков. На выходе один JSON-файл.
 **Вход (по умолчанию):**
 - `../1_анализ_главы/merge.json` — полный анализ (framework, insights, application, limitations)
 - `../1_анализ_главы/вход_главы.json` — метаданные главы (book_title, chapter_title)
 **Выход:** `consistency_result.json` в каталоге скрипта (или путь через `-o`).
 **Формат выхода:** `verdict` (ok | needs_review | bad), `score`, `inconsistencies` — список рассогласованностей с полями type, location, summary.
 **Запуск:**
 ```bash
 cd 2b_финальная_валидация_согласованности
 python3 run_consistency_ollama.py
 # с указанием путей:
 python3 run_consistency_ollama.py --merge /path/to/merge.json --chapter /path/to/вход_главы.json -o consistency_result.json
 ```
 ## Использование в пайплайне
 Вызывается после шага 2a (склейка блоков). При вердикте bad или needs_review — флаг `needs_review` по главе; опционально — «примиряющий» промпт для минимальных правок.
--- a/2b_финальная_валидация_согласованности/merge.json
+++ b/2b_финальная_валидация_согласованности/merge.json
@@ -1,159 +0,0 @@
 {
  "framework": {
    "terms": {
      "стимул": "что в окружающей среде заставляет человека действовать",
      "привычка": "повторяющееся действие, которое становится автоматическим",
      "подкрепление": "воздействие, усиливающее вероятность повторения действия",
      "среда": "окружение, влияющее на поведение через стимулы и ограничения",
      "желание, вызванное стимулом": "непроизвольная тяга к действию, спровоцированному внешним триггером",
      "аутокаталитический процесс": "процесс, усиливающий себя сам"
    },
    "principles": [
      {
        "title": "Среда формирует поведение",
        "description": "Человек не управляет привычками напрямую, а воздействует на окружение, чтобы оно вело его к нужным действиям",
        "example": "Убрать телефон с рабочего стола, чтобы не отвлекаться на соцсети",
        "chains": [
          {
            "cause": "Человек находится в среде с доступными стимулами для нежелательной привычки",
            "mechanism": "Стимул активирует уже сформированную привычку, которая запускает автоматическое действие",
            "result": "Человек повторяет вредную привычку, не осознавая этого"
          },
          {
            "cause": "Изменяется среда, удаляются стимулы, провоцирующие нежелательную привычку",
            "mechanism": "Отсутствие триггеров снижает вероятность срабатывания привычки",
            "result": "Человек реже проявляет нежелательное поведение"
          }
        ]
      },
      {
        "title": "Привычки не исчезают, они только временно подавлены",
        "description": "Даже если человек перестаёт делать что-то, привычка остаётся в мозге и может вернуться при подходящих условиях",
        "example": "Человек перестаёт курить, но снова начинает после посещения места, где раньше курил",
        "chains": [
          {
            "cause": "Человек прекращает проявлять вредную привычку",
            "mechanism": "Мозг сохраняет нейронные связи, связанные с этой привычкой",
            "result": "Привычка может вернуться, если появятся подходящие стимулы"
          },
          {
            "cause": "Окружение меняется, и в нем появляются триггеры, связанные с прошлой привычкой",
            "mechanism": "Стимулы запускают автоматические паттерны поведения",
            "result": "Человек снова начинает делать то, что уже перестал"
          }
        ]
      },
      {
        "title": "Самоконтроль — это краткосрочный, а не долгосрочный инструмент",
        "description": "Противостояние искушению неэффективно на длительном сроке, нужно менять контекст",
        "example": "Человек отказывается от сладкого, но возвращается к нему после стрессового дня",
        "chains": [
          {
            "cause": "Человек пытается контролировать себя в момент искушения",
            "mechanism": "Это требует энергии и усилий, которые невозможно поддерживать всегда",
            "result": "Человек устаёт от борьбы и возвращается к нежелательной привычке"
          },
          {
            "cause": "Человек изменяет окружение, чтобы искушения стали менее доступными",
            "mechanism": "Стимулы для плохого поведения становятся незаметными или невозможными",
            "result": "Человек реже сталкивается с искушением"
          }
        ]
      },
      {
        "title": "Дисциплина — это настройка среды, а не внутреннее усилие",
        "description": "Сильные люди не просто дисциплинированы, а живут в среде, которая поддерживает их цели",
        "example": "Человек встаёт раньше, потому что спальня тёмная и не имеет гаджетов",
        "chains": [
          {
            "cause": "Человек пытается быть дисциплинированным только силой воли",
            "mechanism": "Это требует большого количества энергии и часто неудачно",
            "result": "Человек теряет мотивацию и возвращается к нежелательному поведению"
          },
          {
            "cause": "Человек настраивает окружение так, чтобы хорошее поведение было лёгким",
            "mechanism": "Стимулы для правильных действий становятся более доступными",
            "result": "Человек чаще выбирает здоровые привычки"
          }
        ]
      },
      {
        "title": "Негативные эмоции усиливают негативное поведение",
        "description": "Стресс, тревога и другие негативные чувства провоцируют возвращение к вредным привычкам",
        "example": "Человек садится на диван и ест шоколад, когда ему плохо",
        "chains": [
          {
            "cause": "Человек испытывает стресс или негативные эмоции",
            "mechanism": "Это активирует привычку, которая помогает снизить дискомфорт",
            "result": "Человек снова начинает делать то, что раньше снимало напряжение"
          },
          {
            "cause": "Человек пытается избавиться от вредной привычки, но не меняет среду",
            "mechanism": "Стресс и негативные эмоции остаются, усиливая желание к действию",
            "result": "Человек возвращается к нежелательной привычке"
          }
        ]
      }
    ]
  },
  "insights": [
    {
      "title": "Среда влияет на привычки больше, чем сила воли",
      "description": "Чтобы изменить привычку, нужно изменить окружение, а не надеяться только на самоконтроль",
      "example": "Убрать телефон с рабочего стола, чтобы не отвлекаться на соцсети"
    },
    {
      "title": "Привычки не исчезают, только временно подавляются",
      "description": "Даже если человек перестаёт курить или есть сладкое, эти привычки остаются в мозге и могут вернуться при подходящих условиях",
      "example": "После посещения бара человек снова начинает пить, не осознавая этого"
    },
    {
      "title": "Негативные эмоции усиливают вредное поведение",
      "description": "Стресс, тревога и другие негативные чувства могут спровоцировать возвращение к старым привычкам",
      "example": "После ссоры человек снова начинает есть вредную пищу, чтобы успокоиться"
    },
    {
      "title": "Сокращение стимулов уменьшает повторение нежелательного поведения",
      "description": "Удаление триггеров, связанных с вредной привычкой, снижает вероятность её возобновления",
      "example": "Убрать сигареты из дома, чтобы уменьшить вероятность их употребления"
    },
    {
      "title": "Самоконтроль — это временная стратегия, а не долгосрочное решение",
      "description": "Постоянно бороться с искушением утомительно и непрочное; нужно настраивать среду так, чтобы искушений не было совсем",
      "example": "Поставить телефон в другую комнату, чтобы не проверять соцсети во время работы"
    }
  ],
  "application": {
    "techniques": [
      {
        "name": "Снижение доступности стимула",
        "goal": "Уменьшение вероятности повторения нежелательной привычки за счёт удаления её триггеров",
        "context_example": "Вечер после работы, когда тянет залипнуть в телефон и проверять соцсети",
        "steps": [
          "Определите конкретный стимул (например, наличие телефона на столе)",
          "Уберите объект из зоны видимости или досягаемости (например, оставьте телефон в другой комнате)",
          "Запишите дату и время изменения (для отслеживания эффективности)"
        ],
        "client_phrase": "Уберите источник искушения из вашей среды — действие станет менее вероятным",
        "success_criteria": "Частота использования телефона в моменты, когда это не нужно, снижается с 5 раз/день до 1–2 раз/день за 2 недели"
      }
    ]
  },
  "limitations": [
    {
      "description": "Идеи не работают, если триггер (то, что в окружении запускает действие) не устранён или остаётся доступным, так как привычка может вернуться при появлении стимула",
      "when_relevant": "Когда человек не полностью убирает триггер из своей среды или сталкивается с ним в новой обстановке",
      "example": "Человек удалил сигареты из дома, но снова начинает курить на работе среди коллег-курильщиков"
    },
    {
      "description": "Техники могут не сработать, если негативные эмоции (стресс, тревога) остаются необратленными и усиливают нежелательное поведение",
      "when_relevant": "Когда человек продолжает испытывать сильный стресс или эмоциональные трудности, не решая их на уровне среды",
      "example": "Человек убрал телефон из комнаты, но всё равно переедает перед сном из-за хронической тревоги"
    },
    {
      "description": "Изменения среды могут быть недостаточны, если привычка закреплена на уровне автоматических нейронных паттернов и не сопровождается новыми, здоровыми привычками",
      "when_relevant": "Когда человек устраняет триггер, но не вводит альтернативное поведение для подкрепления",
      "example": "Человек убрал телевизор из спальни, но не нашёл замену в виде чтения или медитации и проводит время впустую"
    }
  ]
 }
--- a/2b_финальная_валидация_согласованности/merged_with_tags.json
+++ b/2b_финальная_валидация_согласованности/merged_with_tags.json
@@ -1,248 +0,0 @@
 {
  "framework": {
    "terms": {
      "стимул": "что в окружающей среде заставляет человека действовать",
      "привычка": "повторяющееся действие, которое становится автоматическим",
      "подкрепление": "воздействие, усиливающее вероятность повторения действия",
      "среда": "окружение, влияющее на поведение через стимулы и ограничения",
      "желание, вызванное стимулом": "непроизвольная тяга к действию, спровоцированному внешним триггером",
      "аутокаталитический процесс": "процесс, усиливающий себя сам"
    },
    "principles": [
      {
        "title": "Среда формирует поведение",
        "description": "Человек не управляет привычками напрямую, а воздействует на окружение, чтобы оно вело его к нужным действиям",
        "example": "Убрать телефон с рабочего стола, чтобы не отвлекаться на соцсети",
        "chains": [
          {
            "cause": "Человек находится в среде с доступными стимулами для нежелательной привычки",
            "mechanism": "Стимул активирует уже сформированную привычку, которая запускает автоматическое действие",
            "result": "Человек повторяет вредную привычку, не осознавая этого"
          },
          {
            "cause": "Изменяется среда, удаляются стимулы, провоцирующие нежелательную привычку",
            "mechanism": "Отсутствие триггеров снижает вероятность срабатывания привычки",
            "result": "Человек реже проявляет нежелательное поведение"
          }
        ]
      },
      {
        "title": "Привычки не исчезают, они только временно подавлены",
        "description": "Даже если человек перестаёт делать что-то, привычка остаётся в мозге и может вернуться при подходящих условиях",
        "example": "Человек перестаёт курить, но снова начинает после посещения места, где раньше курил",
        "chains": [
          {
            "cause": "Человек прекращает проявлять вредную привычку",
            "mechanism": "Мозг сохраняет нейронные связи, связанные с этой привычкой",
            "result": "Привычка может вернуться, если появятся подходящие стимулы"
          },
          {
            "cause": "Окружение меняется, и в нем появляются триггеры, связанные с прошлой привычкой",
            "mechanism": "Стимулы запускают автоматические паттерны поведения",
            "result": "Человек снова начинает делать то, что уже перестал"
          }
        ]
      },
      {
        "title": "Самоконтроль — это краткосрочный, а не долгосрочный инструмент",
        "description": "Противостояние искушению неэффективно на длительном сроке, нужно менять контекст",
        "example": "Человек отказывается от сладкого, но возвращается к нему после стрессового дня",
        "chains": [
          {
            "cause": "Человек пытается контролировать себя в момент искушения",
            "mechanism": "Это требует энергии и усилий, которые невозможно поддерживать всегда",
            "result": "Человек устаёт от борьбы и возвращается к нежелательной привычке"
          },
          {
            "cause": "Человек изменяет окружение, чтобы искушения стали менее доступными",
            "mechanism": "Стимулы для плохого поведения становятся незаметными или невозможными",
            "result": "Человек реже сталкивается с искушением"
          }
        ]
      },
      {
        "title": "Дисциплина — это настройка среды, а не внутреннее усилие",
        "description": "Сильные люди не просто дисциплинированы, а живут в среде, которая поддерживает их цели",
        "example": "Человек встаёт раньше, потому что спальня тёмная и не имеет гаджетов",
        "chains": [
          {
            "cause": "Человек пытается быть дисциплинированным только силой воли",
            "mechanism": "Это требует большого количества энергии и часто неудачно",
            "result": "Человек теряет мотивацию и возвращается к нежелательному поведению"
          },
          {
            "cause": "Человек настраивает окружение так, чтобы хорошее поведение было лёгким",
            "mechanism": "Стимулы для правильных действий становятся более доступными",
            "result": "Человек чаще выбирает здоровые привычки"
          }
        ]
      },
      {
        "title": "Негативные эмоции усиливают негативное поведение",
        "description": "Стресс, тревога и другие негативные чувства провоцируют возвращение к вредным привычкам",
        "example": "Человек садится на диван и ест шоколад, когда ему плохо",
        "chains": [
          {
            "cause": "Человек испытывает стресс или негативные эмоции",
            "mechanism": "Это активирует привычку, которая помогает снизить дискомфорт",
            "result": "Человек снова начинает делать то, что раньше снимало напряжение"
          },
          {
            "cause": "Человек пытается избавиться от вредной привычки, но не меняет среду",
            "mechanism": "Стресс и негативные эмоции остаются, усиливая желание к действию",
            "result": "Человек возвращается к нежелательной привычке"
          }
        ]
      }
    ]
  },
  "insights": [
    {
      "title": "Среда влияет на привычки больше, чем сила воли",
      "description": "Чтобы изменить привычку, нужно изменить окружение, а не надеяться только на самоконтроль",
      "example": "Убрать телефон с рабочего стола, чтобы не отвлекаться на соцсети"
    },
    {
      "title": "Привычки не исчезают, только временно подавляются",
      "description": "Даже если человек перестаёт курить или есть сладкое, эти привычки остаются в мозге и могут вернуться при подходящих условиях",
      "example": "После посещения бара человек снова начинает пить, не осознавая этого"
    },
    {
      "title": "Негативные эмоции усиливают вредное поведение",
      "description": "Стресс, тревога и другие негативные чувства могут спровоцировать возвращение к старым привычкам",
      "example": "После ссоры человек снова начинает есть вредную пищу, чтобы успокоиться"
    },
    {
      "title": "Сокращение стимулов уменьшает повторение нежелательного поведения",
      "description": "Удаление триггеров, связанных с вредной привычкой, снижает вероятность её возобновления",
      "example": "Убрать сигареты из дома, чтобы уменьшить вероятность их употребления"
    },
    {
      "title": "Самоконтроль — это временная стратегия, а не долгосрочное решение",
      "description": "Постоянно бороться с искушением утомительно и непрочное; нужно настраивать среду так, чтобы искушений не было совсем",
      "example": "Поставить телефон в другую комнату, чтобы не проверять соцсети во время работы"
    }
  ],
  "application": {
    "techniques": [
      {
        "name": "Снижение доступности стимула",
        "goal": "Уменьшение вероятности повторения нежелательной привычки за счёт удаления её триггеров",
        "context_example": "Вечер после работы, когда тянет залипнуть в телефон и проверять соцсети",
        "steps": [
          "Определите конкретный стимул (например, наличие телефона на столе)",
          "Уберите объект из зоны видимости или досягаемости (например, оставьте телефон в другой комнате)",
          "Запишите дату и время изменения (для отслеживания эффективности)"
        ],
        "client_phrase": "Уберите источник искушения из вашей среды — действие станет менее вероятным",
        "success_criteria": "Частота использования телефона в моменты, когда это не нужно, снижается с 5 раз/день до 1–2 раз/день за 2 недели"
      }
    ]
  },
  "limitations": [
    {
      "description": "Идеи не работают, если триггер (то, что в окружении запускает действие) не устранён или остаётся доступным, так как привычка может вернуться при появлении стимула",
      "when_relevant": "Когда человек не полностью убирает триггер из своей среды или сталкивается с ним в новой обстановке",
      "example": "Человек удалил сигареты из дома, но снова начинает курить на работе среди коллег-курильщиков"
    },
    {
      "description": "Техники могут не сработать, если негативные эмоции (стресс, тревога) остаются необратленными и усиливают нежелательное поведение",
      "when_relevant": "Когда человек продолжает испытывать сильный стресс или эмоциональные трудности, не решая их на уровне среды",
      "example": "Человек убрал телефон из комнаты, но всё равно переедает перед сном из-за хронической тревоги"
    },
    {
      "description": "Изменения среды могут быть недостаточны, если привычка закреплена на уровне автоматических нейронных паттернов и не сопровождается новыми, здоровыми привычками",
      "when_relevant": "Когда человек устраняет триггер, но не вводит альтернативное поведение для подкрепления",
      "example": "Человек убрал телевизор из спальни, но не нашёл замену в виде чтения или медитации и проводит время впустую"
    }
  ],
  "tags": {
    "principle": [
      {
        "tag": "среда формирует поведение",
        "confidence": 0.95
      },
      {
        "tag": "привычки не исчезают",
        "confidence": 0.92
      },
      {
        "tag": "самоконтроль краткосрочен",
        "confidence": 0.9
      },
      {
        "tag": "дисциплина через среду",
        "confidence": 0.9
      },
      {
        "tag": "негативные эмоции усиливают поведение",
        "confidence": 0.85
      }
    ],
    "psychology": [
      {
        "tag": "стимул",
        "confidence": 0.95
      },
      {
        "tag": "привычка",
        "confidence": 0.95
      },
      {
        "tag": "желание вызванное стимулом",
        "confidence": 0.9
      },
      {
        "tag": "аутокаталитический процесс",
        "confidence": 0.85
      },
      {
        "tag": "подкрепление",
        "confidence": 0.8
      }
    ],
    "method": [
      {
        "tag": "снижение доступности стимула",
        "confidence": 0.95
      },
      {
        "tag": "настройка среды",
        "confidence": 0.92
      },
      {
        "tag": "устранение триггеров",
        "confidence": 0.9
      }
    ],
    "result": [
      {
        "tag": "уменьшение вредных привычек",
        "confidence": 0.95
      },
      {
        "tag": "устойчивое поведение",
        "confidence": 0.9
      },
      {
        "tag": "снижение искушений",
        "confidence": 0.85
      }
    ],
    "context": [
      {
        "tag": "поведенческая психология",
        "confidence": 0.95
      },
      {
        "tag": "привычки",
        "confidence": 0.92
      },
      {
        "tag": "атомные привычки",
        "confidence": 0.9
      }
    ]
  },
  "removed": []
 }
--- a/2b_финальная_валидация_согласованности/run_consistency_ollama.py
+++ b/2b_финальная_валидация_согласованности/run_consistency_ollama.py
@@ -0,0 +1,185 @@
 #!/usr/bin/env python3
 """
 Финальная валидация согласованности анализа главы через Ollama (шаг 2b).
 Проверяет связи между блоками: application ↔ framework, insights ↔ framework, limitations ↔ остальное.
 Вход: merge.json (полный анализ), вход_главы.json (метаданные главы).
 Выход: один JSON-файл (verdict, score, inconsistencies).
 """
 import argparse
 import json
 import re
 import sys
 import time
 import urllib.request
 from pathlib import Path
 OLLAMA_URL = "http://localhost:11434"
 MODEL = "qwen3:14b"
 DIR = Path(__file__).resolve().parent
 DEFAULT_MERGE = DIR.parent / "1_анализ_главы" / "merge.json"
 DEFAULT_CHAPTER = DIR.parent / "1_анализ_главы" / "вход_главы.json"
 OLLAMA_OPTIONS = {
    "temperature": 0.2,
    "num_ctx": 8500,
    "num_predict": 2048,
    "repeat_penalty": 1.1,
 }
 PROMPT_FILE = "validate_consistency.txt"
 def load_json(path: Path) -> dict:
    """Загружает JSON из файла."""
    with open(path, encoding="utf-8") as f:
        return json.load(f)
 def load_prompt(filename: str) -> str:
    """Загружает шаблон промпта из файла."""
    with open(DIR / filename, encoding="utf-8") as f:
        return f.read()
 def substitute_prompt(
    prompt: str,
    book_title: str,
    chapter_title: str,
    full_analysis_json: str,
 ) -> str:
    """Подставляет в промпт поля главы и полный JSON анализа."""
    return (
        prompt.replace("{book_title}", book_title)
        .replace("{chapter_title}", chapter_title)
        .replace("{full_analysis_json}", full_analysis_json)
    )
 def extract_json_from_response(text: str) -> dict:
    """Достаёт JSON из ответа модели (может быть обёрнут в ```json ... ```)."""
    text = text.strip()
    match = re.search(r"```(?:json)?\s*([\s\S]*?)\s*```", text)
    if match:
        text = match.group(1).strip()
    return json.loads(text)
 def call_ollama(prompt: str) -> str:
    """Вызывает Ollama /api/chat и возвращает content ответа."""
    body = json.dumps(
        {
            "model": MODEL,
            "messages": [{"role": "user", "content": prompt}],
            "stream": False,
            "format": "json",
            "options": OLLAMA_OPTIONS,
            "keep_alive": 0,
        },
        ensure_ascii=False,
    ).encode("utf-8")
    req = urllib.request.Request(
        f"{OLLAMA_URL}/api/chat",
        data=body,
        headers={"Content-Type": "application/json"},
        method="POST",
    )
    try:
        with urllib.request.urlopen(req, timeout=None) as resp:
            data = json.load(resp)
        return data.get("message", {}).get("content", "")
    except urllib.error.HTTPError as e:
        body_b = b""
        if e.fp:
            try:
                body_b = e.fp.read()[:1000]
            except Exception:
                pass
        raise RuntimeError(
            f"Ollama HTTP {e.code}: {e.reason}. Body: {body_b.decode('utf-8', errors='replace')}"
        ) from e
 def main() -> int:
    """Загружает данные, вызывает валидатор согласованности, пишет результат в JSON."""
    parser = argparse.ArgumentParser(
        description="Финальная валидация согласованности анализа главы через Ollama (шаг 2b)."
    )
    parser.add_argument(
        "--merge",
        type=Path,
        default=DEFAULT_MERGE,
        help=f"Путь к merge.json (по умолчанию: {DEFAULT_MERGE})",
    )
    parser.add_argument(
        "--chapter",
        type=Path,
        default=DEFAULT_CHAPTER,
        help=f"Путь к вход_главы.json (по умолчанию: {DEFAULT_CHAPTER})",
    )
    parser.add_argument(
        "-o",
        "--output",
        type=Path,
        default=DIR / "consistency_result.json",
        help="Путь к выходному JSON (по умолчанию: consistency_result.json)",
    )
    args = parser.parse_args()
    if not args.merge.is_file():
        print(f"Файл не найден: {args.merge}", file=sys.stderr)
        return 1
    if not args.chapter.is_file():
        print(f"Файл не найден: {args.chapter}", file=sys.stderr)
        return 1
    print("Загрузка merge.json и вход_главы.json...")
    merge = load_json(args.merge)
    chapter = load_json(args.chapter)
    book_title = chapter.get("book_title", "")
    chapter_title = chapter.get("chapter_title", "")
    full_analysis_json = json.dumps(merge, ensure_ascii=False, indent=2)
    prompt_tpl = load_prompt(PROMPT_FILE)
    prompt = substitute_prompt(
        prompt_tpl,
        book_title,
        chapter_title,
        full_analysis_json,
    )
    print(f"Вызов Ollama {MODEL} — валидация согласованности...")
    t0 = time.monotonic()
    try:
        raw = call_ollama(prompt)
    except Exception as e:
        print(f"Ошибка вызова Ollama: {e}", file=sys.stderr)
        return 1
    elapsed = time.monotonic() - t0
    print(f"Ответ получен за {elapsed:.1f} сек ({elapsed / 60:.1f} мин)")
    try:
        result = extract_json_from_response(raw)
    except json.JSONDecodeError as e:
        print(f"Не удалось распарсить JSON ответа: {e}", file=sys.stderr)
        print("Первые 500 символов ответа:", raw[:500], file=sys.stderr)
        return 1
    if not isinstance(result, dict):
        print(
            f"Ожидался объект JSON, получен: {type(result).__name__}",
            file=sys.stderr,
        )
        return 1
    args.output.parent.mkdir(parents=True, exist_ok=True)
    with open(args.output, "w", encoding="utf-8") as f:
        json.dump(result, f, ensure_ascii=False, indent=2)
    print(f"Записано: {args.output}")
    verdict = result.get("verdict", "?")
    print(f"Вердикт: {verdict}")
    return 0
 if __name__ == "__main__":
    sys.exit(main())
--- a/3_извлечение_тегов/README.md
+++ b/3_извлечение_тегов/README.md
@@ -27,6 +27,29 @@
 JSON с тегами по категориям (ключи на английском: `principle`, `psychology`, `method`, `result`, `context`) и confidence score для каждого тега; при необходимости — кандидаты в `proposed` с полем `category` из того же набора. Маппинг категорий: ARCHITECTURE_SUMMARY.md → раздел «Хранение данных» → таблица `tags`.
-## Использование
+## Скрипт через Ollama
-Вызывается после шага 2b (финальная валидация). Модель: qwen3-14b:8bit (или аналог). Перед вызовом в промпт подставляется актуальный список тегов из БД.
+`run_extract_tags_ollama.py` — один вызов Ollama для извлечения тегов по категориям. На выходе один JSON-файл.
 **Вход (по умолчанию):**
 - `../1_анализ_главы/merge.json` — полный анализ (framework, insights, application, limitations)
 - `../1_анализ_главы/вход_главы.json` — текст главы и метаданные
 - `allowed_tags.json` — допустимые теги по категориям (объект с ключами principle, psychology, method, result, context и массивами строк). Если файла нет — используется пустой список (модель вернёт только блок `proposed`). Пример: `allowed_tags.example.json`.
 **Выход:** `extracted_tags.json` в каталоге скрипта (или путь через `-o`).
 **Формат выхода:** `tags` (по категориям: principle, psychology, method, result, context — массивы объектов `{ "tag", "confidence" }`), `proposed` (кандидаты в новые теги).
 **Запуск:**
 ```bash
 cd 3_извлечение_тегов
 # подготовить список тегов (скопировать пример или экспорт из БД):
 cp allowed_tags.example.json allowed_tags.json
 python3 run_extract_tags_ollama.py
 # с указанием путей:
 python3 run_extract_tags_ollama.py --merge /path/to/merge.json --chapter /path/to/вход_главы.json --allowed-tags allowed_tags.json -o extracted_tags.json
 ```
 ## Использование в пайплайне
 Вызывается после шага 2b (финальная валидация). Модель: qwen3-14b:8bit (или аналог). Перед вызовом в промпт подставляется актуальный список тегов из БД (или из файла `allowed_tags.json`).
--- a/3_извлечение_тегов/allowed_tags.example.json
+++ b/3_извлечение_тегов/allowed_tags.example.json
@@ -0,0 +1,31 @@
 {
  "principle": [
    "среда формирует поведение",
    "привычки не исчезают",
    "самоконтроль краткосрочен",
    "дисциплина через среду",
    "негативные эмоции усиливают поведение"
  ],
  "psychology": [
    "стимул",
    "привычка",
    "желание вызванное стимулом",
    "аутокаталитический процесс",
    "подкрепление"
  ],
  "method": [
    "снижение доступности стимула",
    "настройка среды",
    "устранение триггеров"
  ],
  "result": [
    "уменьшение вредных привычек",
    "устойчивое поведение",
    "снижение искушений"
  ],
  "context": [
    "поведенческая психология",
    "привычки",
    "атомные привычки"
  ]
 }
--- a/3_извлечение_тегов/run_extract_tags_ollama.py
+++ b/3_извлечение_тегов/run_extract_tags_ollama.py
@@ -0,0 +1,224 @@
 #!/usr/bin/env python3
 """
 Извлечение тегов по категориям из анализа главы через Ollama (шаг 3).
 Вход: merge.json (анализ), вход_главы.json (текст главы), allowed_tags.json (допустимые теги).
 Выход: один JSON-файл (tags по категориям, proposed).
 """
 import argparse
 import json
 import re
 import sys
 import time
 import urllib.request
 from pathlib import Path
 OLLAMA_URL = "http://localhost:11434"
 MODEL = "qwen3:14b"
 DIR = Path(__file__).resolve().parent
 DEFAULT_MERGE = DIR.parent / "1_анализ_главы" / "merge.json"
 DEFAULT_CHAPTER = DIR.parent / "1_анализ_главы" / "вход_главы.json"
 DEFAULT_ALLOWED_TAGS = DIR / "allowed_tags.json"
 OLLAMA_OPTIONS = {
    "temperature": 0.3,
    "num_ctx": 8500,
    "num_predict": 2048,
    "repeat_penalty": 1.1,
 }
 PROMPT_FILE = "extract_tags.txt"
 def load_json(path: Path) -> dict:
    """Загружает JSON из файла."""
    with open(path, encoding="utf-8") as f:
        return json.load(f)
 def load_prompt(filename: str) -> str:
    """Загружает шаблон промпта из файла."""
    with open(DIR / filename, encoding="utf-8") as f:
        return f.read()
 def substitute_prompt(
    prompt: str,
    book_title: str,
    chapter_title: str,
    framework_str: str,
    insights_str: str,
    application_str: str,
    limitations_str: str,
    chapter_text: str,
    allowed_tags_str: str,
 ) -> str:
    """Подставляет в промпт все поля."""
    return (
        prompt.replace("{book_title}", book_title)
        .replace("{chapter_title}", chapter_title)
        .replace("{framework}", framework_str)
        .replace("{insights}", insights_str)
        .replace("{application}", application_str)
        .replace("{limitations}", limitations_str)
        .replace("{chapter_text}", chapter_text)
        .replace("{allowed_tags_json}", allowed_tags_str)
    )
 def extract_json_from_response(text: str) -> dict:
    """Достаёт JSON из ответа модели (может быть обёрнут в ```json ... ```)."""
    text = text.strip()
    match = re.search(r"```(?:json)?\s*([\s\S]*?)\s*```", text)
    if match:
        text = match.group(1).strip()
    return json.loads(text)
 def call_ollama(prompt: str) -> str:
    """Вызывает Ollama /api/chat и возвращает content ответа."""
    body = json.dumps(
        {
            "model": MODEL,
            "messages": [{"role": "user", "content": prompt}],
            "stream": False,
            "format": "json",
            "options": OLLAMA_OPTIONS,
            "keep_alive": 0,
        },
        ensure_ascii=False,
    ).encode("utf-8")
    req = urllib.request.Request(
        f"{OLLAMA_URL}/api/chat",
        data=body,
        headers={"Content-Type": "application/json"},
        method="POST",
    )
    try:
        with urllib.request.urlopen(req, timeout=None) as resp:
            data = json.load(resp)
        return data.get("message", {}).get("content", "")
    except urllib.error.HTTPError as e:
        body_b = b""
        if e.fp:
            try:
                body_b = e.fp.read()[:1000]
            except Exception:
                pass
        raise RuntimeError(
            f"Ollama HTTP {e.code}: {e.reason}. Body: {body_b.decode('utf-8', errors='replace')}"
        ) from e
 def main() -> int:
    """Загружает данные, вызывает извлечение тегов, пишет результат в JSON."""
    parser = argparse.ArgumentParser(
        description="Извлечение тегов по категориям из анализа главы через Ollama (шаг 3)."
    )
    parser.add_argument(
        "--merge",
        type=Path,
        default=DEFAULT_MERGE,
        help=f"Путь к merge.json (по умолчанию: {DEFAULT_MERGE})",
    )
    parser.add_argument(
        "--chapter",
        type=Path,
        default=DEFAULT_CHAPTER,
        help=f"Путь к вход_главы.json (по умолчанию: {DEFAULT_CHAPTER})",
    )
    parser.add_argument(
        "--allowed-tags",
        type=Path,
        default=DEFAULT_ALLOWED_TAGS,
        help=f"Путь к JSON со списком допустимых тегов по категориям (по умолчанию: allowed_tags.json). Формат: объект с ключами principle, psychology, method, result, context и массивами строк.",
    )
    parser.add_argument(
        "-o",
        "--output",
        type=Path,
        default=DIR / "extracted_tags.json",
        help="Путь к выходному JSON (по умолчанию: extracted_tags.json)",
    )
    args = parser.parse_args()
    if not args.merge.is_file():
        print(f"Файл не найден: {args.merge}", file=sys.stderr)
        return 1
    if not args.chapter.is_file():
        print(f"Файл не найден: {args.chapter}", file=sys.stderr)
        return 1
    print("Загрузка merge.json, вход_главы.json и allowed_tags...")
    merge = load_json(args.merge)
    chapter = load_json(args.chapter)
    if args.allowed_tags.is_file():
        allowed_tags = load_json(args.allowed_tags)
    else:
        allowed_tags = {}
        print(
            f"Файл {args.allowed_tags} не найден; используется пустой список тегов (модель вернёт только proposed).",
            file=sys.stderr,
        )
    book_title = chapter.get("book_title", "")
    chapter_title = chapter.get("chapter_title", "")
    chapter_text = chapter.get("chapter_text", "")
    framework_str = json.dumps(merge.get("framework", {}), ensure_ascii=False, indent=2)
    insights_str = json.dumps(merge.get("insights", []), ensure_ascii=False, indent=2)
    application_str = json.dumps(
        merge.get("application", {}), ensure_ascii=False, indent=2
    )
    limitations_str = json.dumps(
        merge.get("limitations", []), ensure_ascii=False, indent=2
    )
    allowed_tags_str = json.dumps(allowed_tags, ensure_ascii=False, indent=2)
    prompt_tpl = load_prompt(PROMPT_FILE)
    prompt = substitute_prompt(
        prompt_tpl,
        book_title,
        chapter_title,
        framework_str,
        insights_str,
        application_str,
        limitations_str,
        chapter_text,
        allowed_tags_str,
    )
    print(f"Вызов Ollama {MODEL} — извлечение тегов...")
    t0 = time.monotonic()
    try:
        raw = call_ollama(prompt)
    except Exception as e:
        print(f"Ошибка вызова Ollama: {e}", file=sys.stderr)
        return 1
    elapsed = time.monotonic() - t0
    print(f"Ответ получен за {elapsed:.1f} сек ({elapsed / 60:.1f} мин)")
    try:
        result = extract_json_from_response(raw)
    except json.JSONDecodeError as e:
        print(f"Не удалось распарсить JSON ответа: {e}", file=sys.stderr)
        print("Первые 500 символов ответа:", raw[:500], file=sys.stderr)
        return 1
    if not isinstance(result, dict):
        print(
            f"Ожидался объект JSON, получен: {type(result).__name__}",
            file=sys.stderr,
        )
        return 1
    args.output.parent.mkdir(parents=True, exist_ok=True)
    with open(args.output, "w", encoding="utf-8") as f:
        json.dump(result, f, ensure_ascii=False, indent=2)
    print(f"Записано: {args.output}")
    return 0
 if __name__ == "__main__":
    sys.exit(main())
--- a/4_валидация_тегов/README.md
+++ b/4_валидация_тегов/README.md
@@ -26,6 +26,27 @@
 JSON: проверенные теги по категориям с обновлёнными confidence; теги, снятые при валидации, — в блоке `removed` (tag, category, reason). Формат `tags` совпадает с выходом шага 3 для передачи в эмбеддинг и сохранение в БД.
-## Использование
+## Скрипт через Ollama
 `run_validate_tags_ollama.py` — один вызов Ollama для валидации извлечённых тегов. На выходе один JSON-файл.
 **Вход (по умолчанию):**
 - `../3_извлечение_тегов/extracted_tags.json` — результат шага 3 (tags по категориям, proposed)
 - `../1_анализ_главы/merge.json` — полный анализ (framework, insights, application)
 - `../1_анализ_главы/вход_главы.json` — текст главы и метаданные
 **Выход:** `validated_tags.json` в каталоге скрипта (или путь через `-o`).
 **Формат выхода:** `tags` (по категориям с обновлённым confidence), `removed` (массив снятых тегов: tag, category, reason).
 **Запуск:**
 ```bash
 cd 4_валидация_тегов
 python3 run_validate_tags_ollama.py
 # с указанием путей:
 python3 run_validate_tags_ollama.py --extracted-tags /path/to/extracted_tags.json --merge /path/to/merge.json --chapter /path/to/вход_главы.json -o validated_tags.json
 ```
 ## Использование в пайплайне
 Вызывается после шага 3 (извлечение тегов). Модель: qwen3-14b:8bit (или аналог). Время: ~20–30 сек на главу.
--- a/4_валидация_тегов/run_validate_tags_ollama.py
+++ b/4_валидация_тегов/run_validate_tags_ollama.py
@@ -0,0 +1,216 @@
 #!/usr/bin/env python3
 """
 Валидация извлечённых тегов через Ollama (шаг 4).
 Проверка релевантности тегов содержанию главы и анализу; снятие нерелевантных, обновление confidence.
 Вход: extracted_tags.json (шаг 3), merge.json (анализ), вход_главы.json (текст главы).
 Выход: один JSON-файл (tags с обновлённым confidence, removed).
 """
 import argparse
 import json
 import re
 import sys
 import time
 import urllib.request
 from pathlib import Path
 OLLAMA_URL = "http://localhost:11434"
 MODEL = "qwen3:14b"
 DIR = Path(__file__).resolve().parent
 DEFAULT_EXTRACTED_TAGS = DIR.parent / "3_извлечение_тегов" / "extracted_tags.json"
 DEFAULT_MERGE = DIR.parent / "1_анализ_главы" / "merge.json"
 DEFAULT_CHAPTER = DIR.parent / "1_анализ_главы" / "вход_главы.json"
 OLLAMA_OPTIONS = {
    "temperature": 0.2,
    "num_ctx": 8500,
    "num_predict": 2048,
    "repeat_penalty": 1.1,
 }
 PROMPT_FILE = "validate_tags.txt"
 def load_json(path: Path) -> dict:
    """Загружает JSON из файла."""
    with open(path, encoding="utf-8") as f:
        return json.load(f)
 def load_prompt(filename: str) -> str:
    """Загружает шаблон промпта из файла."""
    with open(DIR / filename, encoding="utf-8") as f:
        return f.read()
 def substitute_prompt(
    prompt: str,
    book_title: str,
    chapter_title: str,
    extracted_tags_str: str,
    framework_str: str,
    insights_str: str,
    application_str: str,
    chapter_text: str,
 ) -> str:
    """Подставляет в промпт все поля."""
    return (
        prompt.replace("{book_title}", book_title)
        .replace("{chapter_title}", chapter_title)
        .replace("{extracted_tags_json}", extracted_tags_str)
        .replace("{framework}", framework_str)
        .replace("{insights}", insights_str)
        .replace("{application}", application_str)
        .replace("{chapter_text}", chapter_text)
    )
 def extract_json_from_response(text: str) -> dict:
    """Достаёт JSON из ответа модели (может быть обёрнут в ```json ... ```)."""
    text = text.strip()
    match = re.search(r"```(?:json)?\s*([\s\S]*?)\s*```", text)
    if match:
        text = match.group(1).strip()
    return json.loads(text)
 def call_ollama(prompt: str) -> str:
    """Вызывает Ollama /api/chat и возвращает content ответа."""
    body = json.dumps(
        {
            "model": MODEL,
            "messages": [{"role": "user", "content": prompt}],
            "stream": False,
            "format": "json",
            "options": OLLAMA_OPTIONS,
            "keep_alive": 0,
        },
        ensure_ascii=False,
    ).encode("utf-8")
    req = urllib.request.Request(
        f"{OLLAMA_URL}/api/chat",
        data=body,
        headers={"Content-Type": "application/json"},
        method="POST",
    )
    try:
        with urllib.request.urlopen(req, timeout=None) as resp:
            data = json.load(resp)
        return data.get("message", {}).get("content", "")
    except urllib.error.HTTPError as e:
        body_b = b""
        if e.fp:
            try:
                body_b = e.fp.read()[:1000]
            except Exception:
                pass
        raise RuntimeError(
            f"Ollama HTTP {e.code}: {e.reason}. Body: {body_b.decode('utf-8', errors='replace')}"
        ) from e
 def main() -> int:
    """Загружает данные, вызывает валидацию тегов, пишет результат в JSON."""
    parser = argparse.ArgumentParser(
        description="Валидация извлечённых тегов через Ollama (шаг 4)."
    )
    parser.add_argument(
        "--extracted-tags",
        type=Path,
        default=DEFAULT_EXTRACTED_TAGS,
        help=f"Путь к extracted_tags.json из шага 3 (по умолчанию: {DEFAULT_EXTRACTED_TAGS})",
    )
    parser.add_argument(
        "--merge",
        type=Path,
        default=DEFAULT_MERGE,
        help=f"Путь к merge.json (по умолчанию: {DEFAULT_MERGE})",
    )
    parser.add_argument(
        "--chapter",
        type=Path,
        default=DEFAULT_CHAPTER,
        help=f"Путь к вход_главы.json (по умолчанию: {DEFAULT_CHAPTER})",
    )
    parser.add_argument(
        "-o",
        "--output",
        type=Path,
        default=DIR / "validated_tags.json",
        help="Путь к выходному JSON (по умолчанию: validated_tags.json)",
    )
    args = parser.parse_args()
    if not args.extracted_tags.is_file():
        print(f"Файл не найден: {args.extracted_tags}", file=sys.stderr)
        return 1
    if not args.merge.is_file():
        print(f"Файл не найден: {args.merge}", file=sys.stderr)
        return 1
    if not args.chapter.is_file():
        print(f"Файл не найден: {args.chapter}", file=sys.stderr)
        return 1
    print("Загрузка extracted_tags.json, merge.json и вход_главы.json...")
    extracted = load_json(args.extracted_tags)
    merge = load_json(args.merge)
    chapter = load_json(args.chapter)
    book_title = chapter.get("book_title", "")
    chapter_title = chapter.get("chapter_title", "")
    chapter_text = chapter.get("chapter_text", "")
    extracted_tags_str = json.dumps(extracted, ensure_ascii=False, indent=2)
    framework_str = json.dumps(merge.get("framework", {}), ensure_ascii=False, indent=2)
    insights_str = json.dumps(merge.get("insights", []), ensure_ascii=False, indent=2)
    application_str = json.dumps(
        merge.get("application", {}), ensure_ascii=False, indent=2
    )
    prompt_tpl = load_prompt(PROMPT_FILE)
    prompt = substitute_prompt(
        prompt_tpl,
        book_title,
        chapter_title,
        extracted_tags_str,
        framework_str,
        insights_str,
        application_str,
        chapter_text,
    )
    print(f"Вызов Ollama {MODEL} — валидация тегов...")
    t0 = time.monotonic()
    try:
        raw = call_ollama(prompt)
    except Exception as e:
        print(f"Ошибка вызова Ollama: {e}", file=sys.stderr)
        return 1
    elapsed = time.monotonic() - t0
    print(f"Ответ получен за {elapsed:.1f} сек ({elapsed / 60:.1f} мин)")
    try:
        result = extract_json_from_response(raw)
    except json.JSONDecodeError as e:
        print(f"Не удалось распарсить JSON ответа: {e}", file=sys.stderr)
        print("Первые 500 символов ответа:", raw[:500], file=sys.stderr)
        return 1
    if not isinstance(result, dict):
        print(
            f"Ожидался объект JSON, получен: {type(result).__name__}",
            file=sys.stderr,
        )
        return 1
    args.output.parent.mkdir(parents=True, exist_ok=True)
    with open(args.output, "w", encoding="utf-8") as f:
        json.dump(result, f, ensure_ascii=False, indent=2)
    print(f"Записано: {args.output}")
    removed_count = len(result.get("removed", []))
    print(f"Снято тегов: {removed_count}")
    return 0
 if __name__ == "__main__":
    sys.exit(main())
--- a/5_мерж_анализа_и_тегов/README.md
+++ b/5_мерж_анализа_и_тегов/README.md
@@ -14,16 +14,37 @@
 Один JSON: все поля анализа + `tags`, `removed`. Если задан `--input-chapter`, в выход добавляются метаданные главы/книги (book_id, chapter_id, chapter_number, chapter_title, book_title, author). Этот документ передаётся в шаг 6 (генерация эмбеддингов) и в шаг 7 (payload Qdrant).
-## Использование
+## Скрипт с путями по умолчанию
 `run_merge_analysis_tags.py` — мерж с путями по умолчанию (как в остальных этапах). Без вызова LLM.
 **Вход (по умолчанию):**
 - `../1_анализ_главы/merge.json` — полный анализ (framework, insights, application, limitations)
 - `../4_валидация_тегов/validated_tags.json` — результат шага 4 (tags, removed)
 - `../1_анализ_главы/вход_главы.json` — метаданные главы/книги (book_id, chapter_id и т.д.; подставляются в выход для шагов 6–8)
 **Выход:** `merged_with_tags.json` в каталоге скрипта (или путь через `-o`).
 **Запуск:**
 ```bash
-python3 merge_analysis_tags.py <merge.json> <выход_valid_tag.json> [--input-chapter вход_главы.json] [-o выход.json]
+cd 5_мерж_анализа_и_тегов
 python3 run_merge_analysis_tags.py
 # с указанием путей:
 python3 run_merge_analysis_tags.py --merge /path/to/merge.json --tags /path/to/validated_tags.json --input-chapter /path/to/вход_главы.json -o merged_with_tags.json
 # без метаданных главы:
 python3 run_merge_analysis_tags.py --no-chapter
 ```
-Пример (с метаданными для шага 7):
+## Универсальный скрипт (позиционные аргументы)
 ```bash
-python3 merge_analysis_tags.py ../2b_финальная_валидация_согласованности/merge.json ../4_валидация_тегов/выход_valid_tag.json --input-chapter ../1_анализ_главы/вход_главы.example.json -o merged_with_tags.json
+python3 merge_analysis_tags.py <merge.json> <validated_tags.json> [--input-chapter вход_главы.json] [-o выход.json]
 ```
 Пример:
 ```bash
 python3 merge_analysis_tags.py ../1_анализ_главы/merge.json ../4_валидация_тегов/validated_tags.json --input-chapter ../1_анализ_главы/вход_главы.json -o merged_with_tags.json
 ```
 Без `-o` результат выводится в stdout.
--- a/5_мерж_анализа_и_тегов/run_merge_analysis_tags.py
+++ b/5_мерж_анализа_и_тегов/run_merge_analysis_tags.py
@@ -0,0 +1,95 @@
 #!/usr/bin/env python3
 """
 Запуск шага 5 с путями по умолчанию: мерж анализа (2b) и валидированных тегов (4).
 Без вызова LLM — только слияние JSON. Использует merge_analysis_tags.merge_analysis_and_tags.
 Вход по умолчанию: merge.json (1), validated_tags.json (4), вход_главы.json (1).
 Выход по умолчанию: merged_with_tags.json в каталоге скрипта.
 """
 import argparse
 import json
 import sys
 from pathlib import Path
 DIR = Path(__file__).resolve().parent
 DEFAULT_ANALYSIS = DIR.parent / "1_анализ_главы" / "merge.json"
 DEFAULT_TAGS = DIR.parent / "4_валидация_тегов" / "validated_tags.json"
 DEFAULT_CHAPTER = DIR.parent / "1_анализ_главы" / "вход_главы.json"
 DEFAULT_OUTPUT = DIR / "merged_with_tags.json"
 # Импорт логики мержа из основного скрипта
 from merge_analysis_tags import load_json, merge_analysis_and_tags
 def main() -> int:
    """Загружает анализ и теги по путям (по умолчанию — из соседних этапов), мержит, пишет выход."""
    parser = argparse.ArgumentParser(
        description="Мерж анализа (2b) и валидированных тегов (4) в один JSON (шаг 5). Пути по умолчанию — из этапов 1 и 4.",
    )
    parser.add_argument(
        "--merge",
        type=Path,
        default=DEFAULT_ANALYSIS,
        help=f"Путь к merge.json с анализом (по умолчанию: {DEFAULT_ANALYSIS})",
    )
    parser.add_argument(
        "--tags",
        type=Path,
        default=DEFAULT_TAGS,
        help=f"Путь к validated_tags.json (по умолчанию: {DEFAULT_TAGS})",
    )
    parser.add_argument(
        "--input-chapter",
        type=Path,
        default=DEFAULT_CHAPTER,
        help=f"Путь к вход_главы.json для метаданных главы/книги (по умолчанию: {DEFAULT_CHAPTER})",
    )
    parser.add_argument(
        "-o",
        "--output",
        type=Path,
        default=DEFAULT_OUTPUT,
        help=f"Путь к выходному JSON (по умолчанию: {DEFAULT_OUTPUT})",
    )
    parser.add_argument(
        "--no-chapter",
        action="store_true",
        help="Не подставлять метаданные главы из --input-chapter.",
    )
    args = parser.parse_args()
    if not args.merge.is_file():
        print(f"Файл не найден: {args.merge}", file=sys.stderr)
        return 1
    if not args.tags.is_file():
        print(f"Файл не найден: {args.tags}", file=sys.stderr)
        return 1
    print("Загрузка merge.json и validated_tags.json...")
    try:
        analysis = load_json(args.merge)
        tags_doc = load_json(args.tags)
    except json.JSONDecodeError as e:
        print(f"Ошибка разбора JSON: {e}", file=sys.stderr)
        return 1
    input_chapter = None
    if not args.no_chapter and args.input_chapter.is_file():
        try:
            input_chapter = load_json(args.input_chapter)
        except json.JSONDecodeError as e:
            print(f"Ошибка разбора input-chapter JSON: {e}", file=sys.stderr)
            return 1
    elif not args.no_chapter and not args.input_chapter.is_file():
        print(f"Файл не найден (метаданные главы не добавлены): {args.input_chapter}", file=sys.stderr)
    merged = merge_analysis_and_tags(analysis, tags_doc, input_chapter)
    args.output.parent.mkdir(parents=True, exist_ok=True)
    with open(args.output, "w", encoding="utf-8") as f:
        json.dump(merged, f, ensure_ascii=False, indent=2)
    print(f"Записано: {args.output}")
    return 0
 if __name__ == "__main__":
    sys.exit(main())
--- a/6_генерация_эмбеддингов/README.md
+++ b/6_генерация_эмбеддингов/README.md
@@ -30,6 +30,29 @@
 Ограничения и limitations в эмбеддинг по умолчанию не включаются (опционально — в конфиге). Теги — только в payload, не в тексте для эмбеддинга.
-## Использование
+## Скрипт через Ollama
 `run_embed_ollama.py` — один вызов Ollama `/api/embed` для генерации вектора по JSON шага 5. Текст для эмбеддинга собирается из framework, insights, application по `embed_input_spec.txt` (функция `merged_json_to_embed_text` из `embed_cli.py`).
 **Вход (по умолчанию):**
 - `../5_мерж_анализа_и_тегов/merged_with_tags.json` — результат шага 5 (анализ + теги)
 **Выход:** `embedding.json` в каталоге скрипта — массив float (вектор размерности 1024 для bge-m3).
 **Запуск:**
 ```bash
 cd 6_генерация_эмбеддингов
 python3 run_embed_ollama.py
 # с указанием путей:
 python3 run_embed_ollama.py --merged /path/to/merged_with_tags.json -o embedding.json
 # другая модель или URL Ollama:
 python3 run_embed_ollama.py --model bge-m3 --ollama-url http://localhost:11434
 ```
 ## Универсальный CLI (OpenAI-совместимый API)
 `embed_cli.py` — для LM Studio или другого OpenAI-совместимого API (позиционные аргументы: путь к JSON, имя модели, опционально `--base-url`, `-o`).
 ## Использование в пайплайне
 Вызывается после шага 5 (мерж анализа и тегов). Модель задаётся конфигом (env/конфиг); смена модели не меняет формат хранения в Qdrant, при смене — пересчёт эмбеддингов по необходимости.
--- a/6_генерация_эмбеддингов/run_embed_ollama.py
+++ b/6_генерация_эмбеддингов/run_embed_ollama.py
@@ -0,0 +1,142 @@
 #!/usr/bin/env python3
 """
 Генерация эмбеддинга по JSON шага 5 через Ollama (шаг 6).
 Текст для эмбеддинга собирается из framework, insights, application по embed_input_spec.txt.
 Вход по умолчанию: merged_with_tags.json (5). Выход по умолчанию: embedding.json (вектор).
 """
 import argparse
 import json
 import sys
 import time
 import urllib.error
 import urllib.request
 from pathlib import Path
 from typing import Any
 DIR = Path(__file__).resolve().parent
 DEFAULT_MERGED = DIR.parent / "5_мерж_анализа_и_тегов" / "merged_with_tags.json"
 DEFAULT_OUTPUT = DIR / "embedding.json"
 OLLAMA_URL = "http://localhost:11434"
 EMBED_MODEL = "bge-m3"
 def get_embedding_ollama(base_url: str, model: str, text: str) -> list[float]:
    """
    Запрашивает эмбеддинг текста у Ollama API (POST /api/embed).
    Args:
        base_url: Базовый URL Ollama (например http://localhost:11434).
        model: Имя модели эмбеддингов (например bge-m3).
        text: Текст для эмбеддинга.
    Returns:
        Вектор эмбеддинга (список float).
    Raises:
        urllib.error.HTTPError: При ошибке HTTP.
        ValueError: Если в ответе нет ожидаемой структуры.
    """
    url = f"{base_url.rstrip('/')}/api/embed"
    payload = {"model": model, "input": text}
    body = json.dumps(payload, ensure_ascii=False).encode("utf-8")
    req = urllib.request.Request(
        url,
        data=body,
        headers={"Content-Type": "application/json"},
        method="POST",
    )
    with urllib.request.urlopen(req, timeout=120) as resp:
        data: dict[str, Any] = json.loads(resp.read().decode("utf-8"))
    if "embeddings" not in data or not data["embeddings"]:
        raise ValueError("В ответе Ollama нет поля embeddings")
    embedding = data["embeddings"][0]
    if not isinstance(embedding, list):
        raise ValueError("embeddings[0] не является массивом")
    return [float(x) for x in embedding]
 def main() -> int:
    """Собирает текст из merged JSON, вызывает Ollama /api/embed, пишет вектор в файл."""
    from embed_cli import merged_json_to_embed_text
    parser = argparse.ArgumentParser(
        description="Эмбеддинг по JSON шага 5 через Ollama (шаг 6). На выход — вектор (JSON).",
    )
    parser.add_argument(
        "--merged",
        type=Path,
        default=DEFAULT_MERGED,
        help=f"Путь к merged_with_tags.json (по умолчанию: {DEFAULT_MERGED})",
    )
    parser.add_argument(
        "--model",
        default=EMBED_MODEL,
        help=f"Модель эмбеддингов в Ollama (по умолчанию: {EMBED_MODEL})",
    )
    parser.add_argument(
        "--ollama-url",
        default=OLLAMA_URL,
        help=f"URL Ollama (по умолчанию: {OLLAMA_URL})",
    )
    parser.add_argument(
        "-o",
        "--output",
        type=Path,
        default=DEFAULT_OUTPUT,
        help=f"Путь к выходному JSON с вектором (по умолчанию: {DEFAULT_OUTPUT})",
    )
    args = parser.parse_args()
    if not args.merged.is_file():
        print(f"Файл не найден: {args.merged}", file=sys.stderr)
        return 1
    print("Загрузка merged_with_tags.json...")
    try:
        with open(args.merged, encoding="utf-8") as f:
            merged = json.load(f)
    except json.JSONDecodeError as e:
        print(f"Ошибка разбора JSON: {e}", file=sys.stderr)
        return 1
    text = merged_json_to_embed_text(merged)
    if not text:
        print(
            "Ошибка: текст для эмбеддинга пуст (нет framework/insights/application).",
            file=sys.stderr,
        )
        return 1
    print(f"Вызов Ollama {args.model} — генерация эмбеддинга...")
    t0 = time.monotonic()
    try:
        vector = get_embedding_ollama(args.ollama_url, args.model, text)
    except urllib.error.HTTPError as e:
        print(f"Ошибка HTTP {e.code}: {e.reason}", file=sys.stderr)
        if e.fp:
            try:
                body = e.fp.read().decode("utf-8")
                print(body[:500], file=sys.stderr)
            except Exception:
                pass
        return 1
    except urllib.error.URLError as e:
        print(f"Ошибка запроса: {e.reason}", file=sys.stderr)
        return 1
    except ValueError as e:
        print(f"Ошибка: {e}", file=sys.stderr)
        return 1
    elapsed = time.monotonic() - t0
    print(f"Эмбеддинг получен за {elapsed:.1f} сек, размерность {len(vector)}")
    args.output.parent.mkdir(parents=True, exist_ok=True)
    with open(args.output, "w", encoding="utf-8") as f:
        json.dump(vector, f, ensure_ascii=False)
    print(f"Записано: {args.output}")
    return 0
 if __name__ == "__main__":
    sys.exit(main())
--- a/7_сохранение_qdrant/README.md
+++ b/7_сохранение_qdrant/README.md
@@ -14,11 +14,17 @@
 ## Использование
 Вектор — JSON-массив чисел из шага 6: файл `embedding.json` (Ollama, `run_embed_ollama.py`) или `vector.json` / любой другой файл с массивом, либо stdin.
 ```bash
 # Вектор из файла (merged должен содержать book_id, chapter_id, chapter_number, chapter_title из шага 5 с --input-chapter)
 # Вариант 1: после run_embed_ollama.py (шаг 6 через Ollama)
 python3 save_to_qdrant.py 5_мерж_анализа_и_тегов/merged_with_tags.json 6_генерация_эмбеддингов/embedding.json [--validation-score 0.95]
 # Вариант 2: вектор в любом файле (например vector.json)
 python3 save_to_qdrant.py merged_with_tags.json vector.json [--validation-score 0.95]
-# Вектор из stdin (пайплайн с шагом 6)
+# Вектор из stdin (пайплайн с шагом 6 через embed_cli.py)
 python3 6_генерация_эмбеддингов/embed_cli.py merged_with_tags.json model_name \
  | python3 7_сохранение_qdrant/save_to_qdrant.py merged_with_tags.json -
 ```
--- a/check_postgres_schema.py
+++ b/check_postgres_schema.py
@@ -0,0 +1,42 @@
 #!/usr/bin/env python3
 """Проверка наличия таблиц схемы (books, chapters, chapter_analyses, tags, chapter_tags) в Postgres."""
 import sys
 try:
    import psycopg2
 except ImportError:
    print("Установите: pip install psycopg2-binary")
    sys.exit(1)
 HOST = "192.168.88.15"
 PORT = 5432
 USER = "n8n"
 PASSWORD = "n8n_password"
 DB = "n8n"
 EXPECTED = {"books", "chapters", "chapter_analyses", "tags", "chapter_tags"}
 try:
    conn = psycopg2.connect(
        host=HOST, port=PORT, user=USER, password=PASSWORD, dbname=DB
    )
    with conn.cursor() as cur:
        cur.execute("""
            SELECT table_name FROM information_schema.tables
            WHERE table_schema = 'public' AND table_type = 'BASE TABLE'
            ORDER BY table_name;
        """)
        found = {row[0] for row in cur.fetchall()}
    conn.close()
    print(f"Postgres {HOST}:{PORT}/{DB}")
    print("Таблицы в public:", ", ".join(sorted(found)) if found else "(нет)")
    missing = EXPECTED - found
    extra = found - EXPECTED
    if not missing:
        print("Ожидаемые таблицы этапа 8: все на месте.")
    else:
        print("Не найдены:", ", ".join(sorted(missing)))
    if extra:
        print("Доп. таблицы:", ", ".join(sorted(extra)))
 except Exception as e:
    print(f"Ошибка: {e}")
    sys.exit(1)