fix
This commit is contained in:
@@ -30,6 +30,29 @@
|
||||
|
||||
Ограничения и limitations в эмбеддинг по умолчанию не включаются (опционально — в конфиге). Теги — только в payload, не в тексте для эмбеддинга.
|
||||
|
||||
## Использование
|
||||
## Скрипт через Ollama
|
||||
|
||||
`run_embed_ollama.py` — один вызов Ollama `/api/embed` для генерации вектора по JSON шага 5. Текст для эмбеддинга собирается из framework, insights, application по `embed_input_spec.txt` (функция `merged_json_to_embed_text` из `embed_cli.py`).
|
||||
|
||||
**Вход (по умолчанию):**
|
||||
- `../5_мерж_анализа_и_тегов/merged_with_tags.json` — результат шага 5 (анализ + теги)
|
||||
|
||||
**Выход:** `embedding.json` в каталоге скрипта — массив float (вектор размерности 1024 для bge-m3).
|
||||
|
||||
**Запуск:**
|
||||
```bash
|
||||
cd 6_генерация_эмбеддингов
|
||||
python3 run_embed_ollama.py
|
||||
# с указанием путей:
|
||||
python3 run_embed_ollama.py --merged /path/to/merged_with_tags.json -o embedding.json
|
||||
# другая модель или URL Ollama:
|
||||
python3 run_embed_ollama.py --model bge-m3 --ollama-url http://localhost:11434
|
||||
```
|
||||
|
||||
## Универсальный CLI (OpenAI-совместимый API)
|
||||
|
||||
`embed_cli.py` — для LM Studio или другого OpenAI-совместимого API (позиционные аргументы: путь к JSON, имя модели, опционально `--base-url`, `-o`).
|
||||
|
||||
## Использование в пайплайне
|
||||
|
||||
Вызывается после шага 5 (мерж анализа и тегов). Модель задаётся конфигом (env/конфиг); смена модели не меняет формат хранения в Qdrant, при смене — пересчёт эмбеддингов по необходимости.
|
||||
|
||||
Reference in New Issue
Block a user