diff --git a/index.py b/index.py index 01ebfe9..da05016 100644 --- a/index.py +++ b/index.py @@ -45,8 +45,10 @@ def gather_files(root: Path): def main(): docs, meta = [], [] + files_count = 0 for fp in gather_files(ROOT): + files_count += 1 text = fp.read_text(encoding="utf-8", errors="ignore") for i, chunk in enumerate(split(text)): docs.append(chunk) @@ -55,7 +57,7 @@ def main(): if not docs: raise SystemExit("Aucun fichier trouvé dans /app/Fiches. Vérifiez le montage ou les extensions.") - print(f"Découpé {len(docs)} passages, génération des embeddings…") + print(f"Traité {files_count} fichiers, découpé {len(docs)} passages, génération des embeddings…") model = BGEM3FlagModel(MODEL_NAME, device="cpu") emb = model.encode(docs, batch_size=64) # pas de normalisation interne