⚡ Execução do Pipeline

📄

Extração de Texto

Aguardando...

✂️

Chunking Semântico

Aguardando...

🧠

Geração de Embeddings

Aguardando...

🕸️

Construção do Grafo

Aguardando...

💾

Persistência

Aguardando...

Concluído!

Pipeline executado com sucesso

💻 Como Usar Localmente

# Instalação de dependências
pip install sentence-transformers pdfplumber networkx scikit-learn pyvis faiss-cpu

# Uso básico
python sva_pipeline_manifesto.py --pdf "manifesto.pdf" --outdir "./output"

# Uso avançado com todos os parâmetros
python sva_pipeline_manifesto.py \
  --pdf "manifesto_origem.pdf" \
  --outdir "./output" \
  --model "sentence-transformers/all-mpnet-base-v2" \
  --chunk_size 150 \
  --chunk_overlap 30 \
  --similarity_threshold 0.70 \
  --top_k 5 \
  --faiss_index "./output/index.faiss" \
  --loglevel INFO

# Visualizar resultados
open ./output/sva_manifesto_graph.html

🏗️ Arquitetura do Pipeline

📄
PDF Input
🔤
Extração
✂️
Chunks
🧠
Embeddings
🗄️
FAISS Index
🕸️
Grafo
🌐
HTML Viz