Skip to content

Conversation

@nitaibezerra
Copy link
Contributor

Summary

  • Atualiza toda a documentação para refletir a mudança arquitetural onde PostgreSQL é agora a fonte de verdade central
  • Remove referências aos repositórios arquivados (scraper, typesense)
  • Documenta novos componentes: Cloud SQL, Cloud Composer, Embeddings API
  • Atualiza trilhas de onboarding para usar data-platform

Mudanças Principais

Arquivos Criados

  • docs/modulos/data-platform.md - Documentação do repositório unificado
  • docs/arquitetura/postgresql.md - PostgreSQL como fonte de verdade (schema, config)
  • docs/workflows/airflow-dags.md - DAGs do Cloud Composer (sync HuggingFace)

Arquitetura Atualizada

  • visao-geral.md - 7 camadas com PostgreSQL central
  • fluxo-de-dados.md - 8 etapas incluindo embeddings e sync HF
  • componentes-estruturantes.md - PostgreSQL + HuggingFace como distribuição
  • arquitetura-gcp.md - Novos custos (~$230-280/mês)

Módulos Atualizados

  • scraper.md - Simplificado com redirect para data-platform
  • typesense-local.md - Sync do PostgreSQL, busca vetorial
  • cogfy-integracao.md - Fluxo PostgreSQL → Cogfy → PostgreSQL

Onboarding Atualizado

  • setup-backend.md - Usa data-platform CLI, conexão PostgreSQL
  • roteiro-onboarding.md - Lista repositórios atualizados
  • setup-datascience.md - Diagrama com PostgreSQL

Contexto

A plataforma passou por uma refatoração importante:

  • Antes: HuggingFace era a fonte de verdade
  • Agora: PostgreSQL (Cloud SQL) é a fonte de verdade
  • HuggingFace: Camada de distribuição de dados abertos

Test plan

  • Verificar renderização local com mkdocs serve
  • Validar todos os links internos
  • Testar diagramas Mermaid
  • Buscar referências restantes a repos arquivados

🤖 Generated with Claude Code

nitaibezerra and others added 3 commits January 13, 2026 09:59
- Adiciona docs/arquitetura/postgresql.md com schema detalhado
- Adiciona docs/modulos/data-platform.md documentando novo repo
- Adiciona docs/workflows/airflow-dags.md com DAGs do Composer
- Atualiza diagramas em visao-geral.md e fluxo-de-dados.md
- Atualiza index.md com nova arquitetura e repositórios
- Atualiza componentes-estruturantes.md (HF agora é distribuição)
- Atualiza mkdocs.yml com novos arquivos na navegação

Mudança principal: PostgreSQL (Cloud SQL) é agora a fonte de verdade,
HuggingFace passa a ser camada de distribuição de dados abertos.

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
- Simplifica scraper.md com redirect para data-platform
- Atualiza typesense-local.md para usar PostgreSQL como fonte
- Atualiza cogfy-integracao.md com fluxo PostgreSQL
- Atualiza scraper-pipeline.md com 7 jobs (inclui embeddings)
- Atualiza typesense-data.md para sincronizar do PostgreSQL
- Atualiza arquitetura-gcp.md com Cloud SQL, Composer, Embeddings API

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
- Atualiza setup-backend.md para usar data-platform e PostgreSQL
- Atualiza roteiro-onboarding.md com novos repositórios
- Atualiza setup-datascience.md com diagrama PostgreSQL
- Remove referências aos repos arquivados (scraper, typesense)

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
@nitaibezerra nitaibezerra merged commit 96c3780 into main Jan 14, 2026
2 checks passed
@nitaibezerra nitaibezerra deleted the docs/update-architecture-postgresql branch January 14, 2026 12:48
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants