Arquitetura para um Sistema de Informações sobre Conhecimento Tradicional Associado à Biodiversidade - Versão 2.0

Visão Geral

Este repositório contém a proposta de arquitetura para um sistema de informações dedicado à preservação, curadoria e compartilhamento de conhecimento tradicional associado à biodiversidade. O sistema foi projetado com respeito aos princípios C.A.R.E. (Collective Benefit, Authority to Control, Responsibility, Ethics) e em conformidade com a legislação pertinente.

Motivação e Justificativa

O Cenário Atual: Fragmentação de Iniciativas

O Brasil possui múltiplas iniciativas de qualidade mundial para sistematizar conhecimento tradicional associado à biodiversidade, porém operam de forma isolada sem arquitetura comum que permita integração e sinergia. Por exemplo, algumas das iniciativas em 2025:

1. Projeto GEF "Entre-Ciências" (2025-2029)

Projeto de grande porte (US$ 7 milhões) coordenado pelo MCTI para fortalecer capacidade de Povos Indígenas e Comunidades Locais (PIPCTAFs) gerenciarem dados sobre sociobiodiversidade em Amazônia e Cerrado, usando padrões DarwinCore/PlinianCore via SiBBr.

2. Rede de Conhecimentos sobre Sociobiodiversidade (RCS)

Iniciativa do ICMBio (CNPT) em parceria com UFSC que busca integrar bases de dados dispersas em plataforma única, com ênfase em protocolos comunitários e Consentimento Livre, Prévio e Informado (CLPI).

3. Modernização do SISGEN (RNP-MMA-BID)

Projeto de 13 meses para modernizar o Sistema Nacional de Gestão do Patrimônio Genético e CTA, implementando interoperabilidade via IPT (Integrated Publishing Toolkit) com padrões FAIR e CARE.

4. Useflora: Pesquisa colaborativa para salvaguarda da sociobiodiversidade brasileira (UFSC)

Sistema com registros etnobotânicos validados, implementando inovador "Registro Comunitário" onde comunidades definem níveis de acesso a seus conhecimentos.

O Problema da Fragmentação

Apesar de perseguirem objetivos convergentes, essas iniciativas geram:

Dispersão de dados: mesmo conhecimento armazenado em múltiplos sistemas sem sincronização
Padrões inconsistentes: Useflora (41 campos relacional), GEF (DarwinCore), SISGEN (patrimônio genético), RCS (agregador flexível)
Replicação de esforços: múltiplos "registros comunitários" em desenvolvimento paralelo
Soberania fragmentada: comunidades interagem com sistemas desconectados
Pesquisa limitada: impossível fazer queries que atravessem iniciativas
Sustentabilidade em risco: cada um com seu ciclo de financiamento e dependências

Oportunidade de Integração

Uma arquitetura integrada possibilitaria:

✅ Interoperabilidade sem perda de autonomia: camada comum permite compartilhamento mantendo independência
✅ Registro comunitário unificado: comunidade faz login uma única vez, direitos propagam para todas plataformas
✅ Governança consistente: FAIR + CARE implementados uniformemente
✅ Busca e análise integrada: pesquisadores com visão completa da biodiversidade
✅ Repartição de benefícios rastreável: Lei 13.123/2015 cumprida efetivamente

Imperativo Legal e Institucional

A fragmentação coloca em risco o cumprimento de:

Lei 13.123/2015: comunidades precisam ser informadas sobre usos de conhecimento (impossível se disperso)
Protocolo de Nagoya: exige rastreabilidade internacional (integração técnica essencial)
CDB Art. 8j: participação ativa de detentores (integração facilitaria essa participação)

Convergência das Iniciativas

Todas compartilham:

Objetivo de sistematizar CTA
Desafio de proteção do conhecimento tradicional
Mesma base legal (Lei 13.123/2015)
Compatibilidade técnica (SiBBr, infraestrutura de dados aberta, padrões interoperáveis)
Cobertura geográfica complementar (juntas cobrem praticamente toda biodiversidade brasileira)

Esta proposta de arquitetura não busca substituir as iniciativas existentes, mas criar camada de integração que possibilite interoperabilidade, estabeleça padrões mínimos sem sacrificar autonomia, e implemente governança compartilhada com protagonismo comunitário.

Objetivos

Preservar o conhecimento tradicional de comunidades sobre o uso de plantas e biodiversidade
Validar e qualificar dados através de processos curatoriais rigorosos
Compartilhar informações de forma ética e responsável com pesquisadores e público geral
Integrar múltiplas fontes de dados, desde artigos científicos até registros primários
Automatizar a captura de informações relevantes de fontes confiáveis

Arquitetura do Sistema

O sistema é organizado em quatro contextos principais que trabalham de forma integrada. O diagrama abaixo apresenta a visão de mais alto nível da arquitetura; diagramas C4 detalhados estão disponíveis na documentação técnica.

graph TB
    FS["Fontes Secundárias<br/>(Artigos, PDFs, Livros)"]
    FP["Fontes Primárias<br/>(Comunidades Tradicionais)"]

    EP["✓ etnopapers<br/>Extração com IA<br/>(entrada opcional)"]

    MONGO[("MongoDB<br/>coleções: etnoDB · etnoTermos · etnoRelatos")]


    subgraph "✓ etnoDB — Fontes Secundárias"
        ED_ACQ["Aquisição"]
        ED_CUR["Curadoria"]
        ED_PUB["Apresentação<br/>etnoChat · Painel Analítico"]
    end

    subgraph "etnoRelatos — Fontes Primárias"
        ER_ACQ["Aquisição + CLPI"]
        ER_CUR["Curadoria Comunitária"]
        ER_PUB["Apresentação"]
    end

    subgraph "✓ etnoTermos — Vocabulários SKOS-XL"
	    TERM_CUR["✓ Curadoria"]
	    TERM_ACQ["✓ Aquisição"]
		TERM_PUB["✓ Apresentação"]
    end

    PUB["Público · Pesquisadores · Comunidades Tradicionais"]

    FS -.->|via IA, opcional| EP
    EP --> ED_ACQ
    FS --> ED_ACQ

    FP --> ER_ACQ

    ED_ACQ --> MONGO
    MONGO <--> ED_CUR
    MONGO --> ED_PUB

    ER_ACQ --> MONGO
    MONGO <--> ER_CUR
    MONGO --> ER_PUB

	MONGO --Aquisição Direta--> TERM_ACQ
	TERM_PUB --> PUB
    ED_PUB --> PUB
    ER_PUB --> PUB

    style EP fill:#28a745,stroke:#1e7e34,color:#ffffff
    style TERM_CUR fill:#28a745,stroke:#1e7e34,color:#ffffff
	style TERM_ACQ fill:#28a745,stroke:#1e7e34,color:#ffffff
	style TERM_PUB fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ED_ACQ fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ED_CUR fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ED_PUB fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ER_ACQ fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ER_CUR fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ER_PUB fill:#28a745,stroke:#1e7e34,color:#ffffff
    style MONGO fill:#1168bd,stroke:#0b4884,color:#ffffff

Legenda:

Verde: containers implementados e disponíveis nos repositórios GitHub
Laranja: etnoRelatos — em desenvolvimento
Azul: MongoDB compartilhado com coleções separadas por projeto
Linha pontilhada: entrada opcional (fontes secundárias podem ir direto ao etnoDB sem passar pelo etnopapers)

Projetos Implementados

Esta arquitetura possui implementações concretas que materializam os conceitos propostos:

etnoDB - Banco de Dados de Conhecimento Tradicional

Interface web para gerenciamento de conhecimento tradicional secundário extraído de artigos científicos. Implementa os três contextos arquiteturais principais:

Características:

Três Interfaces Especializadas:
- Aquisição (porta 3001): Entrada de dados por pesquisadores
- Curadoria (porta 3002): Validação e aprovação de registros
- Apresentação (porta 3003): Consulta pública com busca avançada
Stack Tecnológico: Node.js, Express, MongoDB, HTMX, Alpine.js, Tailwind CSS
Estrutura de Dados: Hierárquica (Referência → Comunidade → Planta → Uso)
Workflow C.A.R.E.: Implementação de status (pendente/aprovado/rejeitado)
29 Classificações de Comunidades: Conforme Decreto nº 8.750, de 9 de maio 2016

etnoChat - Interface Conversacional com IA

Componente da camada de Apresentação que permite interação com o banco de dados através de linguagem natural.

Funcionalidades:

Formulação de perguntas em linguagem natural sobre comunidades e plantas
Sugestões automáticas de buscas e relacionamentos entre dados
Explicações contextualizadas sobre registros etnobotânicos
Integração com MCP (Model Context Protocol) para comunicação com modelos de IA

Acesso: Rota /etnochat na porta 3003

Painel Analítico - Dashboard Interativo

Componente da camada de Apresentação para exploração e análise visual dos dados etnobotânicos.

Funcionalidades:

Cartões Resumidos: Total de comunidades, referências aprovadas, plantas únicas e autores
Visualizações Geográficas: Mapas de calor com distribuição por estado
Gráficos Interativos:
- Evolução temporal de publicações (gráfico de área)
- Top 10 plantas mais citadas (gráfico de barras)
Tabelas Analíticas:
- Autores mais produtivos
- Comunidades com maior diversidade botânica
- Referências mais abrangentes
Filtros Avançados: Estado, tipo de comunidade e período de publicação

Stack: Google Charts, HTMX, Alpine.js, Tailwind CSS

Acesso: Rota /painel na porta 3003

etnopapers - Extração Automatizada com IA

Aplicativo desktop Windows para extração automatizada de metadados de artigos científicos em PDF usando inteligência artificial.

Características:

Plataforma: Windows (.NET 8, WPF, MVVM)
Extração com IA:
- Google Gemini (15 req/min, gratuito)
- OpenAI GPT-4o-mini
- Anthropic Claude 3.5 Haiku
Integração Nativa: MongoDB (Atlas ou local)
Dados Extraídos:
- Obrigatórios: Título, autores, ano, abstract
- Opcionais: Espécies (nomes vernaculares e científicos), usos, comunidades, localização
Performance: Melhoria de 50% em relação a soluções locais

etnoTermos - Plataforma de Gestão Terminológica

Plataforma digital para preservação e organização do conhecimento etnobotânico através de um sistema estruturado de glossários, vocabulários controlados e tesauros, seguindo o padrão SKOS-XL (W3C Simple Knowledge Organization System eXtension for Labels). Totalmente integrado ao etnoDB, atuando como infraestrutura terminológica transversal em todos os seus contextos (Aquisição, Curadoria e Apresentação).

Propósito:

Documentar termos e conhecimentos de comunidades tradicionais brasileiras sobre plantas e animais, garantindo reconhecimento cultural, padronização terminológica e justiça na distribuição de benefícios. O padrão SKOS-XL viabiliza interoperabilidade com padrões de dados abertos (Linked Data, RDF) e integração com iniciativas como GBIF, SiBBr e Wikidata.

Características:

Gestão de Conceitos (SKOS-XL):
- Criação com identificadores únicos (URIs) e suporte multilíngue
- Rótulos preferenciais e alternativos (skosxl:prefLabel / skosxl:altLabel)
- Relações hierárquicas (skos:broader / skos:narrower)
- Relações associativas (skos:related)
- Desambiguação de termos idênticos
- Polihierarquia (múltiplos conceitos mais amplos)
Sistema de Notas (SKOS):
- Notas de escopo (skos:scopeNote) e definições (skos:definition)
- Notas históricas (skos:historyNote) e editoriais (skos:editorialNote)
- Exemplos de uso (skos:example)
Gestão de Fontes:
- Rastreabilidade de origens (bibliográficas, conhecimento tradicional)
- Conformidade com princípios CARE para governança de dados indígenas
Recursos Técnicos:
- Busca: Meilisearch para busca inteligente
- Autenticação: OAuth Google
- Exportação: SKOS-XL/RDF, JSON-LD, Dublin Core, CSV
- APIs: REST para integração com etnoDB e sistemas externos
- Containerização: Docker com GitHub Actions

Integração na Arquitetura:

O etnoTermos funciona como infraestrutura terminológica transversal totalmente integrada ao etnoDB, conectando os três contextos:

Aquisição: Fornece vocabulários controlados (SKOS-XL) para padronização na entrada de dados, autocomplete de termos validados para etnoDB e etnoRelatos
Curadoria: Oferece base para validação semântica, normalização de nomenclatura vernacular e desambiguação de termos
Apresentação: Permite navegação por tesauros estruturados e busca expandida por sinônimos e termos relacionados

etnoRelatos - Plataforma de Registros de Conhecimento Tradicional Primário

Plataforma para aquisição, registro e gestão de dados de conhecimento tradicional associado à biodiversidade provenientes de fontes primárias — registrado diretamente junto às comunidades tradicionais. Complementa o etnoDB, que é dedicado a fontes secundárias (artigos científicos, livros).

Diferença fundamental em relação ao etnoDB:

	etnoDB	etnoRelatos
Fonte	Secundária (artigos, livros)	Primária (comunidades, campo)
Origem dos dados	Literatura científica	Registro direto com detentores
Consentimento	Não aplicável	CLPI obrigatório
Curadoria	Validação bibliográfica	Validação comunitária

Propósito:

Registrar diretamente o conhecimento tradicional sobre biodiversidade das comunidades tradicionais brasileiras, com todos os protocolos éticos e legais requeridos (Consentimento Livre, Prévio e Informado — CLPI, conforme Lei 13.123/2015). Este projeto está em fase inicial de desenvolvimento.

Integração na Arquitetura:

O etnoRelatos atua no Contexto de Aquisição da EtnoArquitetura como canal para dados primários, alimentando o mesmo MongoDB compartilhado com o etnoDB. Os dados registrados seguem o mesmo workflow de curadoria, mas com validação comunitária adicional. O etnoTermos fornece suporte terminológico também para o etnoRelatos.

Integração entre Projetos

graph TB
    PDF["PDFs de Artigos"] --> EP["etnopapers<br/>Extração com IA"]
    PDF --> ED_ACQ["etnoDB<br/>Aquisição<br/>Entrada Manual"]
    CAMPO["Registros de Campo<br/>Comunidades Tradicionais"] --> ERELA["etnoRelatos<br/>Aquisição Primária"]

    EP --> MONGO[("MongoDB")]
    ED_ACQ --> MONGO
    ERELA --> MONGO

    ET["etnoTermos<br/>Vocabulários · SKOS-XL"] --> ED_ACQ
    ET --> ED_CUR
    ET --> ED_PUB
    ET --> ERELA

    MONGO <--> ED_CUR["etnoDB<br/>Curadoria"]
    MONGO --> ED_PUB["etnoDB<br/>Apresentação"]
    MONGO --> CHAT["etnoChat<br/>Interface Conversacional"]
    MONGO --> DASH["Painel Analítico<br/>Dashboard"]

    ED_PUB --> PUB["Público"]
    CHAT --> PUB
    DASH --> PUB

    style ED_ACQ fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ED_CUR fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ED_PUB fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ET fill:#28a745,stroke:#1e7e34,color:#ffffff
    style EP fill:#28a745,stroke:#1e7e34,color:#ffffff
    style CHAT fill:#28a745,stroke:#1e7e34,color:#ffffff
    style DASH fill:#28a745,stroke:#1e7e34,color:#ffffff
    style ERELA fill:#28a745,stroke:#1e7e34,color:#ffffff

O fluxo integrado permite que:

etnopapers processa PDFs e extrai metadados usando IA, salvando diretamente no MongoDB
etnoDB (Aquisição) permite entrada manual de dados secundários por pesquisadores, também salvando no MongoDB
etnoRelatos registra conhecimento tradicional diretamente de comunidades tradicionais (fontes primárias), com protocolo CLPI, salvando no mesmo MongoDB
etnoTermos fornece vocabulários controlados (SKOS-XL) para padronização terminológica em todos os contextos, com integração total ao etnoDB e suporte ao etnoRelatos
As três fontes alimentam a mesma base de dados de forma paralela
etnoDB (Curadoria) valida e aprova os registros (de todas as fontes), com suporte de validação semântica do etnoTermos
etnoDB (Apresentação) disponibiliza dados validados publicamente, com navegação por tesauros do etnoTermos
etnoChat permite consultas em linguagem natural via integração com IA (MCP)
Painel Analítico oferece visualizações interativas e análises estatísticas dos dados

Metodologia: C4 Model

A arquitetura deste sistema é documentada utilizando o C4 Model, um framework de visualização que descreve arquiteturas de software através de 4 níveis de diagrama progressivamente mais detalhados (criado por Simon Brown):

Context (Contexto): Visão de alto nível mostrando o sistema como uma caixa preta e suas interações com usuários e sistemas externos
Container (Contêiner): Decomposição do sistema em contêineres tecnológicos (aplicações, bancos de dados, serviços) e como se comunicam
Component (Componente): Detalhamento interno de cada contêiner, mostrando os componentes principais e suas responsabilidades
Code (Código): Nível de detalhe de classes, interfaces e relações (opcional, utilizamos quando necessário)

Essa abordagem oferece clareza progressiva: iniciantes entendem o contexto geral, arquitetos visualizam containers e decisões técnicas, e desenvolvedores acessam detalhes de componentes. Os diagramas neste repositório seguem este padrão, permitindo navegação intuitiva da visão geral até a implementação.

1. Contexto de Aquisição

Responsável pela entrada de dados no sistema de múltiplas fontes:

Dados Secundários: Extração de informações de artigos científicos, livros e publicações
Dados Primários: Registro direto com todos os cuidados éticos e legais necessários
Coleta Automatizada: Robôs que monitoram periódicos científicos (ex: etnobotânica)
Integrações: APIs para consumo de dados de sistemas externos

sequenceDiagram
    participant Fonte as Fonte de Dados
    participant API as API de Ingestão
    participant Validador as Validador
    participant DB as Base de Dados

    Fonte->>API: Envia dados (padrão definido)
    API->>Validador: Valida estrutura
    Validador->>API: Confirma validação
    API->>DB: Armazena com status "pendente"
    DB-->>API: Confirmação

Características principais:

Padrão de dados unificado para todas as fontes
APIs RESTful para ingestão
Sistema de fila para processamento assíncrono
Validação automática de dados taxonômicos via GBIF e Global Names

2. Contexto de Curadoria

Interface dedicada para qualificação e validação dos dados:

Acesso restrito a pesquisadores e representantes de comunidades
Workflow de aprovação e enriquecimento de dados
Integração com APIs de validação taxonômica
Controle de versões e auditoria de alterações

stateDiagram-v2
    [*] --> Pendente
    Pendente --> EmRevisão: Curador inicia revisão
    EmRevisão --> Rejeitado: Dados insuficientes
    EmRevisão --> EmValidação: Revisão completa
    EmValidação --> Aprovado: Validação taxonômica OK
    EmValidação --> EmRevisão: Requer correção
    Aprovado --> Publicado: Curador publica
    Publicado --> [*]
    Rejeitado --> [*]

3. Contexto de Apresentação

Portal público para acesso e consulta das informações validadas:

Interface web responsiva
APIs públicas de consulta
Visualizações interativas
Sistema de busca avançada
Exportação de dados em formatos abertos

Tecnologias Consideradas

Banco de Dados

Devido à complexidade e flexibilidade necessárias para armazenar conhecimento tradicional, três abordagens são consideradas:

Bancos de Dados SQL - Modelo relacional
- Estrutura rigorosa com esquema bem definido
- Integridade referencial garantida
- Consultas poderosas em dados estruturados
- Ideal para relacionamentos complexos
Bancos Orientados a Documentos (JSON)
- Flexibilidade no esquema
- Escalabilidade horizontal
- Consultas ricas em documentos estruturados como JSON
- Armazenamento natural de dados semi-estruturados
Bancos Multi-Modais
- Suportam múltiplos modelos de dados (documentos, grafos, relações)
- Permitem modelar relações complexas entre entidades
- Query language moderna e versátil
- Flexibilidade arquitetural para evolução futura

Integrações Externas

Validação Taxonômica

Flora e Funga do Brasil API (https://floradobrasil.jbrj.gov.br/consulta/) - Verificação primária de nomenclatura científica e validação de dados taxonômicos para plantas, algas e fungos brasileiros
Fauna do Brasil API (https://fauna.jbrj.gov.br/) - Verificação primária de nomenclatura científica e validação de dados taxonômicos para fauna brasileira
GBIF API (https://www.gbif.org/) - Validação de dados taxonômicos como fallback quando não encontrado nas bases brasileiras

Validação Territorial e de Proveniência

Plataforma de Territórios Tradicionais (MPF) (https://territoriostradicionais.mpf.mp.br/) - Sincronização de polígonos territoriais de povos indígenas e comunidades tradicionais, validação de proveniência geográfica e cruzamento espacial de registros com seus territórios de origem

Fontes Autoritativas

Outras Fontes Autoritativas - Padrão extensível para integração com sistemas especializados (SISGEN, SiBBr, registros comunitários) que complementam validação e enriquecimento de dados

Coleta Automática

Periódicos científicos via APIs ou scraping ético, com extração de dados com auxílio de IA

Princípios Orientadores

C.A.R.E. Principles

Collective Benefit: Os dados devem beneficiar as comunidades que os originaram
Authority to Control: Comunidades mantêm autoridade sobre seus conhecimentos
Responsibility: Responsabilidade ética no manejo dos dados
Ethics: Respeito às práticas éticas e culturais

Legislação

O sistema respeita:

Lei da Biodiversidade (Lei 13.123/2015)
Protocolo de Nagoya
Legislações locais sobre conhecimento tradicional

Estrutura da Documentação

Este repositório está organizado da seguinte forma:

etnoArquitetura/
├── README.md (este arquivo)
├── docs/
│   ├── c4-model/
│   │   ├── 01-context-diagram.md
│   │   ├── 02-container-diagram.md
│   │   └── 03-component-diagram.md
│   ├── architecture-decisions/
│   │   ├── ADR-001-database-selection.md
│   │   ├── ADR-002-api-standards.md
│   │   └── ADR-003-data-model.md
│   └── diagrams/
│       ├── data-flow.md
│       └── integration-patterns.md

Navegação da Documentação

Diagrama de Contexto - Visão de alto nível do sistema e seus usuários
Diagrama de Containers - Componentes principais e suas tecnologias
Diagrama de Componentes - Detalhamento interno de cada contexto
Decisões Arquiteturais - ADRs documentando escolhas técnicas

Próximos Passos

Definição detalhada do modelo de dados
- Considerando a diferença entre dados primários e secundários
Prototipação das APIs de ingestão
Desenvolvimento do sistema de autenticação e autorização
Implementação do workflow de curadoria
Desenvolvimento da interface pública

Integração com Referências e Iniciativas

Arquitetura Inspirada em NIKMAS

A proposta de arquitetura incorpora lições aprendidas do projeto NIKMAS (National Indigenous Knowledge Management System) da África do Sul, especialmente:

Modelo de Dados Dual: Preservação simultânea de artefatos originais (gravações audiovisuais, fotos) e estruturas de metadados formais para proteção legal
Arquitetura Distribuída: Nó central com Pontos de Presença (PoPs) regionais para captura descentralizada e sincronização seletiva respeitando confidencialidade
Segurança Multi-Camadas: Controle de acesso baseado em políticas (XACML) para proteção de conhecimento sensível
Catálogo de Detentores: Base de dados de indivíduos e comunidades detentores de conhecimento com rastreamento de proveniência
Curadoria Estruturada: Interface dedicada para especialistas validarem e anotarem dados

Acesso via Comunicações Móveis

Reconhecendo que muitas comunidades tradicionais em áreas remotas têm acesso móvel limitado mas penetrante, a arquitetura prevê:

Aplicações Mobile Offline-First: Captura de dados sem necessidade de conexão permanente
Integração SMS/USSD: Acesso a informações via mensagens de texto para regiões com infraestrutura móvel limitada
WhatsApp Integration: Suporte a plataforma popular para comunicação e consultas
Apps Comunitárias: Desenvolvimento de aplicativos customizados para diferentes contextos culturais

Esta abordagem segue exemplos bem-sucedidos como CyberTracker e MAPEO, que demonstram o potencial de tecnologias móveis para empoderamento comunitário em monitoramento participativo.

Validação e Certificação de Dados

O sistema implementa um workflow robusto de validação em múltiplas etapas:

Validação Estrutural: Verificação automática de conformidade com padrões de dados
Validação Taxonômica: Integração com bases brasileiras (Flora e Funga para flora/fungos, Fauna para fauna) com fallback para GBIF API quando não encontrado nas bases brasileiras
Validação Semântica: Integração com vocabulários existentes
Curadoria Especializada: Revisão por especialistas de domínio (botânicos, etnobólogos, farmacêuticos tradicionais)
Validação Comunitária: Participação de detentores de conhecimento na certificação de dados antes de publicação
Rastreabilidade Completa: Logs de auditoria de todas as mudanças e validações

Aquisição de Dados Primários

Para coleta ética e consentida de dados diretamente das comunidades:

Processo CLPI (Consentimento Livre, Prévio e Informado): Implementação de protocolo completo baseado em Lei 13.123/2015
Registro Comunitário: Interface para comunidades registrarem autonomamente seu próprio conhecimento
Acordos Eletrônicos: Armazenamento e rastreamento de acordos de compartilhamento de benefícios
Infopreneurs Locais: Capacitação de membros da comunidade como coletores de dados com oportunidades de geração de renda
Documentação Audiovisual: Suporte a preservação de conhecimento em múltiplas formas (áudio, vídeo, foto, texto)

Integração com Plataforma de Territórios Tradicionais do MPF

A arquitetura está projetada para integração bidirecional com a Plataforma de Territórios Tradicionais do Ministério Público Federal:

Sincronização de Polígonos Territoriais: Importação automática de limites geográficos de territórios indígenas e tradicionais
Cruzamento Espacial: Associação de registros de conhecimento com territórios de origem
Rastreabilidade Geográfica: Visualização interativa de onde conhecimentos são praticados
Dados Públicos do MPF: Acesso a informações sobre status de demarcação, conflitos e historicamente de ocupação
API de Integração: Endpoints REST para consulta e sincronização de dados territoriais

Esta integração fortalece:

Rastreabilidade de conhecimento até sua origem territorial
Suporte a processos de demarcação e regularização
Monitoramento de ameaças a territórios que guardam conhecimento tradicional
Conformidade com Lei 13.123/2015 sobre proveniência geográfica

Padrões de Dados Abertos

A arquitetura adota e contribui para padrões de dados abertos reconhecidos:

Darwin Core: Para ocorrências de espécies e dados de biodiversidade
Plinian Core: Para descrições de espécies e informações sobre usos
Dublin Core Estendido: Para metadados ricos e flexíveis
SocioBio Standard: Padrão específico para dados de sociobiodiversidade brasileira (ver projeto SocioBio no GitHub)

Interoperabilidade com Sistemas Nacionais

Integração planejada com principais sistemas brasileiros:

SiBBr (Sistema de Informação sobre Biodiversidade Brasileira): Nó brasileiro do GBIF
SisGen (Sistema Nacional de Gestão do Patrimônio Genético): Rastreamento de acesso e repartição de benefícios
CNPq: Integração com dados de pesquisadores e grupos de pesquisa
GBIF Global: Contribuição de dados brasileiros para rede global de biodiversidade

Iniciativas Relacionadas e Complementares

Esta arquitetura integra projetos implementados e dialoga com iniciativas em desenvolvimento:

Projetos da Arquitetura (Implementados)

etnoDB - Interface web com três contextos (Aquisição, Curadoria, Apresentação) para conhecimento tradicional secundário
etnopapers - Aplicativo desktop com extração automatizada de metadados via IA (Gemini, GPT-4, Claude)
etnoTermos - Infraestrutura terminológica com glossários, vocabulários e tesauros no padrão SKOS-XL, com integração total ao etnoDB

Projetos em Desenvolvimento

etnoRelatos - Plataforma para aquisição de dados primários de conhecimento tradicional diretamente de comunidades tradicionais

Dados da Sociobiodiversidade

Useflora - Banco de dados etnobotânicos com registro comunitário onde comunidades definem níveis de acesso

Padrões de Dados

SocioBio - Padrão de dados para sociobiodiversidade brasileira, desenvolvido pelo SiBBr
CESP SiBBr 2024 - Iniciativa de ciência aberta e interoperabilidade do Sistema de Informação sobre Biodiversidade Brasileira

Vocabulários e Terminologia

EtnoVocab - Vocabulário controlado para termos etnobotânicos e etnobiológicos
EtnoVector - Vetorização e representação semântica de conceitos etnobotânicos

Estruturas de Dados e Documentação

Estrutura de Dados Etnobotânicos - Modelos e esquemas para armazenamento de informações etnobotânicas

Estes projetos complementares fornecem:

Implementações concretas da arquitetura (etnoDB e etnopapers)
Padrões de dados interoperáveis
Vocabulários controlados para melhorar a qualidade dos dados
Exemplos práticos de implementação
Recursos para curadoria e validação de informações etnobotânicas

Referências

Para a lista completa de referências bibliográficas organizadas segundo a norma ABNT NBR 6023:2018 (padrão brasileiro), consulte Referencias.md.

Essa documentação incorpora referências a:

Legislação brasileira e internacional relevante (Lei 13.123/2015, Protocolo de Nagoia, Convenção 169 OIT)
Padrões de dados abertos (Darwin Core, Plinian Core, Dublin Core, SocioBio)
Arquitetura de sistemas (NIKMAS, Fedora, OAIS)
Governança de dados (FAIR, CARE)
Tecnologias móveis (CyberTracker, MAPEO)
Etnobiologia e conhecimento tradicional
Iniciativas brasileiras práticas (GEF Entre-Ciências, SISGEN, Useflor@, RCS)
Data sovereignty e consentimento livre, prévio e informado (CLPI)

Histórico de Versões

Para acompanhar a evolução completa desta arquitetura, consulte o CHANGELOG.md que documenta todas as versões e mudanças significativas desde a versão 1.0.0 inicial até a atual versão 2.0.0.

Citação

Se você usar esta proposta de arquitetura em seu trabalho, por favor cite como:

APA:

Dalcin, E. (2026). Arquitetura para um Sistema de Informações sobre Conhecimento Tradicional Associado à Biodiversidade - Versão 2.0 (Version v2.0) [Software documentation]. Zenodo. https://doi.org/10.5281/zenodo.18075074

BibTeX:

@software{dalcin2026,
  author = {Dalcin, Eduardo},
  title = {Arquitetura para um Sistema de Informações sobre Conhecimento Tradicional Associado à Biodiversidade - Versão 2.0},
  version = {v2.0},
  year = {2026},
  publisher = {Zenodo},
  doi = {10.5281/zenodo.18075074},
  url = {https://doi.org/10.5281/zenodo.18075074}
}

DOI: 10.5281/zenodo.18075074

Contribuindo

Este é um projeto em fase de proposta. Contribuições e sugestões são bem-vindas através de issues e pull requests.

Licença

A definir - considerando licenças que respeitem os princípios C.A.R.E. e protejam adequadamente o conhecimento tradicional.

Contato

Para mais informações sobre este projeto, entre em contato através das issues deste repositório.

Name		Name	Last commit message	Last commit date
Latest commit History 48 Commits
.claude		.claude
docs		docs
CHANGELOG.md		CHANGELOG.md
LICENSE		LICENSE
README.md		README.md
Referencias.md		Referencias.md

Folders and files

Latest commit

History

Repository files navigation

Arquitetura para um Sistema de Informações sobre Conhecimento Tradicional Associado à Biodiversidade - Versão 2.0

Visão Geral

Motivação e Justificativa

O Cenário Atual: Fragmentação de Iniciativas

1. Projeto GEF "Entre-Ciências" (2025-2029)

2. Rede de Conhecimentos sobre Sociobiodiversidade (RCS)

3. Modernização do SISGEN (RNP-MMA-BID)

4. Useflora: Pesquisa colaborativa para salvaguarda da sociobiodiversidade brasileira (UFSC)

O Problema da Fragmentação

Oportunidade de Integração

Imperativo Legal e Institucional

Convergência das Iniciativas

Objetivos

Arquitetura do Sistema

Projetos Implementados

etnoDB - Banco de Dados de Conhecimento Tradicional

etnoChat - Interface Conversacional com IA

Painel Analítico - Dashboard Interativo

etnopapers - Extração Automatizada com IA

etnoTermos - Plataforma de Gestão Terminológica

etnoRelatos - Plataforma de Registros de Conhecimento Tradicional Primário

Integração entre Projetos

Metodologia: C4 Model

1. Contexto de Aquisição

2. Contexto de Curadoria

3. Contexto de Apresentação

Tecnologias Consideradas

Banco de Dados

Integrações Externas

Validação Taxonômica

Validação Territorial e de Proveniência

Fontes Autoritativas

Coleta Automática

Princípios Orientadores

C.A.R.E. Principles

Legislação

Estrutura da Documentação

Navegação da Documentação

Próximos Passos

Integração com Referências e Iniciativas

Arquitetura Inspirada em NIKMAS

Acesso via Comunicações Móveis

Validação e Certificação de Dados

Aquisição de Dados Primários

Integração com Plataforma de Territórios Tradicionais do MPF

Padrões de Dados Abertos

Interoperabilidade com Sistemas Nacionais

Iniciativas Relacionadas e Complementares

Projetos da Arquitetura (Implementados)

Projetos em Desenvolvimento

Dados da Sociobiodiversidade

Padrões de Dados

Vocabulários e Terminologia

Estruturas de Dados e Documentação

Referências

Histórico de Versões

Citação

Contribuindo

Licença

Contato

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 4

Packages 0

Uh oh!

Contributors

Uh oh!

Packages