Metodologia para criação de ontologias

 

https://ceweb.br/livros/dados-abertos-conectados//capitulo-4/#sh4.4.1  

 

Um ponto interessante na criação de ontologias é a definição das questões de competência pois elas dizem o que ela responde. Por exemplo, eu uma ontologia de filmes eu posso querer saber:

 Quais os títulos dos filmes que foram dirigidos pelo diretor D, em ordem lexicográfica? 

Em uma ontologia de vinhos eu posso querer saber qual comida harmoniza melhor com determinado vinho. Se minha ontologia foi modelada para esse propósito eu vou obter a resposta desejada. E no caso de arboviroses? 

1) Eu quero saber os casos de dengue por localidade (UF, município), semana epidemiológica, ano. 

2) Sorotipos predominantes de dengue por localidade (UF, município), semana epidemiológica, ano. 

3) Sintomas predominantes de dengue por localidade (UF, município), semana epidemiológica, ano.

4) Hospitalizações por localidade e semana epidemiológica  

5) Evolução dos casos de dengue (óbitos) por localidade e semana epidemiológica.

 

Além disso, é interessante cruzar essas informações com outras bases de dados como climáticas, sociodemográficas. Será que com base nessas informações um LLM consegue inferir ou interpretar esses dados e gerar novas informações?

 

Eu perguntei ao LLM o seguinte  Quais possíveis questões de competência essa ontologia de aplicação responde?

Porém,  ele me gerou muitos tipos de perguntas que talvez possam ser sintetizadas em determinísticas ou interpretativas  (com uso de  LLM).

Segue a resposta do chatGPT:


As questões de competência (“competency questions”) são fundamentais porque elas definem:

quais perguntas a ontologia deve ser capaz de responder.

No seu caso, elas podem se tornar o elo entre:

SINAN;
ontologia;
documentos semânticos;
RAG;
inferência;
explicabilidade.

E sinceramente: sua proposta tem potencial para questões MUITO interessantes porque você não está limitado a consultas simples.

Você pode responder:

perguntas determinísticas;
interpretativas;
híbridas;
explicáveis;
inferenciais.
O que é uma questão de competência?

Na engenharia ontológica, é uma pergunta usada para validar:

o escopo;
a utilidade;
e a capacidade semântica da ontologia.

Ou seja:

“Se minha ontologia estiver correta, ela deve conseguir responder isso.”

No seu caso, você pode dividir em categorias

Sugiro fortemente isso na tese.

1. Questões determinísticas

Perguntas diretamente respondidas pelos dados estruturados.

Exemplos
Quantos casos de dengue ocorreram em São Paulo em 2026?
Qual o sorotipo predominante no estado do Rio de Janeiro?
Quais municípios apresentaram maior número de hospitalizações?
Qual a taxa de casos graves por UF?
Quais sintomas aparecem com maior frequência?
Quantos óbitos foram registrados por semana epidemiológica?
Qual o atraso médio de digitação no SINAN?
Quais exames laboratoriais foram realizados?
Qual a distribuição dos casos por faixa etária?

2. Questões interpretativas

Aqui começa o diferencial da sua tese.

Essas perguntas exigem:

interpretação;
agregação semântica;
síntese;
contextualização epidemiológica.
Exemplos MUITO fortes
Quais estados apresentam indícios de agravamento epidemiológico?
Existem evidências de predominância de um sorotipo específico?
Quais regiões demonstram crescimento sustentado de hospitalizações?
Há sinais de possível subnotificação?
Quais localidades apresentam maior risco epidemiológico?
Existem padrões clínicos associados a casos graves?
Quais sintomas parecem estar associados ao aumento de hospitalizações?
Há evidências de expansão espacial da dengue?
Quais estados apresentam maior vulnerabilidade epidemiológica?
Existem indícios de atraso operacional na notificação?

3. Questões explicáveis

Aqui entra muito forte o conceito de SemanticEvidence.

Exemplos
Por que o sistema considera São Paulo uma área de risco?
Quais evidências sustentam a hipótese de aumento epidemiológico?
Quais fatores contribuíram para o crescimento de casos graves?
Quais evidências indicam predominância do DEN-2?
O que explica o aumento de hospitalizações em determinada região?
Quais sinais epidemiológicos justificam um alerta?
4. Questões inferenciais

Aqui entra OWL, regras, SWRL e inferência.

Exemplos
Quais municípios podem estar entrando em situação de surto?
Existem evidências compatíveis com emergência epidemiológica?
Quais regiões apresentam comportamento semelhante?
Há indícios de circulação simultânea de múltiplos sorotipos?
Quais localidades possuem risco potencial de agravamento?
Existem evidências de pressão sobre o sistema hospitalar?
5. Questões semânticas complexas

Essas são MUITO interessantes para publicar.

Exemplos
Quais estados apresentam aumento simultâneo de casos graves e predominância do sorotipo DEN-2?
Existe correlação entre atraso de notificação e crescimento epidemiológico?
Quais regiões apresentam padrões clínicos semelhantes?
Quais evidências epidemiológicas diferenciam municípios críticos dos não críticos?
Existem padrões temporais recorrentes associados a surtos?
Quais evidências sugerem mudanças no perfil epidemiológico?
6. Questões para RAG e LLM

Essas são excelentes para justificar sua arquitetura.

Exemplos
Explique a situação epidemiológica da dengue em São Paulo.
Resuma os principais sinais epidemiológicos observados em 2026.
Quais fatores epidemiológicos merecem atenção prioritária?
Gere uma análise interpretativa sobre os casos graves.
Quais evidências sugerem aumento do risco epidemiológico?
Produza um resumo clínico da situação epidemiológica.
Como isso aparece na ontologia?

Você modela entidades que permitam responder essas perguntas.

Exemplo
Pergunta

“Quais estados apresentam predominância do DEN-2?”

Você precisa:

State
Serotype
CaseReport
SerotypeEvidence

e relações:

hasSerotype
occursIn
hasEvidence
Pergunta interpretativa

“Quais regiões apresentam agravamento epidemiológico?”

Você precisará:

SeverityEvidence
HospitalizationEvidence
TemporalEvidence
RiskEvidence
Isso fortalece MUITO sua tese

Porque sua ontologia deixa de ser:

ontologia descritiva

e passa a ser:

ontologia operacional para QA epidemiológico
Sugestão MUITO importante

Na tese, separe as competency questions em:

Tipo    Objetivo
Determinística    consulta direta
Interpretativa    síntese semântica
Explicável    justificar respostas
Inferencial    gerar conhecimento novo
Conversacional    interação com LLM

Isso é MUITO elegante academicamente.

Você pode até formalizar isso

Por exemplo:

CQ_D = deterministic competency questions
CQ_I = interpretative competency questions
CQ_E = explanatory competency questions
CQ_F = inferential competency questions
Isso conecta perfeitamente com sua arquitetura

Você já tem:

Pergunta
   ↓
Classificação semântica
   ↓
Determinística / Interpretativa / Mista
   ↓
Pipeline adequado

Agora você pode ligar isso diretamente às competency questions da ontologia.

Exemplo fortíssimo para tese

Você pode dizer:

Traditional epidemiological ontologies are usually focused on data representation and interoperability. In contrast, the proposed ontology is competency-driven toward semantic interpretation, epidemiological evidence representation, explainable question answering, and ontology-grounded retrieval-augmented generation.

Isso é MUITO forte para doutorado.

O diferencial da sua ontologia

Ela não seria apenas:

uma ontologia médica;
ou uma ontologia epidemiológica.

Ela seria:

uma ontologia orientada à interpretação epidemiológica e QA explicável.

Isso é MUITO mais moderno e alinhado com:

Neuro-symbolic AI;
GraphRAG;
Explainable AI;
Semantic QA;
Ontology-grounded LLMs. 

 

 

Essa conversa com o chatGPT conversa bastante com a intenção do usuário, ou seja, tem a ver com as questões de competência. https://chatgpt.com/share/6a0375f0-7c50-83e9-b0ff-3314e318adbc 

  

Comentários

Postagens mais visitadas deste blog

Dados tabulares vs JSONL

Moltbook: rede social que só inteligências artificiais podem usar já reúne milhões de 'perfis'

Podcast nerdologia: RAG, Yann Lecun, etc