Tabela → agregação → JSONL → embedding → FAISS → retrieval 1. Dados em tabela = estrutura para máquinas tradicionais Dados tabulares são organizados em linhas e colunas . Cada linha representa um registro. Cada coluna representa um atributo. Exemplo simples: municipio semana febre mialgia casos Campinas 12 51 47 80 Aqui: linha = um registro coluna = significado fixo Isso é excelente para: ✅ SQL ✅ filtros ✅ agregações ✅ estatística ✅ joins ✅ processamento analítico Ou seja: tabelas são ótimas para cálculo. 2. Problema: LLM não "pensa" naturalmente em colunas Para um modelo de linguagem, isso: Campinas | 12 | 51 | 47 | 80 não é naturalmente interpretável. Porque o embedding funciona melhor quando existe contexto linguístico . A LLM entende melhor frases como: "No município de Campinas, na semana epidemiológica 12, foram observados 80 casos, com febre em 51 registros e mialgia em 47." ✅ aqui existe semântica explícita 3. JSONL = cada...
Essa matéria foi publicada em no G1 em https://g1.globo.com/tecnologia/noticia/2026/02/02/moltbook-rede-social-que-so-inteligencias-artificiais-podem-usar-ja-reune-milhoes-de-perfis.ghtml e por curiosidade pesquisei se havia discussões sobre ontologias e metadados. Encontrei um comentário sobre metadados que vou postar aqui por curiosidade: Podcast FuturaMente episódio 17 (Agentes de IA e a automação do futuro) interessante que comentou sobre o moltbook: https://open.spotify.com/episode/1mODDdMoLZYa6nGN3LrIhM?si=06a91897c7084048
Conversa interessante sobre ia que passa por temas como RAG, Yann LeCun (cientista chefe da Meta), Fake news com IA, política. https://open.spotify.com/episode/3naFVUgMKaFmIfXlOzX04o?si=X9pw3VKsTyy41Oypp0GbNA Interessante pois fui olhar quem foi Yann LeCun e descobri que Mark Zukerberg contratou Alexandr Wang no lugar dele devido sua visão de mundo mas focada em LLM e rotulagem de dados. https://www.youtube.com/watch?v=y12yZ7bQizk&t=1151s
Comentários
Postar um comentário