Loading...
Integração de Dados em Saúde

Centralizamos dados clínicos, epidemiológicos, genômicos e socioeconômicos do Paraná em um Data Lake seguro e interoperável.

Governança e Proteção de Dados

O projeto adota políticas rigorosas de governança, segurança e privacidade, garantindo conformidade com a LGPD e uso responsável dos dados para pesquisa, gestão e políticas públicas.

Inteligência Analítica e IA

O Sabiá promove a aplicação de ciência de dados e Inteligência Artificial para análises preditivas, vigilância epidemiológica e identificação de padrões ocultos, apoiando decisões rápidas e baseadas em evidências.

Decisão Pública com Evidências

Visamos transformar grandes volumes de dados em indicadores claros, fortalecendo a gestão da saúde e a formulação de políticas públicas mais eficientes e equitativas.

Projeto Sabiá – Saúde Avançada com Big Data e IA
Sobre o Projeto

Sabiá: Saúde Avançada com Big Data e Inteligência Artificial

O Projeto Sabiá nasce para enfrentar um dos maiores desafios da saúde pública brasileira: a fragmentação e o subuso dos dados. A iniciativa constrói um Data Lake em Saúde capaz de integrar, organizar e proteger grandes volumes de dados públicos, criando uma base sólida para análises avançadas e decisões baseadas em evidências.

Ao unificar dados clínicos, epidemiológicos, genômicos e socioeconômicos, o Sabiá viabiliza o uso estratégico de ciência de dados e Inteligência Artificial para vigilância epidemiológica, medicina de precisão, redução de desigualdades e fortalecimento das políticas públicas de saúde, sempre em conformidade com a LGPD.

Integração de Dados em Saúde

Data Lake Seguro e Interoperável

Governança e LGPD

Inteligência Artificial Aplicada

Vigilância e Análise Preditiva

Decisão Pública Baseada em Evidências

Saiba Mais
Primeiros Marcos do Projeto

O que Vamos Construir com o Sabiá

Mapeamento das Fontes

Identificar, documentar e padronizar todas as bases de saúde do município de Guarapuava.

Infraestrutura Inicial

Implantar um ambiente com zonas Bronze, Silver e Gold, garantindo segurança, redundância e governança.

Pipelines e Conectores

Criar os primeiros pipelines automáticos para ingestão contínua de dados do sistemas municipais.

Governança e LGPD

Estabelecer políticas de segurança, anonimização, acesso, auditoria e conformidade com a LGPD para todos os dados.

Primeiros Dashboards

Desenvolver visualizações iniciais para apoiar a tomada de decisão em vigilância epidemiológica e gestão municipal.

Fundação para IA

Preparar a estrutura necessária para modelos preditivos, análises avançadas e futuras soluções de IA em saúde pública.

Notícias

Acompanhe o Sabiá

Roda de escuta com educadores

Investimento em nosso projeto

Fundação Araucária investe R$ 3 milhões em Data Lake para pesquisa genômica.

Notícia - Ver mais
Notícia - Ver mais
Notícia - Ver mais
Roda de escuta com educadores

Parceria com o Hub AutoAI

O Sabiá é parceiro do hub AutoAI-Pandemics, iniciativa internacional financiada pela AI4PEP e desenvolvida em parceria com 16 países do Sul Global. AutoAI visa democratizar soluções de IA para não especialistas.

AutoAI - Ver mais
AI4PEP - Ver mais
Roda de escuta com educadores

Conheça o Projeto InteliGente

Reconhecido com mais de 40 prêmios nacionais e internacionais, o InteliGente visa democratizar o acesso à IA por meio da educação social e apoia o Sabiá na formação ética, inclusão digital e capacitação.

InteliGente - Ver mais
Notícias - Ler mais
Nossa Equipe

Quem Constrói o Sabiá

Nossos Parceiros

Quem Caminha ao Nosso Lado

FAQ

Perguntas Frequentes

O Projeto Sabiá (Saúde Avançada com Big Data e Inteligência Artificial) é uma iniciativa interdisciplinar que visa construir um repositório centralizado de dados relacionados à saúde, integrando informações genômicas, clínicas e socioeconômicas para avançar na Medicina de Precisão. A proposta contempla a criação de um Data Lake que armazene dados estruturados e não estruturados, como registros médicos eletrônicos, dados genômicos e ambientais, permitindo análises avançadas com o uso de inteligência artificial e ciência de dados. Os resultados esperados incluem a identificação de variações genéticas, biomarcadores de doenças crônicas e a formulação de políticas públicas baseadas em evidências, além de promover inovação tecnológica e reduzir desigualdades na saúde.

O Sistema Único de Saúde (SUS) tem como princípio a universalidade no acesso às ações e serviços de saúde em todo o território brasileiro. O SUS tem como finalidade garantir assistência integral, gratuita e igualitária à população. No entanto, o gerenciamento e o controle das ações do programa representam um desafio, especialmente diante da dimensão territorial e da diversidade regional do Brasil. Além disso, a saúde pública brasileira enfrenta obstáculos estruturais, como a fragmentação dos sistemas de informação, a desigualdade no acesso aos serviços de saúde e a escassez de dados integrados.

Ademais, a saúde pública no Brasil enfrenta outros desafios crescentes com as doenças crônicas não transmissíveis, como diabetes e hipertensão, agravadas pelo envelhecimento populacional e hábitos não saudáveis. Paralelamente, o país ainda lida com surtos recorrentes de doenças infecciosas, como dengue, zika e chikungunya. Por exemplo, lições aprendidas com a pandemia de COVID-19 destacam a necessidade urgente de fortalecer a capacidade brasileira de resposta a eventos semelhantes no futuro.

Outros problemas que podem agravar ainda mais essa situação são as mudanças climáticas, que, de acordo com PAHO2024, são provavelmente a maior ameaça atual à saúde da humanidade. Vários estudos reportam os impactos das mudanças climáticas na saúde, incluindo tanto os impactos diretos, como ondas de calor, secas, tempestades intensas e aumento do nível do mar; quanto por consequências indiretas, como doenças transmitidas por vetores e pelo ar, insegurança alimentar e hídrica, desnutrição e deslocamentos forçados.

Consequentemente, a falta de interoperabilidade entre bases de dados clínicas, genômicas e socioeconômicas compromete a capacidade de resposta diante de crises e dificulta a implementação de estratégias de prevenção personalizada. Nesse contexto, a transformação digital do setor saúde, apoiada em repositórios integrados como os data lakes, surge como alternativa estratégica para consolidar dados diversos em uma única plataforma analítica.

Essa integração amplia o potencial de análise preditiva e de apoio à decisão, especialmente quando combinada com técnicas de Inteligência Artificial (IA). A IA, por meio do Aprendizado de Máquina (AM), tem demonstrado resultados promissores na identificação de padrões complexos, predição de doenças, descoberta de biomarcadores e otimização do planejamento em saúde. Além disso, data lake são essenciais para o avanço da medicina de precisão por diversos fatores. Primeiramente, pela sua capacidade de armazenamento abrangente, pois não impõe restrições quanto ao tipo de dados armazenados. Ele permite integrar dados estruturados e não estruturados, abrangendo prontuários médicos, históricos hospitalares e outras informações relevantes de saúde em um único ambiente. Essa abordagem ampla possibilita uma visão integrada e detalhada dos dados, ampliando o potencial para análises profundas e geração de percepções valiosas, além de oferecer flexibilidade para diversas metodologias analíticas.

Sendo assim, o objetivo central deste projeto é desenvolver um data lake, chamado Sabiá, voltado à integração de dados relacionados à saúde da população de Guarapuava, no estado do Paraná, com o intuito de extrair informações estratégicas que subsidiem o desenvolvimento de soluções e a formulação de políticas públicas na área da saúde. Para isso, serão integrados dados clínicos e epidemiológicos com dados secundários, como informações sobre clima, meio ambiente, educação e economia local, visando à identificação de relações e impactos entre esses fatores e os indicadores de saúde da população.

Diferentemente dos sistemas tradicionais de armazenamento, que geralmente operam com formatos estruturados e específicos, o data lake aceita dados em seu estado bruto, sem a necessidade de pré-processamento. Essa característica é particularmente vantajosa na área da saúde, pois permite armazenar e explorar dados genômicos, históricos médicos, imagens diagnósticas e outros tipos de informações complexas.

Tal flexibilidade é crucial para identificar correlações entre fatores genômicos, epidemiológicos e clínicos, potencializando descobertas científicas e inovações. Adicionalmente, um Data Lake em Saúde viabiliza a implementação de práticas baseadas em evidências. Com o acesso a grandes volumes de dados integrados e de fontes diversas, pesquisadores e profissionais da saúde podem identificar padrões, tendências e associações que orientem a tomada de decisões clínicas de maneira mais precisa e fundamentada. Dessa forma, o data lake se consolida como um alicerce estratégico para o desenvolvimento da medicina de precisão, permitindo cuidados mais personalizados e eficazes.

Além disso, o presente projeto apoia-se em uma experiência piloto desenvolvida em parceria com pesquisadores do Estado de São Paulo, no âmbito de um projeto financiado pela Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP). Essa etapa está sendo realizada na cidade de Pompéia-SP, com foco na construção de um Data Lake em Saúde, a partir da integração de informações da Secretaria Municipal de Saúde e do Hospital de Pompéia.

A metodologia do projeto será conduzida em etapas interdependentes, organizadas para garantir a coleta, integração, análise de dados no contexto da saúde pública. O processo será estruturado em cinco macrofases: (Macrofase 01) Implementação da Infraestrutura Tecnológica; (Macrofase 02) Coleta, Ingestão e Integração de Dados; (Macrofase 03) Governança e Qualidade dos Dados; (Macrofase 04) Análise de Dados com IA; (Macrofase 05) Implementação e Democratização de Soluções Baseadas em Dados.

O público-alvo inicial do projeto é a população do município de Guarapuava, no estado do Paraná, que conta com 182.093 habitantes sendo sede da 5ª Regional de Saúde do Paraná. Os dados da cidade serão analisados e integrados ao projeto, com foco na população local, além de pesquisadores e gestores de saúde que utilizarão os resultados gerados. Indiretamente, o projeto poderá beneficiar os habitantes do Paraná, caso sua metodologia seja replicada em outras regiões, e, a longo prazo, a população de outros estados brasileiros, ampliando os benefícios da Medicina de Precisão.

O projeto é financiado pela Fundação Araucária, pela Secretaria de Ciência, Tecnologia e Ensino Superior (SETI) e pelo Governo do Paraná, reunindo R$ 3 milhões em investimentos destinados a pesquisa, infraestrutura tecnológica e inovação em saúde pública do projeto Sabiá.

  • (Coordenador Geral) Prof. Dr. David Livingstone Alves Figueiredo — Universidade Estadual do Centro-Oeste (Unicentro) e Instituto para Pesquisa do Câncer (IPEC)
  • (Coordenador Geral) Prof. Dr. André Carlos Ponce de Leon Ferreira de Carvalho — Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC-USP) e Global South AI4PEP Network
  • (Coordenador) Prof. Dr. Robson Parmezan Bonidia — Universidade Tecnológica Federal do Paraná (UTFPR) e Global South AI4PEP Network
  • (Coordenador) Prof. Dr. Luis Gustavo Morello — Fundação Oswaldo Cruz (Fiocruz) e Instituto para Pesquisa do Câncer (IPEC)
  • Prof. Dr. Mauro Miazaki — Universidade Estadual do Centro-Oeste (Unicentro)
  • Prof. Dr. Marcos Quinaia — Universidade Estadual do Centro-Oeste (Unicentro)
  • Profa. Dra. Adriane Feijó Evangelista — Instituto para Pesquisa do Câncer (IPEC)
  • Prof. Dr. Elvis Fusco — Fundação Shunji Nishimura de Tecnologia
  • Prof. Dr. Reinaldo Bernardi — Centro de Inovação no Agronegócio (CIAG)
  • Prof. Dr. Hannes Fischer — Centro de Inovação no Agronegócio (CIAG)
  • Profa. Dra. Tatiana Natasha Toporcov — Universidade de São Paulo (USP)
  • Profa. Dra. Angelica B. W. Wolf — Universidade Federal do Paraná (UFPR)
  • Prof. Dr. Emerson Carraro — Universidade Estadual do Centro-Oeste (Unicentro)
  • Profa. Dra. Polyanna K. de O. Borges — Universidade Estadual de Ponta Grossa (UEPG)
  • Prof. Dr. Weber C. F. N. da Silva — Universidade Estadual do Centro-Oeste (Unicentro)
  • Prof. Dr. Roberto H. Herai — Pontifícia Universidade Católica do Paraná (PUC-PR)
  • Profa. Dra. Bianca de Oliveira Cata Preta — Universidade Federal do Paraná (UFPR)