Cientistas descobrem falha grave no uso de IA para estudos do genoma

Com o avanço exponencial da inteligência artificial e a popularidade de ferramentas como o ChatGPT, 2024 foi marcado como o ano em que a IA se tornou acessível para o público em geral. Embora a IA e o aprendizado de máquina já estejam em uso há anos, principalmente em áreas científicas, o recente boom trouxe novas discussões e desafios, especialmente em campos como a genética e a medicina.

A IA no Estudo da Genética

Pesquisadores da Universidade de Wisconsin–Madison alertam que o uso de inteligência artificial para estudos genéticos pode levar a conclusões equivocadas, especialmente em relação à conexão entre genes e características físicas. Embora a IA seja uma ferramenta poderosa para processar grandes volumes de dados, ela pode introduzir vieses e erros em estudos de associação genética de larga escala.

Estudos de Associação Genômica em Larga Escala

Os estudos de associação genômica de larga escala analisam bancos de dados como o projeto All of Us do National Institutes of Health e o UK Biobank, buscando variações genéticas que possam estar ligadas a características físicas e riscos de doenças. No entanto, esses bancos de dados frequentemente carecem de informações específicas sobre algumas condições de saúde, levando pesquisadores a recorrer à IA para preencher essas lacunas.

A Popularidade da IA em Previsões Genéticas

Nos últimos anos, tem sido cada vez mais comum que pesquisadores utilizem modelos avançados de aprendizado de máquina para prever características complexas e riscos de doenças, mesmo com dados limitados. Essa abordagem vem sendo aplicada em áreas como a medicina personalizada e a pesquisa genética, mas carrega o risco de fornecer previsões imprecisas, dependendo da qualidade e completude dos dados.

Riscos de Falsos Positivos em Diagnósticos

Uma recente pesquisa publicada na Nature Genetics pela equipe do professor Qiongshi Lu mostrou que algoritmos de aprendizado de máquina usados em estudos de associação genômica podem associar erroneamente certas variações genéticas ao risco de desenvolver doenças como o diabetes tipo 2. Esses “falsos positivos” representam um risco significativo, pois podem levar pesquisadores e médicos a conclusões erradas.

Confiabilidade das Previsões de Risco

O problema central é que, ao confiar na previsão de risco de inteligência artificial como uma estimativa precisa, os pesquisadores podem considerar que essas variações genéticas estão realmente associadas ao risco de uma doença, quando na verdade não estão. Esse tipo de erro é particularmente perigoso em estudos que visam identificar fatores de risco genético.

Método para Reduzir Vieses em Estudos com IA

Para enfrentar esses desafios, a equipe de Lu desenvolveu um método estatístico que ajuda a garantir a confiabilidade dos estudos de associação genômica que utilizam IA. Esse método atua removendo o viés introduzido pelos algoritmos de aprendizado de máquina quando eles fazem inferências com base em informações incompletas.

Dados de Proxy em Estudos Genéticos

Além de algoritmos, alguns estudos tentam preencher lacunas de dados utilizando informações de proxy, como históricos familiares. No caso de doenças neurodegenerativas como o Alzheimer, onde há poucos dados diretos, alguns pesquisadores utilizam o histórico de saúde familiar para identificar possíveis correlações genéticas.

Problemas com Dados de Proxy

A equipe de Lu, no entanto, identificou problemas graves com essa abordagem. Estudos que utilizam informações de proxy, como históricos familiares, podem gerar correlações genéticas enganosas. Um exemplo disso foi a associação entre o risco de Alzheimer e habilidades cognitivas superiores, uma conclusão que se revelou errônea quando analisada mais profundamente.

Desafios dos Grandes Bancos de Dados

Com a expansão dos bancos de dados genômicos, que agora incluem centenas de milhares de indivíduos, a “potência estatística” desses estudos aumenta. Entretanto, como destacou o professor Lu, à medida que a quantidade de dados cresce, também cresce o potencial para erros e vieses, exigindo rigor na análise.

A Importância do Rigor Estatístico

O estudo da equipe de Lu serve como um lembrete da necessidade de rigor estatístico em estudos genômicos em larga escala. Embora a inteligência artificial seja uma ferramenta poderosa, sua aplicação em campos tão sensíveis quanto a genética deve ser feita com cautela e supervisão científica.

O Futuro da IA na Genética

O uso da inteligência artificial em estudos genômicos traz tanto benefícios quanto desafios. Por um lado, a IA permite a análise rápida e eficiente de grandes volumes de dados; por outro, erros e vieses podem comprometer a validade das conclusões. A equipe de pesquisadores da Universidade de Wisconsin–Madison alerta que o sucesso desses estudos depende da aplicação de métodos que minimizem o viés e garantam a precisão dos resultadosResumo para quem está com pressa

IA e ChatGPT se tornaram populares em 2024, impactando diversas áreas, incluindo a genética.
Estudos genéticos utilizam IA para identificar conexões entre genes e doenças, mas isso pode introduzir erros.
Pesquisadores da Universidade de Wisconsin-Madison apontam falhas na IA aplicada à genética.
Falsos positivos em diagnósticos são um risco ao confiar excessivamente em previsões da IA.
Métodos estatísticos foram desenvolvidos para reduzir vieses nos estudos genômicos com IA.
Rigor estatístico é essencial em pesquisas de larga escala para garantir resultados confiáveis.