Modelos de Inteligência Artificial - Marlon-Souza16/Redes-Neurais-e-Proteomica GitHub Wiki
Como primeiro passo deste projeto, propõe-se a construção de um modelo de Rede Neural ou KNN para o diagnóstico de câncer de mama. A base de dados em uso (referida como “Dados de Câncer de Mama”) conta com 569 instâncias e 30 features, obtidas a partir de exames de biópsia (por exemplo, características relacionadas aos núcleos celulares). Essas variáveis permitem distinguir, de forma mais precisa, tumores benignos de tumores malignos, contribuindo para a eficiência dos processos de triagem e diagnóstico.
Os genes BRCA1 e BRCA2 desempenham papéis críticos na manutenção da integridade genômica, atuando no reparo de quebras na dupla hélice do DNA por meio de mecanismos como a recombinação homóloga. Mutações patogênicas nesses genes podem comprometer o funcionamento normal das proteínas correspondentes, aumentando significativamente o risco de desenvolvimento de câncer de mama, ovário e outras neoplasias correlatas.
Aqui propõe-se o desenvolvimento de um Modelo de Predição de Mutações Patogênicas para os genes BRCA1 e BRCA2, utilizando técnicas de Inteligência Artificial (IA) em dados genômicos. A abordagem consiste em coletar sequências de DNA associadas a diferentes variantes (mutações conhecidas como patogênicas, benignas ou de significado incerto), presentes em bancos de dados públicos, como o ClinVar e BIC (Breast Cancer Information Core). O modelo treinado busca identificar, de maneira automática, padrões associados ao potencial patogênico de cada mutação, fornecendo uma probabilidade de risco.
A perda ou redução de função em genes supressores tumorais, como BRCA1 e BRCA2, representa um dos principais fatores de risco para o desenvolvimento de câncer de mama. Dado o papel crítico dessas proteínas no reparo do DNA, e sabendo que mutações estruturais podem levar a defeitos na recombinação homóloga (troca de sequências de DNA entre moléculas semelhantes), culminando em instabilidade genômica propõem-se o desenvolvimento de um modelo de IA capaz de gerar miniproteínas (ou peptídeos) funcionais capazes de restaurar ou complementar a função perdida. Assim permitindo intervenções terapêuticas personalizadas e com menos efeitos adversos do que abordagens sistêmicas convencionais. A ideia central consiste em explorar informações proteômicas de BRCA1 e BRCA2, incluindo domínios críticos responsáveis pela interação com outras moléculas de reparo de DNA, para sintetizar novos fragmentos peptídicos que possam se ligar às regiões afetadas pelas mutações ou mesmo substituir domínios danificados.
- A AlphaFold fornece acesso aberto a base de dados com mais de 200 milhões de estruturas de proteínas (https://alphafold.ebi.ac.uk/)
- A validação pode ser feita por docking molecular ?
- Link para ncbi com pesquisa BRCA1 (https://www.ncbi.nlm.nih.gov/nuccore/?term=%22brca1%22+and+complete+sequence+and+homo+sapiens)
- https://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Get&RID=2CR6ARCC016
- Gene completo (https://www.ncbi.nlm.nih.gov/nuccore/L78833.1)