Especificações Técnicas - Marlon-Souza16/Redes-Neurais-e-Proteomica GitHub Wiki

Especificação Técnica

    A seguir, apresenta-se a visão dos aspectos técnicos do projeto, englobando requisitos de software, protocolos, algoritmos, procedimentos de desenvolvimento, formatos de dados, entre outros elementos essenciais à implementação e ao funcionamento da solução proposta.

Stack Tecnológica

  • Linguagens de Programação:
    • Python: será a linguagem utilizada para Machine Learning e manipulação de dados, e também para comunicação com frontend
    • JavaScript: Para desenvolvimento frontend
  • Frameworks e Bibliotecas:
    • TensorFlow / Keras: Criação e treinamento de Redes Neurais Artificiais.
    • scikit-learn: Implementação de algoritmos de KNN, validação cruzada (K-Fold) e outras técnicas de aprendizado de máquina.
    • Pandas e NumPy: Manipulação e análise de dados em escala.
    • Matplotlib: Visualização de resultados (como curvas ROC e matrizes de confusão).
    • FastAPI: Para criação das rotas backend (python)
    • React (frontend): Para criação da tela da clinica

Conceitos de Overfitting e Underfitting

  • Overfitting: Ocorre quando o modelo se ajusta tão bem aos dados de treinamento que não generaliza bem para novos dados. O modelo "decora" os dados de treinamento, perdendo a capacidade de fazer predições precisas em dados desconhecidos.

  • Underfitting: Acontece quando o modelo é muito simples e não consegue capturar padrões nos dados. Ele não consegue nem mesmo representar bem os dados de treinamento, resultando em baixa performance tanto em treinamento quanto em teste.

Proposta de Aplicação Integrada à IA

    A aplicação proposta tem como objetivo principal colocar a Inteligência Artificial (IA) no centro do processo de análise e tomada de decisão, oferecendo suporte aos médicos no diagnóstico, prognóstico e indicação de possíveis tratamentos para o câncer de mama. Para alcançar esse propósito, a arquitetura do sistema será dividida em duas camadas de dados e em uma camada de apresentação (front-end), que dialogam diretamente com o modelo de IA.

Camada de Banco de Dados em Grafos

  • Descrição: Essa base tem a função de armazenar informações relacionadas aos vínculos institucionais e clínicos, como dados da clínica (estrutura organizacional), médicos cadastrados e seus pacientes.

  • Estrutura: Por meio de um banco de dados de grafos, cada entidade (clínica, médico, paciente) é representada como um nó, enquanto as relações (médico–paciente, paciente–exame) são as arestas. Essa modelagem permite compreender de forma rápida e intuitiva como os elementos se conectam, tornando fácil rastrear informações e relacionamentos importantes para a condução do tratamento.

Camada de Banco de Dados Vetorial

  • Descrição: Esta base armazenará os dados dos exames médicos. Cada registro no banco vetorial contém informações específicas dos exames realizados pelos pacientes, como dados laboratoriais, resultados de imagem (quando convertidos em vetores de características), entre outros parâmetros relevantes para a detecção e o acompanhamento do câncer de mama.

  • Estrutura: Os conjuntos de exames são indexados pelo ID do paciente, criando uma ligação direta com a base de grafos que contém a identificação do mesmo. Dessa forma, é possível correlacionar os exames (dados vetoriais) a um determinado indivíduo, mantendo a consistência e a rastreabilidade das informações de saúde.

Camada de Apresentação (Front-End)

    O médico possui acesso a um painel onde são exibidos, de maneira gráfica e intuitiva, os resultados gerados pela IA. Isso inclui:

  • Diagnóstico: Se o cancer (tumor) é maligno ou benigno.
  • Gravidade: Escala de risco e estimativas de progressão.
  • Possíveis Tratamentos: Opções terapêuticas personalizadas, levando em conta a análise de proteínas, aminoácidos e interações identificadas pelo modelo.

    Além disso, o frontend contará com uma exibição de gráficos e relatórios. Permitindo uma análise mais rápida e confiável dos dados e auxiliando o médico na tomada de decisão.

5782af33-5bf4-4a49-9e92-475d502ba77d

Camada de Inteligencia Artificial (Núcleo do Sistema)

    A arquitetura de redes neurais artificiais será utilizada para garantir a análise exaustiva de variáveis clínicas e dados de exames permitindo a identificação e estratificação do câncer de mama. Ao integrar essas informações com dados avançados de proteômica — como presença, estrutura e interações de proteínas e aminoácidos específicos — o modelo de IA passa a ter capacidade de mapear padrões sutis que correlacionam determinados perfis bioquímicos à agressividade do câncer e às possíveis rotas terapêuticas.

    Em síntese, a IA não se limita a classificar o câncer como benigno ou maligno: ela aprofunda a compreensão dos mecanismos moleculares que sustentam o avanço do tumor, ao mesmo tempo em que aponta caminhos terapêuticos baseados na análise de combinações estratégicas de proteínas e aminoácidos. Esse nível de integração entre análises clínicas, proteômica e inteligência artificial promete trazer diagnósticos mais confiáveis, tratamentos mais eficazes e uma perspectiva de cuidado altamente personalizado, elevando o padrão de atendimento em oncologia.