HEMO 2025 / III Simpósio Brasileiro de Citometria de Fluxo
Mais dadosA triagem para o HTLV (Vírus Linfotrópico de Células T Humanas), especialmente os tipos 1 e 2, é essencial em bancos de sangue para prevenir a transmissão transfusional e garantir a segurança do receptor. Na Fundação Centro de Hemoterapia e Hematologia do Pará (HEMOPA), a rotina inclui rastreamento sorológico inicial e confirmação molecular pela reação em cadeia da polimerase em tempo real (qPCR), que detecta o DNA proviral e reduz falsos-positivos. Ferramentas de Inteligência Artificial (IA), como algoritmos de Machine Learning (ML), vêm se tornando cada vez mais relevantes na saúde, nesse contexto, podem integrar diversas variáveis para predizer o desfecho de testes moleculares e auxiliar o controle de qualidade laboratorial.
ObjetivosAvaliar o desempenho de diferentes algoritmos de machine learning na predição dos resultados confirmatórios de qPCR para HTLV em doadores inaptos.
Material e métodosEstudo retrospectivo, transversal e quantitativo com dados obtidos no Laboratório de Biologia Molecular e Celular, da Fundação Hemopa no período de 2015‒2019. A pesquisa foi aprovada no comitê de ética sob CAEE n° 9.004.819.7.0000.8187. A plataforma utilizada foi Orange Data Mining, com dados de 632 exames de qPCR para HTLV. Destes, 80% (n=506) foram reservados para o treino dos modelos e 20% (n=126) para teste. Os dados utilizados tiveram o desfecho removido (detectável/indetectável). A divisão do conjunto de teste foi feita de forma estratificada e aleatória, mantendo proporções de 20% de casos detectáveis (27 de 136) e 20% de indetectáveis (99 de 496). As variáveis preditoras incluíram idade, sexo, raça autodeclarada, residência, estado civil, tipo de doador (primeira vez, repetição ou esporádico), número de doações e resultado sorológico. Durante o treinamento, aplicou-se validação cruzada estratificada por meio do widget “Test and Score” e matriz de confusão para cálculo de acurácia e contagem de erros com intuito de filtrar os melhores modelos.
ResultadosOs algoritimos Neural Network, k-Nearest Neighbors, Random Forest, AdaBoost e Gradient Boosting obtiveram os melhores resultados, com 124 acertos o que correspondendo a 98,41% de acurácia, com apenas dois erros cada. Naïve Bayes apresentou 123 acertos (97,6% de acurácia) e Logistic Regression registrou 122 acertos (96,8% de acurácia). Em todos os casos, os 27 resultados detectáveis foram corretamente previstos.
Discussão e conclusãoA incorporação de algoritmos de machine learning ao controle de qualidade mostra-se promissora, pois modelos como redes neurais e ensembles alcançaram mais de 98% na análise. À medida que a base de treinamento crescer, espera-se um aumento na robustez e confiabilidade das predições. Os modelos testados exibiram alta capacidade preditiva, acima de 96% de acurácia. Para avançar rumo à aplicação prática, recomenda-se ampliar o volume de dados e agregar variáveis clínicas relevantes, além de realizar estudos multicêntricos que validem a robustez desses sistemas em diferentes cenários. Dessa forma, a IA poderá ser uma ferramenta adicional de segurança.




