Sistema de IA Supera Análise Padrão de Imagens para Doenças da Retina
— Oferece potencial para reduzir a atual carga de trabalho de classificação manual
MedPage Today
A revisão das imagens de triagem da retina para retinopatia diabética por um sistema de inteligência artificial (IA) demonstrou potencial para reduzir significativamente a necessidade de revisão manual sem perda de precisão, de acordo com uma grande análise retrospectiva.
Um autonivelador de aprendizagem profunda (DLAG) alcançou especificidade significativamente maior (P<0,001) em comparação com a classificação de consenso e o sistema automatizado iGradingM, nos mesmos níveis de sensibilidade. Com as mesmas especificidades, o DLAG também alcançou maior sensibilidade do que qualquer um dos métodos comparadores. No geral, o DLAG demonstrou sensibilidade de 96,58% para doenças observáveis da retina e 98,48% de sensibilidade para doenças que requerem encaminhamento.
Os resultados sugeriram que o DLAG poderia reduzir a necessidade de classificação manual dos estimados 50% com o sistema iGradingM para 43,84%, relatou Joseph Mellor, PhD, da Universidade de Edimburgo, na Escócia, e coautores no British Journal of Ophthalmology abre em uma nova guia ou janela.
“Se este sistema fosse utilizado no NHS Scotland Diabetic Eye Service [DES], poderia criar poupanças económicas ao avaliar mais episódios de rastreio de pacientes do que os que são classificados finalmente pelo sistema automatizado atual”, escreveram os autores sobre as suas descobertas. “O sistema descrito neste estudo pode ser combinado com a atribuição automatizada de intervalos de triagem para aumentar ainda mais a eficiência da triagem ocular para diabéticos”.
A Escócia tem usado um sistema de classificação baseado em máquina há vários anos e, embora seja mais eficiente do que a classificação manual, o sistema não alcançou um alto grau de precisão, disse Sunir Garg, MD, do Wills Eye Institute da Thomas Jefferson University na Filadélfia e porta-voz da Academia Americana de Oftalmologia.
“Este estudo atual examinou imagens de um grande número de pacientes, muitos dos quais foram examinados várias vezes”, disse Garg ao MedPage Today por e-mail. “A capacidade do sistema atual de detectar doenças oculares diabéticas é melhor do que as dos avaliadores humanos ou do sistema automatizado usado atualmente na Escócia.”
“A classificação automatizada potencialmente aumentará o número de pacientes com doença ocular diabética identificada, bem como estratificada de risco”, continuou Garg. “Dependendo de onde as imagens são adquiridas, isso pode ser mais fácil para os pacientes. Pode-se então identificar aqueles que têm maior necessidade de consultar um oftalmologista”.
Os sistemas baseados em máquinas não substituem um exame oftalmológico abrangente, que pode identificar outras condições comuns, como glaucoma, catarata e degeneração macular, que muitas vezes não são identificadas por esses modelos, acrescentou Garg.
“Uma desvantagem até mesmo deste software de triagem de última geração é que ainda há vários pacientes que precisam ser encaminhados para classificação manual”, disse ele. “As iterações atuais da IA podem ser úteis quando a qualidade da imagem é alta, mas nos casos em que as imagens não eram gradáveis, os rastreadores humanos ainda eram importantes”.
Os sistemas de classificação automática atualmente disponíveis para imagens da retina identificam com segurança cerca de metade dos exames de retina sem a necessidade de classificação manual, observaram Mellor e co-autores em sua introdução. Alguns estudos sugeriram que os sistemas baseados em aprendizagem profunda alcançam maior sensibilidade e especificidade para a retinopatia diabética referenciável, mas uma comparação direta recenteabre em uma nova guia ou janela de sete sistemas diferentes mostraram grande variabilidade em sensibilidade e precisão.
O sistema iGradingM ajudou a reduzir a carga de trabalho de classificação manual no programa de rastreio oftalmológico da Diabetes da Escócia, mas os sistemas de IA oferecem o potencial para poupanças adicionais ao alcançar uma melhor especificidade com sensibilidade semelhante para a deteção de doenças, continuaram os autores.
Mellor e colegas compararam um algoritmo baseado em aprendizagem profunda para detectar qualquer forma de doença retiniana ou imagens que não pudessem ser avaliadas. Eles compararam o desempenho do sistema DLAG com a nota final do DES, a classificação manual e o sistema iGradingM.
O estudo envolveu participantes com 12 anos ou mais no programa nacional de triagem oftalmológica da Escócia durante 2006 a 2016. A triagem envolveu uma única fotografia de 45 graus centrada na mácula de cada olho, além de fotografias adicionais conforme necessário. Os dados incluíram imagens da retina, dados de garantia de qualidade e graus de retinopatia diabética de rotina obtidos de 179.944 pacientes de vários conjuntos de dados nacionais. Nem todos os dados foram incluídos em cada análise.
A nota final do DES foi utilizada como referência, incluindo sensibilidade de 92,80% e especificidade de 90,00%. O DLAG apresentou sensibilidade de 92,97% no mesmo nível de especificidade e especificidade de 90,00% no mesmo nível de sensibilidade (P= 1,000).
A classificação individual resultou em sensibilidade de 95,83% e especificidade de 75,28%.No mesmo nível de especificidade, o DLAG teve sensibilidade de 96,23% (P= 0,021), e no mesmo nível de sensibilidade, o DLAG teve especificidade de 78,12% (P<0,001). O sistema iGradingM alcançou sensibilidade de 92,97% e especificidade de 61,88%, em comparação com 97,60% (P<0,001) e 89,38% (P<0,001), respectivamente, para DLAG com a mesma sensibilidade e especificidade.
Os autores reconheceram várias limitações do estudo: classificação de consenso limitada para o subconjunto de 744 imagens de garantia de qualidade, incapacidade de contabilizar o impacto potencial de uma mudança em 2021 para a triagem bienal para pacientes sem doença, falta de contabilização de múltiplos episódios de triagem para cada paciente, nenhuma informação em nível de episódio sobre midríase e uso da nota final do DES como referência, em oposição à classificação de consenso.