versão impressa ISSN 1676-2444versão On-line ISSN 1678-4774
J. Bras. Patol. Med. Lab. vol.55 no.6 Rio de Janeiro nov./dez. 2019 Epub 02-Mar-2020
http://dx.doi.org/10.5935/1676-2444.20190055
Os sistemas de cuidados de saúde enfrentam múltiplos desafios em todo o mundo: aumento da incidência de doenças, multimorbidade e incapacidade causadas pelo envelhecimento, além de transição epidemiológica, demanda aumentada por serviços de saúde, maiores expectativas sociais e maiores gastos com saúde(1,2). Outro desafio é a ineficiência, com sua baixa produtividade(3). Esses desafios existem em um cenário de conservadorismo fiscal, com políticas equivocadas de austeridade econômica que restringem o investimento em saúde. Uma transformação profunda dos sistemas de saúde é essencial para superar esses desafios e alcançar uma cobertura universal de cuidados em saúde até 2030(4).
O aprendizado de máquina, a manifestação mais tangível da inteligência artificial (IA) - e a mais nova área de crescimento em tecnologia digital - promete atingir mais com menos e pode ser o catalisador dessa transformação(5).
A IA consiste em um conjunto de tecnologias computacionais inspiradas na habilidade humana de raciocinar, com o propósito de sentir, aprender, reagir e criar ação. Difere dos humanos em velocidade, autonomia e generalidade(6-10). No contexto da saúde, o uso de sistemas de IA tem feito grandes progressos, sendo visto como uma das áreas principais da IA e auxiliando diagnósticos médicos, procedimentos e operações(4).
Nesse assunto, um importante segmento do desempenho da IA seria o auxílio no diagnóstico anatomopatológico. Uma vez que o sistema de reconhecimento visual e o software de aprendizagem profunda da IA estão bem estruturados, desenvolver um sistema que ajudaria os patologistas com diagnósticos, especialmente no caso de tumores(11), seria de valor inestimável.
Alguns estudos têm utilizado a IA para ajudar no diagnóstico de neoplasias, como a avaliação de pólipos intestinais(6), detecção de metástases de linfonodos no câncer de mama(9), prognóstico no câncer colorretal(11), câncer de pulmão(8) e câncer gástrico(7).
Nesse contexto, a IA seria um auxílio ao diagnóstico de nódulos de mama. Estes são extremamente comuns nas mulheres, tornando-se mais frequentes à medida que a população envelhece. O câncer de mama tem a maior taxa de incidência e a segunda
taxa de mortalidade nas mulheres. O diagnóstico precoce e preciso é uma estratégia fundamental para minimizar a morbidade e a mortalidade causadas por essa doença(12,13). Os nódulos podem ser classificados em dois grandes grupos: benignos e malignos(14,15).
Os principais representantes do primeiro subgrupo são fibroadenoma e alterações fibrocísticas, que se caracterizam como condições benignas com baixa taxa de complicações. Os nódulos malignos são representados pelo carcinoma ductal in situ, carcinoma invasivo do tipo não especial e carcinoma lobular invasivo. Esses nódulos são extremamente frequentes em uma a cada oito mulheres(12,16).
Houve um aumento recente no número de biópsias e espécimes cirúrgicos de mama para avaliação de nódulos suspeitos. Apesar disso, o número de patologistas não acompanhou a demanda. Pelo contrário, houve diminuição no número de profissionais e sobrecarga de trabalho, colocando em risco a diferenciação entre doenças benignas e malignas(17,18).
Neste estudo, um software de IA foi desenvolvido com base em aprendizagem profunda que possibilitou o reconhecimento histopatológico de nódulos mamários com altas sensibilidade e especificidade. Ele pode ser usado por patologistas para acelerar e aumentar o volume de diagnósticos dessas neoplasias, tanto na distinção entre normal e patológica como na diferenciação de tipo e grau.
O software de IA foi desenvolvido com o uso da técnica de aprendizagem profunda. Ele foi estruturado em um conjunto de algoritmos que modelam abstrações de dados de alto nível usando um gráfico profundo com várias camadas de processamento, compostas por várias transformações lineares e não lineares. Estabeleceu-se uma interface de comunicação com características de imagens histopatológicas mamárias organizadas sob uma cadeia de análise que definiu um padrão lógico de classificação de imagem com e sem lesões neoplásicas de mama.
Adotou-se a linguagem de programação Python versão 3. Essa linguagem promove um método sistemático de programação com base no conceito de software estruturado em blocos, facilitando a identificação das características na base de dados. É uma linguagem dinâmica, interpretada, robusta, multiplataforma, multiparadigma (orientação a objetos, funcional, reflexiva e imperativa). A linguagem de programação PHP versão 5 eJavaScript possibilitou a criação de uma interface de fácil manipulação, que favoreceu a opção de ferramentas, botões e barras de rolagem para escolher alternativas e os comandos necessários. O software foi batizado de Kuiava artificial intelligence (KAi).
As lâminas histopatológicas do tecido mamário removido do site Path Presenter com diferentes resoluções e classificadas como normal, alterações fibrocísticas, fibroadenoma, carcinoma invasivo do tipo não especial e carcinoma invasivo lobular in situ foram usadas para treinamento com o banco de imagens.
Para o desenvolvimento do banco de dados do software, 110 lâminas do site Path Presenter foram usadas, das quais 5.298 imagens foram capturadas. Um total de 759 imagens de mama sem alterações patológicas foram obtidas; 316 com alterações fibrocísticas; 633 com fibroadenomas; 930 com carcinomas in situ; 1.350 com carcinoma invasivo do tipo não especial; 1.310 com carcinoma lobular invasivo (Figura 1).
FIGURA 1 Modelo de imagem usada para desenvolvimento da base de dados do softwareA) carcinoma lobular invasivo; B) carcinoma in situ; C) fibroadenoma; D) carcinoma invasivo sem outra especificação; alterações fibrocísticas; F) mama normal.
Todas essas imagens foram reavaliadas e confirmadas por dois patologistas experientes. Todas as imagens selecionadas foram analisadas pelo software de IA para criar um padrão de reconhecimento. A resolução de imagem do sistema é 224 x 224 pixels para MobileNet e 299 x 299 para Inception. Foi usada a análise de imagens com três canais (R, G e B).
A técnica da aprendizagem profunda com treinamento da rede neural convolucional foi implementada pela biblioteca de código aberto TensorFlow. Dois modelos de rede pré-treinados, MobileNet versão 1.0 e Inception versão 3, foram usados para o treinamento da classificação de imagens. Ambos foram projetados a partir de um conjunto de imagens de propósito geral pré-analisadas disponibilizadas por Google Inc.
O treinamento de algoritmo de IA usou 5.298 imagens fornecidas pelo site Path Presenter nos modelos de rede neuronal pré-treinados MobileNet e Inception. Dez por cento (530) das imagens foram usadas como dados de validação interna de próprio sistema para possibilitar os cálculos de níveis de confiabilidade.
As configurações usadas para calibrar MobileNet e obter o melhor desempenho foram um número de interações de 1.200 com uma taxa de aprendizagem de 0,001, e o nível de confiabilidade oferecido pelo sistema foi 84%.
Para o Inception, a melhor configuração encontrada foi um número de interações de 5.000, com uma taxa de aprendizagem de 0,1, e o nível de confiabilidade oferecido pelo sistema foi 82,4%.
Após o treinamento do software, ele foi submetido a um teste de eficiência, que aconteceu em três etapas:
primeira - selecionamos 120 lâminas histopatológicas com diagnósticos diferentes, que originaram 685 imagens de diferentes ampliações de 40x e 100x (432 imagens de mama sem alterações patológicas, 268 com alterações fibrocísticas, 520 com fibroadenomas, 412 carcinomas in situ, 540 carcinomas invasivos de tipo não especial, 568 carcinomas lobulares invasivos). As lâminas foram cedidas pelo Instituto de Patologia de Passo Fundo, Brasil;
segunda - o diagnóstico das lâminas foi confirmado por dois patologistas e as 685 imagens foram convertidas ao formato JPEG e inseridas no programa. Essas 685 imagens fornecidas pelo instituto passaram por rotações de 90, 180 e 270 graus para aumentar o número de imagens do banco de dados que seriam testadas pelo software. Desse modo, 2.740 imagens foram usadas para validar externamente o sistema;
terceira - as imagens no formato JPEG foram analisadas no software KAi, que liberou o diagnóstico em um arquivo digitado no bloco de notas, depois transferido para o Microsoft Excel 2013.
O software produziu lotes de bloco de notas digitados em uma planilha do Microsoft Excel, criando um banco de dados. Para calcular sensibilidade e especificidade, as seguintes fórmulas foram usadas: sensibilidade = verdadeiro positivo/positivo; especificidade = verdadeiro negativo/negativo. Os testes não paramétricos de Wilcoxon e Mann-Whitney foram usados para avaliar a correção do software. Os resultados foram considerados significantes quando p < 0,05, e o software SSPS 10.0 foi usado para análise.
O software foi desenvolvido para verificar imagens histopatológicas de mama e treinado para realizar diagnósticos. Sua estrutura é mostrada na Figura 2.
FIGURA 2 Estrutura functional do KAi A) página inicial; B) página de inserção da imagem em JPEG; C) página com relatório de resultados.KAi: Kuiava artificial intelligence.
A sensibilidade e a especificidade do software foram verificadas por meio do teste de 2.740 imagens fornecidas pelo Instituto de Patologia de Passo Fundo (432 imagens de mamas sem alterações patológicas, 268 com alterações fibrocísticas, 520 com fibroadenomas, 412 carcinomas in situ, 540 carcinomas invasivos de tipo não especial e 568 carcinomas lobulares invasivos).
Os resultados globais apresentaram sensibilidade de 80,5% [95% intervalo de confiança (IC), 71,9%-89,1%] e especificidade de 96,1% (95% IC, 94,3%-97,8%) para MobileNet, e sensibilidade de 73,8% (95% IC, 52,6%-115%) e especificidade de 94,7% (95% IC, 91,7%-97,7%) para Inception (Tabela).
TABELA Sensibilidade e especificidade por alteração patológica
Condições | MobileNet (valor p) | Inception (valor p) | |
---|---|---|---|
Mama histologica- | Sensibilidade | 0,88 | 0,87 |
mente normal | Especificidade | 0,94 | 0,91 |
Fibroadenoma | Sensibilidade | 0,82 | 0,83 |
Especificidade | 0,99 | 0,98 | |
Alteração fibrocística | Sensibilidade | 0,73 | 0,59 |
Especificidade | 0,98 | 0,98 | |
Carcinoma invasivo | Sensibilidade | 0,62 | 0,23 |
do tipo não especial | Especificidade | 0,97 | 0,98 |
Carcinoma lobular | Sensibilidade | 0,91 | 0,93 |
invasivo | Especificidade | 0,93 | 0,9 |
Carcinoma ductal | Sensibilidade | 0,82 | 0,84 |
in situ | Especificidade | 0,96 | 0,95 |
Global | Sensibilidade | 0,8 | 0,73 |
Especificidade | 0,96 | 0,94 |
Para diferenciação entre condições benignas (mama normal, alteração fibrocística e fibroadenoma) e malignas (carcinomas in situ, invasivos de tipo não especial e invasivos lobulares), o sistema obteve sensibilidade máxima de 78,7% e especificidade de 95,8% para diferenciação de condições malignas. Para condições benignas, a sensibilidade máxima foi 82,6% e a especificidade, 97,4%. Não houve diferença estatística em sensibilidade e especificidade entre MobileNet e Inception (p = 0,74).
As estimativas mundiais mostram uma tendência ascendente na incidência e na prevalência de neoplasias(1). Portanto, os complexos processos de detecção precoce e o correto diagnóstico do câncer dependem, entre outros fatores, do raciocínio e da experiência dos profissionais médicos. Nesse contexto, o uso de técnicas computacionais no diagnóstico estruturado com IA torna-se uma ferramenta importante que ajudará os profissionais de saúde e especialmente os pacientes, melhorando e acelerando o diagnóstico dos tumores(3,4,19). Este trabalho propôs o desenvolvimento de um software que auxiliaria o diagnóstico histopatológico de neoplasias de mama.
Os resultados obtidos mostraram que o Sistema KAi coletaram dados promissores, apresentando sensibilidade de 76% e especificidade de 94,5%, associadas com alto índice preditivo negativo na diferenciação entre nódulos benignos e malignos, com características promissoras a serem incorporadas, no futuro, em laboratórios de patologia como métodos de triagem.
Alguns estudos têm demonstrado que sistemas de IA superam os médicos em diagnosticar enfermidades. Um estudo publicado em Annals of Oncology Scientific Journal, por Holger Haenssler, professor no departamento de dermatologia da Universidade de Heidelberg, na Alemanha, com participação de cientistas da França e dos Estados Unidos, mostrou que os médicos detectaram com precisão 86,6% dos melanomas, e o sistema de IA conseguiu corrigir 95% dos casos(2). Stone et al. (2016)(3) descreveram que na área da saúde, o uso de sistemas de IA tem apresentado grandes progressos, sendo visto como uma das principais áreas da IA capaz de auxiliar diagnósticos médicos.
Os sistemas de apoio a decisões são softwares que se propõem a ajudar os clínicos no diagnóstico e nas decisões terapêuticas relacionados com o paciente. Eles simplificam o acesso a dados precisos na literatura científica, as possibilidades propedêuticas, o estabelecimento de diagnóstico diferencial, além de destacar características específicas em novos padrões clínicos(7,19).
O sistema de leitura e identificação proposto por este projeto facilita a leitura e o diagnóstico de câncer de mama, permitindo aos laboratórios e profissionais diagnosticar tumores a distância, como em cidades, vilas e regiões ribeirinhas que não contam com profissionais capacitados para o diagnóstico. Pode-se rapidamente preparar a histologia, fotografar e realizar uma triagem prévia, quer dizer, um diagnóstico prévio, e/ou mais tarde enviar as imagens para lugares distantes, grandes centros especializados que apresentam tecnologia e profissionais capazes de confirmar o diagnóstico, sem a necessidade de encaminhar espécimes em formol, evitando deterioração, atraso de transporte, perda ou troca de amostras(21,22).
Esse procedimento reduziria significativamente os custos de transporte de material, evitando a perda de amostras e especialmente garantindo a realização de um diagnóstico mais rápido e mais assertivo. Além do mais, os cirurgiões poderiam ter resultados imediatos, mesmo antes da alta dos pacientes, o que facilitaria e melhoraria o comportamento terapêutico(2,4). Por meio do banco de dados, o sistema de leitura e diagnóstico faria recomendações mais enfáticas para cada caso de câncer em alguns minutos, mostrando o melhor tratamento para cada paciente.
Além disso, o presente sistema tem potencialidades, pois usa dois bancos de dados de diferentes instituições, potencializando assim a validação dos dados. Essa característica garante mais segurança de resultados, tendo melhor validação externa. Uma vez que esse trabalho é o resultado de um estudo primário, existem limitações, como o uso de somente dois modelos de rede neural para desenvolvimento do software e captura de imagens clássicas das condições analisadas. As regiões de transição entre condições patológicas e saudáveis não foram incluídas no estudo desta vez. Um desequilíbrio foi observado no número de imagens usadas para cada condição patológica analisada - essa característica pode influenciar a correção do sistema e a validação. Entretanto, enfatizamos que é um método prático, barato e efetivo que só precisa de aperfeiçoamento para aumentar a especificidade e a sensibilidade.
Destacamos o fato de que é improvável que uma máquina substitua inteiramente profissionais humanos, embora esses sistemas IA possam auxiliar o diagnóstico de neoplasias. Além do mais, esse sistema de interpretação e diagnóstico com base em IA é capaz de ler, interpretar, diferenciar e diagnosticar imagens histopatológicas de neoplasmas, tornando o diagnóstico mais preciso, eficiente e rápido, especialmente em lugares onde há estrutura hospitalar e médica frágil(5,6).
Os sistemas de IA são tecnologias que emergiram e desempenham um papel cada vez mais significativo no modo com que os profissionais da saúde prestam assistência e diagnosticam. Eles são modos de complementar as fraquezas estruturais do sistema de saúde, como a indisponibilidade de profissionais e as limitações geográficas. O sistema desenvolvido obteve resultados promissores que favorecem sistemas semelhantes e que podem ser usados como métodos de triagem para o diagnóstico de câncer de mama, pois mesmo no estágio embrionário foi capaz de obter uma sensibilidade máxima de 78,7% e especificidade de 95,8% pra diferenciação de condições malignas, e sensibilidade máxima de 82,6% e especificidade de 97,4% para diferenciação de condições benignas. Enfatiza-se a importância do sistema como uma ferramenta de baixo custo e fácil operação.