Sistema inteligente capaz de identificar tomografias com sinais de covid-19 é selecionado em desafio internacional
Tecnologia foi desenvolvida por dois ex-alunos da USP utilizando diversos recursos de inteligência artificial que possibilitam ao sistema obter um aprendizado profundo a partir das imagens analisadas
Um sistema inteligente capaz de analisar automaticamente uma tomografia, identificando a probabilidade das imagens apresentarem características de um pulmão afetado pela covid-19. Não é ficção científica, essa ferramenta que utiliza diversos recursos de inteligência artificial já existe e foi criada por uma startup sediada em São Carlos, interior de São Paulo, a Visibilia.
A solução já conquistou o reconhecimento do Governo do Estado de São Paulo: está entre as duas selecionadas, na categoria tomografia computadorizada, pelo hub de inovação Ideia Gov em uma chamada pública destinada a encontrar as melhores iniciativas de inteligência artificial para diagnóstico da doença por meio de imagens médicas.
A nova tecnologia tem certidão de nascimento brasileira, mas os dois pesquisadores responsáveis por criá-la são peruanos: Gabriel Humpire-Mamani nasceu no sul do Peru, em Arequipa; e Jorge Valverde-Rebaza no norte do país, em Trujillo. Mas os caminhos dos dois só se cruzaram em 2011, no Brasil, quando ambos se tornaram pós-graduandos no Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos.
Não foi mera obra do acaso que trouxe os dois pesquisadores ao ICMC. O elo comum que uniu as duas histórias tem com nome e sobrenome: Ernesto Cuadros-Vargas, que se tornou uma referência em ciências de computação no Peru depois de fazer mestrado e doutorado no ICMC. Ele foi professor de Gabriel no curso de Ciências de Computação, na Universidad Nacional de San Agustín de Arequipa. “O Ernesto foi a primeira pessoa que me estimulou a fazer mestrado. Até aquela época, ele era o único professor da Universidade que tinha doutorado fora do Peru. Foi assim que surgiu a ideia de fazer mestrado no exterior”, revela Gabriel.
Morando em Delft, na Holanda, Gabriel trabalha remotamente como pesquisador colaborador na Visibilia, especialista em aprendizado de máquina na Nuctech Netherlands e fundou a empresa Inkodev. Ele acabou de finalizar o doutorado na Radboud University Medical Center, hospital universitário afiliado à Radboud University Nijmegen, e está aguardando apenas a data da defesa, que foi adiada por causa da pandemia do novo coronavírus. No doutorado, Gabriel se dedicou a aplicar técnicas de aprendizado profundo para detectar e segmentar tumores e órgãos de pacientes com câncer em tomografias. Esse conhecimento foi fundamental para desenvolver o sistema inteligente na Visibilia e tornar a solução capaz de analisar automaticamente as tomografias.
Já na trajetória de Jorge, o encontro com Ernesto Cuadros-Vargas aconteceu durante um evento no segundo ano da graduação em Ciências da Computação, na Universidad Nacional de Trujillo: “A palestra do Ernesto mudou totalmente a direção da minha carreira. Decidi que faria pós-graduação no Brasil”. Jorge completou o mestrado no ICMC em 2013 e, na sequência, começou o doutorado, momento em que teve a oportunidade de realizar duas visitas científicas a centros de pesquisa na Europa. A primeira foi ao Laboratório de Inteligência Artificial e Apoio à Decisão do Instituto de Engenharia de Sistemas e Computadores do Porto, da Universidade do Porto, em Portugal, em 2014. E a segunda aconteceu em 2015, quando visitou o Laboratoire d’Informatique, Robotique et Microélectronique de Montpellier, da Universidade de Montpellier, na França.
“Nas duas visitas tive contato com uma realidade muito interessante: vários projetos de pesquisa desses centros são realizados com recursos de empresas privadas. Isso possibilita que os cientistas tenham acesso aos dados dessas empresas, o que é fundamental para o desenvolvimento de soluções para problemas reais. Infelizmente, aqui no Brasil, esse acesso ainda é limitado e, muitas vezes, os pesquisadores precisam comprar bancos de dados para conseguir trabalhar”, conta Jorge, que finalizou o doutorado em 2017.
Inspirado por essas visitas e pelo desejo de empreender, em 2017, ele fundou a Visibilia em parceria com Nathalia Camillo Silva. Na empresa, Jorge já coordenou um projeto financiado pela Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) por meio do programa de Pesquisa Inovativa em Pequenas Empresas (PIPE) e, agora, atua na segunda fase de um desses projetos, voltado a criar uma solução para o problema da oferta e procura de emprego. A primeira versão comercial dessa ferramenta está prestes a sair do forno.
Por dentro do sistema inteligente – Para quem não é especialista em computação, um sistema inteligente capaz de analisar automaticamente uma tomografia em tempo recorde pode parecer irreal. Ora, se um ser humano apto a decifrar tomografias demora anos para adquirir o conhecimento e as habilidades necessárias para realizar essa tarefa, como uma máquina pode conseguir fazer isso?
Mas o ser humano que compreende o que aparece naquela complexa imagem do corpo humano, naturalmente, sabe identificar uma série de características ali presentes que podem sinalizar uma infinidade de coisas, desde a existência de uma doença até marcas da superação de uma moléstia anos atrás. Quando falamos de um ser humano formado em medicina, é muito provável que ele olhe para a tomografia do tórax de um paciente com suspeita de covid-19 e imediatamente localize na imagem o pulmão. Isso acontece porque ele relaciona essa imagem do pulmão e todas as suas características (formato, texturas, nuances de áreas mais escuras e mais claras, por exemplo) a todas as demais tomografias de pulmão que já viu ao longo de sua vida. Note que todo esse processo acontece no interior das redes neurais da pessoa, sem que cada etapa seja, necessariamente, realizada de forma consciente.
Claro que, ensinar tudo isso ao computador ainda não é viável. Só que os especialistas já conseguem treinar as máquinas para realizar algumas dessas tarefas específicas que podem ajudar a identificar sinais de covid-19. Para isso, os cientistas de computação constroem uma espécie de cérebro artificial, recheado por diversas redes de neurônios. E cada rede fica responsável por identificar algumas características presentes naquela imagem. Então, por exemplo, imagine que uma dessas redes será encarregada de identificar as formas presentes na tomografia. Essas formas podem ser compreendidas matematicamente, então, os cientistas conseguem ensinar o computador a localizar retas, círculos e demais formas geométricas existentes porque cada uma poderá ser identificada por um conjunto diferente de parâmetros. Então, não é que o computador esteja, de fato, enxergando na imagem a presença de uma reta ou de um círculo. O que o computador faz é identificar na imagem parâmetros que correspondem ao que provavelmente seja uma reta ou ao que provavelmente seja um círculo.
Para treinar essas diversas redes neurais artificiais, os pesquisadores precisam de um grande conjunto de imagens que, ao serem analisadas, vão construindo uma espécie de memória para o sistema: cada acerto faz a rede registrar que o procedimento realizado naquele caso deve ser repetido; cada equívoco faz a rede registrar que o procedimento não deve ser repetido. E, assim, quanto mais imagens são analisadas, melhores são os resultados alcançados.
“O que nosso sistema faz é indicar para o especialista qual a probabilidade daquela tomografia ser de uma pessoa que tem covid-19. A ideia não é substituir o médico, mas colaborar para que seja tomada uma decisão adequada”, ressalta Jorge. Imagine a capacidade que uma máquina tem de armazenar uma quantidade enorme de imagens médicas e você enxergará o potencial que uma ferramenta assim possui.
Anatomia da diversidade – O interessante é que, para ensinar o computador a identificar corretamente os sinais de covid-19, os pesquisadores chegaram a modificar algumas imagens, gerando ruídos propositais. Dessa forma, o sistema aprendeu a reconhecer pulmões com formatos diversos, evitando que julgasse essa diversidade de características como sinais da doença. Afinal de contas, na vida real, há muitas variações nos formatos dos órgãos do nosso corpo e isso nem sempre significa que existe um problema naquele órgão. “A anatomia muda de paciente para paciente. Por exemplo, o tamanho dos órgãos e anomalias já existentes (tumores, lesões, próteses, etc.) são característicos de cada paciente e influenciam diretamente a detecção automática de qualquer nova doença”, diz Gabriel.
Por isso, ele afirma ainda que é muito importante mostrar a máxima variabilidade anatômica aos algoritmos de aprendizado profundo, para que possam ser gerados resultados robustos e confiáveis: “Assim, conseguimos superar o desafio de identificar a presença da covid-19 de maneira independente à condição do paciente, isto é, independentemente de se tratar de alguém com caso leve ou grave da doença, de ser jovem ou idoso, de ter doenças preexistentes etc.”
Outro detalhe interessante é que, normalmente, para analisar adequadamente uma imagem tridimensional como uma tomografia, o computador precisa extrair uma série de informações de cada imagem para nutrir as redes neurais artificiais. Depois, essas redes processam as informações recebidas e, unindo todos os resultados obtidos, o sistema fornece, por fim, o percentual de chance daquela imagem ser de alguém com covid-19. Levar menos de um minuto para fazer isso era praticamente inimaginável poucos anos atrás. Algo que só se tornou possível com a utilização de unidades de processamento altamente velozes como os GPUs (Graphics Processing Units ou Unidades de Processamento Gráfico).
Os próximos passos – “Nosso sistema também possibilita que, futuramente, possamos fazer a identificação de outras doenças, sem que, para isso, seja necessário treinar novamente todas as redes neurais”, destaca Jorge. Esse diferencial do sistema pode ser comparado à capacidade da memória humana, a qual não precisa aprender tudo do zero, pois os novos conhecimentos são somados ao que já foi aprendido anteriormente.
O próximo passo é preparar o sistema para uso em hospitais, clínicas e demais ambientes de uso real para a testagem e validação dos resultados tanto para aprovação tecnológica quanto mercadológica. Atualmente, os responsáveis pelo projeto estão em contato com as equipes técnicas do Hospital das Clínicas da Faculdade de Medicina da USP (HCFMUSP), do Instituto de Pesquisas Tecnológicas (IPT), da Companhia de Processamento de Dados de São Paulo (PRODESP) e da Secretaria da Saúde do Estado de São Paulo. Além de orientações, essas equipes apoiarão os pesquisadores na execução de provas de conceito e testes pilotos.
Para chegar até essa fase, Gabriel e Jorge superaram vários desafios para estar entre as duas propostas finalistas na chamada pública. “Durante quatro semanas, cerca de 30 empresas participaram do processo de seleção, que teve três etapas”, destaca Gabriel. “A Visibilia era uma das empresas mais jovens dentre as participantes; além disso, umas das poucas que participou “sozinha”, pois a maioria era fruto de parceria entre empresas e laboratórios de pesquisa vinculados a universidades”, adiciona Jorge.
Segundo ele, a proposta da Visibilia se destacou especialmente nos seguintes quesitos: capacidade da abordagem na resolução do problema; experiência da equipe na expansão, teste e implantação do sistema; experiência no retreino de algoritmos de aprendizado; expertise da equipe na área através de publicações relevantes; gestão do sistema em função de mudanças de requisitos/necessidades em sistemas médicos reais. “Acredito que esses elementos representam evidências reais do potencial do nosso sistema, da sua capacidade e, sobretudo, da sua efetividade na identificação de COVID-19 em ambientes médicos reais”, assegura Jorge.
Curiosamente, este é o primeiro projeto que Gabriel e Jorge desenvolvem juntos. Desde que começaram a estudar no ICMC e se tornaram amigos, sempre sonharam em trabalhar juntos, mas pertenciam a diferentes grupos de pesquisa e, depois da pós-graduação, os dois prosseguiram por caminhos paralelos. Parece que, agora, finalmente, as trajetórias voltaram a se unir. “Fico feliz em poder contribuir com o Brasil, mesmo estando fora do país. Foi onde encontrei pessoas como a professora Agma Traina, minha orientadora, que me apoiou e me ajudou muito”, lembra-se Gabriel. “Eu adorei minha trajetória. Foi muito enriquecedor estar no ICMC e conhecer o professor Alneu Lopes, meu orientador. Ficamos amigos e ele me ajudou em muitas coisas, não tenho como agradecer”, finaliza Jorge.
Texto: Denise Casatti – Assessoria de Comunicação do ICMC/USP