versão impressa ISSN 1679-4508versão On-line ISSN 2317-6385
Einstein (São Paulo) vol.16 no.3 São Paulo 2018 Epub 17-Set-2018
http://dx.doi.org/10.1590/s1679-45082018ed4087
Atualmente, a velocidade e o volume de dados criados a partir de sites da internet, sensores eletrônicos e celulares estão na ordem de exabytes (1 bilhão de gigabites) a cada 2 dias. Trata-se da quantidade correspondente ao produzido no período desde o início da civilização até 2003. Este número impressionante tende a dobrar a cada 40 meses.(1)
O enorme conjunto de dados, que é grande o suficiente para ser considerado não gerenciável para a interpretação humana sem auxílio de um processo computadorizado e/ou analítico de dados, é conhecido como Big Data. Apesar do volume e da velocidade quase em tempo real do processamento de dados, é necessário trabalhar a qualidade deles, para que gerem informações úteis.
Médicos atuam em pesquisas de aprendizado de máquinas (machine learning), que é a elaboração de algoritmos que respondam e se adaptem automaticamente aos dados, sem necessidade de intervenção humana contínua, visando ao desenvolvimento de inteligência artificial que ajude a tomar decisões, considerando este grande volume de dados.(2,3) Estes profissionais podem ajudar na programação destas máquinas, a fim de garantir confiabilidade no padrão de decisão. Este processo nos faz refletir sobre a formação médica, buscando novas habilidades e formas de atuar que permitam selecionar adequadamente as informações, para facilitar a tomada de decisões na prática clínica.(4,5)
Pesquisas internacionais multicêntricas se desenvolvem de forma mais simples, envolvendo um número crescente de participantes com menor custo. Para tal, disporemos de uma imensa base de dados armazenada em memórias de diversos equipamentos eletrónicos, interligados com a rede, facilitando também o acesso a prontuários eletrónicos. A coleta de dados não poderá ser feita sem o devido consentimento, o que nos obriga a reforçar o debate ético sobre a necessidade da adequação da legislação a esta nova realidade.(6,7)
Um dos desafios futuros será o processo de aquisição da autorização para o uso dos dados já automaticamente coletados por todos os equipamentos de uso diário ligados à internet. Para proteger a privacidade do paciente, serão necessárias novas técnicas de criptografia, de modo a garantir o sigilo dos dados. Nesse tipo de pesquisa, com milhares de testes de hipótese ocorrendo simultaneamente, a possibilidade de uma associação aleatória deve ser considerada como significante fator de risco.
Saber lidar com amostras enviesadas sempre ocupou boa parte do tempo dos médicos.(8) Manejar um volume enorme de dados gerados na Medicina (o Big Data) pode revolucionar o poder decisório do médico e seu conhecimento sobre muitas doenças. Porém, saber coletar, selecionar e analisar os dados obtidos a partir da divulgação de resultados em tempo real envolverá um novo aprendizado na Medicina, para evitar que esta grande quantidade de dados analisados sem uma profunda compreensão de seu contexto produza apenas um big noise (o ruído é aquilo que atrapalha a comunicação entre o emissor e o receptor, na teoria da comunicação), demonstrando a importância da validação cruzada dos dados achados, utilizando outros conjuntos de dados para confirmação da reprodutibilidade e avaliação da possibilidade de generalização.(9)
O Big Data nos oferece a oportunidade de construir uma grande base de dados brasileira, que poderá ser útil para desenvolver, avaliar e melhorar continuamente as diretrizes de práticas clínicas, além de servir como fonte de dados para diversos estudos multicêntricos, tanto nacionais quanto internacionais. Com isso, haverá um proeminente ganho de tempo, dinheiro, vidas e conhecimento.
O futuro da Medicina volta-se para o desenvolvimento de sensores para monitorização de funções vitais e novas moléculas marcadoras de doenças combinadas com supercomputadores, capazes de processar um imenso volume de dados, criando um sistema global de apoio ao diagnóstico médico.(10)