versão On-line ISSN 2317-1782
CoDAS vol.29 no.1 São Paulo 2017 Epub 09-Mar-2017
http://dx.doi.org/10.1590/2317-1782/20172016082
A compreensão da fala possibilita ao ser humano comunicar-se com o outro de forma eficiente, sendo fundamental para sua integração social. Dessa forma, esta habilidade é um dos aspectos mais importantes na avaliação da função auditiva, uma vez que poderá permitir a observação da função comunicativa receptiva, fornecendo informações de como o indivíduo interage em situações de escuta diária(1).
As situações de comunicação entre pessoas são permeadas de ruídos competitivos em diversas atividades do cotidiano. Pesquisas têm demonstrado que até mesmo pessoas com audição normal podem ter a percepção de fala alterada pelos ruídos cotidianos do ambiente(2).
Os testes que compõem a avaliação audiológica básica não refletem, de forma fiel, a habilidade de compreensão da fala em situações sociais, pois são realizados em situações de escuta, nas quais o ruído competitivo não faz parte do objetivo dos exames. Assim, as informações obtidas com a avaliação audiológica básica sobre o desempenho de indivíduos em condições de vida real são limitadas(3).
Neste cenário, dentre vários testes de escuta de fala na presença de ruído, o Hearing in Noise Test (HINT) consiste na verificação do desempenho do indivíduo no reconhecimento da fala no silêncio e na presença de ruído competitivo. É, portanto, adequado para avaliar situações que mais se assemelhem com a escuta na vida diária.
Este instrumento contém 12 listas com 20 sentenças apresentadas ao indivíduo, na presença ou não de ruído competitivo, quando é solicitado a ele para repetir o que lhe foi dito. Determinam-se, então, percentagens de acerto e/ou limiar de reconhecimento das sentenças. Dessa forma, o HINT pode fornecer informações mais detalhadas sobre a capacidade funcional auditiva, avaliando a habilidade de reconhecimento de sentenças em ambientes ruidosos(3). Nesse sentido, o teste pode ser uma valiosa ferramenta para profissionais, pois além de simular situações do dia a dia, contribui para formulação de diagnósticos audiológicos mais precisos(4).
Estudos realizados no Brasil, em diferentes populações, cada vez mais têm demonstrado a relevância do uso do HINT adaptado para o português brasileiro na clínica audiológica, ainda que não tenham sido comparados os desempenhos dos critérios de julgamento utilizados para interpretá-lo. Estudos realizados com o HINT adaptado para o português brasileiro revelaram uma variedade nos critérios de julgamento utilizados pelos pesquisadores(5-7), o que pode dificultar sua utilização na prática clínica.
O critério de Bevilacqua et al.(5) considera que a mudança de um artigo definido ou indefinido, ou até mesmo a adição de palavras sem mudança de sentido da frase, não devem ser contabilizados como erro. O critério proposto por Danieli(6) considera correta a ocorrência da inversão da ordem da sentença, sem comprometer seu significado, ou a mudança do tempo verbal sem alteração do significado. No critério utilizado por Advíncula et al.(7), qualquer palavra omitida ou não repetida corretamente deve ser computada como erro. Essas três formas de julgamento da resposta do indivíduo submetido ao teste encontram-se descritas com detalhes na literatura.
Diante desse cenário, o presente estudo objetivou analisar os diferentes critérios de julgamento de respostas obtidas de indivíduos submetidos à pesquisa de limiares de reconhecimento das sentenças do HINT em português brasileiro.
Participaram da pesquisa 30 adultos jovens, de ambos os gêneros, recrutados entre os estudantes e funcionários da Universidade Federal de Pernambuco, com idade variando de 18-25 anos (média de 21,2 anos). Todos eram falantes nativos do português do Brasil e apresentaram audição normal (limiares tonais ≤ 20 dB NA para as frequências de oitava 250-8000 Hz na orelha de teste). Nenhum indivíduo relatou história de doença otológica ou neurológica. Todos concordaram em participar da pesquisa por meio da assinatura do Termo de Consentimento Livre e Esclarecido (TCLE). Trata-se de um estudo transversal, de caráter quantitativo. Os testes foram realizados entre julho de 2014 e dezembro de 2014 no Laboratório de Audiologia do Departamento de Fonoaudiologia da Universidade Federal de Pernambuco.
Os participantes foram alocados, de forma randômica, em três grupos, cada um com 10 participantes. Em cada um dos grupos, as respostas foram avaliadas por um critério de julgamento diferente: Bevilacqua et al.(5), Danieli(6) e Advíncula et al.(7).
Os estímulos de fala utilizados nesta pesquisa foram as sentenças do HINT na versão do português brasileiro(5). Esta versão do HINT consiste em 12 listas com 20 sentenças cada, gravadas por um locutor nativo do gênero masculino. As sentenças foram originalmente gravadas no House Research Institute (HRI), EUA. O ruído competitivo possuía o mesmo espectro de frequência das sentenças originais (speech-shaped noise) e foi apresentado em uma intensidade fixa de 65 dB NPS.
Os estímulos de fala e o ruído competitivo foram enviados via plataforma digital de processamento de sinal (RZ6, Tucker-Davis Technologies); e sob o controle de um computador que executava um script Matlab™ personalizado, por meio de um fone de ouvido Sennheiser HD580, à orelha direita ou à melhor orelha, quando os limiares obtidos entre as orelhas variaram mais que 5 dB.
Todos os indivíduos foram submetidos ao exame de audiometria tonal e vocal para que fosse verificada a normalidade de sua audição. Posteriormente, foi realizado um teste de reconhecimento de fala em presença de ruído competitivo com o uso das sentenças do HINT na versão do português brasileiro, apresentado de forma monoaural. Para o teste de reconhecimento de sentenças na presença de ruído estável, os indivíduos foram testados em uma cabina acústica e instruídos a repetir cada sentença da forma como era percebida. Fora da cabina, o pesquisador monitorou a resposta oral do indivíduo através de fones de ouvido ligados a um microfone posicionado dentro da cabine. À medida que cada sentença era apresentada ao indivíduo, o texto da sentença foi apresentado simultaneamente na tela do computador na frente do experimentador, com todas as palavras destacadas num retângulo sombreado e sensível à marcação. O pesquisador utilizou o mouse do computador para marcar as palavras que foram omitidas ou repetidas incorretamente. No entanto, para proposta do procedimento adaptativo, à sentença foi dada uma pontuação global de “correto” ou “incorreto”, na qual, para se obter uma pontuação “correto” ou “incorreto”, foram utilizados três critérios de julgamento distintos(5-7), sendo um critério para cada grupo de participantes.
Os limiares de reconhecimento de sentença na presença de ruído estável foram mensurados utilizando um procedimento adaptativo two-down/one-up, que converge para 71% de acerto(8). Nesse procedimento, após duas sentenças corretas, o nível de apresentação da próxima sentença era reduzido em 2 dB; após uma sentença incorreta, o nível de apresentação da próxima sentença era aumentado em 2 dB. A faixa de estimação do limiar continuou até 6 reversões em direção ao nível do limiar. A estimativa do limiar foi calculada como a média dos quatro níveis (intensidades) finais de reversão. Para cada participante, três estimativas de limiares foram obtidas. O limiar final foi calculado como a média das três estimativas obtidas. A escolha das listas foi feita de forma aleatória, bem como o indivíduo não escutou qualquer sentença mais de uma vez, a fim de eliminar variáveis relacionadas ao fenômeno de aprendizagem.
Os dados foram processados e analisados através do software SPSS (Statistical Package for Social Sciences). Foram calculadas medidas de tendência central e dispersão para as variáveis contínuas (idade, média tritonal e média dos limiares) e proporções para a variável nominal (gênero). Depois de avaliar a normalidade das médias dos limiares de respostas dos três grupos pelo teste de Kolmogorov-Smirnov, procedeu-se a uma análise de variância (ANOVA) para compará-las pelo teste F. A probabilidade máxima de erro para rejeição da hipótese nula foi de 5%.
A pesquisa faz parte do estudo intitulado Temporal masking and speech recognition in the aging auditory system: US-BRAZIL e foi aprovada por comitê de ética americano sob o número 11-1113 e pela Comissão Nacional de Ética em Pesquisa (CONEP) sob o número 233/2012.
A amostra de 30 indivíduos, formada por estudantes e funcionários da Universidade Federal de Pernambuco, apresentou média de idade de 21,2 ± 2,41 anos, com variação entre 18 e 25 anos. Aproximadamente 83% (n=25) foram do gênero feminino. A média tritonal foi de 11,13 ± 5,12 dB NA e variou entre 0 (zero) e 18 dB NA.
Foram analisadas as medidas de tendência central dos limiares das respostas ao HINT segundo os três critérios de julgamentos analisados (Figura 1).
Legenda: Teste F (entre grupos) = 0,398; p>0,05
Figura 1 Comparação entre as médias dos limiares das respostas ao HINT segundo os critérios de julgamento
Observa-se que os limiares das respostas ao HINT, segundo o critério de julgamento de Bevilacqua et al.(5), variaram entre 58 e 63,33 dB NPS com média de 59,90 dB NPS e desvio padrão de ± 1,43 dB. Em relação ao critério de Danieli(6), a variação dos limiares esteve entre 58,83 e 60,67 dB NPS com média de 59,60 dB NPS e desvio padrão de ± 0,53 dB. Quando se adotou o critério de Advíncula et al.(7), observou-se uma variação dos limiares entre 58,67 e 60,83 dB NPS com média de 59,95 dB NPS e desvio padrão de ± 0,61 dB.
O teste de Kolmogorov-Smirnov (p>0,05) demonstrou que as médias dos limiares apresentaram distribuição normal. O teste ANOVA mostrou que não houve diferença, estatisticamente significativa, entre as médias dos limiares das respostas ao HINT obtidas pelos três critérios analisados - Bevilacqua et al.(5), Danieli(6) e Advíncula et al.(7), (p>0,05).
Qualquer teste audiológico na prática clínica deve ter padronização de procedimentos para realização e análise. Como visto anteriormente, no Brasil, desenvolveram-se três critérios de julgamento para o desempenho do Hearing in Noise Test (HINT) na versão brasileira. A possibilidade de haver diferença entre as médias dos limiares das respostas ao HINT decorrente da diversidade de critérios de julgamento poderia comprometer o uso do instrumento. A inexistência de um critério único para o julgamento de respostas do HINT na versão para o português brasileiro poderia dificultar a inserção do HINT na prática clínica audiológica.
O presente trabalho demonstrou não haver diferença entre os três critérios de julgamento das respostas do HINT utilizados no Brasil: Bevilacqua et al.(5), Danieli(6) e Advíncula et al.(7). Nesse sentido, considerando a não existência de um consenso entre os autores no que se refere à correção das sentenças, seria esperado haver diferença entre as médias dos limiares das respostas ao teste HINT segundo os critérios de julgamento, o que não se verificou nesta investigação.
Um aspecto a ser discutido é que testes de reconhecimento de fala na presença de ruído utilizam diferentes métodos de pontuação†. No método das palavras-chave (keyword scoring), o participante precisa apenas repetir corretamente as principais palavras da sentença. Por exemplo: na frase: “O meu pai vendeu o sítio” (ver Apêndice A: Lista 1, Sentença 12), apenas as palavras ‘meu’ ‘pai’ ‘vendeu’ e ‘sítio’ são computadas como acerto quando repetidas corretamente. As demais palavras são ignoradas. Outra forma de pontuação nesses tipos de teste é quando todas as palavras da sentença são analisadas (word scoring); ou seja, o indivíduo submetido ao teste precisa repetir a sentença inteira corretamente. Nesses dois métodos, o resultado do teste é calculado com base no número de palavras-chave ou palavras das sentenças utilizadas(9,10).
Ao se considerar os critérios de julgamento utilizados neste estudo, percebe-se que o critério de Advíncula et al.(7) se enquadra no método word scoring, pois todas as palavras são computadas. Seguindo esse raciocínio, pode-se dizer que os demais critérios aqui analisados assemelham-se ao método keyword scoring, considerando apenas a forma de cálculo das respostas, pois em Bevilacqua et al.(5) e Danieli(6) não são determinadas palavras-chave a serem computadas. Contudo, nem todas as palavras precisam ser ditas corretamente. Algumas palavras, se omitidas ou distorcidas, não são consideradas erro.
Outro método de pontuação é o sentence scoring, utilizado por Plomp e Mimpen(11). Nesse método, se apenas uma palavra não for repetida corretamente pelo indivíduo, toda a sentença é computada como erro.
Alguns estudos comparam esses métodos de pontuação. Versfeld et al.(12) demonstrou que, para o teste alemão de fala no ruído de Plomp e Mimpen(11), o limiar de reconhecimento de sentença foi menor para pontuação word scoring do que para a pontuação do sentence scoring. As pessoas apresentaram melhor desempenho quando todas as palavras foram computadas como acerto (ou erro), ao invés das sentenças. Terband e Drullman(13) encontraram efeitos semelhantes quando compararam a pontuação keyword scoring e sentence scoring. As pessoas apresentaram melhor desempenho quando as palavras-chave foram computadas como acerto (ou erro), ao invés das sentenças. Há de se destacar que tais estudos não foram realizados com versões do Hearing In Noise Test, mas com outros testes de reconhecimento de fala na presença de ruído.
Nesse cenário, a literatura parece apontar para os métodos de pontuação com base na quantidade de palavras acertadas, sejam palavras-chave ou todas as palavras da sentença. Dessa forma, os três critérios de julgamento aqui estudados estão em conformidade com aquilo que a literatura indica como método de pontuação.
Outro aspecto que merece ser destacado é que um teste de reconhecimento de fala pode, geralmente, ser realizado de duas formas: busca do limiar e percentual de acertos. Na primeira, o resultado será sempre numa medida de intensidade (decibel) e na segunda, em percentual (%). Como explicado anteriormente, no presente estudo, optou-se pela determinação de limiares de reconhecimento de fala. Dessa forma, a discussão dos resultados aqui encontrados não deve ser extrapolada para resultados de pesquisas nas quais foram determinados percentuais de reconhecimento de fala na presença do ruído competitivo. Estudos demonstraram que os limiares de reconhecimento de fala, por meio de procedimento adaptativo, são diferentes daqueles que são obtidos usando o método de estímulos de intensidade constante (percentual de acertos), mesmo quando os dois métodos apresentaram as mesmas probabilidades alvo para respostas corretas(14-16).
Os resultados deste estudo reforçam a ideia de que qualquer um dos critérios de julgamento analisados poderá ser utilizado como padrão na realização da versão Brasileira do HINT. Antes da utilização do teste na prática clínica, entretanto, são necessárias algumas recomendações, haja vista as limitações deste trabalho. Estudos semelhantes devem ser realizados através da determinação de percentuais de acerto, ao invés de limiares.
Outro detalhe importante na análise realizada é o foco em apenas um aspecto do HINT: o seu material linguístico (e como ele é usado no teste). Faz-se necessário o desenvolvimento de investigações semelhantes com a aplicação do HINT em todas as suas dimensões. Nesse sentido, portanto, o teste na versão brasileira ainda precisaria de mais investimentos científicos para que seu uso seja consolidado na prática clínica.
Os resultados mostraram que, independentemente do critério de julgamento utilizado, as respostas obtidas de indivíduos submetidos à pesquisa de limiares de reconhecimento das sentenças do Hearing In Noise Test em português brasileiro foram semelhantes. Isso abre a possibilidade da aplicação deste teste na clínica audiológica, porém é necessário avaliar outros critérios do teste antes de sua recomendação clínica.