versão On-line ISSN 2317-1782
CoDAS vol.28 no.1 São Paulo jan./fev. 2016
http://dx.doi.org/10.1590/2317-1782/20162015030
A pesquisa em voz profissional nasce na clínica, pela procura de atendimento por trabalhadores que necessitam usar a voz intensamente em suas atividades profissionais e desenvolvem sintomas vocais. Na década de 1980 surgem os primeiros estudos brasileiros na Fonoaudiologia com descrições de ações preventivas e relatos de casos clínicos que apontam a relação do distúrbio de voz com algumas ocupações1. Ao final dos anos 1990, essa percepção é compartilhada por fonoaudiólogos que atuam com vários segmentos de trabalhadores e notam a necessidade de conhecer a realidade de trabalho dos profissionais2.
Pela necessidade de identificar o uso vocal profissional em diferentes contextos de atuação, um grupo de fonoaudiólogos e médicos que atua na área começou construir, em 1998, um questionário com objetivo de levantar dados epidemiológicos de voz e trabalho3. A população escolhida, inicialmente, foi a de professores, por representar um grande contingente de trabalhadores e constituir a categoria profissional mais afetada por distúrbios vocais4.
O questionário elaborado "Condição de Produção Vocal - Professor" (CPV-P) teve origem nas queixas de professores em atendimento clínico e constituiu-se como importante instrumento para caracterizar o perfil vocal de professores, bem como as condições de trabalho nas escolas. Aplicado inicialmente em docentes da Prefeitura do Município de São Paulo5, deu origem a diversas pesquisas realizadas em São Paulo e em outros estados brasileiros, também com outras categorias profissionais com as devidas adequações6
De sua criação até hoje, passou por várias adaptações e processos de validação. Especificamente em relação à dimensão de aspectos vocais, foram feitos estudos de reprodutibilidade7 e desenvolvido um instrumento de triagem para distúrbio de voz, o Índice de Triagem de Distúrbio de Voz (ITDV), que possui alto grau de sensibilidade para mapeamento de distúrbio de voz em professores por meio da autorreferência de presença de 12 sintomas vocais8. O participante que fizer referência a cinco ou mais sintomas deve ser encaminhado para avaliação otorrinolaringológica e fonoaudiológica, a fim de submeter-se à avaliação mais específica para diagnóstico.
O ITDV foi incorporado ao CPV-P que, em sua versão atual, é composto por 62 perguntas divididas nas dimensões: aspectos sociodemográficos (identificação do entrevistado, situação funcional), aspectos do trabalho docente (características do ambiente escolar e da organização do trabalho docente), aspectos vocais (uso vocal, hábitos e estilo de vida) e sintomas vocais por meio do ITDV.
Em relação às respostas, a principal alteração foi proposta por Simões e Latorre9, em estudo sobre prevalência de distúrbio de voz em professores de creche, que inicialmente eram do tipo "sim" e "não" e passaram a ser em escala Likert(nunca, raramente, às vezes, sempre, não sei), o que ampliou as possibilidades de análise dos resultados.
O presente estudo constitui mais uma etapa da sistematização, consolidação de construto e validação do questionário CPV-P, ao comparar as respostas referentes aos sintomas vocais em duas escalas, Likert e escala visual analógica (EVA). A EVA consiste em uma escala linear em milímetros (mm), com ou sem marcas divisórias constantes ao longo do eixo10. É utilizada em enfermagem, especialmente na aferição da intensidade da dor do paciente e sua evolução, para analisar a efetividade dos procedimentos empregados11. Na área de voz, existem estudos que propõem a utilização de EVA para avaliação de voz12 13.
O objetivo do presente estudo é, portanto, comparar as respostas referentes aos sintomas vocais em duas versões do questionário CPV-P, com respostas em escalaLikert e em EVA, para avaliar qual é a melhor forma de aferição.
Trata-se de um estudo observacional transversal. Foram convidadas a participar do estudo todas as professoras da rede municipal de São Paulo com distúrbio de voz que iniciaram atendimento fonoaudiológico no Hospital do Servidor Público Municipal de São Paulo no período compreendido entre julho de 2011 e julho de 2012. Todas receberam informações sobre o teor do trabalho e esclarecimentos sobre preenchimento dos questionários. A pesquisa foi aprovada pelo Comitê de Ética em Pesquisa do Hospital do Servidor Público Municipal de São Paulo (221/2010) e pelo Comitê de Ética em Pesquisa da Pontifícia Universidade Católica de São Paulo (321/2011) e as professoras que concordaram em participar assinaram o Termo de Consentimento Livre e Esclarecido. Para manter sigilo da identificação, o nome das mesmas não constou da base de dados, apenas um número de identificação.
As participantes responderam ao questionário CPV-P em duas versões: com respostas em escala Likert de quatro pontos (nunca, raramente, às vezes, sempre) e em escala analógico-visual em régua de 50 mm (extremo à esquerda representando "nunca" e o extremo à direita, "sempre," conforme representado na Figura 1.
O procedimento foi realizado individualmente, no momento da convocação para terapia, antes do início do processo terapêutico. Inicialmente, as participantes respondiam ao questionário em sua versão clássica, com respostas em escala Likert, com a solicitação de que a participante respondesse de acordo com a graduação que julgasse indicada: nunca, raramente, às vezes ou sempre. Logo em seguida, era oferecido o mesmo questionário com as respostas em EVA e a orientação era para que a participante traçasse uma linha vertical no ponto de graduação que julgasse indicado entre nunca e sempre. O tempo médio para o preenchimento dos dois questionários foi de 20 minutos.
Em ambas as escalas, foram analisadas apenas as questões referentes aos sintomas autorreferidos: rouquidão, perda da voz, falha na voz, falta de ar ao falar, voz fina, voz grossa, voz variando grossa/fina, voz fraca, esforço ao falar, cansaço ao falar, garganta seca, pigarro, bola na garganta, areia na garganta, ardor na garganta, secreção na garganta, dor ao falar, dor ao engolir, dificuldade para engolir, tosse seca, tosse com catarro. Cada sintoma foi analisado em duas categorias: presente e ausente, sendo considerado presente quando a resposta foi às vezes/sempre na escala Likertou acima de 1,5 mm na régua.
Foi realizada dupla digitação dos dados coletados e comparação dos bancos (validate) por meio do programa Epi Info (versão 7.0). Após realização da consistência dos dados, foram realizadas as análises estatísticas no programa SPSS (versão 10.0). Foi feita análise descritiva e, em seguida, aplicação do teste Kappa para descrição da concordância de respostas das duas versões do instrumento. Os resultados do Kappa foram considerados de acordo com os seguintes critérios: concordância perfeita igual a 1,00; concordância ótima de 0,81 a 0,99; concordância boa de 0,61 a 0,80; concordância regular de 0,41 a 0,60; concordância sofrível de 0,21 a 0,40; concordância fraca de 0,00 a 0,20; concordância ruim menor que 0,0010. Foram, ainda, elaborados boxplots para comparar, graficamente, a distribuição e a dispersão de alguns sintomas nos dois tipos de respostas.
Participaram do estudo 65 professoras. A maioria tinha idade entre 40 e 60 anos (52,4%), era casada (50,8%), com ensino superior completo (95,4%), trabalhava mais de 30 horas por semana (50,7%), em atividade letiva (76,9%), há, em média, 16,42 anos, sendo o desvio padrão (DP) de 8,11 anos, com classe definida (64,6%), e atuava em duas escolas (58,5%). A distribuição da amostra segundo características sociodemográficas e funcionais está detalhada na Tabela 1.
A Tabela 2 apresenta as medidas de confiabilidade dos sintomas vocais nos dois formatos de respostas. Houve concordância significante para todos os sintomas.
Tabela 2: Medidas de confiabilidade dos sintomas vocais dos questionários Condição de Produção Vocal - Professor em escala Likert e escala analógica visual
A maioria dos sintomas apresentou concordância boa (Kappa entre 0,61-0,80: rouquidão, voz fina, voz variando, voz fraca, esforço ao falar, pigarro, ardor na garganta, dor ao falar) ou regular (Kappa 0,41-0,60: perda de voz, falha na voz, voz grossa, cansaço ao falar, garganta seca, bola na garganta, secreção na garganta, dor ao engolir, dificuldade engolir, tosse seca). O sintoma falta de ar teve concordância perfeita (Kappa 1,00) e os sintomas areia na garganta e tosse com secreção apresentaram concordância sofrível (Kappa 0,21-0,40).
A Figura 2 apresenta a dispersão nos pontos da régua nas respostas da escala Likert para os sintomas de rouquidão, perda de voz, cansaço ao falar, pigarro, dor ao falar e garganta seca.
Figura 2: Boxplot com dispersão nos pontos da régua (0-5 mm) nas respostas da escala Likert (nunca, raramente, às vezes e sempre) para os sintomas de rouquidão, perda de voz, cansaço ao falar, pigarro, dor ao falar e garganta seca
Nos gráficos da Figura 2 pode-se observar que as medianas das respostas aumentam conforme a gravidade do sintoma, sendo a mediana dos pontos da régua semelhante para as respostas "nunca" e "raramente", com exceção do sintoma "cansaço ao falar". No entanto, a variabilidade das medidas da régua (respostas mínima e máxima) é muito grande nas respostas intermediárias "raramente" e "às vezes", entre 0 e 50 mm, ou seja, em toda extensão da régua. Destaca-se que nenhum participante marcou a resposta "nunca" para rouquidão, o que é esperado considerando que estavam em inicio de tratamento fonoaudiológico por apresentarem distúrbio de voz.
Por ser resultado da interação de fatores pessoais e sociais, o distúrbio de voz é uma manifestação dinâmica e funcional e, por essa razão, a mensuração dos sintomas vocais é uma questão complexa.
Este estudo teve a proposta de comparar duas maneiras de avaliar as respostas referentes aos sintomas vocais do questionário CPV-P: uma em escala Likert e a outra em EVA. Com isso, pretendia-se avaliar a melhor forma de aferição e avançar na consolidação de construto e validação do instrumento. Ao buscar a melhor forma de medir essas percepções subjetivas, considerou-se, a princípio, que a resposta em régua poderia contemplar as nuances de respostas dos sujeitos avaliados e ser uma melhor forma de aferição.
Os resultados mostram boa concordância nas duas formas de aferição dos sintomas vocais, especialmente naqueles que têm definição clara para o respondente, como falta de ar, rouquidão ou pigarro, e apresentaram melhor consistência nas respostas. No entanto, observa-se que essa concordância é observada nas respostas extremas (nunca e sempre). A grande variabilidade de valores na nota mensurada pela régua nas categorias raramente e às vezes aponta a dificuldade do indivíduo na quantificação de um fenômeno subjetivo, mesmo tendo o conceito claramente definido. Essa questão é agravada ao analisar os sintomas com maior grau de subjetividade em sua definição, como areia na garganta ou tosse com secreção, que apresentaram pior grau de concordância.
Durante a aplicação do questionário foi observado um alto grau de dificuldade por vários participantes em compreender como deveriam responder em uma linha contínua sem divisões. Muitos optavam por registrar sua resposta mais próxima do "0 = nunca" ou do "5 = sempre", desconsiderando o espaço intermediário da régua, o que pode ter favorecido a presença de respostas em desacordo com o que o participante gostaria de responder. Com respostas por meio da escala Likert, todos responderam facilmente às questões utilizando toda a graduação.
Esse fato é destacado em estudo realizado com crianças que aponta um viés sistemático em questionários que utilizam respostas em EVA pela alta porcentagem de registros nas extremidades da régua, ao contrário do que é verificado em respostas em escala Likert, nas quais os respondentes fazem uso das respostas intermediarias com maior frequência14. Os autores acrescentam que as respostas em escala Likert apresentaram menos questões em branco do que as em EVA e consideram que a menor quantidade de perdas é um importante indicador para a viabilidade de aplicação de um instrumento.
Da mesma forma, estudo australiano que comparou resposta em EAV e escala Likert para uma questão sobre ansiedade aponta que, ainda que ambas as formas tenham fornecido medidas de predição confiáveis, 11% dos pesquisados completaram incorretamente as respostas em EVA, o que limitou sua utilidade15. Outro estudo que comparou as respostas em escala Likert de sete pontos com a EVA em questionário para avaliar qualidade de vida em doença pulmonar crônica destaca que, ainda que os dois métodos de apresentação de opções de resposta mostrem capacidade de resposta comparável, a escala Likert tem maior facilidade de administração, enquanto a EVA apresenta maior variabilidade de respostas16. No Brasil, estudo que comparou duas formas de aplicação do Protocolo de Participação e Atividades Vocais (PPAV), em EVA e escala numérica17 destacou que os respondentes manifestaram verbalmente sua preferência pela resposta em escala Likert, considerando-a de mais fácil compreensão. Os autores apontam que sem apoio de categorias ou divisão, alguns indivíduos sentem-se inseguros durante o preenchimento do instrumento. Além disso, há uma diferença entre a utilização da EAV em protocolos de autoavaliação e em análises realizadas por profissionais constantemente treinados para o uso de escala visual.
Os estudos citados apontam para a questão crucial da aferição em inquéritos epidemiológicos. Uma das maiores dificuldades de pesquisa consiste na preparação e aferição de instrumento apropriado para alcançar o objetivo proposto10, dificuldade agravada pelo objeto em questão, o sintoma vocal, fenômeno perceptivo subjetivo de complexa quantificação.
Além da discussão dos aspectos metodológicos envolvidos na coleta dos dados, destaca-se ainda a dificuldade no processo de registro. A construção do banco de dados da escala EVA também é um processo trabalhoso, uma vez que, antes de fazer a digitação, o pesquisador precisa medir com uma régua as respostas dadas em cada questão, o que pode acrescentar um viés de aferição. No presente estudo, para minimizar o possível erro, dois pesquisadores fizeram essa mensuração e foi feita a média das duas medidas. Todo esse processo aumenta o tempo de elaboração da base de dados e envolve mais um profissional nessa fase. Pela escala Likert, a digitação pode ser feita diretamente, sem necessidade de preocupação com esse viés.
O questionário CPV-P com respostas em escala Likert mostrou-se mais indicado em relação às respostas em EVA pela facilidade de compreensão e interpretação por parte dos respondentes, bem como por facilitar o registro das respostas para o investigador.
Pelo exposto, opta-se pela recomendação de manutenção das respostas em escala Likert para o questionário CPV-P, considerando-se validado quanto à maneira de aferição das respostas na dimensão de aspectos vocais. O instrumento é indicado para utilização em estudos epidemiológicos para levantar aspectos sociodemográficos, do ambiente e organização do trabalho docente, do uso vocal, de hábitos e estilo de vida, em questões distribuídas em suas cinco dimensões, além possibilitar a estimação da prevalência de sintomas vocais por meio da dimensão de aspectos vocais, hoje constituída pelo ITDV. Recomenda-se, ainda, a utilização do CPV-P como instrumento de triagem para distúrbio de voz, por meio do ITDV, como rotina de serviços públicos e privados e acompanhamento de professores ao longo de sua carreira.