Compartilhar

Confusões perceptivas entre consoantes do Português Brasileiro em função do ruído

Confusões perceptivas entre consoantes do Português Brasileiro em função do ruído

Autores:

Lílian Marinho dos Santos,
Stela Maris Aguiar Lemos,
Rui Rothe-Neves

ARTIGO ORIGINAL

Audiology - Communication Research

versão On-line ISSN 2317-6431

Audiol., Commun. Res. vol.19 no.2 São Paulo abr./jun. 2014

http://dx.doi.org/10.1590/S2317-64312014000200008

INTRODUÇÃO

O comportamento do indivíduo na percepção de consoantes em diferentes situações pode estar ligado diretamente ao modo como os sons são mentalmente representados. Uma proposta sobre a representação linguística dos sons da fala supõe que estes se organizam numa hierarquia de traços, que constituem abstrações de suas características articulatórias(1,2). As premissas básicas da geometria de traços podem ser descritas da seguinte maneira:

“a) Os traços podem ser agrupados em classes de traços; b) As classes formam uma hierarquia estrita, que pode ser representada por uma árvore com raiz; c) Essa hierarquia é universal; d) Cada traço e cada classe de traço são representados por nós, em camadas segmentais separadas; e) Cada nó se liga aos elementos de somente uma camada de nível mais alto.”

Numa análise do português segundo a geometria de traços(3), a estrutura da consoante, organizada hierarquicamente, é representada por nós de raiz, laríngeo, de cavidade oral (CO) e de ponto de consoante (PC). O nó de raiz representa o segmento como unidade fonológica e domina os outros traços. É representado pelos traços de classe principal [±soante], [±aproximante] e [-vocoide]. O nó laríngeo refere-se à participação da laringe na produção dos sons e é representado pelo traço de sonoridade [±vozeado]. O nó de CO corresponde à função da cavidade oral na produção articulatória dos sons. Nele estão ligados os traços de ponto de articulação (nó de ponto de consoante) e de modo de articulação [±contínuo]. O nó de ponto de consoante refere-se ao ponto de articulação na produção do segmento e é representado pelos traços [labial], [coronal] e [dorsal] e pelo traço [±anterior], dependente do [coronal]. Com base nessa descrição, propôs-se uma matriz fonológica dos segmentos consonantais do português.

A partir da geometria de traços, os sons da fala são mais ou menos distintos, em termos de sua similaridade fonológica. Segmentos que compartilham mais traços são mais semelhantes do que aqueles que compartilham menos traços.

Uma teoria da organização dos sons, contudo, deve ser integrada a outros conhecimentos para que se compreenda o uso da língua em situações cotidianas de comunicação. Sabe-se, por exemplo, que a percepção auditiva importa diretamente na comunicação eficiente do dia a dia e depende da adequada integração das habilidades auditivas para o reconhecimento eficaz dos sons da fala, principalmente em ambientes ruidosos(4,5), uma vez que a percepção auditiva no silêncio não reflete a percepção auditiva em um ambiente ruidoso(6,7). Segundo o que se sabe sobre a constituição e a função do sistema auditivo, pode-se dizer que, sob diferentes tipos de ruído, diferentes capacidades auditivas periféricas ou centrais serão exigidas para se extrair do som da fala suas características importantes. Por exemplo, no ruído branco exige-se mais da capacidade de fechamento auditivo, enquanto no ruído de festa, mais da capacidade de figura-fundo para a percepção de fala. Por outro lado, como a geometria de traços propõe uma organização de sons numa hierarquia universal, entende-se que, independentemente das características do processamento (vale dizer, das habilidades utilizadas), os sons mais afetados e mais confusos, sob ruído, serão os mesmos, já que suas semelhanças fonológicas não serão influenciadas por qualquer ruído.

Este estudo foi elaborado para verificar se o comportamento do indivíduo, na percepção de consoantes em meio a diferentes ruídos, está ligado diretamente ao modo como os sons são mentalmente representados. Adicionalmente, visou-se verificar a relação entre similaridade fonológica e similaridade perceptiva. Em outras palavras, esperou-se que, ao perceber a fala, alguém viesse a confundir, mais facilmente, segmentos que compartilham mais traços. Por outro lado, sons que compartilham menos traços deveriam resistir mais à confusão e permanecer distintivamente percebidos, resistindo ao efeito deletério do ruído sobre a comunicação verbal.

A melhor compreensão sobre o comportamento dos indivíduos, diante de situações cotidianas de comunicação que envolvem as habilidades relacionadas tanto à percepção da fala, quanto ao processamento auditivo, associado à compreensão da relação entre os sistemas de traços distintivos e a percepção de fala, poderá trazer contribuições para as áreas da Linguística e da Fonoaudiologia.

MÉTODOS

Trata-se de um estudo transversal, com medidas repetidas, realizado com a aprovação prévia do Comitê de Ética em Pesquisa da Universidade Federal de Minas Gerais (UFMG), conforme parecer número ETIC – 0316.0.203.000-11.

A pesquisa utilizou uma amostra não probabilística, por tipicidade, composta por 11 participantes adultos, com idade entre 20 e 30 anos, recrutados na UFMG. Os critérios de inclusão considerados para o estudo foram:

  • Ter idade entre 18 e 30 anos;

  • Ler, concordar e assinar o Termo de Consentimento Livre e Esclarecido;

  • Apresentar audição periférica e processamento auditivo dentro dos critérios de referência para audiometria tonal liminar, imitanciometria, logoaudiometria, teste de fala com ruído e teste dicótico de dígitos, a saber:

  • Limiares auditivos até 25 dB nível de audição (NA)(8);

  • Curva timpanométrica tipo A, com presença de reflexos acústicos contralaterais, bilateralmente(9);

  • Número de acertos igual ou superior a 70% no teste de fala com ruído, com diferença de até 20% entre as porcentagens de acertos do Índice Percentual de Reconhecimento de Fala e do teste de fala com ruído(10);

  • Resultado igual ou superior a 95% de acertos no teste dicótico de dígitos, tanto na orelha direita, como na esquerda(10).

Os critérios de exclusão foram:

  • Desistir de participar da pesquisa;

  • Não realizar todas as tarefas experimentais propostas.

A coleta de dados da pesquisa foi dividida em duas etapas (avaliação preliminar para seleção da amostra e avaliação da percepção de consoantes), realizadas no Laboratório de Fonoaudiologia da Faculdade de Medicina da UFMG.

A avaliação preliminar da amostra constou da realização de testes para análise da audição periférica (audiometria tonal liminar, logoaudiometria e imitanciometria) e testes de processamento auditivo (teste de fala com ruído e teste dicótico de dígitos), que avaliaram habilidades (fechamento e figura-fundo) necessárias em nosso cotidiano para a percepção de fala no ruído. A avaliação da percepção de consoantes, em situação de ruído, visou verificar a confusão perceptiva entre consoantes seguidas da vogal /a/, em meio ao ruído branco ou ruído de festa, nas relações sinal/ruído igual a 0 e +5 dB (NS). O ruído branco constitui-se em uma forma de onda aperiódica, com igual energia dentro de qualquer banda de frequência e com todas as fases presentes em uma distribuição ao acaso. O ruído de festa consiste no espectro de fala associado a ruídos de uma situação de festa. O ruído branco age mascarando igualmente as frequências - no caso deste estudo, de 10 a 10000 Hz -, com efeito sobre o processamento periférico. Já o ruído de festa, age diferentemente em cada frequência. Por isso, afeta o processamento central em habilidades dependentes de atenção.

Foram apresentadas aos participantes as consoantes [p], [t], [d], [k], [f], [v], [ʃ] e [ʒ], seguidas da vogal [a]. Essas consoantes foram escolhidas pelos seguintes motivos: a) apresentam os mesmos traços de classe principal; b) variam apenas nos traços de classes não principais; c) formam sílabas do tipo consoante-vogal (CV) com significado, isto é, são itens lexicais do português brasileiro. Os traços distintivos que caracterizam os segmentos consonantais utilizados neste estudo são:

/p/: [-soante], [-vocoide], [-aproximante], [-contínuo], [-voz], [labial]

/t/: [-soante], [-vocoide], [-aproximante], [-contínuo], [-voz], [coronal]

/d/: [-soante], [-vocoide], [-aproximante], [-contínuo], [+voz], [coronal]

/k/: [-soante], [-vocoide], [-aproximante], [-contínuo], [-voz], [dorsal]

/f/: [-soante], [-vocoide], [-aproximante], [+contínuo], [-voz], [labial]

/v/: [-soante], [-vocoide], [-aproximante], [+contínuo], [+voz], [labial]

/ʃ/: [-soante], [-vocoide], [-aproximante], [+contínuo], [-voz], [coronal], [-anterior]

/ʒ/: [-soante], [-vocoide], [-aproximante], [+contínuo], [+voz], [coronal], [-anterior]

As sílabas foram gravadas por sujeito adulto homem, em sala acusticamente tratada e insonorizada. Cada sílaba foi gravada duas vezes.

As sílabas foram apresentadas aos participantes de forma diótica, associadas à presença do ruído branco ou do ruído de festa, nas relações sinal/ruído de 0 e +5 dB (NS). Tais relações sinal/ruído baseiam-se em estudos sobre os testes utilizados para processamento auditivo(10). Os dois tipos de ruído foram apresentados numa mesma sessão, com duração média de 30 minutos e intervalo entre os blocos de consoantes, com um e outro ruído. O nível de intensidade de apresentação das sílabas foi de 70 dB (NA). Sílabas e ruídos foram apresentados em ordem aleatória. No total, foram dez repetições por tipo de sílaba, o que totalizou 80 sílabas por indivíduo, em cada tipo de ruído.

Cada participante recebeu uma folha de resposta que continha, impressas, todas as opções de sílabas reproduzidas e foi orientado a prestar atenção somente na sílaba, ignorando o ruído. Assim que ouvisse a sílaba, deveria circular na folha de resposta, a opção que jugasse correta.

As respostas dos participantes foram analisadas numa matriz de confusão, em que cada linha correspondia às consoantes oferecidas como estímulo e cada coluna, à resposta do ouvinte para cada consoante. Nessa matriz foi contabilizada a frequência de ocorrência de erros e acertos para cada sílaba, para todo o grupo de sujeitos. Por meio da frequência de erros, calculou-se a distância perceptiva entre as consoantes, com base no julgamento do ouvinte. A distância foi estimada pela medida Phi (Φ), uma relação entre frequências de confusão obtidas e esperadas, ponderada pelo número de ocorrências(11).

As distâncias perceptivas entre cada consoante, assim calculadas, foram analisadas por meio de escalonamento multidimensional, que é uma representação geométrica das distâncias entre consoantes, tal como um mapa(12). Assim, pode-se dizer que seu resultado representa um mapa perceptivo das consoantes em cada nível e tipo de ruído. Com base nessa análise, investigou-se a hipótese de que não haveria diferenças entre as distâncias perceptivas em cada tipo de ruído, já que diferentes ruídos não afetam a similaridade fonológica.

A avaliação da percepção de consoantes (segunda etapa) objetivou verificar se as consoantes que se revelaram mais confusas compartilham, de fato, menos traços. Foi realizada por meio de um modelo linear (ANOVA), sendo a distância perceptiva, a variável dependente. Foram consideradas variáveis independentes a quantidade de traços em comum (três, quatro ou cinco), o tipo de ruído (branco ou festa) e o nível da relação sinal/ruído (0 ou +5 dB). Não foi possível incluir nesta análise o par de consoantes com seis traços em comum ([ʃ]-[ʒ]), por ser o único exemplar deste tipo. A relação sinal/ruído foi aninhada em tipo de ruído, o que permite comparar um nível com outro, dentro do mesmo tipo de ruído, já que não faz sentido comparar, por exemplo, o nível +5 dB do ruído branco com o nível 0 dB do ruído de festa. Utilizou-se, a posteriori, o teste HSD de Tukey para investigar as diferenças entre os níveis da variável “quantidade de traços”.

RESULTADOS

Os números absolutos e relativos de acertos resultaram em um total de 110 apresentações para cada som (somados todos os sujeitos da amostra). Na matriz de confusão de consoantes, a diagonal representa sempre o máximo de valores em que a consoante foi respondida corretamente, como ela mesma. Os valores fora da diagonal representam a percepção incorreta de cada consoante, quando foi percebida como outra (Tabelas 1 e 2).

Tabela 1 Matriz de confusão de consoante no ruído branco na relação sinal ruído igual a 0 dB (NS) 

Consoante Resposta
 
[ʃ] [d] [f] [ʒ] [k] [p] [t] [v]
[ʃ] 53 (48%) 5 (4%) 3 (3%) 13 (12%) 28 (25%) 0 (0%) 8 (7%) 0 (0%)
[d] 0 (0%) 86 (78%) 2 (2%) 7 (6%) 1 (1%) 2 (2%) 12 (11%) 0 (0%)
[f] 0 (0%) 0 (0%) 40 (36%) 1 (1%) 1 (1%) 66 (60%) 0 (0%) 2 (2%)
[ʒ] 2 (2%) 7 (6%) 0 (0%) 96 (87%) 2 (2%) 2 (2%) 1 (1%) 0 (0%)
[k] 0 (0%) 1 (1%) 0 (0%) 1 (1%) 101 (92%) 0 (0%) 7 (6%) 0 (0%)
[p] 0 (0%) 0 (0%) 27 (24%) 2 (2%) 0 (0%) 81 (74%) 0 (0%) 0 (0%)
[t] 1 (1%) 0 (0%) 4 (4%) 0 (0%) 0 (0%) 7 (6%) 96 (87%) 2 (2%)
[v] 0 (0%) 0 (0%) 7 (6%) 0 (0%) 2 (2%) 8 (7%) 2 (2%) 91 (83%)

Legenda: Célula cinza = consoante respondida corretamente como ela mesma

Tabela 2 Matriz de confusão de consoante no ruído branco na relação sinal ruído igual a +5 dB (NS) 

Consoante Resposta
 
[ʃ] [d] [f] [Ʒ] [k] [p] [t] [v]
[ʃ] 50 (45%) 4 (4%) 1 (1%) 18 (16%) 28 (25%) 1 (1%) 8 (7%) 0 (0%)
[d] 2 (2%) 88 (80%) 0 (0%) 7 (6%) 1 (1%) 0 (0%) 10 (9%) 2 (2%)
[f] 0 (0%) 0 (0%) 36 (33%) 1 (1%) 1 (1%) 69 (63%) 2 (2%) 1 (1%)
[ʒ] 2 (2%) 3 (3%) 2 (2%) 101 (92%) 1 (1%) 0 (0%) 0 (0%) 1 (1%)
[k] 0 (0%) 0 (0%) 0 (0%) 0 (0%) 102(93%) 0 (0%) 8 (7%) 0 (0%)
[p] 0 (0%) 1 (1%) 24 (22%) 0 (0%) 0 (0%) 84 (76%) 0 (0%) 1 (1%)
[t] 0 (0%) 0 (0%) 10 (9%) 2 (2%) 1 (1%) 6 (5%) 90 (82%) 1 (1%)
[v] 0 (0%) 2 (2%) 6 (5%) 1 (1%) 2 (2%) 6 (5%) 1 (1%) 92 (84%)

Legenda: Célula cinza = consoante respondida corretamente como ela mesma

No ruído branco, tanto na relação sinal/ruído 0 dB (NS) (Tabela 1), quanto +5 dB (NS) (Tabela 2), as consoantes que apresentaram maior confusão com outras foram: [f] - [p], [ʃ] - [k] e [ʃ] - [ʒ]. As consoantes menos confusas foram: [k], [ʒ], [v] e [t].

Comparando o desempenho no ruído de festa 0 dB (NS) (Tabela 3) com o ruído branco 0 dB (NS) (Tabela 1), observa-se que o percentual de acertos, na maioria dos casos, foi menor no ruído festa 0 dB (NS), o que demonstra maior confusão das consoantes, quando expostas nesse tipo de ruído (Tabela 3).

Tabela 3 Matriz de confusão de consoante no ruído festa na relação sinal ruído igual a 0 dB (NS) 

Consoante Resposta
 
[ʃ] [d] [f] [ʒ] [k] [p] [t] [v]
[ʃ] 71 (64%) 1 (1%) 2 (2%) 21 (19%) 11 (10%) 1 (1%) 1 (1%) 2 (2%)
[d] 2 (2%) 73 (66%) 0 (0%) 12 (11%) 8 (7%) 0 (0%) 15 (14%) 0 (0%)
[f] 0 (0%) 1 (1%) 15 (14%) 0 (0%) 0 (0%) 93 (84%) 0 (0%) 1 (1%)
[ʒ] 2 (2%) 4 (4%) 0 (0%) 103 (94%) 1 (1%) 0 (0%) 0 (0%) 0 (0%)
[k] 0 (0%) 2 (2%) 0 (0%) 0 (0%) 97 (88%) 0 (0%) 11 (10%) 0 (0%)
[p] 0 (0%) 1 (1%) 28 (25%) 0 (0%) 0 (0%) 78 (71%) 0 (0%) 3 (3%)
[t] 0 (0%) 20 (18%) 2 (2%) 1 (1%) 8 (7%) 10 (9%) 67 (61%) 2 (2%)
[v] 1 (1%) 4 (4%) 34 (31%) 2 (2%) 8 (7%) 19 (17%) 3 (3%) 39 (35%)

Legenda: Célula cinza = consoante respondida corretamente como ela mesma

No ruído de festa 0 dB (NS) (Tabela 3) e +5 dB (NS), as consoantes que apresentaram maior confusão foram: [f] - [p], [v] - [p] e [f] e [t] - [d]). As consoantes menos confusas foram: [k], [ʒ] e [p] (Tabela 4).

Tabela 4 Matriz de confusão de consoante no ruído festa na relação sinal ruído igual a +5 dB (NS) 

Consoante Resposta
 
[ʃ] [d] [f] [Ʒ] [k] [p] [t] [v]
[ʃ] 71 (64%) 1 (1%) 0 (0%) 25 (23%) 12 (11%) 0 (0%) 0 (0%) 1 (1%)
[d] 2 (2%) 56 (51%) 0 (0%) 19 (17%) 11 (10%) 0 (0%) 21 (19%) 1 (1%)
[f] 0 (0%) 2 (2%) 21 (19%) 0 (0%) 0 (0%) 85 (77%) 0 (0%) 2 (2%)
[ʒ] 0 (0%) 1 (1%) 4 (4%) 99 (90%) 0 (0%) 6 (5%) 0 (0%) 0 (0%)
[k] 1 (1%) 1 (1%) 0 (0%) 0 (0%) 105 (95%) 1 (1%) 1 (1%) 1 (1%)
[p] 0 (0%) 0 (0%) 17 (15%) 0 (0%) 1 (1%) 84 (76%) 3 (3%) 5 (4%)
[t] 1 (1%) 35 (32%) 1 (1%) 0 (0%) 6 (5%) 12 (11%) 54 (49%) 1 (1%)
[v] 0 (0%) 2 (2%) 21 (19%) 0 (0%) 8 (7%) 27 (24%) 12 (11%) 40 (36%)

Comparando-se o ruído de festa +5 dB (NS) (Tabela 4) ao ruído branco +5 dB (NS) (Tabela 2), observa-se que o percentual de acertos foi novamente menor no ruído de festa. Esse dado foi observado tanto na relação sinal/ruído igual 0, como em + 5 dB (NS). Não foi possível observar grandes diferenças de tipo de confusão nas duas relações sinal/ruído de um mesmo ruído.

Os resultados das matrizes de confusão de consoantes foram transformados em uma matriz simétrica de distância e, a partir dessa matriz, elaborou-se o mapa perceptivo das consoantes de cada tipo de ruído, em sua relação sinal/ruído. Embora o mapa seja uma representação bidimensional, seus dados foram obtidos considerando-se um espaço de quatro dimensões.

No mapa perceptivo do ruído branco 0 dB (NS) (Figura 1), observa-se uma divisão em três grupos das consoantes (classificadas a partir da geometria de traços), que se encontram em um mesmo plano no mapa perceptivo: 1º) consoantes labiais ([pa], [va] e [fa]); 2º) consoantes coronais anteriores ([ta] e [da]); 3º) consoantes coronais menos anteriores e consoante dorsal ([ʃa], [ʒa] e [ka]).

Figura 1 Mapa perceptivo das consoantes no ruído branco 

No ruído branco, na relação sinal/ruído igual a +5 dB (NS), observa-se uma divisão em cinco grupos: 1º) consoantes labiais ([pa], [va] e [fa]); 2º) consoantes coronais anteriores ([ta] e [da]); 3º) consoantes coronais menos anteriores e consoante dorsal ([ʃa], [ʒa] e [ka]); 4º) consoantes vozeadas ([va], [da] e [ʒa]); 5º) consoantes não vozeadas ([fa], [pa], [ta], [ka], [ʃa]).

As consoantes mais próximas no mapa são aquelas que mais se confundem. Houve uma expressiva confusão entre o [pa] e o [fa], que compartilham entre si cinco traços distintivos(3), a saber: [-soante, -vocoide, -aproximante, -voz, labial].

No ruído branco na relação sinal/ruído igual 0 dB (NS), as consoantes labiais se confundem mais com as consoantes labiais, as coronais se confundem mais com as coronais e as consoantes dorsais se confundem mais com as consoantes dorsais. A +5dB (NS), as confusões acontecem mais entre as consoantes do mesmo grupo, podendo ainda acontecer em relação ao vozeamento (Figura 1).

No ruído de festa, nas relações sinal/ruído igual a 0 dB e a +5 dB (NS), (Figura 2), observa-se no mapa perceptivo uma divisão em quatro grupos, classificados pelos traços distintivos: 1º) consoantes labiais; 2º) consoantes coronais anteriores; 3º) consoantes coronais menos anteriores e consoante dorsal; 4º) pares mínimos quanto ao vozeamento.

Figura 2 Mapa perceptivo das consoantes no ruído festa 

Observa-se, no ruído de festa, que o vozeamento não foi uma dimensão que sobressaiu para separar os grandes grupos, ao contrário do que ocorreu nas confusões causadas pelo ruído branco +5 dB. Com isso, não se verificou a hipótese do estudo, de que a confusão de consoantes pode ser explicada pela similaridade fonológica e, assim, não seria afetada pelo tipo de ruído (Figura 2).

Na comparação entre as relações sinal/ruído no ruído branco e no ruído de festa, nota-se um leve afastamento das consoantes na relação sinal/ruído igual a +5 dB (NS), o que representa menor confusão entre as consoantes (Figura 3).

Figura 3 Mapa perceptivo comparativo das consoantes no ruído branco e no ruído festa 

Quanto à hipótese de relação entre similaridade fonológica e perceptiva, considerando a geometria de traços, verificou-se confusões entre consoantes que compartilham três, quatro, cinco e seis traços distintivos. Na análise dos sons que se diferenciam apenas por um traço distintivo - com cinco e seis traços compartilhados – (sons mais semelhantes linguisticamente), observa-se maior confusão entre os sons que se diferenciam pelos traços do nó de ponto de consoante (coronal- [t]-[p], [k]-[t], [f]-[ʃ], dorsal- [k]-[p]), seguindo-se do nó laríngeo (vozeamento- [f]-[v], [ʃ]-[ʒ], [d]-[t] e nó de cavidade oral (contínuo- [f]-[p], [ʃ]-[t], [d]-[ʒ]).

A distância média entre pares de consoantes, em função das variáveis “quantidade de traços distintivos”, “tipo de ruído” e “relação sinal ruído” está representada na Figura 4.

Figura 4 Relação entre quantidade de traços, distância média, ruído e relação sinal ruído 

Consoantes que compartilham mais traços são perceptivamente menos distantes e a diferença em função da quantidade de traços compartilhados mostrou-se significativa na ANOVA (F2,102=6,23; p=0,0028). No ruído branco, as consoantes mostraram-se mais distantes entre si, do que no ruído de festa, o que mostra que este último produz maior confusão entre as consoantes. Essa diferença também se revelou significativa na ANOVA (F1,102=5,13; p=0,025). Finalmente, não houve diferença em função do nível de ruído, dentro de cada tipo de ruído (F2,102=0,015; p=0,984). Por esse motivo, a análise foi refeita, excluindo-se o fator “nível de ruído”, resultando numa ANOVA com tipo de ruído e quantidade de traços como variáveis independentes e distância perceptiva, como variável dependente. Na nova análise, o tipo de ruído (p=0,024) e a quantidade de traços distintivos (p=0,002) tiveram influência significativa sobre a confusão entre consoantes.

Finalmente, o teste HSD de Tukey (post hoc) mostrou que não houve diferença de distância perceptiva entre os pares de consoantes que compartilham três traços e os pares que compartilham quatro traços (0,0162; p=0,913). São significativas as diferenças de distância perceptiva entre os pares de consoantes que compartilham três traços e os pares que compartilham cinco traços (0,116; p=0,014) e entre os pares de consoantes que compartilham quatro traços e os pares que compartilham cinco traços (0,10; p=0,006).

DISCUSSÃO

No ruído branco, nas relações sinal/ruído igual a 0 e +5 dB (NS) - foram encontradas, em maior número, as seguintes confusões: [f] – [p] (se diferenciam pelo traço contínuo), [ʃ]  - [k] (se diferenciam em nível mais alto na hierarquia de traços pelo traço contínuo, seguido do traço coronal) e [ʃ] - [ʒ] (se diferenciam pelo traço vozeamento) -, observou-se confusões entre consoantes plosivas e fricativas. Tal fato pode ser explicado por estudo(13), que relata que o ruído afeta altas frequências, provocando confusões nas consoantes fricativas. No presente estudo, as confusões [p] - [f] e [ʃ] - [k] revelaram também uma diferença de ponto articulatório. A literatura(14) aponta que a percepção do ponto articulatório é mais prejudicada no ruído branco.

A confusão por vozeamento ocorrida em [ʃ] - [ʒ] difere da literatura, que relata que a percepção do vozeamento e da nasalidade são os traços menos afetados pelo ruído(15,16).

No ruído de festa, nas relações sinal/ruído igual a 0 e +5 dB (NS) - encontradas, em maior número as seguintes confusões: [f] – [p] (que se diferenciam pelo traço contínuo), [v] – [p] (que se diferenciam em nível mais alto na hierarquia de traços pelo vozeamento, seguido do traço contínuo) e [v] – [f] e [t] – [d] (se diferenciam pelo traço de vozeamento) -, percebeu-se que a alta confusão do traço vozeamento no ruído de festa demonstra que o traço vozeamento é mais suscetível a esse tipo de ruído, causando, assim, maior confusão entre consoantes que se diferenciam por este traço(14,17). Contudo, há autores(18,19), que relatam que o traço vozeamento é menos afetado por esse ruído do que os traços de ponto e modo articulatórios.

Tanto para o ruído branco quanto para o ruído de festa, a confusão encontrada com maior frequência foi entre [f] e [p]. Essas consoantes compartilham cinco traços distintivos. Considerando que o [f] é descrito por seis traços e o [p] também é descrito por seis traços, esse par de confusões compartilha um número grande de traços, diferenciando-se apenas pelo traço [contínuo], uma vez que [f] é [+contínuo] e [p] é [-contínuo]. Apesar de se diferenciarem pelo modo articulatório, acusticamente esses sons apresentam uma transição comum de F2. Alguns estudos(18,20) verificaram grandes confusões entre [va] e [ba], que, assim como a confusão observada neste estudo ([fa] e [pa]), diferenciam-se por apenas um traço distintivo (contínuo)(3). A evidência de confusão do som [f] foi encontrada em pesquisas internacionais(17,21,22), em que [f] aparece dentre as consoantes mais confusas dos estudos, na exposição ao ruído.

Os sons menos confusos, tanto no ruído branco quanto no ruído festa, nas duas relações sinal/ruído, foram [k] e [ʒ]. Dados da literatura(17,21) apontaram que esses sons apresentaram melhores escores de reconhecimento quando comparados a outros na exposição ao ruído.

Observou-se um padrão diferente de confusão em relação aos ruídos branco e de festa, em que o percentual de erros na maioria dos casos foi maior no ruído festa. Esse dado foi observado para as duas relações sinal/ruído igual (0 e +5 dB (NS)). Em estudo nacional(23), ficou evidenciada maior dificuldade de reconhecimento de fala na presença de ruído de festa. Além disso, um estudo internacional(17), observou que o ruído de festa mascara diferentemente as consoantes, afetando mais o reconhecimento, enquanto o ruído branco mascara uniformemente as consoantes. Contudo, há pesquisadores(14) que consideram que há piores respostas no reconhecimento, principalmente do ponto articulatório, no ruído branco.

Essa diferença no reconhecimento das consoantes em relação aos tipos de ruído, pode ser explicada pela característica acústica de cada ruído. Pode-se inferir que a maior dificuldade de percepção no ruído de festa deve ser relacionada à necessidade de maior refinamento das habilidades auditivas, em que o sujeito deveria esquecer o que estava sendo ouvido no ruído, para prestar atenção somente às sílabas a serem ouvidas(24). Como foram incluídos na amostra apenas sujeitos com resultados dentro dos padrões indicativos de normalidade, ou seja, com todas as características necessárias para perceber as diferenças experimentais entre as consoantes, os resultados não podem ser devidos a efeitos sistemáticos no nível da audição, seja periférica ou central.

Quanto à relação sinal/ruído, observou-se menor confusão na relação sinal/ ruído igual a +5 dB, em comparação a 0 dB (NS), mas essa diferença não foi significativa. Os estudos compilados(14,19,25) relatam que, à medida que a relação sinal ruído fica positiva, maiores são os escores de acertos na percepção das consoantes. Entretanto, a diferença de apenas 5 dB não foi, neste estudo, suficiente para provocar uma diferença significativa nos escores.

Na construção do mapa perceptivo, utilizou-se da distância entre todas as consoantes. Tanto para o ruído branco, quanto para o ruído de festa foi possível organizar as consoantes em diferentes grupos, levando em consideração os traços distintivos comuns das consoantes próximas no mesmo plano do mapa perceptivo. Essa análise por agrupamento das consoantes por quantidade de acertos e erros é muito utilizada na literatura(17,18,20,21,26,27). Os diferentes agrupamentos em função do tipo de ruído podem ser explicados pelo efeito de cada um em momentos diferentes do processamento auditivo, com o ruído branco mascarando todas as frequências, em um nível periférico e o ruído de festa afetando diferentes frequências, em um nível mais central do sistema auditivo.

É difícil de explicar, a partir da geometria de traços(7), a diferença observada no desempenho dos sujeitos em relação aos tipos de ruído, pois a teoria considera o comportamento dos sons para a organização hierárquica dos traços como universal, seja qual for o meio em que estejam inseridos. Ou seja, independentemente do tipo de ruído, esperaria-se um mesmo comportamento nas respostas. Uma possível explicação para isso é que a organização hierárquica em traços, como é de ordem fonológica, não é afetada por características acústicas do ruído, sendo a confusão de consoantes e a hierarquia fonológica de diferentes ordens. Assim, não se poderia inferir uma da outra.

Quanto aos traços distintivos, observou-se que, quanto mais traços distintivos as consoantes compartilham, menor a distância entre os sons e mais confusos eles são. Considerando os sons que se diferenciam apenas por um traço distintivo (com cinco e seis traços compartilhados), observa-se maior confusão dos traços do nó de ponto de consoante (coronal: [t]-[p], [k]-[t], [f]-[ʃ], dorsal: [k]-[p]), seguidas do nó laríngeo (vozeamento: [f]-[v], [ʃ]-[ʒ], [d]-[t] e nó de cavidade oral (contínuo: [f]-[p], [ʃ]-[t], [d]-[ʒ]). Quanto aos sons que se diferenciam por dois traços, observou-se, ainda, que a confusão afetando o nó de cavidade oral também tende a afetar o nó de ponto de consoante, mais baixo na hierarquia. Esses dados confirmam as seguintes previsões da geometria de traços(7): a) Um maior número de confusões ocorre na parte inferior da árvore da hierarquia de traços, no Nó de Ponto de Consoante; b) Quanto mais traços distintivos as consoantes compartilham, mais confusos eles são. Estas são as consequências observáveis de um nível fonológico mais abstrato, sobre a confusão de consoantes, cujo padrão pareceu ser mais determinado pela natureza acústica dos sons avaliados.

Este estudo demonstrou a importância de se estudar a percepção das consoantes, a fim de se compreender melhor os aspectos acústicos, auditivos e linguísticos que interferem diretamente na comunicação eficiente do dia a dia. O estudo reforçou a teoria de interferência dos ruídos na percepção auditiva e a importância de se ter um processamento auditivo adequado, para melhor percepção das consoantes. Os dados da percepção auditiva trazem informações que podem ser úteis na reabilitação fonoaudiológica de processos fonéticos e fonológicos da fala e percepção auditiva, em portadores de perda auditiva, e alterações do processamento auditivo, dentre outros. Revelou, também, que os aspectos acústicos da consoante interferem com mais peso na percepção auditiva do que os aspectos fonológicos, tal como proposto na geometria de traços. Além disso, trouxe uma associação da percepção de consoantes do português, no ruído associado aos traços distintivos, em indivíduos com audição normal. Essa associação no português mostrou-se escassa durante a revisão bibliográfica, em que a maioria dos estudos é de outras línguas e com outras análises fonológicas.

Como limitações do estudo, destacam-se a amostra não probabilística e o seu tamanho, a não utilização de todas as consoantes do português para uma compreensão de todo o espectro dos sons e a não separação das orelhas durante o teste, uma vez que foi realizado em escuta diótica e assim não se pôde comparar as duas orelhas, para verificar a existência de diferenças importantes.

CONCLUSÃO

O ruído branco e o ruído de festa afetam diretamente a percepção das consoantes, mas de forma diferente, encontrando-se maior número de erros da percepção das consoantes no ruído de festa.

A geometria de traços não explica totalmente as confusões entre consoantes nos diferentes ruídos, que parecem ter mais influência dos aspectos acústicos. Entretanto, em alguns pares de consoantes, verifica-se a previsão de que, quanto mais traços distintivos os pares de consoantes compartilham mais confusos eles são, bem como a de que o maior número de confusões ocorre na parte inferior da árvore na hierarquia de traços, no nó de ponto de consoante.

REFERÊNCIAS

Clements GN. Feature organization. In: Brown K, editor. The Encyclopedia of Language and Linguistics. 2a ed. Oxford: Elsevier; 2006. p. 433-40.
Clements GN, Hume E. The internal organization of speech sounds. In: Goldsmith J, editor. Handbook of phonological theory. Oxford: Blackwell; 1995. p. 245-306.
Mota HB. Aquisição segmental do português: um modelo implicacional de complexidade de traços [tese]. Porto Alegre: Pontifícia Universidade Católica do Rio Grande do Sul; 1996.
Markham D, Hazan V. The effect of talker- and listener-related factors on intelligibility for a real-word, open-set perception test. J Speech Lang Hear Res. 2004;47(4):725-37. http://dx.doi.org/10.1044/1092-4388(2004/055)
Davies MG, Yellon L, Purdy SC. Speech-in-noise perception of children using cochlear implants and FM systems. Aust N Z J Audiol. 2001;23(1):52-62. http://dx.doi.org/10.1375/audi.23.1.52.31096
Fallon M, Trehub SE, Schneider BA. Children’s perception of speech in multitalker babble. J Acoust Soc Am. 2000;108(6):3023-9. http://dx.doi.org/10.1121/1.1323233
Paula A, Oliveira JÁ, Godoy NM, Canovas MBA. Discriminação de monossílabos em ambiente silencioso e ambiente ruidoso. Braz J Otorhinolaryngol. 2000;66(5):426-31.
Lloyd LL, Kaplan H. Audiometric interpretation: a manual of basic audiometry. Baltimore: University Park; 1978.
Jerger J. Clinical experience with impedance audiometry. Arch Otolaryngol. 1970;92(4):311-24.
Pereira LD, Schochat E. Processamento auditivo central: manual de avaliação. São Paulo: Lovise; 1997.
Noruésis MJ. SPSS advanced statistics 6.1. 3a ed. Chicago: SPSS; 1994.
Leeuw J, Mair P. Multidimensional scaling using majorization: SMACOF in R. J Stat Softw. 2009;31(3):1-30.
Bell TS, Dirks D, Carterette EC. Interactive factor in consonant confusion patterns. J Acoust Soc Am. 1989;85(1):339-46. http://dx.doi.org/10.1121/1.397685
Alm M, Behne DM, Wang Y, Eg R. Audio-visual indentification of place of articulation and voicing in white and babble noise. J Acoust Soc Am. 2009;126(1):377-87. http://dx.doi.org/10.1121/1.3129508
Miller GA, Nicely PE. An analysis of perceptual confusions among some English consonants. J Acoust Soc Am. 1955;27(2):338-52. http://dx.doi.org/10.1121/1.1907526
Wang MD, Bilger RC. Consonant confusion in noise: a study of perceptual features. J Acoust Soc Am. 1973;54(5):1248-66. http://dx.doi.org/10.1121/1.1914417
Phatak SA, Allen JB. Consonant and vowel confusions in speech-weighted noise. J Acoust Soc Am. 2007;121(4):2312-26. http://dx.doi.org/10.1121/1.2642397
Woods DL, Yund EW, Herron TJ, Malthew A, Ua Cruadhlaoich. Consonant identification in consonant-vowel-consonant syllables in speech-spectrum noise. J Acoust Soc Am. 2010;127(3):1609-23. http://dx.doi.org/10.1121/1.3293005
Benkí JR. Analysis of English nonsense syllable recognition in noise. Phonetica. 2003;60(2):129-57. http://dx.doi.org/10.1159/000071450
Li F, Menon A, Allen JB. A psychoacoustic method to find the perceptual cues of stop consonants in natural speech. J Acoust Soc Am. 2010;127(4):2599-610. http://dx.doi.org/10.1121/1.3295689
Phatak SA, Yoon Y, Gooler DM, Allen JB. Consonant recognition loss in hearing impaired listeners. J Acoust Soc Am. 2009;126(5):2683-94. http://dx.doi.org/10.1121/1.3238257
Dubno JR, Levitt H. Prediciting consonant confusions from acoustic analysis. J Acoust Soc Am. 1981;69(1):249-61. http://dx.doi.org/10.1121/1.385345
Caporali AS, Silva JA. Reconhecimento de fala no ruído em jovens e idosos com perda auditiva. Rev Bras Otorrinolaring. 2004;70(4):525-32. http://dx.doi.org/10.1590/S0034-72992004000400014
Pereira LD. Sistema auditivo e desenvolvimento das habilidades auditivas. In: Ferreira LP, Befi-Lopes DM, Limongi SCO, editores. Tratado de fonoaudiologia. São Paulo: Roca; 2005. p.547-552.
Li N, Loizou PC. Factors influencing intelligibility of ideal binary-masked speech: implications for noise reduction. J Acoust Soc Am. 2008;123(3):1673-82. http://dx.doi.org/10.1121/1.2832617
Soli SD, Arabie P, Carroll JD. Discrete representation of perceptual structure underlying consonant confusion. J Acoust Soc Am. 1986;79(3):826-37. http://dx.doi.org/10.1121/1.393473
Van Tasell DJ, Soli SD, Kirby VM, Windin GP. Speech waveform envelope cues for consonant recognition. J Acoust Soc Am. 1987;82(4):1152-61. http://dx.doi.org/10.1121/1.395251