versão On-line ISSN 2317-1782
CoDAS vol.25 no.6 São Paulo 2013
http://dx.doi.org/10.1590/S2317-17822013000600534
Os estudos sobre a aquisição fonológica têm se voltado, fundamentalmente, para a investigação da produção de fala, ou seja, quando e de que modo as crianças atingem a produção alvo de sua língua( 1 - 3 ).
Do ponto de vista da produção, já está bem estabelecida a seguinte ordem de aquisição fonológica: vogais, plosivas, nasais, fricativas e, por último, as líquidas( 4 ). Especificamente, no interior de cada uma destas classes prevê-se, ainda, uma aquisição gradual( 4 ). Ou seja, no caso das vogais espera-se que os segmentos que compõem a extremidade do triângulo vocálico (/a/, /i/ e /u/) sejam adquiridos anteriormente às vogais médias altas /e/ e /o/ e, por fim, as vogais médias baixas /Ɛ/ e /ɔ/. Para as obstruintes, as labiais antecedem as coronais que, por sua vez, antecedem as dorsais. Além disso, as obstruintes surdas precedem as sonoras. Em relação às nasais, primeiramente são adquiridos os segmentos /m/ e /n/, enquanto o /ɲ/ é o último a ser estabelecido. Por fim, a aquisição das líquidas se dá de forma intercalada entre líquidas laterais e não laterais, sendo que a primeira a ser adquirida é o /l/ seguida do /R/, / ʎ/ e /r/.
Na literatura nacional são relativamente poucos os estudos que investigam e discorrem sobre o processo de aquisição de contrastes fonológicos do ponto de vista da percepção. O que se encontra, de modo geral, é a descrição do desenvolvimento de habilidades perceptivo-auditivas de bebês( 5 , 6 ), por um lado, e a de experimentos de percepção auditiva com adultos, por outro( 7 ). A única exceção refere-se a um estudo sobre a aquisição perceptivo-auditiva do contraste entre as oclusivas do Português Brasileiro (PB)( 8 ).
No tocante ao desenvolvimento de habilidades perceptivo-auditivas da criança, destaca-se um estudo( 5 ) em que as autoras sintetizam as principais conquistas linguísticas dos bebês durante o primeiro ano de vida, a partir da resenha de pesquisas internacionais. De acordo com o trabalho apresentado, os bebês, logo após o nascimento, já são sensíveis não só a marcações prosódicas usadas na fala dos pais, como também a diferenças fonéticas que se referem, especialmente, à detecção de contrastes silábicos (sílaba tônica x sílaba átona), vocálicos e consonantais. Entretanto, conforme a resenha, essa capacidade inata declina no primeiro ano de vida. Conclui-se, no estudo em questão, que as crianças demonstrarão, nos primeiros meses após o nascimento, maior atenção a características prosódicas da fala e, aos oito meses, maior interesse por sequências silábicas.
Em outro trabalho( 6 ) também se encontram referências sobre o desenvolvimento de habilidades perceptivo-auditivas em bebês. A autora chama atenção particularmente para o fato de que o feto, de 36 a 40 semanas, já consegue perceber distinções na mudança da ordem silábica (por exemplo, entre babi e biba). Adicionalmente, com base em descrições experimentais constantes na literatura internacional, ela destaca a habilidade do bebê (mesmo nas primeiras semanas de vida) de detectar contrastes fonéticos.
Vale ressaltar, porém, conforme descrição na literatura internacional( 9 - 11 ), que ao final do primeiro ano de vida há evidências de uma reorganização perceptivo-auditiva em que a sensibilidade aos contrastes não nativos declina, sendo a atenção perceptivo-auditiva direcionada aos contrastes de sua própria língua.
Em uma pesquisa internacional clássica( 12 ), os autores relataram, com base no estudo de Shvachkin (1948/1973), que experimentos perceptivos com crianças mais velhas, em torno de 2 a 3 anos de idade, mostraram aquisição gradual dos contrastes segmentais de sua língua nativa. Conforme o estudo apresentado por Shvachkin, os autores descrevem como tendência geral que o desempenho perceptivo-auditivo na identificação de alguns contrastes nativos tende a ser melhor que outros, propondo uma ordem de aquisição similar à da produção proposta por Jakobson (1941/1968).
Contudo, depreende-se da literatura consultada a existência de um processo de aquisição na habilidade perceptivo-auditiva, uma vez que parece haver sua reorganização em função do aumento da idade, ou seja, com o avanço da idade diminui-se a sensibilidade aos contrastes não nativos e aumenta-se gradualmente a habilidade de diferenciar contrastes nativos.
No entanto, conforme mencionado anteriormente, observa-se na literatura nacional uma lacuna nos estudos sobre aquisição fonológica, na medida em que a grande maioria deles volta-se para a aquisição do ponto de vista da produção e não da percepção.
Desse modo, o presente estudo teve como proposta geral investigar o desempenho perceptivo-auditivo de crianças no tocante à identificação das vogais tônicas do PB. Especificamente, os objetivos foram: (1) verificar o desempenho perceptivo-auditivo das crianças a partir da tarefa de identificação do contraste fonológico, envolvendo todas as vogais tônicas do PB; (2) uma vez verificado o desempenho perceptivo-auditivo dos sujeitos em relação aos contrastes fonológicos relacionados às vogais tônicas, uma segunda preocupação foi a de identificar quais fonemas e contrastes vocálicos apresentam maior ou menor grau de dificuldade de identificação perceptivo-auditiva por parte das crianças; e (3) verificar se a idade correlaciona-se com a acurácia perceptivo-auditiva.
A escolha da investigação perceptiva dos contrastes vocálicos se justifica pelo fato de essa classe sonora ser a primeira adquirida, em termos de produção, no processo de aquisição fonológica.
Acredita-se, portanto, que a investigação proposta poderá trazer ganhos científicos como: (a) contribuir para a compreensão do desenvolvimento da percepção auditiva em crianças; (2) fornecer mais informações sobre a percepção auditiva dos contrastes fonológicos entre as vogais tônicas do PB; e (3) gerar contribuições na avaliação clínica do desempenho perceptivo-auditivo de sujeitos com alterações fonoaudiológicas.
Após aprovação no Comitê de Ética em Pesquisa (CEP) da Universidade Estadual Paulista "Júlio de Mesquita Filho", sob o protocolo de número 132/2010, foram selecionadas do banco de dados do Grupo de Pesquisa Estudos sobre a Linguagem informações referentes ao desempenho perceptivo-auditivo de 66 crianças, sendo 39 do gênero masculino e 27 do feminino, entre 5 e 6 anos de idade (com média de idade de 66,53 meses e desvio-padrão de 5,54), no tocante à tarefa de identificação perceptual da classe das vogais tônicas do PB. A faixa etária selecionada justifica-se pelo fato de o referido banco ter sido construído a partir de dados linguísticos de crianças pré-escolares, ou seja, crianças entre 3 e 6 anos de idade. Assim, optou-se por selecionar crianças cuja faixa etária correspondesse à última etapa da educação infantil.
Adotou-se como critério de inclusão da amostra dados advindos de crianças que tivessem realizado triagem fonoaudiológica e triagem auditiva prévia. A triagem auditiva consistiu na realização da triagem audiométrica pela doutora Ana Cláudia Vieira Cardoso (Audiologista do Curso de Fonoaudiologia da Universidade Estadual Paulista "Júlio de Mesquita Filho" - UNESP). Para tanto, utilizou-se o audiômetro AD-28 da Interacoustic, com fone TDH-39, em cabine acústica instalada em uma sala da Escola de Educação Infantil Sítio do Pica Pau Amarelo. Foram pesquisadas as frequências sonoras de 1.000, 2.000 e 4.000 Hz a uma intensidade de 20 dB NA (decibel nível de audição). Para assegurar a fidedignidade da resposta, os estímulos sonoros foram apresentados três vezes em cada frequência. Considerou-se que a criança passou na triagem audiométrica se ela respondesse pelo menos dois dos três estímulos apresentados para cada frequência em cada orelha.
Já como critério de exclusão da amostra, descartou-se dados de crianças que apresentaram problemas neurológicos, de linguagem (detectados pela triagem fonoaudiológica) e/ou otológicos/auditivos (detectados pela triagem auditiva), uma vez que problemas dessa natureza poderiam interferir no seu desempenho perceptivo-auditivo. Para a detecção de problemas neurológicos e de linguagem, foram realizadas triagens fonoaudiológicas com cada criança individualmente, com o uso de protocolo específico adotado no curso de Fonoaudiologia da UNESP.
Ressalta-se que inicialmente foram selecionadas 72 crianças do banco de dados. No entanto, seis crianças foram excluídas por apresentarem alterações auditivas durante a triagem audiológica. Destaca-se que as seis crianças foram encaminhadas para realização de avaliação audiológica.
Os responsáveis por todas as crianças participantes da pesquisa permitiram, por escrito, sua participação a partir da assinatura do Termo de Consentimento Livre e Esclarecido.
Nesta pesquisa foi utilizado o Instrumento de Avaliação da Percepção de Fala( 13 ), com o software Perception Evaluation Auditive & Visuelle (PERCEVAL)( 14 ).
O referido instrumento foi elaborado para avaliar o desempenho perceptivo-auditivo de crianças (a partir dos quatro anos de idade), com base em uma tarefa de identificação (também denominada tarefa de escolha forçada) envolvendo os contrastes fonológicos do PB em onset silábico. Nesse instrumento estão envolvidas, preferencialmente, palavras dissilábicas paroxítonas, familiares às crianças, contendo todos os 19 fonemas consonantais do PB na posição acentuada.
A seleção das palavras foi realizada pela autora do instrumento de acordo com os seguintes critérios: (1) contrastarem os fonemas do PB de modo a comporem pares mínimos de palavras; (2) serem passíveis de representação por meio de gravuras; (3) pertencerem ao vocabulário infantil; e (4) pertencerem ao rol de palavras elencadas em um estudo prévio( 15 ).
O PERCEFAL é composto por um subconjunto de quatro experimentos: (a) PERCivogais (avalia a identificação do contraste fônico entre vogais tônicas); (b) PERCocl (avalia a identificação do contraste fônico entre oclusivas); (c) PERCifric (avalia a identificação do contraste fônico entre fricativas); e (d) PERCison (avalia a identificação do contraste fônico entre sonorantes).
Em função dos objetivos do presente trabalho, utilizou-se apenas o PERCivogais.
Na elaboração do PERCivogais foi arrolado (Quadro 1) um total de 42 palavras que constituíam pares mínimos entre si (por análise combinatória: 7 vogais x 6 possibilidades de combinação entre elas = 42 palavras, sendo 21 pares contrastivos).
Cabe destacar que a inclusão das palavras "feira" contrastando com "fera" e "touca" contrastando com "toca" foi baseada na observação de que alguns ditongos apresentam variação com monotongos (por exemplo: p[ej]xe~p[e]xe, f[ej]ra~f[e]ra, etc.) e outros não (por exemplo: r[ej]tor~r[e]tor). Assim, Bisol16 propõe que os primeiros ditongos sejam leves ou falsos, ligados a um único elemento V, ao passo que os segundos sejam os verdadeiros ditongos, ligados a dois elementos V.
As palavras que compuseram o PERCivogais foram gravadas com equipamentos de alta fidelidade no interior de uma cabine acústica, com um adulto falante típico do PB. Foi solicitada ao adulto a produção das palavras alvo no interior de uma frase veículo ("Fale palavra alvo pra ele"), de modo a evitar a curva ascendente característica da produção obtida por meio de repetição isolada de palavras.
Ao término das gravações, com o auxílio do software PRAAT( 17 ), os pares mínimos foram extraídos da frase veículo, constituindo os inputs auditivos do experimento.
Paralelamente à edição dos arquivos de áudio, foram selecionadas gravuras correspondentes a cada palavra, a partir do site http://images.google.com.br/, de domínio público. Com o auxílio do software Paint, as imagens foram recortadas e editadas de modo a padronizá-las, resultando nos inputs visuais do PERCivogais.
Estabelecidos os inputs auditivos e visuais, foi elaborado um script para o experimento de identificação a ser executado pelo software PERCEVAL.
O procedimento experimental de percepção consistiu em um teste de identificação (também designado tarefa de escolha forçada), composto por três etapas distintas: reconhecimento das palavras do experimento, fase treino e fase teste.
Para a realização do teste de identificação, as crianças foram dispostas confortavelmente em frente à tela do computador (contendo o software PERCEVAL), com fones KOSS acoplados aos seus ouvidos, no interior de uma cabine acústica instalada na própria escola de educação infantil.
A etapa de reconhecimento consiste na apresentação dos inputs visual e auditivo às crianças a fim de averiguar o seu conhecimento (ou não) em relação às palavras utilizadas no experimento. Após a sua familiarização com os inputs do experimento, realizava-se uma sondagem, ou seja, uma verificação do conhecimento das palavras pelas crianças. Adotou-se o critério de 80% de acerto para que as crianças fossem conduzidas à fase treino e, posteriormente, ao teste perceptual propriamente dito. Todos os participantes registraram acima de 80% de reconhecimento das palavras.
A fase treino é realizada automaticamente pelo software com o intuito de garantir a compreensão da tarefa por parte dos participantes. Ela consiste na própria tarefa de identificação perceptual, mas os resultados obtidos não são computados pelo software. São aleatorizados os estímulos do experimento e selecionadas dez apresentações. Na sequência, inicia-se a fase teste propriamente dita, com intervalo de aproximadamente dois minutos entre as fases treino e a teste.
Para a tarefa de identificação, que envolve tanto a fase treino quanto a teste, as crianças, individualmente, escutavam (com apresentação binaural em uma intensidade de 50 dB) uma das palavras do par mínimo e, em seguida, precisavam decidir e indicar qual era a gravura correspondente à palavra apresentada auditivamente dentre duas possibilidades de gravuras dispostas na tela do computador. Por exemplo: era apresentada auditivamente à criança a palavra "fogo" e, logo em seguida, dispostas na tela do computador as gravuras correspondentes às palavras "fogo" e "figo", para que o participante decidisse e indicasse qual das gravuras correspondia ao estímulo auditivo apresentado. Os padrões de respostas aceitos foram: acerto (quando a criança identificava o estímulo corretamente), erro (se não o identificava corretamente) e não resposta (quando não apresentava nenhuma resposta durante o período determinado).
Tanto o tempo de apresentação dos estímulos auditivo e visual, de 6.000 ms, quanto o tempo de resposta, de 4.000 ms, foram controlados e mensurados automaticamente pelo software PERCEVAL. Ou seja, se a criança não apresentasse nenhum padrão de resposta no intervalo de 4.000 ms, considerava-se ausência de resposta. Porém, quando a criança apresentava um padrão de resposta, fosse de acerto ou erro, o tempo utilizado para a tomada de decisão na tarefa de identificação era computado automaticamente pelo software, podendo variar de 0 a 4.000 ms.
A duração total do experimento foi de aproximadamente 15 minutos por criança.
A fim de se presumir o tipo de processamento perceptivo-auditivo envolvido na tarefa solicitada, considerou-se o tempo de reação (reaction time) utilizado pelas crianças para a tomada de decisão na tarefa de identificação.
Foram utilizados os seguintes critérios para análise: (a) acurácia perceptivo-auditiva (porcentagem de erros, acertos e não respostas); (b) tempo de resposta dos erros e acertos; e (c) habilidade na identificação do contraste entre as vogais tônicas.
Na análise estatística foram utilizados os testes F, na comparação entre o tempo de reação dos erros e dos acertos, e o Coeficiente de Correlação linear de Spearman, na comparação entre as variáveis "idade" e "acurácia perceptivo-auditiva".
Destaca-se que a correlação é uma medida de relação entre duas ou mais variáveis. O seu coeficiente pode variar de -1,00 a +1,00, sendo que -1,00 representa perfeita correlação negativa, enquanto +1.00, perfeita correlação positiva. Já o valor 0,00 indica falta de correlação. Estabeleceu-se nível de significância α<0,05 e intervalo de confiança de 95%.
Para a análise da habilidade de identificação do contraste entre as vogais tônicas, utilizou-se a matriz de confusão( 18 ) para catalogar quantitativa e qualitativamente os erros perceptivos cometidos pelas crianças. Ressalta-se que este tipo de análise propicia informações relativas aos contrastes mais e menos difíceis na tarefa de identificação, bem como aos padrões de erros mais recorrentes.
No tocante à acurácia perceptivo-auditiva, dentre as 2.772 apresentações dos estímulos (42 estímulos x 66 crianças = 2.772 tokens), observou-se que as crianças apresentaram 253 (9%) erros, 2.449 (88%) acertos e 70 (3%) não respostas.
A média do tempo de reação dos erros foi 2.243,83 ms, enquanto a dos acertos atingiu 2.158,31 ms. Não foi possível utilizar o Teste t de Student na comparação entre as médias dos tempos de reação pelo fato de a variância da distribuição não ser homogênea, violando, desse modo, uma das condições para a sua realização. Comparou-se, então, a variância dos erros e acertos a partir do Teste F, observando-se uma diferença estatisticamente significativa (F=4,23, p=0,00) (Figura 1).
Os contrastes vocálicos que apresentaram maior ou menor grau de dificuldade de identificação perceptivo-auditiva por parte das crianças estão sintetizados na matriz de confusão, na Tabela 1
Tabela 1 Matriz de confusão relativa à tarefa de identificação dos contrastes vocálicos
Matriz de confusão | ||||||||
---|---|---|---|---|---|---|---|---|
Estímulo vocálico apresentado x estímulo vocálico respondido | ||||||||
Estímulo apresentado | Resposta | |||||||
/i/ | /e/ | /ε/ | /a/ | /ɔ/ | /o/ | /u/ | Total | |
/i/ | 343 | 15 | 15 | 5 | 10 | 4 | 4 | 396 |
/e/ | 23 | 328 | 16 | 6 | 8 | 7 | 8 | 396 |
/ε/ | 1 | 7 | 342 | 10 | 29 | 4 | 3 | 396 |
/a/ | 1 | 2 | 1 | 375 | 5 | 3 | 9 | 396 |
/ɔ/ | 1 | 2 | 0 | 1 | 380 | 10 | 2 | 396 |
/o/ | 0 | 1 | 0 | 1 | 1 | 372 | 21 | 396 |
/u/ | 13 | 0 | 1 | 0 | 1 | 2 | 379 | 396 |
Total | 382 | 355 | 375 | 398 | 434 | 402 | 426 | 2.772 |
A primeira coluna da matriz refere-se aos estímulos apresentados, enquanto as demais colunas dizem respeito às respostas dos sujeitos. Por exemplo: dentre os 396 estímulos contendo a vogal tônica /i/, 343 (86,61%) foram reconhecidos como /i/, 15 (3,78%) como /e/, 15 (3,78%) como /ɛ/, 5 (1,26%) como /a/, 10 (2,52%) como /ɔ/, 4 (1,01%) como /o/ e 4 (1,01%) como /u/.
Na linha diagonal decrescente da matriz pode ser observada a acurácia perceptivo-auditiva de cada uma das vogais tônicas do PB, isto é, quantas vezes uma determinada vogal foi reconhecida assertivamente pelas crianças. Em ordem decrescente obteve-se a seguinte acurácia: /ɔ/ (95,95% - 380/396) > /u/ (95,70% - 379/396) > /a/ (94,69% - 375/396) > /o/ (93,93% - 372/396) > /i/ (86,61% - 343/396) > /ɛ/ (86,36% - 342/396) > /e/ (82,82% - 328/396).
Adicionalmente, com base na matriz de confusão, o padrão de erros realizados pelas crianças na tarefa de identificação foi organizado em função de três parâmetros: (1) altura das vogais (subclassificadas em alta, média e baixa); (2) direção anterior/posterior (subclassificação em anterior, central (vogal /a/) e posterior); e (3) sentido do erro no interior do espaço vocálico, ou seja, das vogais mais periféricas para as menos periféricas ou vice-versa.
Quando os erros foram analisados de acordo com o parâmetro altura das vogais, não foi possível verificar o privilégio a uma determinada região, uma vez que eles foram distribuídos quase que uniformemente: 28% (70/253) de erros envolveram as vogais altas (/i/ e /u/); 36% (92/253) as médias (/e/, /ɛ/, /ɔ/ e /o/) e 36% (91/253) a baixa (/a/).
Diferentemente, quando o parâmetro horizontal foi adotado para a análise do padrão dos erros, constatou-se que as vogais anteriores (/i/, /e/ e /ɛ/) foram as mais prejudicadas, correspondendo a 69% (175/253) dos erros, em detrimento às central (/a/) e posteriores (/ɔ/, /o/ e /u/), com 8 (21/253) e 23% (57/253), respectivamente.
No tocante ao sentido do erro no interior do espaço vocálico, considerou-se cada um dos pares a fim de se averiguar a prevalência de um determinado sentido. Por exemplo: no par /i/~/e/, /e/~/i/, comparou-se o número de erros no sentido mais periférico para o menos periférico (/i/~/e/) e vice-versa (/e/~/i/). Como resultado, verificou-se a prevalência de erros no sentido menos periférico para o mais periférico (58,33%) em detrimento ao sentido contrário (41,66%).
Finalmente, compararam-se as variáveis idade e acurácia a partir do Teste e Correlação de Sperman. Como resultado, constatou-se correlação positiva entre a idade acurácia perceptivo-auditiva (r=0,41, p=0,00). Dessa forma, pode-se inferir que o desempenho das crianças na tarefa de identificação tende a melhorar em função do aumento da idade (Figura 2).
Ao considerarmos a acurácia perceptivo-auditiva de crianças na identificação das vogais tônicas do PB, dois aspectos merecem destaque. O primeiro diz respeito à porcentagem de acertos (88%), sugerindo que na faixa etária estudada não há, ainda, um domínio efetivo ou uma acurácia perfeita na identificação das vogais tônicas. Este resultado corrobora estudos anteriores( 9 - 11 ), os quais descrevem que a acurácia perceptivo-auditiva para a língua materna se estende até os sete anos de idade( 11 , 19 ).
O segundo destaque refere-se à comparação da acurácia na identificação das vogais e das consoantes oclusivas de um estudo anterior com crianças na mesma faixa etária( 8 ).Verifica-se, pois, que a acurácia na identificação das oclusivas foi de 85% de acertos, enquanto que na das vogais, 88%. Apesar de a diferença ser de apenas três pontos percentuais, pode-se depreender dessa comparação que a acurácia perceptivo-auditiva não somente é dependente da classe fônica como também parece haver maior acurácia na identificação das vogais. A ideia é confirmada em outro estudo( 20 ), o qual converteu os valores percentuais para um índice de sensibilidade designado de d-prime.
O privilégio na identificação das vogais pode ser explicado devido, possivelmente, às próprias características acústicas das vogais( 21 ). Ou seja, as vogais são segmentos sonoros de maior duração e energia acústica, além de apresentarem reforçamento de frequências (formantes) em uma faixa privilegiada pelo ouvido humano, favorecendo, possivelmente, a sua percepção.
No tocante ao tempo de reação durante a execução da tarefa de identificação, a predição assumida foi baseada na descrição de um estudo clássico( 22 ). Com isso, quanto maior a diferença acústica entre dois pares de estímulos, mais rápida deveria ser a resposta dos sujeitos (menor o tempo de reação) e, ao contrário, quanto menor a diferença acústica entre os estímulos, maior seria o tempo utilizado pelos sujeitos para a tomada de decisão (maior tempo de reação). Nesse sentido, os resultados obtidos, em termos de média aritmética, corroboram a hipótese assumida de que os erros poderiam apresentar maior tempo de reação do que os acertos.
Pode-se, portanto, inferir deste resultado, que os contrastes entre as vogais que apresentaram erros na identificação (tal como os contrastes entre /i/~/e/, /e/~/ɛ/) indicam maior similaridade perceptivo-auditiva, exigindo, consequentemente, maior tempo de reação durante o processamento psicolinguístico para a tomada de decisão.
Em relação à identificação de quais contrastes vocálicos apresentaram maior ou menor grau de dificuldade na identificação perceptivo-auditiva, houve diferenças no desempenho entre os pares contrastivos e os fonemas individualmente.
Especificamente, ao organizar e analisar esses padrões de erro mais recorrentes em função da altura da vogal no triângulo vocálico, da direção anterior/posterior e do sentido do erro no interior do espaço vocálico, ou seja, das vogais mais periféricas para as menos periféricas ou vice-versa, dois relevantes achados podem ser destacados.
O primeiro diz respeito à presença de um desempenho gradual na tarefa de identificação em função do contraste analisado. Isto é: o desempenho perceptivo-auditivo na tarefa solicitada não foi similar ou equiparável a todos os contrastes sugerindo, consequentemente, a existência de diferentes graus de similaridade entre as vogais tônicas do PB. Conforme os resultados obtidos neste estudo, os contrastes de maior similaridade entre si, ou seja, aqueles que menos se diferenciaram, foram /i/~/e/, /e/~/ɛ/, /ɛ/~/ɔ/ e /o/~/u/, enquanto os de menor similaridade entre si foram /i/~/o/, /ɛ/~/o/ e /ɛ/~/u/.
Diferentes graus de similaridade perceptivo-auditiva entre vogais têm sido reportados na literatura internacional. Em um estudo a respeito das características acústicas do espaço vocálico das vogais do inglês americano e sua relação com a acurácia na identificação dessas vogais( 23 ), a autora reportou não somente diferentes porcentagens de acurácia de identificação dessas vogais, como também destacou que a maioria dos erros de identificação envolve os pares vocálicos /æ/~/e/ e /ɑ/~/ʌ/, devido a sua proximidade no quadrilátero vocálico.
Mais recentemente, em uma pesquisa sobre a percepção e a produção das vogais do alemão por crianças monolíngues deste país e crianças turcas adquirindo o alemão( 24 ), as autoras reportaram diferentes porcentagens de discriminação, em ambos os grupos, entre os pares vocálicos investigados, concluindo que a habilidade de discriminação declina em função do aumento da similaridade perceptivo-auditiva.
Além da constatação da presença de diferentes graus de similaridade perceptivo-auditiva entre as vogais, o segundo achado que merece destaque refere-se ao fato de essa similaridade não ser simétrica, tanto no que se refere ao eixo ântero-posterior, quanto à direção no interior do espaço vocálico.
Quando se considerou o parâmetro ântero-posterior, constatou-se que as vogais anteriores (/i/, /e/ e /ɛ/) apresentaram maior número de erros quando comparadas às central (/a/) e posteriores (/ɔ/, /o/ e /u/). Analogamente, no que se refere à direção do erro no interior do espaço vocálico, a tendência que prevaleceu foi a das vogais menos periféricas (vogais médias) para as mais periféricas.
A presença de assimetria relacionada aos inventários vocálicos, bem como a análise do sentido dessa assimetria, tem sido descrita tanto em termos de produção( 25 ) quanto de percepção( 23 , 26 - 29 ).
Em termos de percepção, especialmente na década de 1990, autores reportaram a presença de assimetria na percepção de vogais por crianças( 26 ). Ao investigarem a discriminação dos pares vocálicos do alemão /u/-/y/ e /ʊ/-/Y/ por crianças alemãs aprendizes do inglês entre 6 a 12 meses de idade, constatou-se uma assimetria perceptual, ou seja, melhor desempenho na tarefa de discriminação tanto de /y/ para /u/ (ao invés de /u/ para /y/) quanto de /Y/ para /ʊ/ (ao invés de /ʊ/ para /Y/).
Em um estudo subsequente( 27 ), os autores confirmaram a presença da assimetria tanto na percepção de contrastes vocálicos da língua nativa das crianças de mesma faixa etária, quanto na de contrastes vocálicos não nativos.
Já em 2001, autores conduziram um estudo( 28 ) para explorar, dentre outros objetivos, o sentido da assimetria na percepção das vogais por crianças. Os resultados confirmaram a hipótese de que a assimetria, no interior do espaço vocálico, ocorre das vogais menos periféricas para as mais periféricas, uma vez que as últimas serviriam como vogal de referência.
Posteriormente, em uma extensa revisão na literatura sobre a assimetria na percepção de vogais( 29 ), os mesmos autores concluíram que a assimetria direcional (das vogais menos para as mais periféricas) ocorre tanto em crianças quanto em adultos. De acordo com eles, a hipótese explicativa para a existência de assimetrias perceptuais é a de que os estímulos, em um domínio perceptual, não são igualmente salientes. Complementou-se, ainda, a explicação sobre o sentido desta assimetria pelo fato de as vogais periféricas funcionarem como uma espécie de "ponto de ancoragem" na tarefa perceptivo-auditiva, designado pelos autores como natural perceptual magnets.
Os resultados obtidos no presente estudo, no tocante à direção do erro no interior do espaço vocálico, corrobora a hipótese do estudo descrito anteriormente sobre as vogais periféricas servirem como pontos de ancoragem na tarefa de percepção, na medida em que a tendência que prevaleceu nos erros foi a das vogais menos para as mais periféricas.
Em termos de produção, na literatura nacional encontra-se um trabalho(25) sobre a aquisição das vogais do PB e tipologias de línguas em que a autora reconhece a presença da assimetria como ocorrência que pressiona a hipótese de universalidade tanto na constituição de inventários fonológicos quanto nas etapas do processo de aquisição das vogais do PB, especialmente em se tratando da aquisição das vogais médias baixas da língua. Na tentativa de explicar e formalizar sistemas vocálicos assimétricos( 25 ), a autora faz referência à relação de marcação de ponto para segmentos vocálicos, sendo proposta a seguinte ordem: |labial>coronal>dorsal|. Isso significa dizer que, em se tratando de vogais, evidencia ser [dorsal] o ponto mais harmônico, seguido do [coronal] e, por fim, do [labial], o menos harmônico.
Estendendo os resultados descritos acima, em termos de produção, para os obtidos no presente estudo, em termos de percepção, parece haver concordância em relação ao parâmetro ântero-posterior. Conforme descrito anteriormente, os erros na tarefa de identificação envolveram em maior proporção as vogais anteriores (que apresentam o traço [coronal]) do que as posteriores, as quais envolvem a coocorrência dos traços [dorsal/labial].
Finalmente, a idade das crianças mostrou-se como um importante fator no desempenho perceptivo-auditivo, na medida em que as mais novas apresentaram pior acurácia quando comparadas à das mais velhas e, ainda, pelo fato de que com o aumento da idade a acurácia tende a melhorar. Este resultado corrobora os encontrados nos estudos citados anteriormente( 8 - 11 , 19 , 30 - 32 ), os quais sugerem que a aquisição perceptivo-auditiva de contrastes fonológicos ocorre de forma gradativa.
Em síntese, os resultados obtidos sugerem que o domínio perceptivo-auditivo da classe das vogais parece ocorrer de modo gradual e assimétrico. Assim, o fonoaudiólogo, ao trabalhar com a aquisição fônica, tanto em termos de produção, quanto em termos de percepção auditiva, deve levar em conta os diferentes graus de similaridade e saliência perceptivo-auditiva entre os pares vocálicos, a fim de considerar os ambientes favorecedores ou desfavorecedores na emergência de um determinado contraste.
Os resultados obtidos no presente estudo mostram que não há, ainda, domínio efetivo ou acurácia perfeita na identificação das vogais tônicas pelas crianças na faixa etária de cinco a seis anos. Revelam ainda que o tempo de reação durante a execução da tarefa sugere diferentes graus de similaridade entre os estímulos. Ou seja, quanto maior a diferença acústica entre dois pares de estímulos, mais rápida é a resposta dos sujeitos (menor o tempo de reação) e, ao contrário, quanto menor a diferença acústica entre os estímulos, maior é o tempo utilizado pelos sujeitos para a tomada de decisão (maior tempo de reação).
Além da constatação da presença de diferentes graus de similaridade perceptivo-auditiva entre as vogais, observou-se, também, que essa similaridade não é simétrica, tanto no que se refere ao eixo ântero-posterior, quanto no que se refere à direção no interior do espaço vocálico.
Vogais anteriores apresentaram maior similaridade do que as posteriores. As vogais periféricas (que ocupam os extremos do triângulo vocálico) parecem servir como pontos de ancoragem na tarefa de percepção, na medida em que a tendência que prevaleceu nos erros foi a das vogais menos para as mais periféricas. O paralelismo entre a ordem de aquisição em termos de produção e a em termos de percepção nem sempre se manteve.
Adicionalmente, a idade das crianças correlacionou-se positivamente com a acurácia perceptivo-auditiva, sugerindo que à medida que a idade avança há melhora na habilidade de identificar os contrastes oclusivos.
O presente estudo deve se estender para investigar a identificação de contrastes fonológicos, envolvendo outras classes de sons. Além disso, deve ampliar a população, abrangendo outras faixas etárias.