O contraste entre oclusivas alveolares e velares em dados típicos de fala: análises acústica e ultrassonográfica

O contraste entre oclusivas alveolares e velares em dados típicos de fala: análises acústica e ultrassonográfica

Autores:

Roberta Michelon Melo,
Helena Bolli Mota,
Larissa Cristina Berti

ARTIGO ORIGINAL

CoDAS

versão On-line ISSN 2317-1782

CoDAS vol.29 no.3 São Paulo 2017 Epub 08-Jun-2017

http://dx.doi.org/10.1590/2317-1782/20172016117

INTRODUÇÃO

Os segmentos oclusivos compõem o sistema fônico do Português Brasileiro (PB). Essas consoantes podem ser categorizadas quanto ao contraste de vozeamento (vozeadas ou não vozeadas, conforme o fechamento ou a abertura do gesto glótico), grau de constrição (grau fechado, característico dos gestos articulatórios dos sons oclusivos do PB) e, também, quanto ao local da constrição dos gestos articulatórios (labiais /p/ e /b/, alveolares /t/ e /d/ e velares /k/ e /g/(1).

A aquisição dessa classe de sons ocorre precocemente no desenvolvimento infantil. Aos três anos de idade todas as consoantes oclusivas já se encontram adquiridas no sistema de sons das crianças(2).

Uma pesquisa(3) com crianças com desenvolvimento típico de fala (DTF), falantes do PB, revelou, com o estudo acústico de oclusivas e fricativas, a existência de um período de “refinamento articulatório”, ou seja, mesmo após o “término” da aquisição fonológica, parece ocorrer um aprimoramento das habilidades motoras de produção de fala, período em que os gestos articulatórios tornam-se gradativamente mais estáveis, tanto em sua organização temporal, como em sua magnitude.

A noção de estados gradientes durante o processo de aquisição do sistema fônico está relacionada com a perspectiva teórica da Fonologia Gestual(4,5). Essa teoria trata os eventos de fala como uma tarefa dinâmica e preconiza a adoção de análises instrumentais para a investigação dos gestos articulatórios envolvidos na produção dos contrastes fônicos.

Quanto às oclusivas, segmentos alvo do presente estudo, essas vêm sendo investigadas por meio de parâmetros acústicos(3,6-13) e, em menor número, por parâmetros articulatórios, como os parâmetros obtidos por meio de imagens de ultrassonografia do movimento de língua, entre outros(13-22).

No que se refere à imagem de ultrassonografia de língua durante a produção de /t/, /d/, /k/ e /g/, em razão de ser uma técnica ainda pouco explorada no meio científico, diferentemente da análise acústica, não há um consenso na literatura acerca da metodologia de coleta dos dados, tampouco sobre o tipo de medidas articulatórias a serem adotadas. Até o momento, as consoantes oclusivas foram descritas quanto às constrições das curvas de línguas durante a produção das diferentes oclusivas(16,19,21,22) e, também, em relação a complexos parâmetros articulatórios(13,18,23).

Para o PB, língua-alvo deste estudo, a ultrassonografia de língua ainda carece de maiores investigações. Até o momento, esse instrumento de análise de fala foi utilizado para a pesquisa de consoantes líquidas(24,25), oclusivas(19,22) e fricativas(26).

A partir do exposto, a presente pesquisa tem como tema a caracterização acústica e articulatória do contraste típico entre oclusivas alveolares e velares do PB. Para tanto, foram formuladas as seguintes hipóteses de pesquisa:

(i) Ao comparar os dados acústicos e articulatórios das oclusivas, tanto na fala adulta como na fala de crianças com DTF, espera-se encontrar particularidades referentes à produção de constrições alveolares e velares.

(ii) Ao comparar as produções de adultos e de crianças com DTF, espera-se observar diferenças entre os grupos, resgatadas por meio de ambos os instrumentos de análise de fala (análise acústica e articulatória).

Desse modo, este artigo tem como objetivo principal caracterizar acústica e articulatoriamente o contraste entre oclusivas alveolares e velares em dados típicos de fala, além de comparar os parâmetros (acústicos e articulatórios) de adultos e de crianças com DTF.

MÉTODO

Este é um estudo transversal, quantitativo/descritivo. Seus dados pertencem a um projeto de pesquisa aprovado pelo Comitê de Ética em Pesquisa da Universidade Federal de Santa Maria, sob o registro 14973013.8.0000.5346. Todos os indivíduos incluídos nesta pesquisa assinaram o Termo de Consentimento Livre e Esclarecido, ou tiveram o termo assinado por seus responsáveis, no caso de crianças. Além disso, também foi respeitado o assentimento da criança acerca da sua participação no estudo.

A amostra foi constituída por:

(i) Vinte indivíduos adultos, dez do gênero feminino e dez do gênero masculino, com idades entre 19 e 38 anos (M= 24 anos; DP= 5,9 anos – coleta de análise acústica; e M= 24 anos; DP= 6,1 anos – coleta de análise articulatória). Três indivíduos do gênero feminino, incluídos na amostra submetida à análise acústica, tiveram de ser excluídos da análise articulatória, em razão de apresentarem imagem de baixa qualidade durante a produção de oclusivas velares em seu ponto de máxima elevação de língua. Para tanto, foram incluídos três novos indivíduos, do mesmo gênero e idades semelhantes, para o experimento com o ultrassom.

(ii) Quinze crianças com DTF, seis do gênero feminino e nove do gênero masculino, com idades entre quatro anos e sete meses e sete anos e cinco meses (M= 5,7 anos; DP= 10,9 meses).

A seleção da amostra foi composta por entrevista inicial e triagem fonoaudiológica (avaliações miofuncional orofacial, de linguagem, voz e audição).

Foram considerados os seguintes critérios para a inclusão dos indivíduos:

(i) não apresentar omissões e/ou substituições de segmentos identificadas por meio de análise perceptivo-auditiva;

(ii) ter idade entre 19 e 44 anos para o grupo de adultos e entre quatro e oito anos para o grupo de crianças com DTF. Segundo os Descritores em Ciências da Saúde (DECs), considera-se adulto o indivíduo que se encontra na faixa etária considerada. Para o grupo com DTF, definiu-se a idade mínima de quatro anos em função de nessa faixa etária as oclusivas se encontrarem frequentemente adquiridas no sistema fônico das crianças. Como este trabalho compõe um estudo maior e analisa também os dados da fala de crianças com desvio fonológico, o limite máximo de idade do grupo de crianças com DTF foi definido a partir do mesmo critério adotado para o grupo com alteração da fala. Isso acontece, pois a literatura aponta que, a partir dos nove anos de idade, o desvio fonológico, normalmente, já foi superado e, a partir dessa idade, as trocas de sons configurar-se-iam como erros residuais de fala. Além disso, houve também uma preocupação de se evitar influências da maturação de estruturas neuromotoras com o avançar da idade;

(iii) não ter realizado ou estar realizando terapia fonoaudiológica; e

(iv) ser falante monolíngue do PB, conforme informações levantadas na entrevista inicial (locais de residência; período e duração do contato com uma segunda língua).

Os critérios de exclusão adotados foram: (i) a presença de alterações vocais, auditivas e/ou de linguagem; (ii) de prejuízos evidentes nos aspectos neurológico, cognitivo, psicológico e/ou emocional; e (iii) de alterações de origem miofuncional orofacial que justificassem alguma interferência na produção correta dos sons da fala.

Para o procedimento de gravação dos dados, foram empregados os seguintes equipamentos: microfone unidirecional (Shure – SM48); pedestal; transdutor endocavitário (65C10EA – 5 MHz) acoplado a um ultrassom portátil (Mindray – DP6600); computador; caixa de som; cabine acústica; estabilizador de cabeça; unidade SyncBrightUp de sincronização de áudio e vídeo e Software Articulate Assistant AdvancedAAA (os três últimos da Articulate Instruments Ltd).

O corpus utilizado em ambas as análises foi composto por quatro palavras do PB, todas dissílabas, paroxítonas, com as consoantes oclusivas em onset inicial e no contexto vocálico de /a/ (/’kap«/, /‘tap«/, /‘galo/ e /‘daɾ«/). Essas palavras foram extraídas ou embasadas pelos critérios de seleção de palavras apresentados no Instrumento de Avaliação de Fala para Análise Acústica (IAFAC)(27).

As palavras-alvo foram representadas por figuras e apresentadas por meio da tela do computador para a nomeação. O indivíduo foi instruído a incluir a palavra-alvo na frase-veículo “Fala ____ de novo”, repetida por seis vezes, em padrão vocal habitual (intensidade, frequência e velocidade).

Durante a gravação, os indivíduos permaneceram sentados, com postura ereta, no interior de uma cabine acústica. O transdutor do ultrassom foi posicionado na região submandibular de modo fixo, preso ao estabilizador de cabeça. Para auxiliar na aquisição das imagens com o ultrassom, foi utilizado um gel para o contato do transdutor com a pele dos indivíduos. Quando crianças eram avaliadas, a gravação era supervisionada pela primeira autora deste artigo, que também permaneceu no interior da cabine. O tempo de coleta variou de 15 a 20 minutos, sendo realizada em uma única sessão.

Para o presente trabalho, foram consideradas três repetições da palavra-alvo para o estudo acústico (4 palavras x 3 repetições x 35 indivíduos = 420 segmentos oclusivos analisados) e cinco repetições para o estudo articulatório (4 palavras x 5 repetições x 35 indivíduos = 700 segmentos oclusivos analisados).

Algumas produções das palavras-alvo foram excluídas da análise acústica devido à nomeação incorreta da palavra-alvo ou da frase-veículo, pausa longa entre as palavras da sentença, ruído externo interveniente e/ou registro acústico indiferenciado do burst.

Em virtude da exclusão de alguns segmentos e do design estatístico selecionado, foi necessário selecionar o mesmo número de repetições das oclusivas entre os parâmetros acústicos e entre os grupos. Portanto, foram selecionadas três repetições de cada consoante para o experimento acústico. No caso da análise das imagens de ultrassom, foram mantidas cinco repetições de cada consoante, sendo excluídos os dados em que a obtenção da imagem de língua no ponto de máxima constrição estivesse prejudicada e, também, em que tivesse ocorrido a nomeação incorreta da palavra-alvo ou da frase-veículo. Foram priorizadas as primeiras repetições de cada indivíduo para serem incluídas nas análises. Caso uma repetição fosse excluída, era considerada a repetição seguinte, até que se completasse o número total de repetições previsto.

A captação de áudio e de imagens de língua foi realizada com o uso do Software AAA. Para a análise das imagens de ultrassom, foram utilizados os recursos ofertados por esse software, já os sinais de áudio foram analisados por meio do Software Praat.

Com a análise acústica, os sons-alvo foram analisados por meio dos seguintes parâmetros: voice onset time (VOT); pico espectral e momentos espectrais relativos ao burst (centroide, variância, assimetria e curtose); transição consoante-vogal (CV) e medidas de duração relativa da oclusão e do burst em relação à duração total do segmento. A extração desses parâmetros foi realizada manualmente e foram seguidos os procedimentos descritos em outros trabalhos(3,9-11).

Para a análise articulatória dos dados ultrassonográficos, foram selecionados os instantes correspondentes à produção de cada segmento analisado ([t], [k], [d] e [g]), ou seja, com base no espectrograma fornecido pelo programa, guiou-se pelo último ciclo regular relativo à segunda vogal da palavra “Fala” até o início da vogal seguinte à oclusiva a ser analisada. Posteriormente, foi realizado um traçado (spline) sobre a superfície da língua (em corte sagital), no instante correspondente ao ponto de máxima elevação da língua(28), durante a produção da oclusiva. Destaca-se que a sincronização de áudio e vídeo foi realizada por meio da unidade SyncBrightUp e a seleção do frame de máxima elevação da língua foi realizada com a inspeção visual do trecho de vídeo selecionado para cada consoante.

Depois de traçar todas as splines para cada uma das cinco repetições da consoante oclusiva, por meio de um comando do software, foi calculado um valor médio independente para cada um dos 42 eixos ou raios da fan e, assim, um contorno médio da língua foi desenhado com base nesses 42 pontos. Da mesma forma, foram ofertados dois desvios padrão. Posteriormente, foram comparadas duas splines médias para cada um dos contrastes investigados ([t] x [k], [t] x [g], [d] x [k] e [d] x [g]). Para isso foi aplicado um Teste t para cada eixo da fan, recurso também oferecido pelo software, com p<5%.

Com a aplicação desse teste estatístico, foi contabilizado o número total de eixos que as duas splines médias estavam cruzando, o número obtido foi dividido por dois a fim de dividir a língua em duas regiões, anterior e posterior. Quando o número total de eixos correspondia a um número ímpar, o eixo excedente foi contabilizado como pertencente à região anterior. Assim, com a determinação do número total de eixos para cada região, foi levantado o número de eixos significantes na região anterior e na região posterior. Os eixos significantes apontados pelo Teste t correspondiam, portanto, aos eixos em que as duas curvas médias de língua (oclusiva alveolar x oclusiva velar) mostravam diferenças estatisticamente significantes entre elas.

Por fim, foi realizado o cálculo da proporção de eixos significantes, com a divisão do número de eixos significantes da região anterior de língua, pelo número total de eixos dessa mesma região. O resultado foi então multiplicado por 100. O procedimento foi realizado do mesmo modo para a região posterior de língua. O cálculo da proporção de eixos significantes para cada uma das duas regiões foi realizado para cada indivíduo do estudo. Posteriormente, esses valores foram submetidos ao tratamento estatístico dos dados, como descrito adiante.

A Figura 1 ilustra a janela do software com a comparação estatística entre duas splines médias de língua e com a divisão das regiões anterior e posterior.

Legenda: 1 – Cinco splines e spline média da oclusiva [g]; 2 – Cinco splines e spline média da oclusiva [d]; 3 – Eixo “zero” da fanspline; 4 – Eixo “41” da fanspline; 5 – Fanspline; 6 – Asteriscos assinalando os eixos significantes; 7 – Região anterior da língua; 8 – Região posterior da língua

Figura 1 Janela do Software Articulate Assistant Advanced (AAA) 

O método estatístico adotado para a análise dos dados acústicos foi conduzido a partir de uma série de ANOVA de Medidas Repetidas para cada um dos parâmetros acústicos adotados. O fator intragrupo considerado foram as quatro consoantes e as três repetições e, o fator intergrupo, o período de desenvolvimento da fala dos indivíduos (adultos e crianças com DTF). O teste post hoc utilizado foi o Teste de Bonferroni. Os valores de p considerados significantes foram de p<0,05 e o software empregado foi o Statistica 7.0.

Para o tratamento das medidas obtidas com as imagens de ultrassom, inicialmente, foi empregado o Teste de Normalidade Kolmogorov-Smirnov e a distribuição foi considerada normal se p>0,05. Para a detecção de diferenças entre duas médias levando em consideração a região da língua, foi utilizado o Teste t Pareado para as amostras de distribuição normal e o Teste Não Paramétrico de Wilcoxon para as amostras de distribuição não normal. Para realizar a comparação entre os grupos com relação às variáveis estudadas, foi empregado o Teste de Mann-Whitney, uma vez que essas variáveis demonstraram-se não normais. Para essas análises, os valores de p considerados significantes também foram de p<0,05, porém o software utilizado foi o Statistical Package for Social Science 15.0 – SPSS.

Por fim, com relação à descrição das curvas de língua durante a produção das oclusivas [t], [d], [k] e [g], essa também foi realizada no ponto de máxima elevação da língua e com base nas variáveis do trato da Fonologia Gestual(4) analisadas com o auxílio das imagens de ultrassom (local e grau de constrição da ponta de língua e local e grau de constrição do dorso de língua).

RESULTADOS

Análise acústica do contraste entre oclusivas alveolares versus velares

Na Tabela 1, são apresentados os valores descritivos de cada parâmetro acústico, referente ao grupo de adultos e ao grupo de crianças com DTF.

Tabela 1 Valores descritivos dos parâmetros acústicos pesquisados para os dois grupos do estudo 

Parâmetros Adultos Crianças com DTF
[k] [t] [g] [d] [k] [t] [g] [d]
VOT
(ms)
M 44,22 16,96 -94,56 -114,85 44,05 20,47 -98,47 -108,78
DP 12,47 5,77 31,67 32,17 19,36 12,07 36,42 49,98
Pico Espectral
(Hz)
M 352,14 322,25 352,83 720,51 621,98 691,50 530,53 378,05
DP 526,34 542,33 404,89 1196,24 908,90 1282,25 582,56 310,24
Centroide
(Hz)
M 1338,77 498,12 603,72 492,64 1422,13 1058,79 827,14 687,94
DP 883,13 513,71 486,71 389,61 675,25 1063,28 663,85 713,53
Variância
(MHz)
M 2,85 1,08 0,75 0,60 2,91 2,89 1,33 1,10
DP 2,25 1,46 0,89 0,96 1,68 2,86 1,82 1,85
Assimetria M 2,95 10,04 7,22 8,60 2,48 5,88 5,34 8,09
DP 1,67 7,73 3,97 4,44 1,43 6,49 3,85 5,44
Curtose M 14,24 225,43 104,81 154,28 8,53 100,15 55,93 124,87
DP 19,04 440,78 111,38 164,44 9,08 216,20 78,60 157,08
Transição CV
(Hz)
M 1629,47 1566,42 1762,42 1594,23 1823,20 1861,53 1952,07 1939,91
DP 155,06 191,78 211,38 346,02 300,04 268,26 380,56 346,02
Duração relativa da Oclusão (%) M 74,73 89,55 86,52 92,92 72,71 86,84 86,87 90,40
DP 6,62 4,13 5,76 3,42 8,18 6,99 6,82 5,61
Duração relativa do Burst
(%)
M 25,27 10,40 13,48 7,08 27,29 12,80 13,29 9,58
DP 6,62 4,19 5,76 3,42 8,21 6,88 6,85 5,64

Legenda: DTF – Desenvolvimento típico de fala; VOT – Voice onset time; CV – Consoante/vogal; ms – milissegundos; Hz – Hertz; MHz – megahertz; M – Média; DP – desvio padrão

Na Tabela 2, são apresentados os resultados obtidos com a aplicação da ANOVA de Medidas Repetidas dos nove parâmetros acústicos pesquisados.

Tabela 2 Resultados da análise estatística referente aos nove parâmetros acústicos pesquisados 

Parâmetros Acústicos Fatores
Grupos
Adultos X DTF
Consoantes Oclusivas Interação Consoante/Grupo
VOT F(1,33)=
0,0774
p= 0,78 F(3,99)= 560,3611 p 0,01* F(3,99)= 0,4231 p= 0,73
Pico Espectral F(1,33)= 1,11694 p= 0,29 F(3,99)= 0,27574 p= 0,84 F(3,99)= 3,47451 p 0,01*
Centroide F(1,33)= 5,9496 p= 0,02* F(3,99)= 18,2265 p 0,01* F(3,99)= 1,5598 p= 0,20
Variância F(1,33)= 5,7526 p= 0,02* F(3,99)= 19,4033 p 0,01* F(3,99)= 3,0979 p= 0,03*
Assimetria F(1,33)= 3,9457 p= 0,05 F(3,99)= 20,9163 p 0,01* F(3,99)= 2,3849 p= 0,07
Curtose F(1,33)= 2,77964 p=0,10 F(3,99)= 8,14936 p 0,01* F(3,99)= 1,19140 p= 0,31
Transição CV F(1,33)= 18,675 p 0,01* F(3,99)= 9,074 p 0,01* F(3,99)= 3,212 p= 0,02*
Duração relativa da Oclusão F(1,33)= 2,21 p= 0,14 F(3,99)= 164,18 p 0,01* F(3,99)= 1,33 p= 0,26
Duração relativa do Burst F(1,33)= 2,0113 p= 0,16 F(3,99)= 169,9732 p 0,01* F(3,99)= 1,1007 p= 0,35

*Resultados estatisticamente significantes

Teste estatístico = ANOVA de Medidas Repetidas, com p<0,05

Legenda: VOT – Voice onset time; DTF – Grupo de crianças com Desenvolvimento Típico de Fala

O único parâmetro acústico que se mostrou distinto entre os grupos de adultos e crianças com DTF, na ausência de significância para a interação consoante/grupo, foi o centroide.

Os parâmetros com diferença estatisticamente significante entre as consoantes oclusivas [k], [t], [g] e [d] foram: o VOT, o centroide, a assimetria, a curtose, a duração relativa da oclusão e do burst. Tais parâmetros apresentaram diferenças entre as oclusivas investigadas de maneira semelhante entre os grupos.

Foi observado o efeito para a interação entre consoante/grupo para os parâmetros acústicos: pico espectral, variância e transição CV. Ou seja, para esses parâmetros, as diferenças do contraste fônico alveolar versus velar foram dependentes do tipo de grupo.

Uma série de análises post hoc foi conduzida a fim de verificar a diferença entre as consoantes e a diferença entre as consoantes em função do grupo (esta no caso dos parâmetros em que a interação consoante/grupo se mostrou significante).

Na Tabela 3, é apresentada a análise post hoc, realizada com o intuito de sinalizar as diferenças entre os pares de consoantes oclusivas, independentemente do tipo de grupo.

Tabela 3 Valores de significância post hoc na comparação entre as oclusivas alveolares e velares, nos dois grupos de indivíduos, na ausência da interação consoante/grupo 

Parâmetros Acústicos [t] × [k] [t] × [g] [d] × [g] [d] × [k]
VOT p 0,01* p 0,01* p 0,01* p 0,01*
Centroide p 0,01* 1,00 1,00 p 0,01*
Assimetria p 0,01* 0,12 0,08 p 0,01*
Curtose p 0,01* 0,05 0,50 p 0,01*
Duração relativa da Oclusão p 0,01* 0,28 p 0,01* p 0,01*
Duração relativa do Burst p 0,01* 0,12 p 0,01* p 0,01*

*Resultados estatisticamente significantes

Teste estatístico = Post hoc de Bonferroni, com p<0,05

Legenda: VOT – Voice onset time

Para o VOT, foi possível observar, além da marcação do contraste de vozeamento, a distinção dos quatro pares de oclusivas alveolares e velares, que são: [t] x [k], [t] x [g], [d] x [g] e [d] x [k]. O mesmo resultado foi observado para os outros cinco parâmetros destacados na Tabela 3, ou seja, todos eles distinguiram os dois contrastes, alveolar/velar e voz, todavia, não foi observada uma diferença estatisticamente significante para todos os pares contrastados.

Em relação aos parâmetros com diferença entre os pares de oclusivas alveolares e velares de modo distinto entre os dois grupos pesquisados, verificou-se, com o teste post hoc para o parâmetro de pico espectral, diferença estatisticamente significante somente para o grupo de adultos nas comparações [d] x [g] e [d] x [k], com valor de p igual a 0,02. Para o parâmetro de variância, foi constatada diferença estatisticamente significante para o grupo de adultos nas comparações [t] x [k] e [d] x [k] (p≤0,01) e, para o grupo com DTF, foi observada a diferença entre [t] x [g] (p=0,02) e [d] x [k] (p≤0,01). Outro parâmetro sensível ao efeito consoante/grupo foi a transição CV, para esse parâmetro novamente o grupo de adultos foi o único a diferenciar o contraste nas comparações entre as oclusivas [t] x [g] e [d] x [g] (p≤0,01).

Ainda, quanto ao parâmetro da variância, essa apresentou efeito para a repetição, com F(2,66)= 5,9994 e p≤0,01. A interação entre repetição/grupo não se mostrou significante (F(2,66)=1,1764 e p=0,31). Esses resultados sugerem a existência de variabilidade entre as repetições das oclusivas para os valores de variância, independentemente do grupo.

Análise articulatória do contraste entre oclusivas alveolares versus velares

Em relação aos parâmetros articulatórios propostos no presente estudo, foi realizada a comparação entre a proporção de eixos significantes da região anterior de língua e a proporção de eixos significantes da região posterior de língua, em cada grupo investigado (adultos e crianças com DTF).

Na Tabela 4, são apresentados os resultados para o grupo de adultos. Foi observada diferença estatisticamente significante entre as regiões anterior e posterior de língua na comparação de todos os contrastes: [t] x [k], [t] x [g], [d] x [k] e [d] x [g]. Nos quatro contrastes estudados, a maior média percentual de eixos significantes foi encontrada na região anterior de língua.

Tabela 4 Comparação entre as proporções de eixos significantes da região anterior e posterior de língua, no grupo de adultos 

Contrastes Região da língua p-valor
Anterior
M(DP)
Posterior
M(DP)
[t] × [k] 0,8796(±0,07) 0,7067(±0,17) 0,003*
[t] × [g] 0,8695(±0,06) 0,6973(±0,21) 0,003*
[d] × [k] 0,8458(±0,08) 0,6875(±0,20) 0,011*
[d] × [g] 0,8581 (±0,07) 0,7019 (±0,18) 0,001*

*Resultados estatisticamente significantes

Teste estatístico – Teste t pareado, com p<0,05

Legenda: M – Média; DP – desvio padrão

Para o grupo de crianças com DTF (Tabela 5), foi constatada diferença estatisticamente significante entre as regiões anterior e posterior de língua somente na comparação dos contrastes [t] x [k] e [t] x [g]. A maior média percentual de eixos significantes também foi encontrada na região anterior de língua para esses pares de consoantes.

Tabela 5 Comparação entre as proporções de eixos significantes da região anterior e posterior de língua, no grupo de crianças com desenvolvimento típico de fala 

Contrastes Região da língua p-valor
Anterior
M(DP)
Posterior
M(DP)
[t] × [k] 0,7796 (±0,10) 0,6186 (±0,20) 0,023*
[t] × [g] 0,7564 (±0,16) 0,5999 (±0,23) 0,024*
[d] × [k] 0,7956 (±0,12) 0,7722 (±0,22) 0,735
[d] × [g] 0,7456 (±0,11) 0,6533 (±0,23) 0,149

*Resultados estatisticamente significantes

Teste estatístico utilizado – Teste de Wilcoxon, com p<0,05

Legenda: M – Média; DP – desvio padrão

Nas Figuras 2 e 3, são ilustradas as splines de língua na comparação de cada um dos contrastes – [t] x [k], [t] x [g], [d] x [k] e [d] x [g] – para um indivíduo de cada um dos grupos investigados.

Legenda: Em pontilhado – oclusivas velares [k] e [g]; em linha contínua: – oclusivas alveolares [t] e [d]; à esquerda das imagens – região posterior de língua; à direita - região anterior de língua

Figura 2 Splines de língua referentes a cada um dos contrastes investigados, produzidas por um sujeito do grupo de adultos da pesquisa 

Legenda: Em pontilhado – oclusivas velares [k] e [g]; em linha contínua: – oclusivas alveolares [t] e [d]; à esquerda das imagens – região posterior de língua; à direita - região anterior de língua

Figura 3 Splines de língua referentes a cada um dos contrastes investigados, produzidas por um sujeito do grupo de crianças com desenvolvimento típico de fala da pesquisa 

As splines de língua expostas na Figura 2 vão ao encontro dos resultados da Tabela 4. De modo geral, ao se considerar as variáveis do trato da Fonologia Gestual, constatou-se, para as oclusivas alveolares, uma tendência de elevação e anteriorização da ponta da língua em direção à região dos alvéolos. Contrariamente, para as oclusivas velares, foi possível evidenciar uma elevação e posteriorização do dorso de língua em direção à região do véu palatino.

A Figura 3, correspondente às splines de uma criança com DTF também evidenciou as diferenças entre as contrições alveolares e velares. Os gestos articulatórios (em suas variáveis do trato – local de constrição de ponta de língua e local de constrição do corpo de língua) de crianças com DTF se mostraram semelhantes aos gestos articulatórios descritos para o grupo de adultos. No entanto, na grande maioria dos dados, observa-se menor magnitude dos gestos articulatórios para esses indivíduos, além da existência de maior variabilidade entre algumas repetições dos segmentos.

Ao comparar as proporções de eixos significantes do grupo de adultos e do grupo de crianças com DFT, em relação à região anterior de língua durante a produção de [t] x [k], foi evidenciada diferença estatisticamente significante entre os grupos. Assim, também se confirmou para os outros três pares de oclusivas contrastados – [t] x [g], [d] x [k] e [d] x [g] –, do mesmo modo, em relação à região posterior de língua. Em todas as comparações, foi constatada maior média de eixos significantes para o grupo de adultos, com exceção apenas da comparação entre as proporções de eixos significantes da região posterior de língua, durante a produção do contraste entre [d] x [k].

DISCUSSÃO

A presente pesquisa objetivou investigar acústica e articulatoriamente o contraste entre oclusivas alveolares e velares do PB. Para isso, foram pesquisados alguns parâmetros de análise acústica e de análise de imagens de ultrassonografia dos gestos de língua, em dados de falantes adultos e crianças com aquisição típica.

Análise acústica do contraste entre oclusivas alveolares versus velares

Quanto à análise acústica, seis (VOT, centroide, assimetria, curtose, duração relativa da oclusão e do burst) dos nove parâmetros investigados sinalizaram para uma diferença entre as consoantes alvo do estudo independentemente do tipo de grupo, ou seja, se mostraram eficazes para a diferenciação do contraste entre oclusivas alveolares e velares de modo similar entre adultos e crianças com DTF.

Os valores de pico espectral mostraram distinção entre as consoantes, todavia, distinção essa relacionada ao tipo de grupo. Esse fato remete ao entendimento de que adultos e crianças com DTF aqui avaliados, empregam de forma distinta esse parâmetro com relação à marcação do contraste de ponto articulatório. Outros dois parâmetros também evidenciaram significância estatística para a interação entre consoante/grupo, que foram a variância e a transição CV.

Diferenças estatisticamente significantes entre falantes adultos e crianças com DTF também foram verificadas, nesse caso por meio do parâmetro de centroide e com a análise post hoc dos parâmetros acústicos que apresentaram significância para a interação consoante/grupo – pico espectral, variância e transição CV.

A análise acústica é um método consagrado entre os pesquisadores da fala para a caracterização dos contrastes de sons. O VOT é considerado um dos parâmetros acústicos importante na investigação dos segmentos oclusivos, sendo extensivamente investigado primeiramente para a marcação do contraste de vozeamento, entretanto, também tem sido relacionado ao contraste de ponto articulatório das oclusivas(3,5-8,10,13), o que também foi confirmado por meio dos achados desta pesquisa. Quando contrastadas as consoantes com base apenas no contraste alveolar versus velar ([t] versus [k] e [d] versus [g]), foi observada a ocorrência de maiores valores de VOT para [k] e [d], respectivamente.

Quanto aos demais parâmetros, outra pesquisa(9) observou o emprego de todos os parâmetros acústicos aqui investigados na diferenciação das consoantes [t] e [k], na fala de um indivíduo adulto do PB (pico espectral, momentos espectrais do burst, transição CV e durações relativas). Dado esse que corrobora em parte com alguns dos achados deste artigo, uma vez que, no presente estudo, todos os parâmetros evidenciaram diferenças entre os pares de oclusivas alveolares e velares. A autora(9) destacou também que algumas dessas medidas acústicas mostraram-se como primárias ou secundárias na distinção do contraste alveolar versus velar.

No que diz respeito à distinção entre os grupos do estudo, as diferenças observadas entre os parâmetros acústicos durante a produção oral adulta e infantil, constatadas no presente trabalho e em outros achados da literatura(3,6,8), instigam antigos conhecimentos da Fonoaudiologia e da Linguística. Crianças com DTF, ao apresentarem uma produção estável e condizente com o alvo adulto de acordo com análise perceptual, por qual motivo apresentariam distinções acústicas em relação ao padrão da sua língua? Esse fato foi discutido com maior profundidade após a apresentação dos dados articulatórios.

Análise articulatória do contraste entre oclusivas alveolares versus velares

Na sequência, a segunda análise instrumental empregada nesta pesquisa diz respeito à análise das imagens de língua adquiridas com o auxílio do equipamento de ultrassonografia. Um dos desafios com a realização deste estudo referia-se à obtenção de uma análise quantitativa das imagens de língua com o auxílio do software AAA. Portanto, buscou-se uma alternativa para esse tipo de análise por meio dos recursos do programa selecionado para a gravação e análise dos dados de produção de fala. Em razão do contraste alvo do estudo aparentemente estar relacionado a gestos articulatórios de ponta e dorso de língua, poderia ser questionada a superioridade da região anterior ou posterior de língua na marcação do contraste fônico alveolar versus velar. Portanto, foi proposta a análise das proporções de eixos significantes da região anterior e posterior de língua.

Com isso, os resultados da presente pesquisa apontaram algumas diferenças entre as duas regiões de língua, tanto para o grupo de adultos como para o grupo de crianças com DTF. Em todas as significâncias estatísticas, foi constatada maior média percentual de eixos significantes na região anterior de língua. Com isso, é possível inferir maior influência da região médio anterior de língua na estabilização do contraste de ponto articulatório da classe das oclusivas.

Dentre as medidas quantitativas relacionadas à ultrassonografia descritas na literatura para os segmentos analisados, tem-se o índice de excursão do dorso de língua(13,23). Esse parâmetro foi usado para caracterizar o contraste entre oclusivas alveolares e velares de falantes do Inglês(13), foram observados, para uma criança com distinção perceptível entre segmentos alveolares e velares, maiores valores do índice de excursão do dorso de língua para as consoantes velares.

Em relação à descrição das curvas de língua no ponto máximo de constrição, foi confirmada a utilização de um gesto de ponta e dorso de língua, respectivamente empregados durante a produção de oclusivas alveolares e velares. Caracterização semelhante foi citada em outro trabalho com dados típicos de fala do PB(19).

O presente estudo se propôs ainda comparar os dois grupos investigados também por meio de dados de ultrassonografia de língua e, dessa maneira, novamente foram observadas algumas particularidades das produções adultas e infantis. Mesmo que ambos os grupos apresentem produções categóricas de [t], [d], [k] e [g] (identificadas via análise perceptivo auditiva), uma distinção entre as fases do desenvolvimento também foi apontada com a comparação do parâmetro de proporção de eixos significantes da região anterior e posterior de língua, sendo observada maior média de eixos significantes para o grupo de adultos.

Ainda, com a inspeção visual das curvas de língua, mesmo ao serem identificadas as mesmas variáveis do trato durante a formação de constrições alveolares e velares nos dois grupos do estudo, também é possível refletir em torno de algumas características das curvas de língua do grupo de crianças. Por exemplo, foi observada, para o grupo com DTF, menor diferenciação entre as magnitudes dos gestos de ponta e dorso de língua, além da observação de maior variabilidade das curvas de língua durante as repetições de uma consoante.

Com isso, reacendem novamente os questionamentos levantados na presente discussão. Tanto os resultados ofertados pela análise acústica como pela análise articulatória sugerem um período de estabilização nas produções de crianças com DTF. Tal interpretação pode ser explicada pela Fonologia Gestual(4,5), uma vez que é possível constatar a presença de estados gradientes, mesmo em dados sem alterações de fala, o que, dito em outras palavras, corrobora a identificação de um período de “refinamento articulatório” mesmo após o término da aquisição do segmento(3).

Os dados de crianças ao mostrarem diferenças em relação aos parâmetros empregados por indivíduos adultos permitem inferir, portanto, um período de maturação neuromotora relacionada ao uso dos articuladores do trato vocal. Nesses casos, mesmo que seja observado algum nível de distanciamento entre as fases adulta e infantil, em que não são utilizados todos os parâmetros na marcação de um determinado contraste, a utilização de pelo menos um parâmetro em uma magnitude adequada propicia o resgate do contraste por meio da audição(8,9).

Mesmo com objetos diferentes de estudo, outras pesquisas constataram que o desenvolvimento motor e o controle motor da fala parecem ser guiados pelas mesmas restrições maturacionais(29). Consequentemente, a maturação do controle motor fino no discurso se dá paralelamente com o aumento da idade(30).

Reforçando essa ideia, entende-se que a produção madura da fala é uma ação hábil que requer muitos anos de desenvolvimento e aperfeiçoamento da cognição humana, dos sistemas linguístico e motor(14).

Por fim, além de discutir acerca do contraste fônico entre oclusivas alveolares e velares, o presente estudo visou utilizar um novo método de investigação instrumental da fala, as imagens de ultrassonografia de língua. Sem a pretensão de responder a todas as dúvidas que ainda acompanham a investigação dos contrastes fônicos por meio de um aparato tecnológico, esta pesquisa pretendeu também incentivar novos trabalhos no domínio da aquisição e desenvolvimento dos sons da fala e, também, da prática fonoaudiológica com as alterações de fala.

CONCLUSÃO

Quanto à análise acústica, verificaram-se, por meio de seus parâmetros, diversas distinções entre a produção de constrições alveolares e velares na classe das oclusivas. Os valores de VOT, centroide, assimetria, curtose e medidas de duração relativa da oclusão e do burst apresentaram diferenças entre as consoantes oclusivas independentemente do tipo de grupo pesquisado. Contrariamente, os resultados referentes aos parâmetros de pico espectral, variância e transição CV sugerem que o grupo de adultos e de crianças com DTF distinguiram as consoantes oclusivas por meio desses três parâmetros de maneira distinta entre eles.

No que se refere aos parâmetros articulatórios propostos, novamente, foram evidenciadas diferenças entre todos os pares de oclusivas alveolares e velares contrastados na fala de indivíduos adultos. Entretanto, as crianças com DTF mostraram diferenças na comparação entre as proporções de eixos significantes da região anterior e posterior de língua apenas para os pares [t] x [k] e [t] x [g]. Do mesmo modo, as curvas de língua auxiliaram na identificação dos gestos articulatórios durante a produção de constrições alveolares e velares, também nas produções dos dois grupos do estudo.

Em relação à comparação entre os grupos, as distinções apontadas por ambas as análises de fala sugerem um período de refinamento dos gestos articulatórios do grupo de crianças com DTF, mesmo após a aquisição das oclusivas, ou seja, para além dos cinco anos e sete meses, idade média das crianças incluídas nesta pesquisa.

REFERÊNCIAS

1 Gafos AI. A grammar of gestural coordination. Nat Lang Linguist Theory. 2002;20(2):269-337. .
2 Ferrante C, Van Borsel J, Pereira MMB. Aquisição fonológica de crianças de classe sócio econômica alta. Rev CEFAC. 2008;10(4):452-60. .
3 Cristofolini C, Seara IS. Características acústicas de consoantes plosivas e fricativas produzidas por crianças de 6 e 12 anos: período de refinamento articulatório? Verba Volant. 2012;3(1):55-71.
4 Browman C, Goldstein L. Articulatory phonology: an overview. Phonetica. 1992;49(3-4):155-80. PMid:1488456. .
5 Albano EC. O gesto e suas bordas: esboço de fonologia acústico-articulatória do Português Brasileiro. Campinas: Mercado das Letras-Associação de Leitura do Brasil; 2001.
6 Kim M, Stoel-Gammon C. The acquisition of Korean word-initial stops. J Acoust Soc Am. 2009;125(6):3950-61. PMid:19507977. .
7 Theodore RM, Miller JL, DeSteno D. Individual talker differences in voice-onset-time: contextual influences. J Acoust Soc Am. 2009;125(6):3974-82. PMid:19507979. .
8 Rinaldi LC, Albano E. Contrastes em estabilização em crianças sem queixas fonoaudiológicas. Verba Volant. 2012;3(1):1-23.
9 Berti LC, Marino VCC. Contraste fônico encoberto entre /t/ e /k/: um estudo de caso de normalidade e de transtorno fonológico. Rev CEFAC. 2011;13(5):866-76. .
10 Melo RM, Mota HB, Mezzomo CL, Brasil BC, Lovatto L, Arzeno L. Desvio fonológico e a dificuldade com a distinção do traço [voz] dos fonemas plosivos – dados de produção e percepção do contraste de sonoridade. Rev. CEFAC. 2012;14(1):18-29. .
11 Berti LC. Produção e Percepção da fala em crianças com distúrbios fonológicos: a ancoragem em pistas fonético-acústicas secundárias. In: Ferreira-Gonçalves G, Brum-de-Paula M, Keske-Soares M. Estudos em aquisição fonológica. Pelotas: Editora e Gráfica Universitária PREC - UFPel; 2011. p. 153-74.
12 Marino VCC, Berti LC, Lima-Gregio AM. Características acústicas da oclusiva glotal associada à sequência de Pierre Robin: estudo de caso. Rev CEFAC. 2013;15(2):466-77. .
13 Byun TM, Buchwald A, Mizoguchi A. Covert contrast in velar fronting: an acoustic and ultrasound study. Clin Linguist Phon. 2015;1:1-27.
14 Cheng HY, Murdoch BE, Goozée JV, Scott D. Electropalatographic assessment of tongue-to-palate contact patterns and variability in children, adolescents, and adults. J Speech Lang Hear Res. 2007;50(2):375-92. PMid:17463236. .
15 Goldstein L, Pouplier M, Chen L, Saltzman E, Byrd D. Dynamic action units slip in speech production errors. Cognition. 2007;103(3):386-412. PMid:16822494. .
16 Bressmann T, Radovanovic B, Kulkarni GV, Klaiman P, Fisher D. An ultrasonographic investigation of cleft-type compensatory articulations of voiceless velar stops. Clin Linguist Phon. 2011;25(11-12):1028-33. PMid:21787146. .
17 Gibbon FE, Lee A. Using EPG data to display articulatory separation for phoneme contrasts. Clin Linguist Phon. 2011;25(11–12):1014-21. PMid:21967129. .
18 Falahati R, Mielke J. An ultrasound study of coronal stop deletion in Persian. Can Acoust. 2011;39(3):172-3.
19 Berti LC. Investigação ultrassonográfica dos erros de fala infantil à luz da Fonologia Gestual. In: Ferreira-Gonçalves G, Brum-de-Paula M. Dinâmica dos movimentos articulatórios: sons, gestos e imagens. Pelotas: Editora UFPel; 2013. p. 127-44.
20 Mauszycki SC, Wambaugh JL, Dromey C. Electropalatographic measures of stop consonants in speakers with and without apraxia of speech on repeated sampling occasions. J Med Speech-Lang Pathol. 2013;20(4):77-81.
21 Cleland J, Scobbie JM, Wrench AA. Using ultrasound visual biofeedback to treat persistent primary speech sound disorders. Clin Linguist Phon. 2015;29(8-10):575-97. PMid:25751614. .
22 Melo RM, Dias RF, Mota HB, Mezzomo CL. Imagens de ultrassonografia de língua pré e pós terapia de fala. Rev CEFAC. 2016;18(1):286-97. .
23 Zharkova N. Using ultrasound to quantify tongue shape and movement characteristics. Cleft Palate Craniofac J. 2013;50(1):76-81. PMid:22117937. .
24 Barberena LS, Keske-Soares M, Berti LC. Descrição dos gestos articulatórios envolvidos na produção dos sons /r/ e /l/. Audiol Commun Res. 2014;19(4):338-44. .
25 Berti LC, Boer G, Bressmann T. Tongue displacement and durational characteristics of normal and disordered Brazilian Portuguese liquids. Clin Linguist Phon. 2016;30(2):131-49. PMid:26853548. .
26 Wertzner HF, Francisco DT, Pagan-Neves LO. Contorno de língua dos sons /s/ e /ʃ/ em crianças com transtorno fonológico. CoDAS. 2014;26(3):248-51. PMid:25118923. .
27 Berti LC, Pagliuso A, Lacava F. Instrumento de avaliação de fala para análise acústica (IAFAC) baseado em critérios linguísticos. Rev Soc Bras Fonoaudiol. 2009;14(4):305-14. .
28 Kochetov A, Sreedevi N, Kasim M, Manjula R. Spatial and dynamic aspects of retroflex production: na ultrasound and EMA study of Kannada geminate stops. J Phonetics. 2014;46:168-84. .
29 Le Normand MT, Vaivre-Douret L, Payan C, Cohen H. Neuromotor development and language processing in developmental dyspraxia: a follow-up case study. J Clin Exp Neuropsychol. 2000;22(3):408-17. PMid:10855048. .
30 Singh L, Singh NC. The development of articulatory signatures in children. Dev Sci. 2008;11(4):467-73. PMid:18576954. .