a prÉ-indicaÇÃo prosÓdica para as oraÇÕes subordinadas...
Post on 02-Jun-2020
4 Views
Preview:
TRANSCRIPT
0
Universidade Federal do Rio de Janeiro
A PRÉ-INDICAÇÃO PROSÓDICA PARA
AS ORAÇÕES SUBORDINADAS ADVERBIAIS
NO PORTUGUÊS BRASILEIRO E NO FRANCÊS
Cirineu Cecote Stein
2008
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
1
A PRÉ-INDICAÇÃO PROSÓDICA PARA
AS ORAÇÕES SUBORDINADAS ADVERBIAIS
NO PORTUGUÊS BRASILEIRO E NO FRANCÊS
Cirineu Cecote Stein
Tese de Doutorado apresentada ao Programa de
Pós-graduação em Letras Vernáculas da
Universidade Federal do Rio de Janeiro como
quesito para a obtenção do título de Doutor em
Letras Vernáculas (Língua Portuguesa).
Orientador: Prof. Dr. João Antônio de Moraes
Rio de Janeiro
Fevereiro de 2008
ii
A PRÉ-INDICAÇÃO PROSÓDICA PARA AS ORAÇÕES SUBORDINADAS
ADVERBIAIS NO PORTUGUÊS BRASILEIRO E NO FRANCÊS
Cirineu Cecote Stein
Orientador: Professor Doutor João Antônio de Moraes
Aprovada por:
_____________________________________________________
Presidente, Prof. Dr. João Antônio de Moraes
_____________________________________________________
Prof. Dr. César Augusto da Conceição Reis – UFMG
_____________________________________________________
Prof. Dr. José Olímpio de Magalhães – UFMG
_____________________________________________________
Profa. Dra. Myrian Azevedo de Freitas - UFRJ
_____________________________________________________
Profa. Dra. Dinah Maria Isensee Callou - UFRJ
_____________________________________________________
Profa. Dra. Maria Jussara Abraçado de Almeida – UFF, Suplente
_____________________________________________________
Profa. Dra. Cláudia de Souza Cunha – UFRJ, Suplente
Rio de Janeiro
Fevereiro de 2008
iii
Stein, Cirineu Cecote.
A Pré-Indicação Prosódica para as Orações Subordinadas Adverbiais no
Português Brasileiro e no Francês/ Cirineu Cecote Stein. - Rio de
Janeiro:UFRJ/ CLA, 2008.
xviii, 253f.:il.; 31 cm.
Orientador: João Antônio de Moraes
Tese (doutorado) – UFRJ / CLA/ Programa de Pós-graduação em Letras
Vernáculas, 2008.
Referências Bibliográficas: f. 237-244.
1. Pré-Indicação Prosódica. 2. Interface Prosódia-Sintaxe. I. Moraes, João
Antônio de. II. Universidade Federal do Rio de Janeiro, Faculdade de
Letras. III. Título.
iv
RECONHECIMENTOS
Embora o trabalho de doutoramento seja essencialmente solitário – em especial os momentos de
escritura –, permanece a minha alegria em ter podido contar, ao longo de quatro anos, com a
preciosa ajuda de algumas pessoas que cederam seu espaço e seu tempo profissionais e pessoais
à concretização desta pesquisa. Assim, gostaria de dirigir meus sinceros reconhecimentos
- ao meu orientador, João Antônio de Moraes, com quem muito aprendi, quer no âmbito
intelectual quer no âmbito pessoal, e à Carmen Moraes, por toda a extrema gentileza e
compreensão quando atendia minhas chamadas telefônicas diurnas e noturnas (a maioria delas),
permitindo que eu retirasse seu esposo do convívio familiar para sanar minhas dúvidas, sempre
urgentes;
- à Cláudia Cunha, que me cedeu sua sempre boa vontade e sua bela voz para as inúmeras
gravações necessárias ao longo desta pesquisa;
- à Mônica Nobre e à Maria Mirtis Caser, que não mediram esforços para, estando eu em Paris,
aplicarem um novo teste de percepção junto aos seus alunos e aos de outros professores, nas
Universidades Federais do Rio de Janeiro e do Espírito Santo. A ambas, o carinho da amizade e
o constante agradecimento;
- à Aparecida Lino, à Dinah Callou, à Myrian Freitas, à Mônica Orsini e, mais uma vez, à
Cláudia Cunha, à Mônica Nobre e ao João Moraes, que sempre disponibilizaram suas aulas e
seus alunos para que eu aplicasse os testes perceptivos necessários a esta pesquisa;
- aos alunos das Faculdades de Letras das Universidades Federais do Rio de Janeiro e do Espírito
Santo, que sempre se mostraram gentis e receptivos aos meus inúmeros testes perceptivos;
- ao Marcus Maia, que não mediu esforços e gentilezas para uma co-orientação em uma possível
prosódia implícita que, infelizmente, não foi possível confirmar no âmbito desta pesquisa e que,
assim, não integra estas páginas;
v
- à Annie Rialland, ao Bernard Gautheron, à Coralie Vincent, à Cécile Fougeron, à Jacqueline
Vaissière, de Paris III, e ao Philippe Martin, de Paris VII, cujos ensinamentos e convivência
agregaram imensa valia a este doutoramento;
- aos meus colegas do Institut de Phonétique, da Universidade de Paris III, a quem desejo
representar na figura da Aline Santiago, pessoa cuja grandiosidade de espírito supera
enormemente todas as expectativas comuns;
- à agência CAPES, que, além de ter financiado estes quatro anos de pesquisa, também
possibilitou minha estada no Institut de Phonétique da Université de Paris III – Sorbonne
Nouvelle, em Paris, de maio de 2006 a abril de 2008 (processo n. 4431/05-7).
vi
SINOPSE
A confirmação do fenômeno preditivo
prosódico no português brasileiro, em sua
variedade carioca, e no francês falado na
França, em sua variedade parisiense. A
caracterização dos contornos prosódicos
identificadores da pré-indicação de orações
subordinadas adverbiais no português
brasileiro, a partir de dois contornos
principais da F0.
vii
RESUMO
A PRÉ-INDICAÇÃO PROSÓDICA PARA AS ORAÇÕES SUBORDINADAS
ADVERBIAIS NO PORTUGUÊS BRASILEIRO E NO FRANCÊS
Cirineu Cecote Stein
Orientador: João Antônio de Moraes
Resumo da Tese de Doutorado submetida ao Programa de Pós-graduação em Letras
Vernáculas, Faculdade de Letras, da Universidade Federal do Rio de Janeiro – UFRJ, como parte
dos requisitos necessários à obtenção do título de Doutor em Língua Portuguesa.
A pré-indicação prosódica corresponde à possibilidade de a melodia vocal sugerir, além de
informações sintáticas, pistas que transmitem ao ouvinte informações adicionais sobre o que virá
a ser enunciado. Esta pesquisa objetiva: 1. confirmar a existência do fenômeno preditivo no
português brasileiro (PB) e no francês; 2. identificar, em duas orações principais, os
comportamentos específicos dos componentes prosódicos responsáveis pelo valor pré-indicativo
das nove subcategorias elencadas pela gramática tradicional para as orações subordinadas
adverbiais (causa, comparação, concessão, conformidade, condição, conseqüência, finalidade,
proporção, tempo). Foram realizados dois testes perceptivos. O primeiro, cujo objetivo foi
verificar quais das nove subcategorias seriam mais claramente reconhecidas pré-indicativamente,
evidenciou seis contornos prosódicos para o PB: causa, conseqüência, finalidade (caracterizados
pelo movimento ascendente da F0 a partir da sílaba tônica final), conformidade, concessão e
tempo (caracterizados pelo movimento descendente da F0 a partir da sílaba tônica final); mas
nenhum de forma significativa para o francês. O segundo teste foi realizado a partir da ressíntese
de uma versão neutra e de uma versão monotônica das duas orações principais para o PB,
manipulando-se a duração e a F0. Foi possível isolar os componentes prosódicos responsáveis
por cada uma das pré-indicações, mensurando suas variações. De todas as ressínteses efetuadas,
selecionaram-se duas para cada subcategoria. Foi possível identificar uma delas, em cada
subcategoria, como mais representativa de cada uma das pré-indicações.
Palavras-chave: Prosódia, pré-indicação prosódica, predição prosódica, contorno prosódico,
orações adverbiais, sintaxe.
Rio de Janeiro
Fevereiro de 2008
viii
ABSTRACT
PROSODIC PRE-INDICATION FOR SUBORDINATE ADVERBIAL CLAUSES IN
BRAZILIAN PORTUGUESE AND IN FRENCH
Cirineu Cecote Stein
Orientador: João Antônio de Moraes
Abstract da Tese de Doutorado submetida ao Programa de Pós-graduação em Letras
Vernáculas, Faculdade de Letras, da Universidade Federal do Rio de Janeiro – UFRJ, como parte
dos requisitos necessários à obtenção do título de Doutor em Língua Portuguesa.
Prosodic pre-indication refers to the possibility of the voice melody to suggest, besides syntactic
information, some cues which will present the listener with additional information concerning
what is about to be said in the following sentence. This research aims at: 1. validate the
predictive phenomenon existence in Brazilian Portuguese (BP) and in French; 2. identify, in two
main clauses, the specific behavior of the prosodic components responsible for the pre-indicative
value of the nine subcategories listed by traditional grammar, concerning the subordinate
adverbial clauses (cause, comparison, concession, conformity, condition, consequence, finality,
proportion, and temporality). Two perceptive tests were produced. The first one, whose goal was
to identify which of the nine subcategories would be more clearly recognized pre-indicatively,
evidenced six prosodic contours for BP: cause, consequence, finality (all of them characterized
by an ascending F0 movement from the final stressed syllable on), conformity, concession, and
time (all of them characterized by a descending F0 movement from the final stressed syllable
on); but none significantly for French. The second test was produced with the resyntheses of a
neutral and a monotonous versions of two main clauses for BP. The durational and F0 values
were manipulated. It was possible to isolate the prosodic components responsible for each of the
pre-indications, measuring their variations. Among all of the resyntheses produced, two were
selected for each subcategory. It was possible to identify one of them, for each subcategory, as a
better representative of each of the pre-indications.
Key-words: Prosody, prosodic pre-indication, prosodic prediction, prosodic contour, adverbial
clauses, sintax.
Rio de Janeiro
February, 2008
ix
RESUME
LA PRE-INDICATION PROSODIQUE POUR LES PROPOSITIONS SUBORDONNEES
ADVERBIALES DANS LE PORTUGAIS BRESILIEN ET DANS LE FRANÇAIS
Cirineu Cecote Stein
Orientador: João Antônio de Moraes
Résumé da Tese de Doutorado submetida ao Programa de Pós-graduação em Letras
Vernáculas, Faculdade de Letras, da Universidade Federal do Rio de Janeiro – UFRJ, como parte
dos requisitos necessários à obtenção do título de Doutor em Língua Portuguesa.
La pré-indication prosodique correspond à la possibilité de la mélodie vocale suggérer, au-delà
des pistes syntaxiques, des pistes qui transmettent à l‟écouteur des informations additionnelles
sur ça qui sera énoncé. Cette recherche a pour but : 1. Confirmer l‟existence du phénomène
prédictif dans le portugais brésilien (PB) e dans le français ; 2. Identifier, dans deux propositions
principales, les comportements spécifiques des composants prosodiques responsables pour la
valeur pré-indicative des neuf sous-catégories énumérées par la grammaire traditionnelle pour les
propositions subordonnées adverbiales (cause, comparaison, concession, conformité, condition,
conséquence, but, proportion, temps). Deux tests perceptifs ont été réalisés. Le premier, dont le
but était vérifier lesquelles des neuf sous-catégories seraient clairement reconnues pré-
indicativement, a mis en évidence six contours prosodiques pour le PB : cause, conséquence, but
(caractérisés par le mouvement ascendant de la F0 à partir de la syllabe tonique finale),
conformité, concession et temps (caractérisés par le mouvement descendant de la F0 à partir de
la syllabe tonique finale) ; mais aucune reconnaissance significative a été établie pour le français.
Le deuxième test a été produit à partir de la resynthèse d‟une version neutre et d‟une version
monotonique des deux propositions principales pour le PB, en manipulant leur durée et leur F0.
C‟était possible isoler les composants prosodiques responsables pour chacune des pré-
indications, et faire la mensuration de ses variations. Parmi toutes les resynthèses produites, deux
ont été sélectionnées pour chaque sous-catégorie. C‟était possible identifier une, dans chaque
sous-catégorie, comme la plus représentative de chaque pré-indication.
Mots-clés : Prosodie, pré-indication prosodique, prédiction prosodique, contour prosodique,
propositions adverbiales, syntaxe.
Rio de Janeiro
Février, 2008
x
Sumário
LISTA DE SIGLAS E ABREVIATURAS .............................................................................. XIII
LISTA DE FIGURAS ............................................................................................................... XIV
LISTA DE TABELAS ........................................................................................................... XVIII
0. INTRODUÇÃO ......................................................................................................................... 1
1. REVISÃO BIBLIOGRÁFICA .................................................................................................. 8
1.1 OS ASPECTOS GRAMATICAIS ............................................................................................. 14
1.2 OS CONTORNOS PROSÓDICOS ............................................................................................ 21 1.3 A RELAÇÃO ORAÇÃO PRINCIPAL – ORAÇÃO SUBORDINADA ................................................ 36
1.4 A PRÉ-INDICAÇÃO ............................................................................................................ 41
2. AS RELAÇÕES DE COORDENAÇÃO E DE SUBORDINAÇÃO ...................................... 52
3. OS MODELOS ENTONATIVOS ........................................................................................... 64
3.1 ALGUMAS CARACTERÍSTICAS DO SISTEMA ENTONACIONAL DO FRANCÊS ............................ 72
3.2. ALGUMAS CARACTERÍSTICAS DO SISTEMA ENTONACIONAL DO PORTUGUÊS ....................... 81
4. METODOLOGIA .................................................................................................................... 90
4.1 A FORMAÇÃO DO CORPUS PARA O PB ................................................................................ 91 4.2 A FORMAÇÃO DO CORPUS PARA O FR ................................................................................ 95
4.3 TESTE 1 ........................................................................................................................... 99 4.3.1 O Teste 1 para o PB ......................................................................................................99
4.3.2 O Teste 1 para o FR .................................................................................................... 102 4.4 O PROCESSO DE RESSÍNTESE .......................................................................................... 103
4.5 TESTE 2 ......................................................................................................................... 108 4.6 PROSOGRAMAS .............................................................................................................. 110
5. DESCRIÇÃO E ANÁLISE DOS RESULTADOS DO TESTE 1 ........................................ 111
5.1. OS RESULTADOS PARA O PB .......................................................................................... 111
5.1.1 Cruzamentos a partir da subcategoria causal.............................................................. 112 5.1.2 Cruzamentos a partir da subcategoria comparativa .................................................... 114
5.1.3 Cruzamentos a partir da subcategoria concessiva ....................................................... 116 5.1.4 Cruzamentos a partir da subcategoria condicional ..................................................... 118
5.1.5 Cruzamentos a partir da subcategoria conformativa ................................................... 120 5.1.6 Cruzamentos a partir da subcategoria consecutiva ..................................................... 121
5.1.7 Cruzamentos a partir da subcategoria final................................................................. 123 5.1.8 Cruzamentos a partir da subcategoria proporcional ................................................... 124 5.1.9 Cruzamentos a partir da subcategoria temporal .......................................................... 125
5.2. OS RESULTADOS PARA O FR .......................................................................................... 126 5.2.1 Cruzamentos a partir da subcategoria causal.............................................................. 127
5.2.2 Cruzamentos a partir da subcategoria comparativa .................................................... 128 5.2.3 Cruzamentos a partir da subcategoria concessiva ....................................................... 129
5.2.4 Cruzamentos a partir da subcategoria condicional ..................................................... 130 5.2.5 Cruzamentos a partir da subcategoria conformativa ................................................... 131
5.2.6 Cruzamentos a partir da subcategoria consecutiva ..................................................... 131 5.2.7 Cruzamentos a partir da subcategoria final................................................................. 132
5.2.8 Cruzamentos a partir da subcategoria proporcional ................................................... 133
xi
5.2.9 Cruzamentos a partir da subcategoria temporal .......................................................... 134
5.2.10 Considerações sobre o resultado para o FR .............................................................. 135 5.3. CRITÉRIOS DE SELEÇÃO DOS CANDIDATOS A CONTORNOS PRÉ-INDICATIVOS .................... 136
6. O PROCESSO DE RESSÍNTESE ........................................................................................ 139
RESSÍNTESE DAS ORAÇÕES PRINCIPAIS 1 .............................................................................. 144
6.1. RESSÍNTESE DAS OPS 1 NEUTRAS COM F0 ASCENDENTE ................................................ 144 6.1.1 Pré-indicação consecutiva .......................................................................................... 144
6.1.2. Pré-indicação causal.................................................................................................. 146 6.1.3. Pré-indicação final..................................................................................................... 148
6.2. RESSÍNTESE DAS OPS 1 NEUTRAS COM F0 DESCENDENTE .............................................. 150 6.2.1. Pré-indicação concessiva ........................................................................................... 150
6.2.2. Pré-indicação conformativa ....................................................................................... 153 6.2.3. Pré-indicação temporal .............................................................................................. 156
6.3. RESSÍNTESE DAS OPS 1 MONOTÔNICAS COM F0 ASCENDENTE ....................................... 159 6.3.1. Pré-indicação consecutiva ......................................................................................... 159
6.3.2. Pré-indicação causal.................................................................................................. 160 6.3.3. Pré-indicação final..................................................................................................... 162
6.4. RESSÍNTESE DAS OPS 1 MONOTÔNICAS COM F0 DESCENDENTE ...................................... 164 6.4.1. Pré-indicação concessiva ........................................................................................... 164
6.4.2. Pré-indicação conformativa ....................................................................................... 165 6.4.3. Pré-indicação temporal .............................................................................................. 167
RESSÍNTESE DAS ORAÇÕES PRINCIPAIS 2 .............................................................................. 169 6.5. RESSÍNTESE DAS OPS 2 NEUTRAS COM F0 ASCENDENTE ................................................ 170
6.5.1. Pré-indicação consecutiva ......................................................................................... 170 6.5.2. Pré-indicação causal.................................................................................................. 172
6.5.3. Pré-indicação final..................................................................................................... 174 6.6. RESSÍNTESE DAS OPS 2 NEUTRAS COM F0 DESCENDENTE .............................................. 175
6.6.1. Pré-indicação concessiva ........................................................................................... 175 6.6.2. Pré-indicação conformativa ....................................................................................... 177
6.6.3. Pré-indicação temporal .............................................................................................. 178 RESSÍNTESE DA OP 2 MONOTÔNICA ...................................................................................... 180
6.7. RESSÍNTESE DAS OPS 2 MONOTÔNICAS COM F0 ASCENDENTE ....................................... 181 6.7.1. Pré-indicação consecutiva ......................................................................................... 181
6.7.2. Pré-indicação causal.................................................................................................. 182 6.7.3. Pré-indicação final..................................................................................................... 184
6.8. RESSÍNTESE DAS OPS 2 MONOTÔNICAS COM F0 DESCENDENTE ...................................... 186 6.8.1. Pré-indicação concessiva ........................................................................................... 186
6.8.2. Pré-indicação conformativa ....................................................................................... 187 6.8.3. Pré-indicação temporal .............................................................................................. 189
7. DESCRIÇÃO E ANÁLISE DOS RESULTADOS DO TESTE 2 ........................................ 191
7.1 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CAUSAL ..................................................... 192
7.1.1 OP 1 ressintetizada para a pré-indicação de causa ..................................................... 193 7.1.2 OP 2 ressintetizada para a pré-indicação de causa ..................................................... 194
7.1.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação causal195 7.2. CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONCESSIVA ............................................. 201
7.2.1 OP 1 ressintetizada para a pré-indicação de concessão .............................................. 202 7.2.2 OP 2 ressintetizada para a pré-indicação de concessão .............................................. 203
7.2.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação
concessiva ................................................................................................................... 203
xii
7.3 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONFORMATIVA ......................................... 206
7.3.1 OP 1 ressintetizada para a pré-indicação de conformidade ......................................... 207 7.3.2 OP 2 ressintetizada para a pré-indicação de conformidade ......................................... 207
7.3.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação
conformativa ............................................................................................................... 208
7.4 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONSECUTIVA ............................................ 210 7.4.1 OP 1 ressintetizada para a pré-indicação de conseqüência ......................................... 211
7.4.2 OP 2 ressintetizada para a pré-indicação de conseqüência ......................................... 212 7.4.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação
consecutiva .................................................................................................................. 212 7.5 CRUZAMENTOS A PARTIR DA SUBCATEGORIA FINAL ........................................................ 214
7.5.1 OP 1 ressintetizada para a pré-indicação de finalidade .............................................. 216 7.5.2 OP 2 ressintetizada para a pré-indicação de finalidade .............................................. 217
7.5.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação final .. 217 7.6 CRUZAMENTOS A PARTIR DA SUBCATEGORIA TEMPORAL ................................................. 220
7.6.1 OP 1 ressintetizada para a pré-indicação de temporalidade........................................ 221 7.6.2 OP 2 ressintetizada para a pré-indicação de temporalidade........................................ 222
7.6.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação
temporal ...................................................................................................................... 222
7.7 CRITÉRIOS PARA ESCOLHA DAS RESSÍNTESES REPRESENTATIVAS DOS PADRÕES PROSÓDICOS
PRÉ-INDICATIVOS ........................................................................................................... 224
8. CONCLUSÃO ....................................................................................................................... 227
9. ÍNDICE ANALÍTICO ........................................................................................................... 233
10. REFERÊNCIAS BIBLIOGRÁFICAS ................................................................................ 237
11. ANEXOS .............................................................................................................................. 245
xiii
LISTA DE SIGLAS E ABREVIATURAS
PB português brasileiro
FR francês falado na França
OP oração principal
OSAdv oração subordinada adverbial
F0 freqüência fundamental
C consoante
caus causal
comp comparativa
conces concessiva
condic condicional
confor conformativa
consec consecutiva
propor proporcional
STF sílaba tônica final
VPreTF vogal pré-tônica final
SPTF sílaba pré-tônica final
VR valor de referência
LR linha de referência
SAPreTF sílaba anterior à sílaba pré-tônica final
VTF vogal tônica final
V vogal
xiv
LISTA DE FIGURAS
Figura 0.1 – Entonação de “o seu trabalho é bom” sugerindo um elogio, 5
Figura 0.2 – Entonação de “o seu trabalho é bom”, a que será acrescentada uma ressalva, 5
Figura 1.1 – As cinco regras adicionais sugeridas por Stockwell (1960, citado por Fox
2000:282) para aprimoramento da proposta fonológica da Gramática Gerativa proposta por
Chomsky (1957), 14
Figuras 1.2 e 1.3 – Contorno da F0 de elocuções contendo apenas tons H e tons H e L no iorubá
(conseqüentemente, com downstep), 49
Figura 1.4 – Contornos da F0 de elocuções com dois a cinco downsteps sobrepostos à linha de
regressão das elocuções contendo apenas tons H, para um dos falantes dagará (Rialland,
2001:305), 50
Figura 3.1 – O “contorno nananère” aplicado à frase Bien sûr que j'te crois, Marie va arriver
(Claro que eu acredito em você, Maria vai chegar) (Marandin, 2004), 77
Figura 3.2 – A continuação maior agrupando várias continuações menores em uma unidade
maior (Portes, 2005), 79
Figura 3.3 – Asserção ascendente comprometendo o locutor, mas não seu alocutário (Beyssade
e Marandin, 2007), 80
Figura 3.4 – Esquema geral dos contornos finais para o francês, segundo Beyssade e Marandin
(2007), 81
Figura 4.1 – Freqüência fundamental das OPs 1 – Ficava infeliz – para o PB, 94
Figura 4.2 – Freqüência fundamental das OPs 2 – Mostrava-se cansado – para o PB, 95
Figura 4.3 – Freqüência fundamental das OPs 1 – il est ennuyé – para o FR, 98
Figura 4.4 – Freqüência fundamental das OPs 2 – il se montre irritable – para o FR, 99
Figura 4.5 – Modelo gráfico para aplicação do Teste 1 no PB, 101
Figura 4.6 – Modelo gráfico para aplicação do Teste 1 no FR, 103
Figura 4.7– Freqüência fundamental e alinhamento das orações principais neutras, 105
Figura 4.8 – Modelo gráfico para aplicação do Teste 2, 109
Figura 5.1 – Freqüência fundamental e alinhamento das OPs 1 causal e consecutiva de
referência – Ficava infeliz – para o PB, 113
Figura 6.1 – Diagramação visual do valor de referência (VR), da linha de referência (LR) e da
elevação da F0 acima da LR, a partir da OP 1 consecutiva de referência, 141
Figura 6.2 – Processo de ressíntese (6.1.1.3.i) da OP 1 neutra para a pré-indicação consecutiva,
145
Figura 6.3 – Processo de ressíntese (6.1.1.4) da OP 1 neutra para a pré-indicação consecutiva,
146
Figura 6.4 – Processo de ressíntese (6.1.2.3.i) da OP 1 neutra para a pré-indicação causal, 147
Figura 6.5 – Processo de ressíntese (6.1.2.4) da OP 1 neutra para a pré-indicação causal, 148
Figura 6.6 – Processo de ressíntese (6.1.3.2.i) da OP 1 neutra para a pré-indicação final, 150
xv
Figura 6.7 – Processo de ressíntese (6.1.3.3) da OP 1 neutra para a pré-indicação final, 150
Figura 6.8 – Diagramação visual para cálculo da variação da F0 na concavidade formada na
VTF da OP 1 concessiva de referência, 151
Figura 6.9 – Processo de ressíntese (6.2.1.1) da OP 1 neutra para a pré-indicação concessiva,
153
Figura 6.10 – Processo de ressíntese (6.2.1.2.b) da OP 1 neutra para a pré-indicação concessiva,
153
Figura 6.11 – Processo de ressíntese (6.2.2.1) da OP 1 neutra para a pré-indicação conformativa,
155
Figura 6.12 – Processo de ressíntese (6.2.2.2.d) da OP 1 neutra para a pré-indicação
conformativa, 156
Figura 6.13 – Processo de ressíntese (6.2.3.2) da OP 1 neutra para a pré-indicação temporal, 158
Figura 6.14 – Processo de ressíntese (6.2.3.3) da OP 1 neutra para a pré-indicação temporal, 158
Figura 6.15 – Processo de ressíntese (6.3.1.3.i) da OP 1 monotônica para a pré-indicação
consecutiva, 160
Figura 6.16 – Processo de ressíntese (6.3.1.4) da OP 1 monotônica para a pré-indicação
consecutiva, 160
Figura 6.17 – Processo de ressíntese (6.3.2.3.i) da OP 1 monotônica para a pré-indicação causal,
161
Figura 6.18 – Processo de ressíntese (6.3.2.4) da OP 1 monotônica para a pré-indicação causal,
162
Figura 6.19 – Processo de ressíntese (6.3.3.3.g) da OP 1 monotônica para a pré-indicação final,
163
Figura 6.20 – Processo de ressíntese (6.3.3.4) da OP 1 monotônica para a pré-indicação final,
164
Figura 6.21 – Processo de ressíntese (6.4.1.1) da OP 1 monotônica para a pré-indicação
concessiva, 165
Figura 6.22 – Processo de ressíntese (6.4.1.2.b) da OP 1 monotônica para a pré-indicação
concessiva, 165
Figura 6.23 – Processo de ressíntese (6.4.2.1) da OP 1 monotônica para a pré-indicação
conformativa, 166
Figura 6.24 – Processo de ressíntese (6.4.2.2.d) da OP 1 monotônica para a pré-indicação
conformativa, 167
Figura 6.25 – Processo de ressíntese (6.4.3.2) da OP 1 monotônica para a pré-indicação
temporal, 168
Figura 6.26 – Processo de ressíntese (6.4.3.3) da OP 1 monotônica para a pré-indicação
temporal, 168
Figura 6.27 – Processo de ressíntese (6.4.3.3) da OP 1 monotônica para a pré-indicação
temporal, 170
Figura 6.28 – Processo de ressíntese (6.5.1.3.i) da OP 2 neutra para a pré-indicação consecutiva,
171
xvi
Figura 6.29 – Processo de ressíntese (6.5.1.4) da OP 2 neutra para a pré-indicação consecutiva,
172
Figura 6.30 – Processo de ressíntese (6.5.2.3.f) da OP 2 neutra para a pré-indicação causal, 173
Figura 6.31 – Processo de ressíntese (6.5.2.4) da OP 2 neutra para a pré-indicação causal, 173
Figura 6.32 – Processo de ressíntese (6.5.3.5.c) da OP 2 neutra para a pré-indicação final, 175
Figura 6.33 – Processo de ressíntese (6.5.3.6) da OP 2 neutra para a pré-indicação final, 175
Figura 6.34 – Processo de ressíntese (6.6.1.1) da OP 2 neutra para a pré-indicação concessiva,
176
Figura 6.35 – Processo de ressíntese (6.6.1.2.b) da OP 2 neutra para a pré-indicação concessiva,
177
Figura 6.36 – Processo de ressíntese (6.6.2.1) da OP 2 neutra para a pré-indicação conformativa,
178
Figura 6.37 – Processo de ressíntese (6.6.2.2.d) da OP 2 neutra para a pré-indicação
conformativa, 178
Figura 6.38 – Processo de ressíntese (6.6.3.2) da OP 2 neutra para a pré-indicação temporal, 180
Figura 6.39 – Processo de ressíntese (6.6.3.4) da OP 2 neutra para a pré-indicação temporal, 180
Figura 6.40 – Processo de ressíntese (6.7.1.3.g) da OP 2 monotônica para a pré-indicação
consecutiva, 182
Figura 6.41 – Processo de ressíntese (6.7.1.4) da OP 2 monotônica para a pré-indicação
consecutiva, 182
Figura 6.42 – Processo de ressíntese (6.7.2.3.f) da OP 2 monotônica para a pré-indicação causal,
183
Figura 6.43 – Processo de ressíntese (6.7.2.4) da OP 2 monotônica para a pré-indicação causal,
184
Figura 6.44 – Processo de ressíntese (6.7.3.5.c) da OP 2 monotônica para a pré-indicação final,
185
Figura 6.45 – Processo de ressíntese (6.7.3.6) da OP 2 monotônica para a pré-indicação final,
186
Figura 6.46 – Processo de ressíntese (6.8.1.1) da OP 2 monotônica para a pré-indicação
concessiva, 187
Figura 6.47 – Processo de ressíntese (6.8.1.2.b) da OP 2 monotônica para a pré-indicação
concessiva, 187
Figura 6.48 – Processo de ressíntese (6.8.2.1) da OP 2 monotônica para a pré-indicação
conformativa, 188
Figura 6.49 – Processo de ressíntese (6.8.2.2.d) da OP 2 monotônica para a pré-indicação
conformativa, 189
Figura 6.50 – Processo de ressíntese (6.8.3.2) da OP 2 monotônica para a pré-indicação
temporal, 190
Figura 6.51 – Processo de ressíntese (6.8.3.4) da OP 2 monotônica para a pré-indicação
temporal, 190
Figura 7.1 – Prosogramas para as OPs 1 de referência, 199
xvii
Figura 7.2 – Prosogramas para as OPs 2 de referência, 200
Figura 8.1 – Representação esquemática dos contornos prosódicos pré-indicativos de
consequência, de causa e de finalidade, para o PB, 229
Figura 8.2 – Representação esquemática dos contornos prosódicos pré-indicativos de
concessão, de conformidade e de tempo, para o PB, 231
xviii
LISTA DE TABELAS
Tabela 3.1 – Os dez contornos para o francês definidos por Delattre (1966), 72
Tabela 4.1 – Orações principais e subordinadas adverbiais utilizadas como base para a
formação do corpus para o PB, 92
Tabela 4.2 – Orações principais e subordinadas adverbiais utilizadas como base para a
formação do corpus para o FR, 96
Tabela 5.1 – Resultados de um Teste Chi2 para o cruzamento, no Teste 1, entre as 9
subcategorias de OPs 1 para o PB, 111
Tabela 5.2 – Resultados de um Teste Chi2 para o cruzamento, no Teste 1, entre as 9
subcategorias de OPs 2 para o PB, 112
Tabela 5.3 – Resultados de um Teste Chi2 para o cruzamento entre as 9 subcategorias de OPs 1
para o FR, 127
Tabela 5.4 – Resultados de um Teste Chi2 para o cruzamento entre as 9 subcategorias de OPs 2
para o FR, 127
Tabela 5.5 – Sobreposição dos resultados significativos dos cruzamentos, no Teste 1, da OP2
aos da OP1 para o PB, 137
Tabela 5.6 – Sobreposição dos resultados significativos dos cruzamentos, no Teste 1, da OP2
aos da OP1 para o FR, 138
Tabela 7.1 – Resultados obtidos a partir de um Teste T pareado, indicando que os números
totais de reconhecimento das ressínteses a e b não são significativamente distintos, 192
Tabela 7.2 – Resultados de um Teste Chi2 para a subcategoria causal, a partir do cruzamento
das ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 193
Tabela 7.3 – Resultados de um Teste Chi2 para a subcategoria concessiva, a partir do
cruzamento das ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 202
Tabela 7.4 – Resultados de um Teste Chi2 para a subcategoria conformativa, a partir do
cruzamento das ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 207
Tabela 7.5 – Resultados de um Teste Chi2 para a subcategoria consecutiva, a partir do
cruzamento das ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 211
Tabela 7.6 – Resultados de um Teste Chi2 para a subcategoria final, a partir do cruzamento das
ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 216
Tabela 7.7 – Resultados de um Teste Chi2 para a subcategoria temporal, a partir do cruzamento
das ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 221
1
0. INTRODUÇÃO
Os estudos lingüísticos, assim como freqüentemente ocorre em outras áreas, não
conseguiram escapar a uma tendência comum: em uma ciência, quando um elemento bastante
significativo é descoberto, não é raro que todas as atenções se voltem para ele. Ainda que tal
atitude seja plenamente justificável, quer pelo interesse prático da descoberta, quer pela
possibilidade de resolução de inúmeros outros pontos até então obscuros, há um custo científico
muito grande em relação aos aspectos globais da ciência em questão: outros pontos passam a
merecer menor atenção.
A implicação direta desse tipo de procedimento é, por vezes, o avanço menos rápido da
pesquisa científica em determinadas áreas. Uma teoria pode ser responsável por uma
reformulação completa de paradigmas historicamente instituídos, como o que ocorreu com a
Teoria da Relatividade ou com a Teoria da Gramática Gerativa. No entanto, um conjunto
considerável dentro do universo dos pesquisadores acaba se dedicando exclusivamente a um
único aspecto que, de uma forma ou de outra, recebeu mais foco dentro da nova teoria. Como
decorrência, coloca-se em segundo plano a pesquisa de outros pontos que, num primeiro
momento, pareceriam secundários mas que, ao longo da evolução da ciência em questão, acabam
por se mostrar decisivos na explicação de inúmeros processos. O que ocorre na Lingüística,
grosso modo, não é muito diferente disso.
É inquestionável a importância que os estudos sintáticos, a partir da Gramática Gerativa,
tiveram no desenvolvimento da pesquisa lingüística. A sintaxe se revelou um esqueleto
extremamente bem organizado, capaz de sustentar, em sua estruturação, toda uma série de
configurações (de várias ordens) para a constituição do processo lingüístico como um todo.
Apenas para manter as metáforas no campo biológico, o que veio a acontecer foi a atribuição do
status de “cérebro” à sintaxe. Se é possível que ela sozinha detenha tal importância, ou a
compartilhe com outros “órgãos”, caberá à pesquisa futura estabelecer. O que parece já aceito
dentro da comunidade dos lingüistas é o fato de a sintaxe não se mostrar determinante em todos
os processos lingüísticos, mesmo no conjunto dos de importância primeira no processamento
cognitivo. Alguns pesquisadores já chegam a considerar o culto estabelecido à autonomia da
sintaxe como uma verdadeira aberração (Anderson, 2005).
Os estudos prosódicos, tradicionalmente, foram categorizados na esfera do
paralingüístico – considerados, portanto, de segunda linha. Alguns pontos bastante significativos
já foram elucidados, principalmente no conjunto das expressões de afetividade, embora, pelo
2
menos ao que consta até o momento, não se tenha conseguido, por exemplo, um processo de
síntese vocal capaz de explorar essa dimensão cognitiva de forma satisfatória. Evidentemente,
cabe aos engenheiros dedicados ao estabelecimento dessa tecnologia o desenvolvimento desses
meios, mas é indispensável que o aparato lingüístico os sustente de forma sólida.
Nos momentos iniciais da Gramática Gerativa, a relação entre as unidades entonacionais
e as unidades sintáticas era vista como um fenômeno de performance. A evolução se deu quanto
a serem essas unidades governadas por regras, ainda que não em relação de igualdade. E, numa
postura mais extrema, Selkirk (1984) chega a defender um nível independente para a estrutura
entonacional na gramática. Percebe-se, com isso, a reação adversa à preponderância da sintaxe
nos estudos gerativos. Historicamente, na evolução das ciências, esse movimento entre os
extremos parece necessário para o estabelecimento de um meio termo mais ponderado.
O fato de alguns fenômenos lingüísticos se explicarem exclusivamente pela sintaxe ou
exclusivamente pela prosódia (como ocorre na desambigüização de algumas sentenças) não
implica, necessariamente, a autonomia de uma ou de outra. Embora tanto a sintaxe quanto a
prosódia desempenhem funções específicas à sua natureza, o resultado do processamento
lingüístico parece se dar com a interação entre as duas (que, por sua vez, interagem com outros
componentes, como o semântico). Ladd (1978) é um dos primeiros a reconhecer essa interação.
Posteriormente (1996), com a Linguist’s Theory of Intonational Meaning, defende que os
elementos da entonação apresentam significado, sem necessariamente estarem dissociados da
sintaxe. Steedman (1991) também questiona a independência da sintaxe, assumindo uma
representação sintática mais flexível.
O interesse deste trabalho está centrado na área da prosódia, buscando identificar
comportamentos melódicos lingüísticos (em oposição aos paralingüísticos) específicos. Mais
exatamente, na possibilidade de ela ser um fator preditivo ao longo de uma elocução. Isso
implica assumir, por conseguinte, a existência de estruturas prosódicas. Ladd (1978:517) indica
que, desde Pike (1945), tem-se prestado atenção, por exemplo, a um contorno que normalmente
é considerado como uma entonação especial de “chamamento” ou “vocativo”. Esse contorno foi
descrito como um “canto falado”, por Pike; como um “canto vocativo”, por Liberman (1975) e
Leben (1976); e por Gibbon (1976), simplesmente como um tipo de contorno numa seção
intitulada “Chamamentos”. Como Ladd (520) sugere, todos esses rótulos têm uma sensação de
uso cotidiano, mesmo doméstico, como se o fenômeno rotulado fizesse parte de uma troca
estereotipada, algo como “Nada que você não pudesse ter antecipado”. No entanto, mesmo que
Ladd não concorde com a idéia de se tratar essencialmente de uma entonação apelativa,
3
preferindo analisá-la como uma entonação “estilizada” cuja função é assinalar um certo elemento
de previsibilidade ou estereótipo na mensagem, permanece a noção da existência de
determinadas estruturas prosódicas (dir-se-á “contornos prosódicos”) responsáveis por transmitir
informações específicas. Ao que parece, a criação de uma estrutura entonativa se dá pela relação
que partes de um contorno entonativo estabelecem entre si, o que induziria ao questionamento
sobre a significância da escolha de uma determinada estrutura entonacional dentro de um
contexto discursivo (Fox, 1984).
A postura assumida aqui (na mesma linha de Ladd, 1998) é a de que o fenômeno
prosódico deve ser analisado em duas esferas distintas: a do lingüístico e a do paralingüístico.
Nesta última, estaria parte de toda a fenomenologia relacionada à manifestação das atitudes e das
emoções veiculadas pelo locutor, num determinado contexto comunicativo. Assim, uma
expressão de raiva, considerada na esfera paralingüística, pode ser produzida em uma sentença
declarativa ou em uma sentença interrogativa, ambas caracterizadas a partir de contornos
melódicos específicos, constituídos na esfera do lingüístico. Essas variações melódicas são
decorrência da própria natureza idiossincrática que a entonação assume ao ser realizada por
diversos locutores. No entanto, isso não significa dizer que não seja possível identificar uma
configuração prosódica relativamente constante para a expressão paralingüística, o que
aproximaria os aspectos dessa fenomenologia da expressão lingüística.
Admitida a possibilidade de estabelecimento de contornos prosódicos, a expectativa é a
de que a aplicação de um dado contorno permita ao ouvinte, em alguns casos, prever como a
sentença será complementada pelo locutor. Fox (1984) sugere esse fenômeno a partir da
caracterização de grupos tonais aparentemente independentes, que formam estruturas
incompletas a serem completadas pelo interlocutor. Como será discutido (seção 1.4), uma
hipótese para o contorno ascendente comum às sentenças interrogativas totais é ser ele parte de
uma estrutura maior, que seria completada pela resposta. Uma outra possibilidade de pré-
indicação, sugerida por Fónagy e Galvany (1974, citado por Moraes 1998), é a de que
marcadores melódicos situados nas sílabas iniciais de uma enunciação antecipariam a
modalidade da elocução, indicando tratar-se, por exemplo, de uma interrogativa. O fenômeno
preditivo torna-se bastante explícito, como comenta Grosjean (1983), a partir dos cortes feitos
durante a edição de uma entrevista a ser divulgada nos meios midiáticos. Geralmente, esses
cortes respeitam as fronteiras sintáticas e semânticas, mas não as prosódicas. Isso faz que o
ouvinte tenha a impressão de que o entrevistado iria dizer algo mais.
4
Embora qualquer predição seja, por natureza, probabilística e raramente perfeita, esse
fenômeno pode ser bastante útil ao processamento cognitivo das informações. Como Grosjean
sugere, a predição reduz o leque de possibilidades lingüísticas, permitindo que o ouvinte focalize
um ponto específico. Em decorrência disso, o processamento cognitivo torna-se mais eficiente,
permitindo, por exemplo, a preparação mais rápida de uma resposta. O que não se pode perder de
vista é o fato de, apesar de a noção de uma função entonacional implicar uma distinção total dos
significados a partir de parâmetros do sistema entonacional, raramente isso acontecer (Couper-
Kuhlen, 1985). Não se deve imaginar que a entonação, sozinha, seja responsável pelos contrastes
lingüísticos (ainda que, algumas vezes, isso possa ocorrer, como ocorre em alguns casos de
desambigüização de sentenças). Em situações discursivas de interação, não é raro que uma
melodia utilizada represente uma intenção do locutor diferente da que os campos semântico e
sintático de uma enunciação indiquem.
* * *
O objetivo deste estudo é verificar a existência de estruturas pré-indicativas, nos termos
de Fónagy (1974), no português brasileiro – doravante PB – e no francês falado na França – a
partir do capítulo 4, referente à descrição metodológica, FR. Uma vez que a intenção é
caracterizar uma abordagem na esfera lingüística (em oposição à paralingüística), foi feita uma
delimitação à categoria das orações subordinadas adverbiais, numa tentativa de estabelecer a
ligação entre os comportamentos sintático e prosódico dessas relações de subordinação. A
motivação inicial ocorreu a partir da observação de como locutores brasileiros imprimem
modulações diferentes às orações principais de um período, em função das orações subordinadas
subseqüentes. Mais ainda, a possibilidade de um ouvinte complementar uma elocução – em
conformidade com as expectativas do locutor – com base apenas na melodia entonada. Assim,
considerando-se a ordem canônica “oração principal – (conectivo) oração subordinada
adverbial”, a expectativa é a de que existam conformações melódicas específicas que, aplicadas
às orações principais, permitirão prever qual a relação adverbial a ser apresentada na oração
subordinada.
Embora fora da relação de subordinação, e com caráter meramente ilustrativo, um
exemplo bastante claro desse fenômeno pré-indicativo no PB ocorre com as orações coordenadas
adversativas. A oração “o seu trabalho é bom”, de acordo com a entonação que lhe seja
conferida, poderá ser entendida como um elogio ou como um comentário a que se acrescentará
5
alguma ressalva. Neste último caso, o ouvinte perceberá que o locutor, na verdade, deseja
apresentar alguma crítica ao trabalho efetuado. Uma possível continuação seria “mas não
apresenta consistência metodológica”. Essas duas interpretações são caracterizadas a partir das
curvas melódicas, respectivamente, das figuras 0.1 e 0.2, abaixo.
Figura 0.1 – Entonação de “o seu trabalho é bom” sugerindo um elogio.
Figura 0.2 – Entonação de “o seu trabalho é bom”, a que será acrescentada uma ressalva.
* * *
Assim, objetivando caracterizar, ainda que de forma muito breve, o percurso dos estudos
prosódicos com vistas ao fenômeno pré-indicativo, num primeiro momento será apresentada uma
revisão bibliográfica, em que serão consideradas:
a) as noções referentes ao fenômeno entonativo e a evolução dos estudos lingüísticos;
b) a entonação em relação à gramática e, mais especificamente, à sintaxe, numa
interface com a Gramática Gerativa;
c) a caracterização dos sistemas entonativos;
6
d) a relação da entonação com as orações principais e as orações subordinadas; e
e) um breve histórico da noção de pré-indicação, incluindo-se esse fenômeno prosódico
em algumas línguas tonais africanas.
Num segundo momento, serão discutidas as relações sintáticas de coordenação e de
subordinação, com vistas à extensão dessa caracterização aos fenômenos prosódicos. Ao longo
dessa análise, serão revistos alguns testes utilizados para determinar o status subordinativo ou
coordenativo de um sintagma oracional. Esses testes, quando possível, foram os mesmos
aplicados à constituição do corpus utilizado nesta pesquisa.
Por conta do avanço considerável em que já se encontram os estudos prosódicos
relacionados ao francês, a caracterização do sistema entonativo dessa língua será feita
anteriormente à do sistema entonativo do PB, no terceiro capítulo.
Relacionado ao aspecto empírico deste trabalho, o quarto capítulo apresenta uma
descrição da metodologia empregada na elaboração dos testes de percepção utilizados para
verificar a existência do fenômeno pré-indicativo das orações subordinadas adverbiais no PB e
no francês, bem como a conformação prosódica responsável pela caracterização de cada uma das
subcategorias pré-indicativas.
O quinto capítulo apresenta e analisa os resultados obtidos a partir da bateria de testes
(Teste 1), identificando o nível de reconhecimento das orações principais como pré-indicativas
das subcategorias adverbiais oracionais em estudo.
Com o objetivo de identificar os componentes prosódicos responsáveis por cada uma
dessas pré-indicações, assim como seu comportamento, os arquivos sonoros gerados para as
orações principais tomadas como referência pré-indicativa tiveram suas versões neutra e
monotônica ressintetizadas de forma a reproduzir as elocuções originais. O sexto capítulo é
dedicado à descrição desse processo de ressíntese.
O sétimo capítulo apresenta os resultados obtidos com a bateria de testes (Teste 2), em
que se submeteram duas versões ressintetizadas de uma versão neutra e de uma monotônica das
orações principais de referência ao julgamento de falantes nativos. O objetivo do Teste 2 foi
identificar, dentre as múltiplas manipulações dos componentes prosódicos, aquelas que mais
provavelmente contêm as configurações responsáveis pelas pré-indicações adverbiais oracionais.
Na conclusão, apresenta-se uma síntese dos principais pontos desenvolvidos ao longo
desta pesquisa, analisando-se, de forma mais ampla, os resultados obtidos para os Testes 1 e 2 e
as suas implicações na configuração dos padrões prosódicos pré-indicativos de orações
7
subordinadas adverbiais no português brasileiro. Apresenta-se, também, a configuração
prosódica, em termos absolutos, para cada um desses padrões, assim como sua representação
esquemática.
8
1. REVISÃO BIBLIOGRÁFICA
Com o advento da Gramática Gerativa, a tradição dos estudos estabeleceu-se no sentido
de considerar a sintaxe como detentora de uma estrutura auto-suficiente. Essa pretensa
autonomia sugere que a sintaxe seja analisada de forma independente de outras considerações,
tanto em relação ao campo da semântica e da fonologia quanto ao campo da pragmática. Mais
recentemente, essa visão autônoma da sintaxe já tem sido mesmo considerada como uma
aberração da lingüística durante a segunda metade do século XX (cf. Anderson, 2005). O
prestígio dessa visão que os estudos sintáticos adquiriram impôs uma certa obliteração aos outros
segmentos de estudo no âmbito da Gramática Gerativa, especialmente se consideradas as
manifestações prosódicas (Chomsky e Halle, 1968:372) trataram todos as incongruências entre
unidades sintáticas e unidades entonacionais como fenômenos ligados à performance). É
somente a partir do nascimento da abordagem autossegmental da prosódia (segundo Di Cristo
(2004:140), apoiado sobre uma revisão da análise tradicional dos sistemas das línguas tonais,
especialmente os trabalhos de Woo, 1969, e Leben, 1973) que certos traços fonológicos
assumem um domínio de especificação de dimensões menores ou maiores que o segmento
fonêmico tradicional.
Assim como Anderson (2005) propõe ser impossível estabelecer categorias sintáticas a
partir de níveis puramente distribucionais, sendo necessário um vínculo com a semântica,
inúmeros outros trabalhos apresentam propostas de integração direta entre a sintaxe e a fonologia
(cf. Croft, 1995; Freitas, 1995; Bermúdez-Otero, 2004; entre outros). Selkirk (1984) e Nespor e
Vogel (1986) chegam, ainda, a sugerir um nível independente para a estrutura entonacional na
gramática (cf. seção 1.1).
Partindo-se para um direcionamento ainda mais específico dentro dos estudos
fonológicos, já é possível considerar que a entonação também apresenta um papel de
significativa importância na caracterização sintática. Algumas vezes, é mesmo possível sugerir
que a entonação seja a responsável maior pela atribuição do sentido a uma enunciação. É o que
ocorre, por exemplo, quando uma mesma seqüência de palavras, pronunciada com padrões
entonacionais diferentes, é entendida de formas diferentes, ainda que os sentidos lexicais
permaneçam constantes. As diferentes segmentações prosódicas aplicadas em (a) e (b) a seguir,
tomadas de Grosjean (1983:504), evidenciam bem claramente esse papel prosódico:
9
(1) a [The other day I saw John really anxious]S [I said „Hi‟ to him]S
(Um outro dia eu vi John realmente ansioso. Eu lhe disse “Oi”.)
b [The other day I saw John]S [Really anxious, I said „Hi‟ to him]S
(Um outro dia eu vi John. Realmente ansioso, eu lhe disse “Oi”.)
Se ocorre uma mudança de significado por conta exclusiva da variação entonacional imposta à
enunciação, a conclusão natural se coloca no sentido de a entonação ser significativa.
House (2006:1543) indica que a entonação, no entanto, não é capaz de sugerir um
significado lingüístico independentemente da cadeia de palavras à qual ela seja aplicada, ou seja,
embora a entonação produza significados diferentes, ela o faz sobre um substrato lingüístico
anterior (no caso, uma seqüência de palavras) (cf., no entanto, Bänziger et al., 2003, em que oito
emoções foram prosodicamente caracterizadas a partir de duas sequências de sílabas que não
continham informações nem semânticas nem sintáticas1). A entonação seria, então, parcialmente
icônica, comparável ao gesto, e algumas similaridades entre várias línguas comprovariam sua
natureza não-arbitrária. Essa visão universalista é mais usualmente sustentada pelo fenômeno da
declinação, a associação usual da F0 alta ou ascendente à modalidade interrogativa e à não-
finalidade do enunciado, além da presença de movimentos melódicos pontuais em palavras
novas (tema) ou de alguma outra forma de importância significativa para a informação
transmitida (cf. Ladd, 1996:113).
A sugestão de House (2006:1544) é a de que a entonação seja analisada a partir de três
orientações funcionais distintas, cada uma delas podendo ser mais ou menos importante em uma
determinada enunciação. A primeira orientação se dá em direção ao próprio falante. A partir da
elocução produzida, seria possível identificar elementos próprios da caracterização pessoal do
locutor, tais como grupo social ou região a que pertence, seu sexo, além de propriedades
idiossincráticas. Todo esse conjunto seria responsável pela identidade do locutor. A essas
propriedades idiossincráticas associam-se informações paralingüísticas, como as atitudes e/ou
emoções que o locutor pode, consciente ou inconscientemente, atribuir à sua enunciação.
A segunda orientação proposta seria de ordem explicitamente lingüística, e que House
associa à função gramatical da entonação. A entonação seria utilizada em conjunto com o
conteúdo proposicional, explicitando-lhe, por exemplo, um sentido específico, ainda que o
fraseamento possa apresentar uma ambigüidade. É o que ocorre em (2), abaixo: a versão (a) da
1 A sugestão de House torna-se nula, a menos que não se considerem as emoções no nível lingüístico.
10
frase, pronunciada sem pausa entre “Labour” e “because”, sugere que o fato de a pessoa não ter
votado em Labour não foi devido ao contato com Tony Blair, mas a outros fatores; a versão (b),
com pausa entre “Labour” e “because”, sugere que o contato entre Labour e Tony Blair foi
responsável por a pessoa não ter votado em Labour.
(2) a. I didn‟t vote Labour because of Tony Blair.
(Eu não votei em Labour por causa de Tony Blair.)
b. I didn‟t vote Labour, because of Tony Blair.
(Eu não votei em Labour, por causa de Tony Blair.)
A terceira orientação da entonação se faria em direção ao processo de construção
discursiva em si mesmo, focalizando a interação entre o locutor e o ouvinte numa conversação,
ou mesmo entre o ouvinte e a estrutura de um texto, como num monólogo. É o que ocorre em
(3), em que a versão (b) evidencia, pela entonação exclamativa, um envolvimento emotivo forte
do locutor com a apresentação do coral.
(3) a. The choir was great. Their standard was really professional.
(O coral foi ótimo. O padrão deles era realmente profissional.)
b. The choir was great. Their standard was really professional!
(O coral foi ótimo. O padrão deles era realmente profissional!)
A entonação utilizada nos exemplos fará que o ouvinte interprete cada uma das
mensagens de uma forma específica. Num universo de inúmeras possibilidades (entre elas, os
fatores pragmáticos, tais como o contexto discursivo, o conhecimento enciclopédico, os
estereótipos culturais; as relações temporais e aspectuais; a ontologia temporal, envolvendo os
tipos de acontecimentos, estados, “acontecimentos negativos”, como sugerem Dargnat e Jayez,
2007:2-3), a entonação permite que várias interpretações sejam eliminadas, prevalecendo uma.
Ladd (1996:7) já havia sugerido esse nível sentencial ou pós-lexical para a entonação,
considerando que, por esses critérios, a entonação exclui características como o acento lexical e
o tom, determinados no léxico e que servem para distinguir uma palavra de outra, como é o caso,
11
no inglês, do substantivo permit (“permissão”, acentuado na primeira sílaba) e o verbo permit
(“permitir”, acentuado na última sílaba).
Essa proposta de interação entre o comportamento prosódico e o contexto em que a
elocução se produz já havia, de certa forma, sido apresentada por Fox (1984). A idéia seria a de
que certos aspectos do padrão prosódico seriam acessados mais em termos de suas funções
internas dentro da estrutura entonacional do que em relação às referências externas aos
significados discursivos específicos em questão. O que se verificaria, nesse caso, seria o
estabelecimento de relações entre as partes do padrão entonacional, cujo papel pode ser
entendido como o da criação de uma estrutura entonacional que seria, então, projetada no
discurso como um todo. Assim, percebe-se que, na abordagem de Fox, a escolha por uma certa
estrutura entonativa apresenta uma significação especial para o contexto discursivo.
Socialmente, é comum que determinadas frases produzam efeitos distintos dos esperados
pelo locutor no momento da enunciação. Esse fenômeno se explica de várias formas, desde
interferências de ordem cultural, tais como concepções religiosas que o ouvinte projeta sobre a
enunciação, até o mau uso de pistas prosódicas para elucidar um significado específico numa
sentença ambígua (cf. Stein, 2003). Nas situações em que o conteúdo lexical ou a estrutura
sintático-textual se mostra incongruente com a entonação utilizada, geralmente é o significado
produzido a partir da entonação que prevalece, como confirma Couper-Kuhlen (1985:116),
citando Pike (1945:22).
Mesmo que a entonação geralmente suplante o conteúdo lexical ou a estruturação
sintática (Ladd, 1978), deve-se considerar, no entanto, que ela não prevalece sempre. Couper-
Kuhlen (1985:116) apresenta o exemplo de uma aeromoça solicitando a um passageiro que pare
de fumar. Mesmo que ela utilizasse uma entonação cortês, uma frase ofensiva, como Put that
goddam pipe away (“Pare de fumar essa porcaria de cachimbo”), seria sempre interpretada como
ofensiva. Uma outra limitação para a entonação, muitas vezes, se dá por conta das restrições de
significado. Como Steedman (1991:9) menciona, contornos que imponham divisões como as
sugeridas em (4) não são permitidos, uma vez que “in ten” e “prefer corduroy” não formam um
grupo entonacional, devido à restrição imposta pelo que Selkirk (1984) denominou de “Sense
Unit Condition” (condição para a unidade de sentido):
(4) #(Three cats)(in ten prefer corduroy)
(Três gatos)(em dez preferem veludo)
12
Steedman explica essa impossibilidade de divisão a partir do que denomina “estrutura
informacional” – ou seja, distinções de foco, pressuposição e atitudes proposicionais em
direção às entidades no modelo discursivo (1991:9)2.
Como se pode perceber, o desentendimento dos lingüistas quanto à forma como os
fenômenos entonativos devam ser tratados conduz a uma disputa intensa quanto ao caráter
lingüístico da entonação. Martinet (1962:28, citado por Couper-Kuhlen, 1985:118) afirma
categoricamente que a entonação não passaria de “mera gesticulação com a glote” e que
pertenceria à “mais distante periferia do campo da linguagem”. Sua justificativa se centra no
fato de a entonação não apresentar dupla articulação, não sendo organizada, em um nível, como
uma sucessão de unidades mínimas a que se acoplam significados e, num nível mais baixo, numa
seqüência de segmentos distintos a que falta significação. Vários estudos, no entanto, parecem
conduzir à atribuição de um status lingüístico à entonação (cf. inter alia Selkirk, 1980, que,
como já comentado, assume uma postura incisiva ao considerar a prosódia como um componente
autônomo da gramática), retirando-a, pelo menos parcialmente, da esfera do paralingüístico.
No entanto, embora haja indicações de que a entonação deva ser considerada como um
fenômeno lingüístico – em oposição a “paralingüístico” –, deve ser levantado o questionamento
quanto a ser ela a única responsável pelos contrastes encontrados, por exemplo, nos casos citados
anteriormente. Couper-Kuhlen (1985:116) reflete sobre o fato de tanto a entonação quanto o
conteúdo lexical da enunciação serem responsáveis, em níveis semelhantes, pela caracterização
da atitude do locutor. Da mesma forma, haveria indicação mais explícita das relações textuais
entre as sentenças a partir dos conectores que a partir da configuração prosódica propriamente
dita. Também a interrogação pode ser marcada tanto pela entonação quanto pela forma
interrogativa (observe-se, no entanto, que em línguas como o português, esse papel será
desempenhado predominantemente pela entonação, embora algumas vezes o ordenamento das
palavras ou a presença de partículas gramaticais identifique a modalidade interrogativa; cf.
Moraes, 1998). Haveria, assim, a possibilidade de que a função entonativa estivesse sendo
superestimada. Hultzén (1959, citado em Couper-Kuhlen, 1985:116), sugere que o mecanismo
especificativo da entonação deva ser muito simples e não-específico e, ainda, que o que quer que
seja específico na interpretação talvez se obtenha mais a partir do texto em seu contexto
material e lingüístico do que do refinado contorno da entonação.
De qualquer forma, o problema maior está no fato de muitos estudos não procurarem
estabelecer uma base sólida para a caracterização entonativa. Ladd (1996:20) observa que grande
2 Optamos por apresentar, ao longo deste trabalho, nossa própria tradução para as citações utilizadas.
13
parte dos autores dos estudos relativos à entonação não busca identificar categorias fonológicas.
Normalmente, o que se faz é considerar um conjunto de funções entonacionais, assumindo que a
descrição mais adequada para essas funções deva ser caracterizada por meio das variantes
prosódicas contínuas do discurso, especialmente a F0, a duração e a intensidade. Um pouco mais
à frente (38), Ladd sugere que, por conta da sua natureza acústica, do seu domínio de extensão e
das mensagens que sugere, a entonação parece se colocar realmente como um fenômeno
paralingüístico, por três razões específicas: muito provavelmente, todas as línguas utilizam os
componentes suprassegmentais da entonação de forma paralingüística; alguns componentes
entonacionais parecem se estender sobre grandes trechos do discurso, sendo tentador analisar o
contorno entonativo como um conjunto de longo termo para a sentença como um todo; e o fato
de o sentido entonacional ser indiscutivelmente afetivo e interpessoal, quase nunca
proposicional, não havendo muitos casos em que o valor de verdade de uma enunciação seja
afetado pela entonação. Seu posicionamento, no entanto, é o de que nenhum desses três fatores
se coloca de forma decisiva. A questão essencial deve ser posta quanto à possibilidade de a
entonação envolver uma estrutura categorial e, para que se possa atingir essa informação, seria
necessário fazer uma distinção metodológica para os diferentes aspectos envolvidos na
entonação. A principal crítica de Ladd está no fato de a pesquisa instrumental tradicional tratar
todos os sentidos entonacionais como paralingüísticos. A metodologia normalmente utilizada
busca encontrar propriedades fonéticas variáveis continuamente nas elocuções que se possam
relacionar diretamente aos aspectos do significado da elocução. Isso se mostra adequado para o
significado paralingüístico, mas não para o lingüístico, eliminando a possibilidade de
reconhecimento de uma estrutura fonológica para a entonação.
Na exemplificação que estabelece (39), Ladd cita o fato de que algumas descrições
(Schubiger, 1958; O‟Connor e Arnold, 1973) estabelecem uma diferença entonacional entre um
contorno „high fall‟ e um contorno „low fall‟ para uma frase como “He didn‟t.” (Ele + passado
negativo), enquanto outras (Palmer, 1922; Crystal, 1969) analisam esses contornos como
variantes paralingüísticas da mesma categoria básica entonacional „fall‟. A grande dificuldade
está, como se pode constatar, em separar o que deve ser entendido como mensagem
paralingüística do que deve ser entendido como mensagem entonacional.
Como solução para a questão, Ladd (1996) propõe o que chamou de “Teoria Lingüística
do Significado Entonacional”, cuja idéia central é a de que os elementos da entonação
apresentam significado. Mesmo sendo bastante gerais, esses significados seriam parte de um
sistema com uma pragmática interpretativa rica, e apresentariam nuance bastante vívida em
14
determinados contextos. O contraste principal estaria no fato de a abordagem instrumental
tradicional considerar que significados bastante específicos, como a interrogação e a raiva, são
sugeridos por propriedades fonéticas gerais, com pouca intervenção de inferências pragmáticas
dependentes do contexto. Os pressupostos caracterizados por Ladd serão tomados como
referência principalmente nas seções 1.2 e 1.4.
1.1 OS ASPECTOS GRAMATICAIS
A tradição da gramática gerativa estabeleceu, como já comentado, a autonomia da sintaxe
em relação a todos os outros componentes lingüísticos, entre eles o fonológico. A representação
sintática de superfície e a representação fonológica subjacente eram vistas pela teoria padrão
como entidades quase idênticas em suas características, e se defendia que o mapeamento da
sintaxe para a fonologia consistia simplesmente em promover algumas alterações na estrutura de
superfície, adicionando-se elementos de fronteira que seriam responsáveis por representar as
propriedades de junção relevantes a certas regras fonológicas. Como Fox (2000:282) indica, é
Stockwell (1960) quem tenta reconciliar a análise feita por Trager/Smith com a abordagem
formal do primeiro modelo transformacional de Chomsky (1957), com a adição de cinco regras,
como representado na figura 1.1 (figura 5.8, em Fox).
1. S → Nuc + IP (Intonational Pattern)
2. IP → C (Contour) + JP (Juncture Point)
3. C → Disc(ontinuity)
Cont(inuity)
4. Disc → 001 ↓ (=any fall to 1 + terminal fade; 0=any pitch phoneme)
5. Cont → 002↓
003↓
004↓
021↑
032↑
043↑
Figura 1.1 – As cinco regras adicionais sugeridas por Stockwell (1960, citado por Fox 2000:282) para aprimoramento da proposta fonológica da Gramática Gerativa proposta por Chomsky (1957) (Intonation
Pattern = padrão entonacional; Contour = contorno; Juncture Point = ponto de junção; Discontinuity =
15
descontinuidade; Continuity = continuidade; any fall to 1 + terminal fade = qualquer queda até 1 +
esmaecimento terminal; any pitch phoneme = qualquer fonema de pitch).
Para suprir o fato de cada sentença ter um padrão entonacional, a regra inicial (S → NP +
VP) proposta por Chomsky é modificada para a Regra 1, na figura 1.1; a estrutura sintática da
frase é representa por Nuc, reescrito como NP + VP, como anteriormente. O padrão entonacional
(IP, Intonational Pattern) pode ser gerado pelas Regras 2 a 5, que explicitam as possibilidades.
O padrão consiste de um Contour (C) e de um Juncture Point (JP); o Contour pode representar
quer uma Discontinuity, quer uma Continuity; o primeiro resulta em um pitch descendente, com
esmaecimento terminal; o último, em um pitch final não-baixo, com um esmaecimento terminal,
ou uma elevação terminal.
Na segunda metade do século XX, vários estudos passaram a contemplar a estruturação
prosódica de forma específica, chegando-se ao ponto de sugerir que o componente prosódico
teria uma caracterização – da mesma forma que havia sido postulado para a sintaxe – autônoma.
Selkirk (1980:2), argumentando contra a representação suprassegmental, afirma a necessidade do
estabelecimento de categorias prosódicas, entendidas como subunidades da estrutura prosódica e
que seriam responsáveis por classificar os nós da representação arbórea. Como categorias
prosódicas, estipulou a sílaba, o pé, a palavra prosódica, a frase fonológica, a frase entonacional
e a elocução. A sugestão seria a de não existir isomorfismo entre as estruturas prosódica e
sintática. Pelo contrário, a “estrutura prosódica é uma entidade distinta”, sendo necessário
estabelecer um mapeamento não-trivial entre essas duas estruturas.
Em um outro trabalho (1984:27), após estabelecer a definição de “frases entonacionais”3,
a autora sugere que a necessidade de definição dos contornos entonacionais, relativamente a
alguma unidade de representação simultaneamente mais larga que a palavra e variável na
extensão, é que teria motivado a existência da frase entonacional. Essa unidade não poderia ser
sintática, pela simples razão de a seqüência sintática a que um contorno entonacional esteja
associado não ser, necessariamente, um constituinte de estrutura sintática.
A hipótese defendida é a de que os constituintes imediatos de uma frase entonacional
devem suportar ou uma relação head-argument ou uma relação head-(restrictive) modifier entre
si. Com essa caracterização, Selkirk estipula a frase entonacional como uma “unidade de
sentido”. A proposta de se entender a estrutura prosódica como autônoma é decorrência de a
autora postular que o fraseamento entonacional de uma sentença seja determinado de forma livre
à estrutura de superfície dessa sentença. Fraseamentos específicos estariam condicionados à
3 Esta noção será apresentada mais à frente, quando da discussão de Croft (1995).
16
aplicação de filtros, reflexo da condição de boa formação, que codificariam os constraints nas
relações semânticas verificadas entre os constituintes dentro de sucessivas frases entonacionais.
Selkirk caracteriza essa condição de boa formação como sendo a “condição de unidade de
sentido”.
Esse mapeamento entre a sintaxe e a fonologia se desenvolveria em duas etapas. Na
primeira, haveria o mapeamento da estrutura sintática em uma estrutura de superfície entonada, o
que significa dizer que a estrutura de superfície passaria a ter associada a si uma estrutura
entonacional. Na segunda etapa, o alinhamento da grade métrica seria construído para a sentença
com base nessa estrutura de superfície entonada. O resultado da segunda etapa seria a
representação fonológica subjacente da sentença.
A estrutura sintática, em si mesma, não teria como determinar, por exemplo, a
localização, o número ou as características tonais dos acentos melódicos atribuídos a uma
sentença. O mesmo aconteceria com o fraseamento entonacional, uma vez que uma mesma
sentença poderia ser dividida em frases entonacionais de formas diferentes, a partir de elocuções
diferentes. Como realça Selkirk (1984:285), não se pode dizer que a estrutura sintática de uma
sentença determine seu fraseamento entonacional, uma vez que uma mesma estrutura sintática
pode dar origem a várias representações entonacionais. Além disso, deve-se levar em
consideração que a estrutura sintática é normalmente um indicador fraco da variação prosódica.
Isso ocorre porque os padrões prosódicos são afetados por inúmeros fatores, como o tamanho e o
padrão acentual das palavras, o ritmo do discurso e, ainda, fatores discursivos como o acento
contrastivo. Vários estudos também já demonstraram que locutores não-informados da existência
de ambigüidades nas frases a que foram expostos durante os experimentos utilizaram pistas
prosódicas menos consistentes para a desambigüização sintática do que os locutores que já
possuíam essas informações (Lehiste, 1973; Wales e Toner, 1979; Allbritton, McKoon e
Ratcliffe, 1996, citados por Snedeker et al., 2000).
A problemática central em relação à proposta de Selkirk está em considerar o elemento
prosódico como constitutivo de uma unidade autônoma da gramática. As posturas extremas,
embora normalmente não se sustentem por longo tempo, apresentam o grande mérito de
promoverem o questionamento a respeito de pontos que, se não fosse por elas, passariam
constantemente despercebidos. A evolução dessas discussões acabou por conduzir a propostas de
certa forma conciliatórias, considerando uma inter-relação entre os vários componentes da
gramática. Nesse processo evolutivo, Croft (1995) propõe a “hipótese de armazenagem da
unidade entonacional”, que estabeleceria um elo entre as unidades entonacionais, a simplicidade
17
gramatical e a alta freqüência de indicação. O artigo, que será aqui tomado como referência, se
desenvolve a partir da observação de um corpus de narrativas orais no inglês.
O ponto inicial seria a determinação do que se consideraria uma “unidade entonacional”.
Croft assume essa definição em termos do que deve ser percebido como um contorno
entonacional único. Na verdade, trata-se da mesma noção que Selkirk, como comentado acima,
estabeleceu, e que foi assumida também por Nespor e Vogel (1986). Outros rótulos anteriores,
embora essencialmente sem diferenças quanto à caracterização, foram os de Quirk et al.
(1964:6804) propondo “unidade tonal”; Cruttenden (1986:35), com “grupo entonacional”; e
Halliday (1967), com “grupo tonal” e, posteriormente (1970), “unidade tonal”. Selkirk
exemplifica essa noção com duas possibilidades de fraseamento entonacional para “Albernathy
gesticulated” (“Albernathy gesticulou”):
(5) a IP (Albernathy gesticulated) IP
b IP (Albernathy) IP IP (gesticulated) IP
Assim, pode ser atribuída uma única frase entonacional à sentença como um todo, ou uma para o
SN e outra para o SV, o que evidencia não haver isomorfia entre frases entonacionais e
constituintes da estruturação sintática. Essa terminologia (em todas as variações apresentadas
acima) contempla tanto situações em que o tom possa ser considerado de forma mais ampla,
envolvendo seqüências melódicas ascendentes e descendentes (especialmente na tradição
britânica), quanto em seqüências de tons simples nivelados (especialmente na tradição
estadunidense). Por se mostrarem aparentemente como fronteiras naturais, parece haver uma
tendência a considerar as pausas como marcadores das unidades entonacionais. No entanto, elas
não devem ser tomadas dessa forma. Embora se possa, de fato, verificar uma pausa ao final de
um grupo entonacional, nem sempre haverá uma estabelecendo esse tipo de marcação, e nem
sempre uma pausa é produzida com essa intenção demarcativa. No primeiro caso, pode-se fazer
referência ao sistema prosódico do francês, em que o acento primário, delimitador de um grupo
rítmico, é freqüentemente marcado pelo aumento da duração silábica, sem que se constate,
necessariamente, uma pausa silenciosa. A sensação de pausa que se verifica muitas vezes, nesse
caso, é decorrência de um efeito psicológico (Jean-Yves Dommèrgues, comunicação pessoal).
No segundo caso, uma pausa pode ser produzida por conta da própria performance do locutor
durante o ato discursivo, caracterizando, por exemplo, hesitações.
4 Todas as referências mencionadas nesta sessão são as apresentadas em Croft (1995).
18
Uma sentença pode apresentar uma estruturação mais simples, ou significativamente mais
complexa. A partir dessa constatação, é possível perceber que uma unidade entonacional não
corresponde gramaticalmente a uma sentença, pela simples razão de que a extensão de uma
unidade entonacional é freqüentemente menor do que a daquela. Assim, é possível identificar em
uma mesma sentença, por vezes, várias unidades entonacionais. Croft alerta que se deve
considerar cuidadosamente a relação entre os papéis desempenhados pela sentença, na análise
sintática, e o papel de unidades comparáveis na análise do discurso falado, para que ambos os
sistemas possam ser integrados, evitando-se, assim, que o papel dos grupos entonacionais ou o
das estruturas sintáticas sejam percebidos de forma indevida. Quanto ao tamanho da unidade
gramatical, assume-se que ele seria do mesmo tipo das outras restrições atribuídas à competência
prosódica na interface sintaxe-prosódia.
Para a realização de seus testes, Croft utilizou o corpus de Chafe (1980), formado de
narrativas de “pear-stories” (“histórias de pêra”). Essa denominação se deu por conta da temática
utilizada nas entrevistas realizadas: foi construído um pequeno filme sobre um menino, algumas
peras e pessoas que o menino encontrou. As pessoas entrevistadas na formação do corpus
deveriam descrever os eventos do filme, em vários intervalos após verem as imagens. Os
resultados dos levantamentos realizados por Croft a partir das narrativas produzidas pelos
participantes indicaram que, na quase totalidade das vezes, as unidades entonacionais
correspondiam a unidades gramaticais (97%). Em 91% dos casos, as unidades entonacionais
consistiam de unidades gramaticais que possuíam um conjunto completo de complementos, e
nenhum constituinte disjunto. Essas unidades foram denominadas “unidades gramaticais totais”.
A preferência esmagadora das unidades entonacionais de se concentrarem em unidades
gramaticais totais foi denominada “condição de unidade gramatical total”. No entanto, nem todas
as unidades gramaticais são unidades entonacionais, pela razão de muitas vezes uma unidade
gramatical ser, ela própria, integrante de uma outra unidade gramatical.
Os resultados obtidos a partir dos levantamentos efetuados evidenciaram, por exemplo,
que 81% das orações subordinadas adverbiais5 constituíram unidades entonacionais. Possíveis
explicações para o fato de outras orações adverbiais não terem constituído unidades
entonacionais estariam ligadas a fatores discursivos que estariam interferindo no fato de certas
expressões adverbiais ocorrerem no mesmo grupo entonacional ou não. A previsão de Croft é a
de que fatores discursivos interfeririam na segmentação da unidade entonacional nos casos em
5 Para a análise detalhada dos fatores determinando as condições em que um grupo entonacional de um tipo
específico é total ou não, cf. Croft (1995:849 e 861).
19
que não houvesse um grau muito forte de integração sintática entre as unidades gramaticais, que
estariam, portanto, relativamente distantes sintaticamente.
Como já mencionado, Croft lançou a “hipótese de unidade entonacional armazenada”
com base na idéia de que nem todas as estruturas sintáticas podem ser armazenadas, por conta da
recursividade da gramática. Paralelamente, a noção de “estrutura sintática armazenada” sugere
que algumas construções, como muito provavelmente NPs/PPs simples encaixadas fariam parte
das estruturas fixas da língua, não sofrendo variações; estariam, assim, armazenadas e
disponíveis para acesso imediato6. Outras estruturas, no entanto, precisariam ser computadas
com base nas estruturas sintáticas armazenadas ou pré-compiladas. A hipótese de Croft tenta
formular um critério independente que seja suficiente para distinguir esses dois tipos de
estruturas sintáticas. Assim, a seguinte formulação é apresentada:
“As construções que são armazenadas ou pré-compiladas são as unidades gramaticais
que (normalmente) ocorrem em uma unidade entonacional simples.” (Croft, 1995:872)
Um outro suporte circunstancial para a hipótese de Croft seria o tamanho médio das
unidades entonacionais. Esse tamanho, no corpus de Altenberg (1990:282), seria de quatro
palavras; no de Crystal (1969:256), cinco palavras; e no de Chafe (1980:14), seis palavras. A
memória de curto-termo teria provavelmente uma capacidade dentro dos limites desses números.
Croft sugere, então, que as construções armazenadas/pré-compiladas, e as próprias unidades
entonacionais, poderiam ser a manifestação das limitações da memória de curto-termo no
processamento. Nessa linha de pensamento, para que o usuário da língua pudesse construir
unidades entonacionais mais longas, seria necessário que essa capacidade de memória fosse
maior. Assim, a estrutura e a organização da gramática teriam evoluído de forma a se adaptarem
às limitações e às capacidades da mente humana7.
Assumindo-se, então, que a entonação desempenha um papel lingüístico em sintonia com
a sintaxe, esse seu papel parece ser o de codificar um conjunto de instruções que seriam
utilizadas na interpretação do conteúdo morfossintático da elocução. Deve-se ainda considerar
que, para que possa haver a combinação de duas categorias sintáticas, é necessário que suas
6 Aubergé et al. (1997) sugerem que a morfologia da entonação deva ser descrita por meio de léxicos mentais de
contornos armazenados, organizados hierarquicamente. Cada classe de contornos se responsabilizaria diretamente
por determinados valores lingüísticos, sem interface fonológica alguma. Seria o caso de uma “estrutura morfológica
armazenda”, por paralelismo à proposta de Croft. 7 Para maiores detalhes sobre as restrições relacionadas à memória de curto-termo, cf. Croft 1995.
20
categorias prosódicas também se combinem, embora as regras combinatórias prosódicas e
sintáticas não precisem ser as mesmas (cf. a condição do constituinte prosódico, de Steedman,
1991:13, e a seção 3.2).
Assumindo-se também que a prosódia apresente alguma relação com o significado de
uma enunciação, House (2006:1548) sugere que, uma vez que a entonação contribui para a
representação semântica codificada da elocução (assim como para o estabelecimento das
relações sintáticas), necessariamente ela estaria contribuindo também para as explicaturas dessa
elocução. A noção de “explicatura” se diferenciaria, como indica, da de “implicatura”. As
explicaturas seriam as suposições necessárias para que se consiga desenvolver a representação
semântica codificada de uma elocução. As implicaturas, por sua vez, seriam o uso feito das
explicaturas para produzir inferências adicionais. Portanto, numa linha cronológica, as
explicaturas se processam anteriormente às implicaturas. House exemplifica essas noções a partir
da frase “They lack fibre.” (Eles não têm fibra.).
O ouvinte, para interpretar o significado dessa enunciação, deverá, inicialmente, atribuir
um referente para o pronome “they” e, além disso, pressupor o significado que o locutor atribui a
“fibre”. É necessário o uso de procedimentos inferenciais para que se consiga decodificar o que
está implicitamente informado. Parece não haver dúvida de que essa frase produzirá resultados
diferentes em cada um dos contextos (a) e (b) a seguir:
(6) a Parents have been complaining about the quality of school dinners. They say they lack
fibre.
(Os pais têm reclamado da qualidade dos jantares na escola. Dizem que eles não têm
fibra.)
b The army officers have been grumbling about the quality of their new recruits. They say
they lack fibre.
(Os oficiais do exército têm comentado sobre a qualidade dos novos recrutas. Dizem que
eles não têm fibra.)
No contexto (a), após ter inferido que “they” se refere a “dinners” e “fibre” ao conteúdo
da comida (o que corresponde às explicaturas), o ouvinte pode utilizar seu conhecimento para
inferir que não há nem frutas nem legumes nas refeições (o que corresponde às implicaturas).
Quando pronunciada, a frase “they lack fibre” poderá receber entonações diversas, que refletirão
a atitude do falante em relação a essa proposição. Essa atitude do falante em relação à proposição
21
enunciada seria, como indica House, uma explicatura de nível mais elevado. A entonação,
tomada como fenômeno paralingüístico, seria responsável, portanto, pela interpretação dessas
explicaturas de nível mais elevado.
1.2 OS CONTORNOS PROSÓDICOS
A noção de que as manifestações prosódicas sofrem influência direta de inúmeros
aspectos idiossincráticos já foi amplamente discutida na literatura (cf. Ladd, 1996, para uma
revisão bibliográfica mais detalhada). Inúmeros estudos já demonstraram que um mesmo
contorno entonativo pode apresentar flutuações dependendo do contexto em que esteja sendo
produzido (cf. inter alia, Prevost e Steedman, 1994). A variação, por exemplo, da freqüência
fundamental refletirá diretamente tanto o estado de espírito do locutor, caracterizando emoções
e/ou atitudes particulares, quanto a própria conformação física de seu trato vocal. A relativização
na análise dos fenômenos prosódicos deve ser assumida como fundamento, embora não se deva
desconsiderar que, apesar de toda relativização que se faz necessária, é freqüentemente possível
observar comportamentos prosódicos que se mostram constantes em determinadas situações
enunciativas. Quando se pensa a caracterização de um contorno prosódico8, portanto, deve-se
procurar perceber quais são os limites – muitas vezes tênues – entre o possivelmente absoluto e o
idiossincrático.
Num primeiro momento, parece interessante lembrar que o fenômeno entonativo deve ser
considerado a partir dos múltiplos efeitos que pode causar no ouvinte. Socialmente, constrói-se
toda uma simbologia para os sons e a qualidade vocal. O contato do ser humano com o mundo
animal parece se colocar como uma fonte bastante inspiradora para a construção desse
imaginário lingüístico. Em princípio, talvez seja bastante difícil estabelecer a origem exata de
determinada simbologia. Normalmente, associa-se um tom de voz baixo à idéia de agressividade
ou de domínio, enquanto uma postura submissa é refletida por um tom de voz mais agudo. Uma
possível explicação para esse simbolismo estaria relacionada ao fato de o órgão produtor de uma
vocalização mais grave ser maior que o que produz uma vocalização mais aguda (Gussenhoven,
2002a:48). A observação do mundo animal sugere que os seres maiores (como um elefante) ou
vistos como mais dominadores (como um leão) produzem sons bastante graves. A sociedade
humana, por analogia com o mundo animal, teria incorporado essa relação aos seus valores
8 O termo “padrão prosódico” será empregado nas discussões em que outros autores o tenham utilizado em suas
obras. A partir do capítulo 4, em que se aplicam as informações específicas desta pesquisa, será assumido o termo
“contorno prosódico”, entendendo-se que deve ser utilizado, exclusivamente, para uma conformação melódica com
valor fonológico; portanto, distintivo.
22
simbólicos, com a mesma noção de domínio sendo atribuída ao ser masculino – que apresenta o
duto vocal mais longo que o da mulher e, por conseguinte, a voz mais grave.
Biemans (2000, citado por Gussenhoven, 2002a:48) encontrou uma correlação positiva
entre registros artificiais superpostos sobre elocuções espontâneas masculinas e femininas e uma
escala de feminilidade, ao lado de uma correlação negativa, considerando-se uma escala de
masculinidade. Isso significa dizer que os tons mais agudos relacionam-se diretamente aos
valores semânticos de polidez, não-agressividade e amizade. Por extensão (provavelmente
devido ao imaginário social construído historicamente), a noção de vulnerabilidade se associaria
a tons mais agudos, e a de confiança, a tons mais baixos.
Assim como esses valores relacionados à qualidade da voz se solidificaram, de certa
forma, dentro da sociedade, alguns contornos entonacionais também se mostram como
tendências genéricas. Mais de 70% das línguas provavelmente apresentam contornos entonativos
ascendentes para a entonação interrogativa, enquanto uma entonação ascendente para uma
afirmação é excepcional. Assim, é razoável afirmar que se trata de uma gramaticalização desse
contorno melódico. Por outro lado, a gramaticalização da altura do pico da freqüência
fundamental seria menos comum, uma vez que essa variação estaria diretamente relacionada a
fatores de ordem mais emotiva e/ou atitudinal (Gussenhoven, 2002a:49).
As funções paralingüísticas do pitch são observadas de igual forma nas línguas tonais.
Também os falantes chineses masculinos apresentam a voz mais grave que a das mulheres, e
suas vozes, elevadas para a expressão da raiva, por exemplo, soam de forma semelhante às
manifestações de raiva em qualquer outra língua. Como sugere Ladd (1996:2), isso não significa
dizer que não se possa atribuir uma função fonológica ao pitch, mas que, na verdade, além de
uma função fonológica, o pitch desempenharia também funções paralingüísticas. A questão
estaria em determinar se línguas como o inglês e o francês, por exemplo, utilizariam o pitch com
funções fonológicas. Caso isso venha a se verificar, a entonação estará, portanto, relacionada aos
aspectos lingüísticos, além dos paralingüísticos.
Uma modulação melódica pode apresentar, normalmente, uma grande variação ao longo
da escala de tempo. Qualquer tentativa de estabelecer um movimento melódico como detentor de
aspectos fonológicos deve levar em consideração que nem toda flutuação da freqüência
fundamental será responsável por uma caracterização fonológica. Variações na F0 sempre
estarão se processando: ainda que não pareça estar acontecendo algo significativo ao longo do
movimento, a queda gradativa da F0, por exemplo, continuará a acontecer, por conta do
fenômeno da declinação. Devido à própria natureza dos mecanismos físicos envolvidos na
23
produção da elocução (como a diminuição progressiva do volume de ar expelido pelos pulmões,
diminuindo a pressão subglotal), um mesmo movimento de pitch se mostrará mais elevado no
início do que no final de uma elocução.
Ao discutir a questão envolvendo a perspectiva de fenômenos prosódicos poderem ser
considerados universais ou específicos de certas línguas, Gussenhoven (2002a) defende a idéia
de que ambas as possibilidades são verdadeiras, simultaneamente, para qualquer língua. A
diferença estaria em que o aspecto universalista seria exercido a partir da implementação
fonética, enquanto o significado específico à língua se localizaria na morfologia e na fonologia
entonacionais9. Os significados universais estariam fundamentados nos aspectos envolvendo a
F0, caracterizadora do processo de produção do discurso. Para Gussenhoven, os significados
universais se fundamentariam em metáforas das condições biológicas que estariam influenciando
esse processo de produção discursiva. Essas metáforas foram denominadas por ele como
“códigos biológicos”, em número de três e, juntas, elevam-se a uma teoria do significado
paralingüístico na entonação.
A problemática central, na visão de Gussenhoven, estaria sobre qual seria a explicação
para a natureza dos significados paralingüísticos universais. Esse conhecimento seria derivado de
três condições determinadas biologicamente. A primeira, caracterizadora do Código de
Freqüência, estaria relacionada ao tamanho variável que os órgãos com que o discurso é
produzido – em particular a laringe – adquirem nos diversos locutores, produzindo variações na
freqüência fundamental, por exemplo, de uma criança e de um adulto, como já discutido acima.
Laringes menores contêm pregas vocais menores e mais leves, o que possibilita, com uma dada
quantidade de energia, uma maior velocidade nas vibrações do que em uma laringe com pregas
vocais maiores e, por conseguinte, mais pesadas. Esse aumento da velocidade de vibração eleva
os índices da freqüência fundamental, produzindo tons mais agudos. O termo para essa relação
entre forma e função foi aproveitado a Ohala (1983, 1984, 1994).
A segunda condição, caracterizadora do Código de Esforço, diria respeito à energia –
detectável no sinal acústico – necessária para a produção do discurso. O volume de energia pode
ser variado, sendo que a utilização de uma maior quantidade produziria movimentos
articulatórios mais precisos, além de movimentos de pitch mais canônicos e mais numerosos.
Quanto maior o cuidado na produção do discurso, menos difusos serão esses movimentos.
9 Bolinger (1983:100) já havia sugerido a impossibilidade de que as implementações entonacionais de língua para
língua sejam idênticas. Para que fossem, seria necessário que o iconismo da entonação fosse perfeito, o que, como
preconiza, só poderia ser encontrado caso algo fosse o seu próprio ícone.
24
A terceira condição, caracterizadora do Código de Produção (ou de Fase de Produção), se
relacionaria ao fato de essa energia ser dividida em porções que coincidem com as fases de
exalação durante o processo respiratório. Esse código é que se mostra responsável pelos pitchs
mais elevados no início das elocuções e mais baixos no final.
De acordo com Chen (2003:108), a interpretação informacional (ou seja, o atributo
relacionado ao que está sendo dito) do Código de Produção é a de que inícios com pitch elevado
indicam novos tópicos, enquanto inícios com pitch rebaixados, a continuação de tópicos. No fim
de uma elocução, os finais com pitch elevado indicam continuação; com pitch rebaixado, o fim
da elocução. Uma outra analogia que se pode estabelecer em relação ao Código de Produção são
as associações metafóricas de “para cima” e “para baixo” sugeridas por Lakoff e Johnson
(citados por Bolinger 1983:99), úteis na organização da experiência cotidiana de algo concluído
ou não-concluído. Assim, durante uma ação, está-se “para cima” e em movimento (da mesma
forma que a F0); no final dessa ação, senta-se ou deita-se para descansar.
Recapituladas as possibilidades de análise paralingüística da prosódia, e os mecanismos
biológicos nela envolvidos, e partindo-se para a discussão do que se deva entender como um
contorno prosódico, retoma-se Di Cristo (2004:108-110), que lembra que é possível estabelecer
uma análise a partir de uma visão holística ou de uma visão composicional. No caso de uma
concepção holística radical, de inspiração gestáltica, o contorno entonativo global,
correspondente geralmente ao que se denomina Unidade Entonativa, Grupo Entonativo ou
Sintagma Entonativo exprimiria uma significação que não poderia ser decomposta em elementos
significativos menores. O contorno, como um todo, possuiria um estatuto semelhante ao de um
morfema (o que justificaria o termo “morfema entonativo”). A especificidade dessa abordagem
holística estaria em a significação do contorno global não poder ser inferida a partir da
significação de suas partes. Di Cristo acredita que essa concepção deva ser reformulada caso se
admita que algumas partes de um contorno possam ser mais informativas que outras, como
normalmente ocorre com o ataque, a pretônica e a tônica, no caso do francês, correspondentes,
respectivamente, às sílabas inicial, penúltima e final do contorno. Assumindo o estabelecido por
Rossi et al. (1980), Di Cristo indica que, uma vez que a significação do contorno é deduzida de
uma relação entre suas partes, e não da globalidade de sua configuração, que se deva falar, nesse
caso, de um “morfema discontínuo”. Aubergé et al. (1997), ao avaliarem o ponto em que se deu
a identificação de seis atitudes ao longo de enunciações completas, verificaram, por sua vez, que
a informação prosódica sobre essas atitudes não estaria distribuída uniformemente ao longo das
25
enunciações, mas concentrada em pontos específicos, mesmo que o contorno fosse global (na
mesma linha dos princípios da Gestalt).
A abordagem composicional (ilustrada pela escola estadunidense “autossegmentalista”,
especialmente a partir dos trabalhos de Pierrehumbert, 1980) considera que as entidades
constitutivas dos contornos (tais como os acentos melódicos e os tons de fronteira) são
responsáveis por veicular cada uma das significações particulares responsáveis pela construção
do significado geral do contorno que as inclui. Assim, os acentos melódicos e os tons de
fronteira seriam analisados como morfemas em si mesmos, ou seja, como signos prosódicos,
inseridos em unidades significativas mais amplas. O pitch entre esses acentos melódicos e os
tons de fronteira seria preenchido pela fonética, como lembra Gussenhoven (2002b:5). Essa
abordagem parece se aproximar da de Wells (1945, citado por Fox, 2000:281), segundo a qual os
fonemas entonacionais seriam agrupados em seqüências que constituiriam morfemas, o que
significa dizer que o contorno, como um todo, não teria um estatuto fonológico.
Selkirk (1980:21) entende que o contorno entonacional de uma entonação completa deve
ser visto como constituído de contornos entonativos primitivos menores, cada um com suas
características próprias. Além disso, cada um desses contornos estaria associado a uma frase
entonacional. Couper-Kuhlen (1985) entende, com isso, que a frase entonacional apresenta,
como uma de suas características, um único contorno entonacional, que se projeta ao seu longo.
Ladd (1996:44) assume postura semelhante, considerando que um contorno entonativo
pode se projetar sobre uma enunciação monossilábica, concentrando-se de forma compacta,
como também pode se projetar sobre uma enunciação contendo várias sílabas. No entanto,
detalhando um pouco mais sua análise, o autor caracteriza a análise de um contorno projetado
sobre uma enunciação de seis sílabas como formado a partir de dois eventos distintos, em vez de
uma simples extensão sobre as sílabas:
(7) a A: I hear Sue‟s taking a course to become a driving instructor.
(Ouvi dizer que Sue está fazendo um curso para se tornar instrutora de auto-escola.)
B: Sue?
(8) b A: I hear Sue‟s taking a course to become a driving instructor.
(Ouvi dizer que Sue está fazendo um curso para se tornar instrutora de auto-escola.)
26
B: A driving instructor?
(Instrutora de auto-escola?)
Na primeira frase, o formato rise-fall-rise abrange toda a elocução, formada de uma única
sílaba. Ladd indica que, na segunda frase, não houve apenas a extensão desse formato sobre
todas as sílabas. Pelo contrário, estariam se processando dois eventos distintos, o primeiro
caracterizado pela elevação e queda da F0 sobre a sílaba <driv>, e o segundo, como tom de
fronteira, consistindo de uma elevação nos últimos dez segundos da elocução. O tom baixo
verificado entre esses dois extremos seria uma simples transição entre esses dois eventos. Uma
caracterização nesses termos mostra-se mais exata quanto à descrição de como esse tom pode ser
aplicado a enunciações contendo vários números de sílabas e padrões acentuais diferentes.
Um contorno prosódico, definido sob os aspectos da teoria métrico-autossegmental, é
analisado como constituído a partir de uma seqüência de tons. Essas seqüências serão
responsáveis por gerar o formato dos padrões de pitch associados às elocuções. Considerando-se
que os contornos são representativos da associação entre forma e significado – ou seja, um dado
contorno (que apresenta um formato específico) produzirá, necessariamente, um significado
específico –, não será qualquer seqüência de tons que deverá ser considerada como um contorno
prosódico. Esses contornos, essencialmente, contribuem com a constituição da Gramática de
uma língua. Marandin (2004), discutindo o princípio de Lambrecht, segundo o qual os valores
discursivos são por natureza contrastivos, observa a implicação de que o valor discursivo dos
contornos depende dos paradigmas das formas verificados em cada língua individualmente.
Assim, os contornos falling e non-falling, no inglês, estariam relacionados, respectivamente, com
o comprometimento do locutor e do ouvinte em relação à enunciação proferida, mas não no
francês (cf. discussão mais à frente).
Um contorno prosódico, para ser estabelecido como tal, necessariamente deve ser
submetido aos mesmos testes contrastivos utilizados para outras estruturas gramaticais; por
exemplo, a caracterização de uma seqüência fonética como sendo um morfema. Couper-Kuhlen
(1985:110) lembra que um contraste significativo deve ser entendido como sendo o que se
estabelece entre duas configurações entonacionais distintas quando falantes nativos associam
diferentes significados aos diferentes membros do par, esses significados podendo ser
considerados diferentes sob aspectos descritivos, expressivos ou sociais; ou, ainda, quando
contextos diferentes são apropriados aos diferentes membros do par. Caso dois elementos co-
27
ocorram no mesmo ambiente, não se trata de duas unidades contrastivas, a menos que possam ser
contrastadas em outros ambientes, o que indicaria tratarem-se de elementos contrastivos, mas
neutralizáveis sob certas circunstâncias.
A autora caracteriza seis tipos de contrastes significativos: no nível informacional, no
nível gramatical, no nível ilocucionário, no nível atitudinal, no nível textual-discursivo, e no
nível indexical. No nível informacional, um contraste se estabeleceria nos casos em que uma
mesma enunciação seria utilizada em contextos com estruturas informacionais diferentes.
(9) a I saw a MÀN in the garden
(Eu vi um homem no jardim)
b I SÀW a man in the garden
(Eu vi um homem no jardim)
A primeira elocução, em que o acento prosódico recai sobre “man”, seria uma resposta
possível a uma pergunta como “O que você viu?”, ou “O que aconteceu então?”, enquanto a
segunda, com o acento prosódico sobre “saw”, apenas responderia à pergunta “Você ouviu um
homem no jardim?”. A entonação é que será responsável nessas situações por atribuir uma
estrutura de foco contrastivo a “saw”, na segunda elocução.
O termo “gramatical”, para caracterizar o segundo contraste significativo, é utilizado pela
autora no sentido tradicional. Esse tipo de contraste se estabelece, portanto, a partir da função
gramatical da entonação, que possibilita, por exemplo, a diferenciação entre uma afirmação e
uma questão.
(10) a |shut the DÒOR||
(feche a porta)
b |shut the DÓOR||
(feche a porta)
As elocuções acima representam o uso do contorno descendente e ascendente para
caracterizar, respectivamente, uma ordem e um pedido.
O valor ilocucionário seria caracterizado a partir da possibilidade de a entonação conferir
uma força intencional à elocução em um dado contexto. Ou seja, segundo a entonação utilizada
28
para uma enunciação, o ouvinte poderia perceber, por exemplo, uma intenção subjacente do
locutor, tal como sugerir algo.
(11) a h|WHY don‟t you move to CaliFÓRnia||
(por que você não se muda para a Califórnia)
b l|why don‟t you move to CaliFÓRnia||
(por que você não se muda para a Califórnia)
Nos exemplos acima (extraídos por Couper-Kuhlen de Sag e Liberman, 1975), percebe-
se que a intenção do locutor, com a elocução (a), é apenas fazer uma pergunta, desejando obter
informações sobre as razões pelas quais seu interlocutor não estaria disposto a se mudar para a
Califórnia. Com a elocução (b), mais do que uma simples pergunta, o locutor sugere que seria
uma boa opção para seu interlocutor mudar-se para a Califórnia. Esse valor adicional conferido
ao formato, nesse caso, interrogativo do contorno prosódico é que se caracteriza como a força
ilocucionária que foi atribuída à enunciação.
Entende-se como um contraste atitudinal aquele que se estabelece com base na expressão
da emoção do locutor.
(12) a h|good MÓRning||
(bom dia)
b l|good MÒRning||
(bom dia)
O exemplo (aproveitado de Gimson, 1980) evidencia, na versão (a), um certo estado de euforia
do locutor, caracterizado pelo tom ascendente sobre a sílaba <mor>. O tom descendente sobre
essa mesma sílaba produz a sensação de um cumprimento rotineiro, sem grande entusiasmo.
O quinto contraste significativo, indicativo da função textual da entonação, seria o
responsável pelo aspecto coesivo estabelecido entre diferentes enunciações. Couper-Kuhlen
lembra que o termo “textual”, nesse caso, deve ser entendido como relacionado aos aspectos da
organização lingüística além da sentença e relacionados à mensagem em si mesma.
29
(13) a the h|lecture was CÀNcelled || the
h|speaker was ÌLL||
(A conferência foi cancelada. O conferencista estava doente.)
b the h\lecture was CÁNcelled || the |speaker was ÌLL||
(A conferência foi cancelada, o conferencista estava doente.)
O exemplo (b) acima (aproveitado por Couper-Kuhlen de Brazil, Coulthard e Johns, 1980:31)
deixa perceber que o contorno continuativo verificado sobre a sílaba <can> permite o
estabelecimento de uma relação discursiva direta entre as duas enunciações. Torna-se bem
evidente a noção de que o cancelamento da conferência se deu por causa da doença do
conferencista. Evidentemente, o simples fato de ambas as elocuções se posicionarem uma ao
lado da outra, e nessa seqüência em que foram apresentadas, sugere a relação causa-
conseqüência, como ocorre também na versão (a). A aplicação do contorno entonativo
continuativo, na versão (b), realça essa relação.
O último contraste significativo que Couper-Kuhlen caracteriza para os contornos
prosódicos, o indexical, seria responsável por estabelecer diferenças identitárias entre os seus
usuários. Trata-se do reconhecimento, por exemplo, de um indivíduo como pertencente a um
certo grupo sócio-regional que faria uso de um contorno específico em determinadas situações
comunicativas; assim como, entre várias outras possibilidades, de uma certa identificação
profissional, como se verifica, por exemplo, nas elocuções proferidas por pregadores religiosos
ou vendedores de rua.
Pela observação dos exemplos acima, talvez seja possível dizer que a porção mais
significativa de um contorno esteja localizada sobre a parte final da frase entonacional. Nos
casos dos contornos informacional e ilocucionário, o contraste entre as versões a e b dos
exemplos se estabeleceu, pelo contrário, a partir do realce de porções localizadas em posições
que não as finais. A marcação de foco, em princípio, pode se dar em qualquer posição da frase,
bastando que, para isso, na intenção comunicativa, o elemento destacado esteja nessa posição.
Estendendo-se essa observação para os aspectos afetivos da comunicação, os possíveis contornos
prosódicos talvez tendam a se concentrar em determinados pontos da frase entonacional segundo
a língua analisada. Para o holandês, como destaca Gussenhoven (2002a:48), a tendência parece
ser a localização sobre a porção final, numa sugestão de que, nessa língua, os finais dos
contornos seriam utilizados mais freqüentemente para sugerir os significados afetivos. Já no PB,
essa posição não seria tão recorrente. Em uma mesma frase entonacional, os pontos mais
30
significativos dos contornos ocupariam tanto as posições finais quanto as iniciais ou médias,
algumas vezes esses pontos significativos se distribuindo entre mais de uma posição (Moraes e
Stein, 2006).
Mesmo que a localização para um caráter distintivo de um contorno ao longo de uma
frase entonacional seja fixa, normalmente ocorrem variações na extensão do pitch. Ladd
(1996:150), ao analisar um exemplo hipotético, constituído pela seqüência tonal M..H..H..L..M,
evidencia duas possibilidades de realização para o contorno:
(14) a
b
Essa variação de pitch ocorre da mesma forma nas línguas entonacionais. Como o autor sugere,
tanto no inglês quanto no iorubá é possível distinguir uma extensão de pitch “normal” e uma
“expandida” daquilo que, em outros aspectos, é exatamente o mesmo tom. Assim, tanto nas
línguas entonacionais quanto nas tonais, observa-se uma identidade de relação entre a
modificação na extensão paralingüística do pitch e a especificação lingüística tonal. Ladd faz
essa observação com o intuito de mostrar que esse tipo de modificação na extensão do pitch não
seria um problema para o modelo descritivo da teoria métrico-autossegmental, assim como para
nenhuma outra teoria fonológica da estrutura entonacional. Em outras palavras, o que se
verificaria, nesses casos, seria uma projeção idiossincrática do locutor sobre o contorno
entonacional, expressando, por exemplo, um maior entusiasmo durante a elocução. Um mesmo
contorno prosódico assumiria, então, uma função fonológica e, paralelamente, expressiva, ou,
como colocou Ladd, observa-se, simultaneamente, uma caracterização lingüística e outra
paralingüística para o mesmo contorno.
Pode-se pensar a existência, então, de determinados contornos que são próprios de
situações corriqueiras, nos termos de Ladd (1978:524), situações estereotipadas ou estilizadas,
31
como observado, por exemplo, quando da troca de agradecimentos entre um vendedor e um
cliente. Todas as vezes em que houver necessidade de uma expressão autêntica de agradecimento
ou de desculpas, o mesmo contorno que normalmente é utilizado com esse propósito sofrerá uma
variação mais expressiva da F0. A proposta de Ladd (535) é a de que os contornos estilizados
são, na verdade, entonações planas com algo adicionado, ou seja, trata-se de uma modificação de
contornos mais básicos. A modificação pertenceria à forma: a realização de pitch uniforme dos
tons gerando o contorno. Marandin (2004) propõe a extensão dessa caracterização ao aspecto
semântico da estilização. Assim, a estilização estaria adicionando ao contorno original um efeito
de menção. O significado dos contornos estilizados poderia, então, ser decomposto em dois
elementos caracterizados, um como o contorno evidente, outro como os efeitos ligados ao fato de
esse contorno ter sido mencionado (para uma discussão mais detalhada, cf. seção 3.1 e figura
3.4, à frente).
Em princípio, a modificação na extensão do pitch poderia parecer um simples
redimensionamento na proporção entre um certo nível fixo de referência, estabelecido na parte
mais baixa da extensão do pitch, e os alvos a serem atingidos para a produção de um
determinado efeito expressivo. No entanto, Ladd (1996:269), assumindo o expresso por
Liberman et al. (1993), indica que estaria sendo envolvido, nesse processo, algum componente
aditivo além dos fatores multiplicativos que produziriam essa extensão proporcional do pitch.
Estaria presente, portanto, uma certa modificação no nível fixo de referência.
Um exemplo de fator extrínseco interferindo nesse nível de referência seria a variação na
extensão de projeção do pitch devida às características individuais dos falantes. Os valores reais
da F0 que correspondem a um tom H ou M sofrerão influência da identidade masculina ou
feminina do locutor, ou ainda de seu estado emotivo. Existe, portanto, como já dito, uma relação
direta desses níveis com a caracterização idiossincrática do locutor e o contexto paralingüístico
da elocução. No entanto, como afirma Ladd (270), nem a posição dos tons na escala, nem sua
identidade lingüística serão afetadas por esse tipo de influência (para detalhes sobre o modelo
matemático proposto, cf. Ladd (1996:265-69); para uma breve discussão da proposta de
normalização e de inicialização como alternativas para essas variações idiossincráticas, cf. mais
à frente).
De um certo modo, parece ser possível dizer que, da mesma forma que a variação na
extensão dos tons é caracterizadora de manifestações paralingüísticas, a distância na escala
temporal entre dois eventos fonológicos distintos deve ser percebida, como já discutido acima,
como a transição entre esses eventos. Segundo Ladd (1996:45), esse seria um dos pontos
32
principais na diferenciação entre a teoria métrico-autossegmental e as teorias anteriores: ela
distingue explicitamente “eventos” e “transições”. Assim, os eventos seriam as partes
lingüisticamente importantes dos contornos, localizadas em determinados pontos, e não
estendidas sobre todo o contorno. A manifestação da F0 entre esses eventos significativos seria
uma transição gradual entre, por exemplo, o nível alto ao final de um evento local e o baixo no
início do evento seguinte.
A consideração da existência de pontos localizados da F0 como caracterizadores dos
eventos significativos para um contorno prosódico implicaria, por extensão, dizer que o
movimento da F0, nesses eventos, atende a uma configuração específica. Parecem existir
evidências claras de que o alinhamento dos alvos da F0 seria cuidadosamente controlado (Ladd,
1996:68). Isso sustentaria uma teoria segundo a qual os alvos da F0 seriam a manifestação
fonética de tons estáticos subjacentes, o que não seria incompatível com a noção de serem os
movimentos de pitch considerados como primitivos. No entanto, uma vez que se constatam mais
evidências para o alinhamento preciso dos alvos, torna-se mais improvável a noção de que os
alvos da F0 seriam apenas pontos onde os movimentos de pitch começariam e terminariam.
Dessa forma, a proposta de uma visão baseada em configurações para os contornos prosódicos
torna-se mais plausível.
Mesmo dentro de um único evento, a F0 se estende ao longo da linha cronológica. A
previsão de um contorno se diferenciar de outro com base nos picos atingidos pela F0, ou pela
sua projeção cronológica, não se coloca de forma exatamente fácil. Como reporta Ladd
(1996:68), referindo os experimentos de Liberman e Pierrehumbert (1984), haveria indícios de
que a descrição em termos de níveis – ou seja, o nível atingido pela F0 em um determinado
ponto sendo mais elevado do que o nível atingido em outro ponto – parece expressar melhor as
regularidades nos dados experimentais analisados do que a variação na extensão. Os
experimentos utilizados evidenciaram uma correlação significativa entre a variação geral do
pitch e o tamanho das extensões da F0. No entanto, a relação entre as alturas atingidas pelos
picos mostrou-se muito mais regular do que a relação entre os tamanhos das extensões, o que
suportaria a idéia segundo a qual o posicionamento pontual dos picos da F0 é que seria mais
significativo para a caracterização dos contornos. Ladd (1996:69) apresenta ainda, como
confirmação dessa hipótese, os dados perceptivos obtidos por „t Hart (1981). Com base em um
experimento em que o autor procurou explorar especificamente a extensão da F0, em detrimento
de sua elevação, foi possível constatar que os ouvintes têm uma atenção consideravelmente
33
desenvolvida para o nível do alvo da F0, mostrando um desempenho muito baixo no julgamento
da extensão em si mesma.
Uma vez estabelecida a noção de que os níveis atingidos pela F0 são muito mais
significativos do que sua extensão ao longo da escala cronológica, esse referencial poderia ser
tomado como base para o estabelecimento de um modelo capaz de mensurar as variações da
freqüência fundamental. A proposta de Ladd (1996:256) tende para o que seriam considerados os
modelos normalizadores. Um modelo desse tipo focalizaria a noção de variação do pitch em
termos de alguns pontos de referência específicos do falante, tais como o valor mais alto e o mais
baixo da F0. Esse modelo possibilitaria abstrair variações entre os falantes, assim como
comportamentos paralingüísticos, expressando as características invariáveis dos tons em termos
do que seria uma variação idealizada do falante, possibilitando um processo de fatoração das
fontes de variação. Assim, seria estipulado que um tom H estaria se realizando no valor máximo
de variação do falante, ao invés de considerar que esse tom H estaria a uma determinada
distância de um tom L. Não estaria sendo feita referência ao contexto fonético da elocução, o que
permitiria considerar que, numa dada configuração, o início de um tom low-rise não seria
referenciado a partir de algum nível de pitch precedente. Uma exemplificação de uso desse
modelo seria a abordagem feita por Earle (1975, citado por Ladd, 1996:256) dos tons lexicais em
palavras monossilábicas vietnamitas. Foi estabelecido um valor de 100 para o ponto mais
elevado na escala de variação de F0 de cada falante, e 0 para o ponto mais baixo. Earle definiu as
formas de citação de cada um dos contornos dos seis tons lexicais do idioma em termos da
variação ao longo da escala percentual definida para cada falante.
Um elemento complicador na tentativa de estabelecer uma normalização, nos moldes
discutidos acima, é o fato de que a variação do pitch pode sofrer modificações, como já discutido
anteriormente, mesmo se considerado o discurso de um único falante. É o que se observa em
situações envolvendo variações paralingüísticas, como a elevação da voz para demonstrar raiva,
ou abaixamento, por um estado de tristeza, ou situações com propósitos comunicativos diversos,
como não falar alto para não perturbar os outros leitores em uma biblioteca. Embora a variação
do pitch seja intensa nessas diversas situações, alguma dessas variações seria independente da
mensagem lingüística. Como Ladd (1996:259) lembra, o que pode ser dito com a voz alta
também pode ser dito com a voz baixa. Seria o caso, então, de buscar uma normalização dessas
diferenças.
No entanto, outros fatores estariam interferindo nessa normalização. Caso sejam
comparadas as dimensões da F0 em falantes diferentes, poderão ser encontrados pontos comuns
34
de intersecção. Normalmente, a variação de F0 em uma mulher estará dentro de limites de pitch
diferentes da variação verificada em um homem de voz mais grave. No entanto, caso se
comparem dois homens, ou duas mulheres, será mais difícil estabelecer uma normalização. No
primeiro caso, a voz feminina será indiscutivelmente mais elevada; no segundo caso, nem
sempre será possível estabelecer a voz de um dos falantes como sendo a mais elevada. Ladd
(1996:260) propõe a caracterização de um nível geral da F0 e a caracterização das diferenças no
que ele denomina span (a extensão das freqüências utilizadas). Freqüentemente, o nível geral e o
span não são claramente distinguíveis, por covariarem: quanto mais elevado o nível geral, mais
amplo o span. Como Ladd menciona, a comparação entre uma voz masculina que apresente uma
variação de 80Hz (de 80Hz a 160 Hz, por exemplo) e uma feminina com variação de 160 Hz (de
160Hz a 320 Hz) permitirá dizer que a feminina apresenta uma variação duas vezes maior que a
masculina, mas com a mesma largura de uma oitava ou 12 semitons, se essa variação for
expressa logaritmicamente (160/80 = 320/160 = 2).
Haveria, a partir da idéia da “unidade da fonologia de pitch”, a expectativa de existirem
consistências similares no escalonamento de alvos da F0 entre falantes que produzissem uma
mesma elocução nas línguas européias. Ladd (1996:262) considera o exemplo “I‟ve been there
before” (eu já estive lá antes) entoado como uma frase declarativa neutra. São identificados
quatro alvos, um L inicial, um H* acentuado sobre “been”, seguido de um L e, finalmente, um
tom de fronteira L%. A normalização dos dados hipotéticos desses quatro alvos, pronunciados
por três falantes, sendo um deles um homem, com H* representando 100 por cento e L%
representando 0 por cento, indica que, para todos os três falantes, os quatro pontos-alvo
mostram-se os mesmos (para maiores detalhes, cf. Ladd, 1996:262).
* * *
Vários estudos têm buscado a identificação de contornos entonacionais. Embora não seja
implausível a existência de contornos mais sutis, envolvendo uma variação tonal mais fina, um
ponto que já parece ser consensual é a existência de duas configurações básicas, uma com
caracterização descendente da F0, outra com caracterização não-descendente. Marandin (2004)
identificou, para o francês, esse primeiro nível de contraste como pertencente à esfera da
controvérsia em oposição à não-controvérsia, considerando-se o conteúdo da elocução. O uso de
uma modulação descendente da F0 indicaria, da parte do locutor, uma postura não-controversa,
não ocorrendo, portanto, uma revisão do comprometimento que é expresso com a elocução. Em
outras palavras, o locutor não viria a opor qualquer argumentação ao que sua elocução sugere. Já
35
um contorno não-descendente anteciparia uma possível falta de concordância entre o locutor e
seu interlocutor quanto ao conteúdo proposicional da elocução. Assim, atos discursivos
prototípicos (asserções, questões e comandos, que são expressos por sentenças, respectivamente,
declarativas, interrogativas e imperativas) são verbalizados com um contorno descendente.
Gussenhoven (2002a:7), sumarizando uma sua proposta de 1984, identifica três contornos
entonativos básicos, sendo que o primeiro deles equivale ao que Marandin (2004) veio a
identificar como o contorno indicativo de uma postura não-controversa. Caracterizado como
sendo do tipo H*L, Gussenhoven sugere que esse primeiro contorno qualifica os constituintes
lingüísticos para uma adição ao modelo discursivo. Assim, o falante estaria se comprometendo
com a inclusão da informação no modelo, ou, nos termos utilizados por Marandin, não
anteciparia possíveis questionamentos em relação ao conteúdo proposicional enunciado. O
segundo contorno seria do tipo H*L H%, responsável por caracterizar os constituintes
lingüísticos para uma seleção a partir do modelo discursivo. Dessa forma, o falante se
comportaria como se o modelo discursivo já contivesse essa enunciação. Finalmente, o terceiro
contorno, do tipo L*H, caracterizaria a informação como potencialmente pertencente ao modelo
discursivo e o ouvinte, com isso, estaria sendo convidado a resolver a questão. Gussenhoven
rotulou esse modelo como sendo de Teste. Na classificação de Marandin, trata-se do contorno
que sugere uma controvérsia. Ladd (1980:150) menciona que Liberman e Sag (1974) haviam
descrito esse contorno como sendo o contorno da contradição. A idéia de contradição talvez
fosse mais bem expressa como sendo um questionamento em relação às suposições do ouvinte.
Em ambas as acepções, o contorno não poderia ser aplicado a uma oração encaixada, ou seja,
subordinada a uma outra. O exemplo apresentado é de Liberman e Sag (é mantida, aqui, a
mesma notação que foi utilizada originalmente para caracterizar o contorno):
(15) * Medical science has demonstrated that ¡elephantiasis isn‟t incurable!
(A ciência médica demonstrou que a elefantíase não é incurável!)
O problema verificado no exemplo está relacionado ao fato de a entonação sugerir que o
ponto de vista sobre a elefantíase não ser incurável é originário do locutor. No entanto, a oração
principal (que também seria pronunciada pelo locutor) indica que esse parecer foi emitido pela
ciência médica. O que se verifica, portanto, é uma incompatibilidade entre o contorno entonativo
impresso à oração subordinada e o conteúdo proposicional da oração principal. No entanto, caso
o contorno seja disseminado sobre toda a enunciação, as sentenças passam a ser aceitáveis:
36
(16) ¡Medical science has demonstrated that elephantiasis isn‟t incurable!
(A ciência médica demonstrou que a elefantíase não é incurável!)
Percebe-se, então, a existência de um princípio segundo o qual o ponto de vista sugerido por uma
enunciação, considerando-se o conteúdo proposicional, deve ser relativamente consistente.
Assumindo-se o ponto de vista do contorno entonacional, essa consistência deve se colocar
também no nível interno à enunciação. Como Ladd (1980:159) lembra, os pontos de vista não
precisam necessariamente ser os mesmos, mas precisam ser compatíveis.
1.3 A RELAÇÃO ORAÇÃO PRINCIPAL – ORAÇÃO SUBORDINADA
O processamento de uma enunciação, considerando-se o que foi discutido até o
momento, está relacionado à sua conformação sintática, mas não pode ficar restrito a ela. Muitas
vezes, a prosódia será tomada como única pista disponível para a atribuição de um sentido exato
a uma enunciação, como ocorre nos casos, já mencionados, em que se faz necessária a
desambigüização de uma sentença. Considerando essa função gramatical da entonação, portanto,
percebe-se que a substituição de uma entonação por outra pode acabar por produzir uma
mudança no sentido ou na função gramatical. É freqüente que uma determinada entonação
acompanhe uma estrutura gramatical no discurso real. Nas palavras de Crystal (1969) (citado por
Couper-Kuhlen, 1985:114), as considerações gramaticais também devem ser levadas em
consideração no estudo da entonação, uma vez que se percebe uma correlação regular entre uma
estrutura gramatical e um padrão entonacional. Couper-Kuhlen, comentando essa correlação
sugerida por Crystal, questiona até que ponto essa correlação deve ser tomada como um critério
adicional ou alternativo para a função entonativa. O ponto a ser considerado diz respeito ao fato
de que, muitas vezes, um padrão entonacional específico é distintivo com respeito a um certo
tipo de significado, considerando-se a noção de pares mínimos, mas, no discurso real, nem
sempre esse padrão co-ocorreria com o membro apropriado do par. Nesse caso, seria mais difícil
considerar a noção de uma função entonativa.
No entanto, a prosódia parece oferecer uma contribuição um pouco mais específica ao
processamento de uma enunciação. Grosjean (1983:503) afirma que a informação prosódica
pode ser utilizada como fonte de informação para o processamento do sinal até o ponto em que a
elocução foi produzida pelo locutor, mas também para prever o que deverá vir após esse ponto.
Para ilustrar a segunda afirmação, propósito central de seu artigo, o autor menciona que, muitas
vezes, determinados trechos de uma entrevista radiodifundida dão a impressão de que o
37
entrevistado não concluiu sua elocução. Isso se deve ao fato de que, no momento da edição do
sinal sonoro, as fronteiras semânticas e sintáticas teriam sido respeitadas, mas não as fronteiras
prosódicas. Essa impressão de que o entrevistado teria, originalmente, dito muito mais do que foi
apresentado ao público é sugerida pelo comportamento prosódico, que apresenta uma
informação sobre o tamanho da elocução.
Os experimentos de Grosjean confirmaram que a prosódia é capaz de informar, em um
determinado ponto da sentença, o tamanho do restante da enunciação. O interesse desse
fenômeno está, entre outros, na possibilidade de o ouvinte não apenas prever esse tamanho do
restante da enunciação, mas também contar com uma ajuda no sentido de delinear o fim da
sentença e, a partir disso, prever o início da seguinte. Isso se colocaria como um facilitador do
parsing, permitindo que, com a previsão da conclusão da sentença, o interlocutor prepare sua
resposta para uma possível intervenção na situação comunicativa.
Os resultados dos experimentos permitiram quatro conclusões. Inicialmente, confirmou-
se a capacidade extremamente precisa dos participantes na estimação do tamanho do restante da
sentença, caso ela seja interrompida antes de seu término. Essa capacidade diz respeito não
apenas ao reconhecimento de uma sentença como tendo sido interrompida, mas também à
previsão, por exemplo, de a continuação ser feita com três ou com seis palavras. Em segundo
lugar, constatou-se que os participantes não conseguiram diferenciar sentenças que terminariam
com nove palavras das que terminariam com seis palavras. Grosjean sugere que isso se deva ao
fato de os valores prosódicos dessas sentenças que seriam complementadas com nove palavras
situarem-se entre os valores das sentenças que seriam terminadas com três palavras e os valores
das que seriam terminadas com seis palavras. A terceira conclusão é a de que os participantes
não conseguiram distinguir entre os vários tipos de sentenças (final com nenhuma palavra; com
três palavras; com seis palavras; e com nove palavras) no início da potencialmente última
palavra da sentença. Isso significa dizer que as pistas prosódicas que permitem a previsão do
tamanho do restante da sentença encontraram-se ao longo dessas potenciais últimas palavras,
talvez, especificamente, sobre a sílaba tônica. Finalmente, constatou-se que existe um gradiente,
talvez prosódico, ao longo dessas últimas palavras, com o aumento da capacidade dos
participantes em prever o tamanho da continuação da sentença ao longo da progressão prosódica
dessas últimas palavras.
A importância da predição prosódica para o ouvinte pode ser caracterizada, segundo
Grosjean (1983:503), de três formas distintas. Inicialmente, com a predição, ocorreria uma
redução no leque de possibilidades interpretativas. Com isso, o ouvinte teria como direcionar o
38
foco de sua atenção para um ponto específico, o que tornaria o processamento cognit ivo mais
eficiente, podendo, até mesmo, ser acelerado, quer durante a percepção do discurso, quer durante
o reconhecimento das palavras, quer, ainda, durante o parsing sintático. Em segundo lugar, a
predição estaria ajudando na demarcação do domínio de processamento. O estabelecimento de
uma fronteira de palavra, de frase ou de sentença deixaria o ouvinte pronto para o processamento
seguinte, fosse ele de uma palavra, de uma frase ou de uma sentença. Finalmente, uma vez que
estaria ocorrendo uma economia no processamento cognitivo do ouvinte, haveria mais tempo
disponível para outras atividades necessárias à compreensão global do discurso, tais como a
integração das informações e a preparação, por exemplo, de uma resposta.
De uma forma um pouco menos específica, no sentido de não ter havido o interesse de
prever o tamanho do restante da sentença, Pierrehumbert e Hirschberg (1990:278), reportando
Liberman e Pierrehumbert (1984), indicam que se constatou que a variação de pitch em frases
declarativas é rebaixada e comprimida, como forma de antecipação do final da elocução.
Também Swerts et al. (1994), ao buscarem as pistas melódicas indicativas do final de uma
elocução, reportam que Cutler e Pearson (1986) identificaram o uso de contornos com downstep
como sendo boas pistas dadas pelo falante para sinalizar que deseja passar o turno da fala para
seu interlocutor, enquanto os contornos com upstep indicariam a intenção do falante de
permanecer com o turno de fala. Reportam também que Wichmann (1991) constatou, para o
inglês britânico, que se o último acento de um contorno é menor quanto à abrangência de sua
variação do que o precedente, a impressão é a de que o contorno parece mais final (“final”, aqui,
no sentido de finalização da enunciação). A hipótese que Swerts et al. assumem para os
experimentos que reportam é a de que, também no holandês, contornos entonacionais que
apresentem a convergência das linhas superior e inferior delimitadoras da declinação da F0 são
percebidos como “mais finais” do que outros contornos que apresentem as linhas de declinação
divergentes. Os resultados que obtiveram indicaram que esse valor final está mais associado a
quedas iniciais da F0 do que a quedas finais.
A combinação desses resultados se presta, de certa forma, à sustentação do procedimento
da teoria métrico-autossegmental em considerar que os contornos entonacionais são seqüências
de eventos fonológicos sucessivos. Como Ladd (1996:147) indica, não haveria necessidade de
considerar a relação entre parâmetros lexicais e entonacionais da F0 em termos de um modelo de
sobreposição, em que os parâmetros lexicais estariam superimpostos às tendências
39
entonacionais. Os aspectos da F0 seriam, em si mesmos, eventos localizados na seqüência de
tons, da mesma forma que os aspectos lexicais10
.
Uma vez que, durante o processamento cognitivo, o ouvinte faz uso das pistas prosódicas
para prever a continuação da sentença, é de esperar que essa função preditiva deva se concentrar
ao final de determinadas estruturas sintáticas. Uma vez que as orações principais, no processo de
subordinação, apresentam uma estruturação que, necessariamente, deve ser complementada por
uma outra oração, elas parecem se colocar como boas candidatas a concentrar a função preditiva.
Green (1976, citada por Ladd 1980:149) cunhou o termo “fenômeno da oração principal”
(no inglês, main clause phenomena). A partir de então, uma certa atenção passou a ser
direcionada para essas estruturas, considerando que existem certas transformações sintáticas,
itens lexicais e alguns outros fenômenos gramaticais cuja ocorrência se mostra amplamente
restrita às orações principais. Segundo Green, a concordância do falante com o que está sendo
afirmado na oração principal se relacionaria com o fenômeno da oração principal nas orações
subordinadas. Em outros termos, o falante deveria concordar com o que está sendo enunciado na
oração principal. Isso sugeriria uma teoria relativa à formulação de asserções. A conclusão a que
a autora chega é a de que esse fenômeno afeta, de alguma forma, o que está sendo afirmado,
sugerindo que o que há de comum em todos os ambientes idiossincráticos em que ele é aceitável
nas orações subordinadas é o fato de esses ambientes não contradizerem a asserção principal da
sentença, o que, de alguma forma, é assinalado pelo fenômeno da oração principal (Ladd,
1980:152). Esse fenômeno, no entanto, não caracteriza especificamente os aspectos entonativos,
sendo determinado por fatores pragmáticos, semânticos e sintáticos (Green, 1976:392). No
entender de Ladd (1980:154), a função do fenômeno da oração principal estaria mais relacionada
à forma como a asserção é feita do que a uma parte da asserção propriamente dita. Ao pronunciar
uma sentença utilizando-se desse fenômeno, o falante estaria transmitindo a informação e, ao
mesmo tempo, direcionando-a de uma maneira específica, por exemplo, de uma forma
dramática. Esse fenômeno seria semelhante à entonação no sentido de que ambos contribuem
mais intensamente para a parte não-proposicional da mensagem, ou seja, a forma como ela é
dita.
Também a escolha do acento frasal pode influenciar a interpretação das relações entre
orações contíguas. Pierrehumbert e Hirschberg (1990:304) observaram que a conjunção e, por
10 Isso se aplicaria a línguas tanto entonacionais quanto tonais. No caso do chinês, existe uma maior quantidade de
eventos na F0 pela simples razão de os tons lexicais ocorrerem em aproximadamente todas as sílabas, com as
transições na ordem de apenas alguns milissegundos. No inglês, por exemplo, os acentos de pitch ocorrem
principalmente nas palavras proeminentes, com as transições podendo ocupar várias sílabas.
40
exemplo, é assimétrica, podendo por vezes sugerir temporalidade ou causalidade entre as orações
que une. A proposta seria a de que a escolha do acento frasal poderia influenciar se uma dada
interpretação é sugerida ou não. A exemplificação é feita como abaixo11
, com duas
possibilidades de tom unindo as duas orações:
(17) a George ate chicken soup and got sick
H* H* H* H H* H* L L%
(George comeu a sopa de galinha e passou mal)
b George ate chicken soup and got sick
H* H* H* L H* H* L L%
No primeiro caso, o tom H favorece a interpretação de que a sopa de galinha é que teria
ocasionado o mal estar de George. Embora no segundo caso essa relação causal seja mantida,
não há um reforço entonacional. Trata-se, portanto, de uma situação em que as relações
estabelecidas entre as duas orações são percebidas, em primeiro lugar, pelo próprio conteúdo
proposicional, considerando-se, naturalmente, a seqüência cronológica em que os eventos se
sucedem (colocar a segunda oração em primeiro lugar, seguida pelo conectivo, implicaria que a
sopa de galinha seria entendida como uma possível cura para o mal estar de George). A prosódia,
nesse caso específico, serviu como um reforço para a percepção da relação existente entre as
orações.
O posicionamento do contorno de continuação (L H%), no exemplo a seguir, no entanto,
estabelecerá relações completamente diferentes entre as enunciações apresentadas (305),
evidenciando uma situação em que o papel prosódico deixa de ser secundário:
(18) a My new car manual is almost unreadable
L L%
(O manual do meu carro novo é quase ilegível)
b It‟s quite annoying
L H%
(É quase ofensivo)
c I spent two hours figuring out how to use the jack
L L%
(Gastei duas horas tentando entender como se usa o macaco)
11 No caso desses exemplos, trata-se de uma coordenação no nível sintático, mas de uma subordinação no semântico.
41
Por conta do contorno de continuação, a elocução (b) deve ser analisada em relação à frase
seguinte. Dessa forma, (c) se coloca como o que o locutor considera como sendo praticamente
ofensivo: no caso, o fato de ter gasto tanto tempo para entender o mecanismo de funcionamento
do macaco do carro. Uma outra relação, no entanto, deve ser estabelecida com o posicionamento
desse contorno continuativo ao final da elocução (a):
(19) a My new car manual is almost unreadable
L H%
b It‟s quite annoying
L L%
c I spent two hours figuring out how to use the jack
L L%
A elocução (b) passa a ter relação direta com a elocução (a), e o novo entendimento é o de que o
manual do carro é quase ofensivo. O estabelecimento das relações entre as elocuções, portanto,
só foi possível por conta do contorno prosódico aplicado a elas.
1.4 A PRÉ-INDICAÇÃO
A partir do momento em que se postula que os elementos da entonação apresentam
significado (Ladd, 1996), pressupõe-se que seja possível, e mesmo esperado, que o usuário da
língua faça uso desses elementos na construção do seu discurso. Pierrehumbert e Hirschberg
(1990:271) propõem que um locutor faz a escolha de uma dada entonação em sua interação com
o ouvinte. Essa entonação refletirá como a sentença se relaciona, de forma específica, com as
crenças do ouvinte, assim como oferecerá uma antecipação da contribuição das elocuções
subseqüentes na formulação do discurso. Essas relações, segundo as autoras, assumem uma
natureza composicional, composta pelos acentos melódicos, pelos acentos frasais e pelos tons de
fronteira que produzem as entonações.
Posto desta forma, a impressão é a de que, durante toda a construção do discurso, o
falante faz uso – conscientemente – de todos os contornos melódicos disponíveis para
representar, de forma precisa, seu pensamento. Grande parte da produção discursiva se dá de
forma automatizada, o que permite a ocorrência de lapsos freqüentes durante o ato comunicativo.
No entanto, o discurso também pode ser produzido a partir de um certo planejamento – o que
não implica um nível de consciência plena sobre os processos envolvidos nessa produção.
42
Snedeker et al. (2000:8) constataram, em seus experimentos, que o uso de pistas prosódicas
informativas dependem da consciência do falante em relação à situação discursiva, sugerindo
que essas pistas serão utilizadas se necessário.
A proposta dos autores é a de que esse uso se dá na condição de que os falantes tenham
conhecimento do contexto referencial em que estejam inseridos. Especificamente, utilizar pistas
prosódicas para evidenciar, por exemplo, uma das interpretações possíveis em uma enunciação
ambígua dependerá da existência ou não de outras pistas contextuais fornecidas pela situação
referencial. Esse contexto referencial, portanto, seria crítico na determinação dos falantes em
produzir pistas prosódicas mais fortes: a não-existência de pistas referenciais evidenciadoras de
uma das interpretações induziria os falantes ao uso das marcas prosódicas desambigüizadoras, o
que confirma, por exemplo, uma das máximas de Grice (1975), a da clareza, segundo a qual a
eficiência da interação comunicativa não permite dúvidas quanto ao conteúdo proposicional
enunciado. Por outro lado, os testes realizados evidenciaram que os ouvintes também fizeram
uso dessas pistas prosódicas (ainda que imperfeitamente), estando elas presentes.
Os padrões entonativos poderiam, também, sofrer uma segmentação, de forma que um
enunciado iniciado por um locutor viesse a ser complementado pelo ouvinte (que passa a
assumir, no seu turno, a função de locutor). Fox (1984) adota a idéia segundo a qual esses
padrões entonativos seriam vistos como grupos tonais independentes, que poderiam ser
considerados como a primeira parte de uma estrutura a ser completada pela elocução seguinte. É
o caso dos padrões entonativos utilizados nas questões totais, que apresentam, comumente, uma
modulação ascendente. Normalmente se associa a melodia ascendente a um contorno
continuativo. A finalização desse contorno, no caso de uma questão total, se daria com a resposta
do interlocutor. Essa análise indica, portanto, um padrão entonacional que se divide em dois
segmentos. Como alternativa de análise, Fox sugere que se poderia analisar o contorno
continuativo das questões totais sem recorrer a um interlocutor. Bastaria interpretar essas
questões como sendo a primeira parte de uma questão alternativa truncada, que seria
hipoteticamente completada por “ou não”. Assim, o contorno ascendente se projetaria sobre a
primeira parte da questão, e a segunda se responsabilizaria pelo contorno final. Essa abordagem
explicaria, por exemplo, por que as questões parciais não apresentam contorno continuativo: elas
não poderiam ser complementadas por “ou não”.
A análise do contorno entonacional das questões totais como sendo a parte inicial de um
contorno maior deixa perceber, de certa forma, a expectativa de que esse contorno será
complementado. Essa complementação, nesse caso específico, poderia se dar de apenas duas
43
formas, com uma resposta afirmativa ou uma resposta negativa. Parece bastante razoável,
portanto, sugerir que esse contorno continuativo das questões totais seja pré-indicativo de uma
resposta “sim/não”. Naturalmente, isso não se deve colocar de forma absoluta, principalmente
por conta da existência de inúmeras variações, considerando-se, inclusive, variações
idiossincráticas da modulação.
Ladd (1996:252) enfatiza a idéia de a modulação ser um parâmetro fonético anômalo.
Muitos pontos de referência, quando se lida com sons do discurso segmental, são válidos para
todos os falantes, já tendo sido devidamente estabelecidos enquadramentos taxonômicos tanto
para os aspectos articulatórios quanto para os aspectos acústicos dos sons segmentais. A variação
entre falantes, nesses casos, não anularia a validade das descrições fonéticas. Muito
provavelmente, também não anula a capacidade de predição prosódica. No entanto, não se
estabeleceu ainda uma referência exata, nesses mesmos termos, para uma descrição melódica. A
melodia varia intensamente de falante para falante, considerando-se ainda a situação discursiva
de uso das entonações, e mesmo entre uma parte da elocução e outra. Como já discutido na seção
1.2, Ladd sugere que seria necessário, ao invés de postular uma caracterização absoluta, procurar
estabelecer caracterizações que se coloquem de forma explicitamente relativa, por via da
normalização ou da inicialização.
Considerando as propostas de Ladd, e antes de pensar a possibilidade de extensão desse
conceito de predição por via prosódica a outros campos sintáticos, não se deve perder de vista,
todavia, a noção de que toda predição é raramente perfeita. Como lembra Grosjean (1983:503), a
predição, por definição, é probabilística, e o ouvinte deve levar isso em consideração caso venha
a estabelecer uma predição. Grosjean considera ainda dois outros pontos. Um deles diz respeito
ao fato de a predição não precisar ocorrer durante o processamento on-line: não seria difícil
imaginar um sistema de processamento que utilizasse apenas informações passadas e presentes,
sem tomá-las em consideração para observar o que viria a seguir. O outro ponto se relaciona ao
fato de que ainda não haveria evidência suficiente para o uso da predição no processamento.
Portanto, o fenômeno da predição prosódica deve ser sempre visto (pelo menos até que se
constate o contrário) de forma não-absoluta.
Couper-Kuhlen (1985:115), nessa mesma linha de pensamento, observa que o termo
“função entonacional” sugere que todas as categorias e parâmetros do sistema entonacional se
mostrariam distintos uns dos outros no que concerne um certo tipo de significado, mas que
raramente isso acontece. Da mesma forma, é preciso relativizar o significado de frases como
“função gramatical da entonação” ou “função atitudinal da entonação”, uma vez que elas
44
sugerem, em princípio, que as distinções entonativas seriam responsáveis por absolutamente
todos os constrastes de significado em um dado domínio, o que, mais uma vez, raramente ocorre.
Observando-se a realização das atitudes, o que se percebe é que algumas vezes uma atitude se
manifesta por via entonativa, enquanto outra se manifesta pela escolha lexical, assim como uma
dada construção gramatical pode estar relacionada a um correlato entonacional, enquanto outra,
não.
Embora se deva pensar o fenômeno prosódico em termos relativos, Ladd (1996:13),
citando Lieberman e Michaels (1962:248), critica o fato de que a maior parte das tentativas de
estabelecimento de sistemas de análise lingüística analisa a modulação da freqüência
fundamental apenas em suas variações mais amplas, desprivilegiando, portanto, a sua estrutura
fina, além de desprezar, igualmente, o papel da amplitude e das variações fonéticas. Como
sugere Jacqueline Vaissière (comunicação pessoal), uma tentativa de caracterização de um
sistema prosódico deve considerar a modulação da freqüência fundamental em todas as suas
nuances, a duração e a intensidade, mas também as pausas, a qualidade da voz, e a articulação
(timbre)12
, para que se consiga, de fato, cobrir uma ampla gama de fatores relacionados ao
fenômeno prosódico.
* * *
A prosódia, tomada como elemento caracterizador das emoções e/ou atitudes, parece se
localizar na esfera do paralingüístico. Como discutido anteriormente, os possíveis padrões
entonacionais que se estabeleçam para uma língua apresentarão os tons dispostos em
determinadas posições e seqüências fixas, que serão entendidas como a marca identitária desses
contornos. As variações na escala do pitch são entendidas como expressões idiossincráticas,
revelando, por exemplo, os estados emotivos do falante no momento da elocução.
Quando se pensa o fenômeno da pré-indicação prosódica, também entendido como a
predição, parece ser necessário diferenciar o que ocorre na esfera das emoções/atitudes daquilo
que ocorre nas situações em que um determinado comportamento prosódico de um trecho de
uma enunciação sugere um outro trecho subseqüente. Uma vez que a modulação prosódica
utilizada em uma sentença se responsabiliza por sugerir que o falante está, por exemplo, triste ou
raivoso, talvez não seja apropriado dizer que a prosódia, neste caso um componente
paralingüístico, pré-indique algo que virá a seguir: a enunciação, entoada daquela forma, já
12 Di Cristo (2004:82) prefere qualificar o timbre como paraprosódico.
45
apresenta, em si mesma, a caracterização psicológica momentânea de seu enunciador. O
elemento prosódico, nesse caso, não seria preditivo de uma emoção/atitude, pois a
emoção/atitude já estaria totalmente manifestada na enunciação. O fenômeno da pré-indicação
ocorreria nos casos específicos em que, considerada uma enunciação (sintática ou
semanticamente) incompleta, o contorno entonativo que lhe fosse aplicado permitisse ao ouvinte
estabelecer previsões sobre como o falante daria prosseguimento à enunciação. A hipótese, nesse
caso, é a de que a entonação, a partir do estabelecimento de contornos prosódicos específicos
para cada modalidade pré-indicativa, poderia ser analisada dentro da esfera do lingüístico (em
oposição ao paralingüístico), assumindo uma configuração fonológica. Pierrehumbert e
Hirschberg (1990:271), por exemplo, ao mencionarem o uso de um contorno entonacional para
caracterizar uma interpretação discursiva, propõem que um falante escolhe uma entonação
específica para sugerir uma relação particular entre uma elocução, as crenças correntemente
percebidas de um ouvinte ou ouvintes, e as contribuições antecipadas das elocuções
subseqüentes.
Nessa linha de pensamento, a entonação não seria estudada em si mesma, mas como
elemento revelador de todo um processo procursivo, segundo os termos de Barbizet (1979:239).
Um dos grandes problemas estaria em sempre se entender a entonação como um simples
acompanhante do enunciado. A partir do momento em que se passe a observar a entonação de
forma mais incisiva, a constatação será a de que existe uma relação de entrelaçamento intenso
entre ela e outros componentes do discurso, algumas vezes de forma dependente, outras de forma
autônoma. A entonação estaria na posição de caracterizar a intencionalidade discursiva. Como
Barbizet (1979:240) e Vaissière (2004) sugerem, a relação entre as possíveis funções entonativas
e a sintaxe, de um lado, e o sentido, de outro, sofrerá modificações consideráveis quando esses
fenômenos forem observados na língua real.
Se no francês, por exemplo, se considerar a construção “ce n‟est pas comme cela” (não é
assim), a conjunção “que” (que) será o único elemento que poderá ocorrer logo a seguir, no eixo
sintagmático. A única variação que pode se verificar nessa conjunção será decorrência de fatores
fonológicos, por conta do elemento seguinte. No processo de produção discursiva, o enunciador
utiliza a conjunção antes mesmo de se preocupar em conhecer os elementos que serão utilizados
para preencher o quadro sintático que teria acabado de esboçar. Esse procedimento só se mostra
possível, segundo Barbizet (1979:243), porque existe uma curva melódica concebida como
autônoma que é aplicada sobre “ce n‟est pas comme cela”.
46
Fónagy (1974) é um dos principais precursores nos estudos da pré-indicação prosódica. O
termo “pré-indicação” foi, ao que parece, cunhado por ele, em seu artigo intitulado “La fonction
préindicative en français et en hongrois”. Suas observações se baseiam no fato de que a
entonação apresenta um papel bastante significativo na segmentação discursiva. Segundo ele
(44), os macro-movimentos da F0 se refletiriam na consciência humana como um movimento
espacial. Por outro lado, a entonação progressiva conteria ainda outras mensagens, indicando,
por exemplo, o comprimento do restante da frase, ou sua qualidade, isto é, se se poderia esperar
uma oração coordenada, uma subordinada, uma frase intercalada, uma enumeração, entre outras.
Para que se possam caracterizar esses comportamentos da curva melódica, seria preciso, em
primeiro lugar, estabelecer uma distinção entre as diferentes projeções perceptivas para seus
movimentos. Assim, a curva da freqüência fundamental apresentaria uma micro-estrutura,
responsável por determinar a musicalidade da voz; e uma macro-estrutura, que determinaria a
percepção das mudanças de altura, ou seja, as mudanças de freqüência dentro de uma sílaba e de
uma sílaba a outra. Embora essas diferenças sejam bastante sutis, o ouvido humano apresenta
uma grande capacidade de detectar informações, por exemplo, sobre as fronteiras entre sílabas de
um contínuo a partir de diferenças finas da F0 ou da duração (Vaissière, 1997).
Os resultados dos testes efetuados por Fónagy, na tentativa de caracterizar o fenômeno
pré-indicativo, mostraram-se negativos para a predição da frase longa. No entanto, quando se
tratava da predição de frases intercaladas, os resultados mostraram-se positivos. A melodia seria
a responsável por esse tipo de pré-indicação. Como já discutido, Grosjean (1983), embora
assumindo um paradigma distinto do adotado por Fónagy, confirmou a existência de um certo
limite quanto ao tamanho da continuação predita para uma certa frase a partir da entonação que
lhe fosse imposta. Como já comentado, não haveria diferença, quanto à capacidade preditiva,
entre uma frase com seis palavras e outra com nove, o que sugere que o limite de uma predição
distintiva estaria localizado nessa quantidade máxima de seis palavras, possivelmente em
sintonia com a capacidade de armazenagem da memória de curto-termo.
Ao analisar os resultados referentes à pré-indicação do fim de uma enumeração ou do fim
próximo de uma frase, Fónagy (1974:55) constatou uma variação bastante acentuada da
distribuição das respostas fornecidas pelos participantes segundo as diferentes realizações
prosódicas das estruturas sintáticas. Esses resultados deixariam bastante evidente a grande
variação, por vezes inconstância, dos esquemas prosódicos responsáveis por esses dois tipos de
pré-indicação. Seria possível que essa variabilidade tão intensa fosse decorrência, em primeiro
lugar, da não-identificação de um contorno prosódico específico para esses casos ou, ainda, da
47
própria variação idiossincrática que pode ser impressa aos múltiplos contornos, o que produziria
julgamentos diferentes dos participantes dos testes. Para Fónagy, essa variabilidade observada
em seus experimentos sugeriria a necessidade de distinguir quais seriam as realizações que
poderiam ser caracterizadas como pré-indicativas das que não seriam consideradas dessa forma.
Para o caso da entonação pré-terminal, uma mudança no esquema melódico da enumeração,
como a subida ou a ligeira depressão do patamar melódico, é que seria responsável por indicar
que o último termo enumerado teria sido atingido.
A distinção entre o valor pré-indicativo da mudança melódica e da mudança de débito
verbal sofreu, no caso, uma limitação por conta do tamanho do corpus analisado. A constatação
foi a de que o débito verbal apresentou uma aceleração considerável durante o penúltimo
membro da enumeração. A pré-indicação de uma enumeração parece ser favorecida pela
configuração que o primeiro membro da enumeração apresenta. Assim, para que uma
enumeração seja predita como longa, esse primeiro membro deveria apresentar uma acentuação
vigorosa, com o patamar da F0 bem elevado e linearizado, o que o colocaria em especial relevo.
Associado a isso, o início da frase do predicado que antecede a enumeração deveria se colocar
em anacruse, ou seja, suas sílabas iniciais deveriam se mostrar prosodicamente menos realçadas
que as últimas. Com isso, a sentença completa contendo uma enumeração longa se iniciaria em
um tom mais baixo; o ponto anterior ao início da enumeração apresentaria um tom alto; o início
da enumeração manteria esse tom alto, com a configuração prosódica, como mencionado,
contribuindo para o seu realce; gradativamente, haveria um rebaixamento de tom até o final da
enumeração, seguindo a própria curva natural da declinação. Ainda não se deveria desconsiderar
a possibilidade de uma pausa ultra-breve ou de uma quasi-pausa precedendo a enumeração.
Ao buscar a caracterização para um possível contorno prosódico pré-indicativo de uma
continuidade adversativa para um enunciado, Fónagy percebeu uma certa constância na subida
da F0 ao final da frase antecedendo a adversidade. No entanto, os resultados dos experimentos
evidenciaram que a ausência dessa subida não bastava, em si mesma, para prever uma
proposição não-adversativa. Os experimentos, portanto, não apresentaram resultados
conclusivos. Foi possível perceber apenas indicações para a caracterização do fenômeno da pré-
indicação. Isso levou Fónagy (1974:58) a assumir que a pré-indicação não constituiria – ainda –
um procedimento sintático.
Ao se pensar a possibilidade de um modelo de produção do discurso, a capacidade do
sistema de prever a extensão da linha de declinação deve ser levada em conta. Nos experimentos
de Fónagy, a possível pré-indicação do tamanho de uma enumeração se relaciona diretamente à
48
previsão do índice de declinação aplicado à curva da freqüência fundamental13
. É possível
perceber uma certa relação entre o fenômeno da predição prosódica, nos termos estabelecidos
por Fónagy, como discutido acima, e o que Ladd (1996:29) caracterizou como o planejamento
antecipado ou lookahead (“olhar à frente”). Uma das dificuldades em estabelecer descrições
quantitativas das tendências da F0 estaria no fato de essas tendências serem geralmente
dependentes do tamanho do domínio ao qual se aplicam. Inúmeros estudos já evidenciaram que
quanto maior é o domínio sobre o qual a declinação pode ser observada, menos íngrime é a
declinação da F0. Isso é decorrência natural do fenômeno da declinação, responsável por fazer a
F0 cair de forma constante ao longo de um domínio, independentemente de qual seja o seu
tamanho. A implicação direta desse fato é a necessidade de conhecimento antecipado, da parte
do modelo de produção do discurso, da extensão desse domínio, a fim de estabelecer o grau
exato de declinação em que a F0 deve ser iniciada. Ladd acredita que esse grau de planejamento
antecipado deva ser psicolingüisticamente inviável.
Uma possibilidade bastante interessante de análise do fenômeno antecipatório diz
respeito, em algumas línguas tonais, à elevação dos tons altos, no início de uma determinada
seqüência tonal, com o intuito de permitir uma seqüenciação progressiva de downsteps14
.
Rialland (2001:301) reporta que o downstep não seria apenas progressivo em seu efeito
(provavelmente por conta do efeito do próprio fenômeno da declinação), como também
envolveria a elevação dos tons precedentes. O artigo de Rialland será tomado, aqui, como
referência principal para esta discussão.
A proposta da autora é a de que existiriam três estratégias na implementação do
downstep: uma estratégia de “cancelamento”; uma estratégia de “aumento na extensão do pitch”;
e uma estratégia de “resetting” (realocação), responsável por diminuir o número de downsteps
dentro de uma dada unidade.
Laniran (1992, reportado por Rialland, 2001:302) observou que, no discurso do
informante do iorubá, uma língua da família Niger-Congo falada na Nigéria, as elocuções
formadas em sua totalidade por tons H não apresentaram declinação. Percebeu-se também que a
13 Para uma discussão mais detalhada sobre a linha de declinação, ver, mais à frente, a sessão referente aos padrões entonativos. 14 Pierrehumbert e Hirschberg (1990:280) indicam que o upstep eleva o tom de fronteira após um tom H indicativo
de um acento frasal. Assim, a seqüência H H% se manifestaria como um platô elevado, seguido de uma elevação
adicional no final. A seqüência H L% se manifestaria também como um platô elevado, mas sem nenhuma queda no
fim. Já o downstep, ou catátese, abaixa e comprime a latitude do pitch após algum dos dois acentos tonais. Como a
regra se aplica interativamente, ocorre uma sucessão de acentos, criando uma escada descendente na curva
melódica. As autoras lembram ainda que o downstep ocorre numa posição nuclear, resultando num tipo de tom
“médio”, mais baixo que o tom H precedente, mas bem acima do nível mais baixo da latitude do falante.
Gussenhoven (2002b:13) lembra que o downstep é uma forma gramaticalizada da declinação.
49
realização dos tons H, nessa condição, mantinham a mesma configuração, independentemente da
extensão da elocução. Um exemplo de contorno da F0 produzido em elocução contendo apenas
tons H pode ser visto na figura 1.2, abaixo:
Figuras 1.2 e 1.3 – Contorno da F0 de elocuções contendo apenas tons H e tons H e L no iorubá
(conseqüentemente, com downstep) (Laniran, 1992, citado por Rialland, 2001:302).
A observação da figura 1.3 evidencia que, numa seqüência em que se verifica o
downstep, o primeiro tom H é realizado mais alto do que os tons altos na elocução contendo
apenas tons H. A explicação para essa elevação estaria no fato de que os falantes, com o intuito
de promover uma maior extensão para a realização dos downsteps necessários, aumentam a
abrangência do pitch. No entanto, a declinação progressiva dos downsteps se processa até o
ponto hipotético em que o “valor básico” tanto dos tons H (no exemplo da figura 1.3, em torno
de 90Hz para o falante em questão) quanto dos tons L é atingido. A partir desse ponto, o
downstep é cancelado, o que caracteriza, portanto, a estratégia de “cancelamento”. Parece haver
um limite para a realização do downstep, situado a não mais do que três degraus de
proeminência. A partir desse ponto, o downstep seria negligenciado. Essa limitação, como
indicam Laniran e Clements (1995, citados por Rialland, 2001:302), talvez se explique pela
natureza amplamente não-distintiva do downstep no iorubá.
A segunda estratégia – a de “aumento na extensão do pitch” – foi percebida no dagará,
uma língua da família Niger-Congo do ramo Gur falada em Burkina. Trata-se de uma língua de
dois tons, em que os downsteps distintivos são acionados por tons baixos flutuantes.
Uma estratégia como as exibidas pelos falantes do iorubá, aplicada a uma língua com
downsteps distintos, conduziria à supressão de várias distinções. Rialland (2001:303) levanta
alguns questionamentos sobre como essa língua preservaria seus distintos downsteps. Seriam
concebíveis, para solucionar esse problema, algumas estratégias, como (a) rebaixar o limite
50
inferior da extensão do pitch a cada novo downstep, independentemente de quantos eles seriam;
(b) a realocação depois de um certo número de downsteps, evitando, assim, excessivos
downsteps em seqüência; (c) aumentar o limite superior da extensão do pitch no início da
elocução; ou, ainda, (d) o aumento da extensão de pitch com downsteps através do aumento dos
limites superior e inferior da extensão de pitch simultaneamente.
Os dados observados para o dagará apresentaram, assim como para o iorubá, as elocuções
constituídas apenas de tons H realizadas quase sem declinação alguma, quase totalmente planas.
A única exceção se observou no rebaixamento final. O que se observou foi que, embora todos os
locutores tenham mostrado comportamento semelhante na realização das elocuções contendo
apenas tons H, as estratégias utilizadas foram diferentes quando se buscou implementar o
downstep. À exceção da primeira estratégia listada acima, todas as outras três foram utilizadas.
Rialland enfatiza que dois dos falantes chegaram a produzir sete downsteps sem realocação
(“resetting”).
A observação da figura 1.4, em que é ilustrada a quarta estratégia mencionada acima,
possibilita uma noção bem clara de como se processa esse fenômeno de antecipação do
downstep:
Figura 1.4 – Contornos da F0 de elocuções com dois a cinco downsteps sobrepostos à linha de regressão das
elocuções contendo apenas tons H, para um dos falantes dagará (Rialland, 2001:305)
A questão posta a seguir diz respeito à possibilidade de a produção do downstep envolver
uma elevação antecipatória ou não. Os trabalhos de Poser (1984) e Kubozono (1993) (citados por
Rialland, 2001:309) evidenciaram que, no japonês, sempre que um tom H é relacionado a uma
mora acentuada, ele se realiza num pitch mais elevado do que o pico de uma palavra acentuada,
51
considerando-se o mesmo contexto. Esse tom H, associado a um acento, é imediatamente
seguido por um tom L15
. Assim, essa elevação dos tons H em posição acentuada pode ser
considerada como uma elevação antecipatória, o que indica, portanto, que existe antecipação
local, em que o tom H que precede um tom L é elevado.
A partir do momento em que o fenômeno antecipatório foi constatado em algumas
línguas tonais, como indica o artigo de Rialland, parece bastante razoável assumir que ele possa
se verificar nas outras línguas não-tonais, considerando, naturalmente, nuances específicas. Caso
se considerem os dados apresentados como reflexo de uma realidade lingüística concreta, a
sugestão de Ladd, comentada acima, de que o grau de planejamento antecipado seria
psicolingüisticamente inviável, não teria como ser sustentada.
15 O japonês suspende o downstep em constituintes em foco (Gussenhoven, 2002a).
52
2. AS RELAÇÕES DE COORDENAÇÃO E DE SUBORDINAÇÃO
A análise da estruturação sintática de uma enunciação, num nível mais profundo, prevê
que os constituintes sejam observados a partir dos processos de parataxe e de hipotaxe. A
parataxe diz respeito às relações estabelecidas entre os constituintes de forma a não haver
dependência sintática entre uns e outros, enquanto a hipotaxe prevê esse tipo de dependência.
Considerando-se a estruturação arbórea de uma frase, dois nódulos com a mesma função podem
se relacionar um ao outro sem o estabelecimento de uma dependência, como ocorre, por
exemplo, entre dois nódulos nominais que desempenhem a função de sujeito, ou dois nódulos
verbais (constituindo um período composto). Trata-se, portanto, de uma relação paratática. Numa
relação hipotática, a dependência entre os constituintes se dá, por exemplo, entre um nódulo
nominal com a função de objeto e o verbo que o comanda.
Ao se estender a análise desses processos às orações16
formadoras de um período, várias
abordagens, com terminologias distintas, são verificadas ao longo do tempo. De um ponto de
vista voltado para a tradição gramatical anterior ao gerativismo, as orações são classificadas em
dois grandes grupos. No caso da tradição estabelecida para a língua portuguesa (Cunha e Cintra,
1985; Bechara, 1982), o período é assumido como a enunciação completa que contém ao menos
um verbo e é delimitada, ao final, pelas marcas de pontuação final, interrogativa, exclamativa ou
de reticências, estas duas últimas constituindo ou final de um parágrafo ou seguidas por outro
período (que se inicia por uma letra maiúscula). Cada verbo presente no período (entendendo-se
por verbo as formas verbais plenas e/ou as locuções verbais) constitui o núcleo oracional. Caso o
período seja formado por apenas uma oração, será chamado de simples; por mais de uma oração,
composto. De acordo com a relação sintática estabelecida entre as orações do período,
consideram-se os processos de coordenação (parataxe) e de subordinação (hipotaxe).
Quanto ao processo de coordenação, as orações do período podem estar unidas umas às
outras por meio de conjunções. As que apresentam a conjunção, ou síndeto, são denominadas
sindéticas (do grego syndeton, indicando a presença de conjunção aditiva entre os termos de uma
construção coordenada e, por extensão, de todas as orações que apresentam uma conjunção
coordenativa); as que não apresentam o síndeto são chamadas de assindéticas. As orações
coordenadas sindéticas se subdividem em aditivas, adversativas, alternativas, explicativas e
conclusivas.
16 Uma oração é definida como uma unidade que pode ser analisada nos elementos Sujeito, Verbo, Complemento,
Objeto e Advérbio, sendo os dois primeiros obrigatórios (Chen, 2003, citando Cruttenden, 1997).
53
As orações subordinadas, por sua vez, dividem-se em três categorias, que, nas descrições
tradicionais, refletem a caracterização morfológica que lhes é subjacente: substantivas (por
desempenharem o papel de um substantivo), adjetivas (por desempenharem o papel de um
adjetivo) e adverbiais (por desempenharem o papel de um advérbio). No período composto por
subordinação, a oração dependente sintaticamente denomina-se oração subordinada e a que
comanda a subordinação denomina-se principal. Caso a oração subordinada seja introduzida por
uma conjunção subordinativa e contenha uma forma verbal finita, será considerada desenvolvida;
caso não apresente essa conjunção e a forma verbal seja infinita, será considerada reduzida (de
infinitivo, de gerúndio ou de particípio, segundo a forma verbo-nominal empregada).
Tradicionalmente, as orações subordinadas substantivas subdividem-se em cinco
categorias, nomeadas a partir do valor sintático que desempenham como termos da oração:
subjetivas, predicativas, objetivas diretas, objetivas indiretas e completivas nominais. São
introduzidas, quando em sua forma desenvolvida, por conjunções integrantes.
As orações subordinadas adjetivas, segundo a restrição ou não-restrição que estabelecem
em relação ao termo a que se relacionam, podem ser classificadas como restritivas ou
explicativas, respectivamente. Quando desenvolvidas, são introduzidas por um pronome relativo.
As orações subordinadas adverbiais, finalmente, subdividem-se em nove categorias:
causais, comparativas, concessivas, condicionais, conformativas, consecutivas, finais,
proporcionais e temporais, segundo as relações estabelecidas com a oração principal. Para
Mateus et al. (2003), essas nove subcategorias são divididas em dois grupos. O primeiro, que
caracteriza especificamente a subordinação adverbial, inclui as orações causais, as concessivas,
as condicionais, as finais e as temporais. O segundo é relacionado às construções de graduação e
comparação, envolvendo as orações comparativas, as conformativas, as consecutivas e as
proporcionais.
Com o advento da gramática gerativa, o enfoque das relações entre as orações passou a
ser observado a partir de sua estruturação profunda. Algumas vezes, a terminologia utilizada
sofreu alterações, com o intuito de caracterizar mais adequadamente a forma como as relações
estariam sendo estabelecidas. Chen (2003:108), por exemplo, caracteriza uma sentença composta
como sendo a que contém duas ou mais orações unidas ou coordenadas por conectivos como “e”,
“mas” e “ou”, enquanto uma sentença complexa seria a que contém duas orações, uma delas
sendo a oração subordinada e a outra a oração superordenada. Sob um ponto de vista discursivo,
Dargnat e Jayez (2007:5), citando Polanyi (1985), sugerem que a diferença entre a subordinação
e a coordenação está na continuação ou interrupção de uma atividade discursiva em curso.
54
Assim, sendo A e B dois constituintes discursivos, B é subordinado a A se B interrompe a
atividade discursiva manifestada por A. Do contrário, B é coordenado a A. Como exemplos,
citam as elaborações, as interrupções e os parênteses como evidenciando a subordinação. Já a
narração e o encadeamento temático evidenciam a coordenação. É interessante ainda observar
que, sob esse ponto de vista discursivo, toda justaposição física de constituintes (à qual os
autores não atribuem nenhum valor sintático ou semântico) correspondendo a um ato de
linguagem pode dar lugar a uma interpretação coesiva. Assim, não será a presença ou a ausência
de uma conjunção a responsável pelo estabelecimento dessas relações. A conjunção apenas
evidenciará a relação estabelecida entre esses constituintes.
Dentro do grupo das orações subordinadas, Diessel (2001:435), reportando Noonan
(1985:42), indica que as orações adverbiais se distinguem das completivas (“substantivas”, na
nomenclatura da gramática tradicional do português), quanto à função que desempenham dentro
do período. As orações completivas, por agirem como argumentos centrais do predicado, não
podem normalmente ser suprimidas, uma vez que se colocam como constituintes obrigatórios da
oração principal. As orações adverbiais, por sua vez, como desempenham o papel de adjuntos,
podem ser sempre omitidas no nível sintático, e são, normalmente, introduzidas por
subordinadores adverbiais, base para a relação semântica estabelecida com a oração principal.
A distinção entre a subordinação adverbial e a coordenação de orações não se apresenta
de forma essencialmente clara. Pode-se dizer que há uma certa equivalência no campo semântico
entre algumas orações subordinadas adverbiais e algumas orações coordenadas. Assim, às
subordinadas causais equivalem as coordenadas explicativas; às subordinadas concessivas, as
coordenadas adversativas; às subordinadas consecutivas, as coordenadas conclusivas; e às
subordinadas proporcionais, as coordenadas alternativas. O que diferencia umas das outras é,
precisamente, o processo de dependência (hipotaxe) ou de independência sintática (parataxe)
estabelecido no período que contribuem para constituir. De uma ou de outra forma, é freqüente a
dificuldade de distinção, por exemplo, entre as subordinadas causais e as coordenadas
explicativas. Embora o interesse maior desta pesquisa não seja direcionado para o
comportamento prosódico das orações coordenadas, o confronto entre a conformação da
freqüência fundamental que se propõe para as subordinadas causais e o que Moraes (1998; cf.
seção 3.2, frases (37a,b)) propõe para as coordenadas explicativas, por exemplo, coloca-se como
um bom índice diferenciador entre umas e outras.
Seguindo uma tendência verificada em vários trabalhos sobre a combinação de orações,
Diessel (2001:437) prefere analisar essa distinção entre orações coordenadas e orações
55
subordinadas adverbiais como formadora de um contínuo, ao invés de estipular dois tipos
distintos de conexões entre orações, e compila um conjunto de testes sintáticos úteis para a
diferenciação entre orações subordinadas adverbiais e orações coordenadas, apresentados a
seguir17
.
1) As orações adverbiais, quando antepostas à oração principal, admitem a inclusão de um
pronome catafórico controlado por um nome co-referencial presente na oração principal. As
orações coordenadas não admitem esse procedimento (Reinhart, 1983; Haspelmath, 1995):
(a) Quando elei veio a Paris, Pedroi encontrou João. (subordinação)
*Elei veio a Paris, e Pedroi encontrou João. (coordenação)
2) É possível omitir um elemento em uma oração que seja modificada por uma oração principal,
mas nada pode ser omitido em uma oração que esteja acompanhando uma oração coordenada
(Ross, 1967; van Oirsouw, 1987).
(a) O que você disse a ela __ quando você saiu? (subordinação)
(omissão, por exemplo, de “de manhã”)
(b) *O que você disse a ela __ e você saiu? (coordenação)
3) Em muitas línguas, as orações adverbiais podem ocorrer em posições variadas em relação à
associação oração principal/predicado. Por outro lado, as orações coordenadas apresentam
uma posição normalmente fixa (Haspelmath, 1995).
(a) Pedro admitiu que Maria estava certa [antes que ele saísse]. (subordinação)
(b) [Antes que ele saísse] Pedro admitiu que Maria estava certa. (subordinação)
(c) Pedro admitiu, [antes que ele saísse], que Maria estava certa. (subordinação)
(d) Pedro admitiu que Maria estava certa [e (ele) saiu]. (coordenação)
(e) *[E ele saiu] Pedro admitiu que Maria estava certa. (coordenação)
(f) *Pedro admitiu, [e ele saiu], que Maria estava certa. (coordenação)
4) Orações adverbiais não podem ocorrer com questões-tag, mas orações coordenadas podem
(Cristofaro, 1998a,b).
(a) *Ela vai ajudá-lo se ela estiver lá, ela não estará? (subordinação)
(b) Ela vai ajudá-lo, mas ela não estará lá, estará? (coordenação)
17 As referências apresentadas foram citadas por Croft (1995).
56
5) Num par de orações coordenadas, é possível a omissão do verbo em uma das orações, o que
não é permitido no caso das adverbiais (Ross, 1970; Hudson, 1976).
(a) *Bill tocou violão quando João, o piano. (subordinação)
(b) Bill tocou violão e João, o piano. (coordenação)
Uma forma de confirmar o status adverbial de uma oração em contraste com as orações
coordenadas, seria, como sugere Diessel (2001:438), a verificação do fenômeno denominado
como “deranking” (Stassen, 1985), que consiste na redução ou eliminação da morfologia verbal,
como o tempo, o aspecto e o modo. Como esse fenômeno, em muitas línguas, se restringe às
orações adverbiais, ele pode se mostrar bastante útil quando utilizado na base de algumas línguas
específicas. Diessel, na formulação de seu corpus, utilizou os cinco critérios apresentados a
seguir para a classificação das orações adverbiais:
1) a ocorrência de formas verbais específicas como as do subjuntivo, que, em algumas línguas,
como no groenlandês ocidental, é restrita a orações subordinadas;
2) o uso de sufixos de caso que marcam as orações adverbiais em línguas nas quais as orações
subordinadas são formadas pela nominalização, como é o caso do turco;
3) a ocorrência de marcadores de tópico e definidos, utilizados em línguas como o Ayutla
Mixtec, para indicar o status informacional das orações adverbiais;
4) uma ordem de palavras específica, como no alemão, que distingue orações subordinadas de
sentenças independentes;
5) restrições na ocorrência de marcadores de negação, de foco e de atos discursivos nas orações
subordinadas, como no Urubu-Kaapor.
É preciso levar em consideração que nenhum desses critérios é universalmente aplicável.
No entanto, sua combinação com os testes sintáticos descritos anteriormente, como afirma
Diessel (2001:439), parece ser suficiente para promover a distinção da maior parte das orações
adverbiais em relação às sentenças coordenadas.
Um dado interessante verificado pelo autor (2001:442) é que parece haver uma forte
correlação entre a ordenação das orações principais e adverbiais e a posição do subordinador
adverbial. A maioria das línguas OV (objeto-verbo), em que as orações adverbiais são marcadas
por subordinadores em sua posição final, tendem a posicionar essas orações adverbiais
anteriormente à oração principal. No entanto, em línguas em que as orações adverbiais são
introduzidas por um subordinador, como ocorre nas línguas VO (verbo-objeto) e numa
57
significativa minoria das línguas OV e OV/VO, as orações adverbiais ocorrem normalmente
tanto antes quanto depois da oração principal.
Outra possibilidade de distinção entre orações subordinadas e sentenças coordenadas,
como reporta Diessel (2001:437), é o estabelecimento de dois critérios pragmáticos, já bastante
utilizados na literatura. O primeiro diz respeito ao fato de as orações independentes, entre elas as
sentenças coordenadas, fornecerem informação de primeiro plano, enquanto as orações
subordinadas se prestariam às informações de segundo plano (“background”). O outro critério
sugere que orações coordenadas seriam atos de discurso independentes, enquanto as orações
subordinadas não apresentariam força ilocucionária. Os componentes pragmáticos seriam, em
princípio, os componentes universais das orações subordinadas, mas sua mensuração seria
extremamente difícil caso se desejasse utilizá-los para estabelecer uma divisão entre as orações
adverbiais e as coordenadas.
Se comparadas às orações principais, as orações coordenadas estariam, considerando-se
uma estrutura sentencial de coordenação, em condições de igualdade em dois aspectos: ambas
são o mesmo tipo de constituinte, e desempenham o mesmo papel na estrutura coordenada. Cada
oração seria considerada a partir de uma unidade entonacional, caso se faça a extensão de análise
aos aspectos prosódicos do discurso (cf. Vaissière, 1997, 2004). Croft (1995:851), ao discutir as
relações entre as estruturas gramaticais e as unidades entonacionais, considera, então, que a
razão para haver um limite máximo de uma oração principal finita em uma unidade entonacional
é o fato de que as orações principais, no caso de se verificarem várias, precisam ser coordenadas
entre si e, com isso, são separadas, cada uma sendo representada por um grupo entonacional
distinto. Elas nunca estariam subordinadas a uma unidade gramatical mais alta, inclusive
entonacionalmente, pelo simples fato de não haver uma unidade gramatical mais alta.
As relações de coordenação e de subordinação, assim, podem ser observadas sob o ponto
de vista entonacional. Fox (1984:125) indica que os grupos tonais, quando em seqüência,
poderiam ser analisados como promovedores de duas relações básicas: a de subordinação, em
que se estabeleceria a dependência entre um grupo tonal e outro; e a de coordenação, em que não
se verificaria dependência alguma entre eles, embora estivessem relacionados, da mesma forma
que verificado na análise da estruturação sintática. Fox realça que a subordinação ou a
coordenação se aplicam aos grupos tonais, e não aos padrões entonacionais, pela razão de ainda
não ter sido verificada uma consistência entre os padrões e o status dos grupos tonais nos quais
eles ocorrem. Uma possível projeção dessas estruturas no discurso deveria considerá-las como
um todo, não como grupos tonais individuais.
58
Na tentativa de identificação de possíveis estruturas entonacionais, Fox (1984:121) indica
a existência de quatro abordagens principais. Uma primeira seria aquela em que os padrões
entonacionais seriam imbuídos de significados como “continuativo”, a que se associaria uma
conformação ascendente da F0 (não-final), e “não-continuativo”, com uma conformação
descendente. Esses significados seriam do tipo “interno” ou “estrutural”, e não “atitudinal”. Essa
abordagem não se apresenta como satisfatória, uma vez que se pode encontrar, sem muita
dificuldade, um padrão final ascendente e um não-final, descendente.
Outro enfoque seria o que privilegia seqüências recorrentes de grupos tonais. Inúmeras
obras apresentam listas de seqüências possíveis, mas o problema principal está no fato de as
classificações serem bastante arbitrárias, normalmente sem uma discussão sobre como se
estabelecem as relações entre os grupos tonais ou mesmo a natureza das estruturas criadas.
A terceira abordagem consistiria na classificação dos tipos de seqüências encontradas.
Fox (1984:121) menciona o trabalho de Palmer (1922), em que se estabelece a distinção entre
seqüências coordenadas e subordinadas com base na identidade dos tons envolvidos. De acordo
com essa proposta, a coordenação seria caracterizada pela presença de um mesmo tom em cada
grupo tonal e, por conseguinte, tons diferentes para a caracterização da subordinação. Crystal
(1969) faria uma distinção similar, mas sugerindo que a subordinação ocorre com tons idênticos
quanto à extensão do pitch.
A última abordagem elencada por Fox, caracterizadora de um enfoque mais elaborado,
reconheceria uma entidade entonacional maior com vários tipos de estrutura interna. Schubiger
(1958, citado por Fox, 1984) propõe uma unidade apresentando uma estrutura semelhante à do
grupo tonal, em que haveria uma seqüência de grupos tonais com um desempenhando a função
nuclear. O próprio autor já apresentara (Fox, 1973) a proposta de um “grupo paratonal”, em que
várias relações estruturais estariam presentes.
Fox (1984:126) introduz uma fórmula que seria capaz de representar os vários tipos
estruturais de seqüências, qualquer que fosse o padrão utilizado. No caso, “a” representa os
grupos tonais independentes e “b”, os dependentes. Os índices subscritos indicam o número
mínimo de casos:
b0a1b0
Parece ser possível, no entanto, que exista uma maior complexidade interna aos grupos.
Grupos tonais poderiam ser dependentes de grupos tonais independentes individualmente, o que
59
produziria uma interrupção na seqüência dos grupos tonais estruturalmente equivalentes. Assim
estruturas independentes como baba, por exemplo, sofreriam a inserção de grupos tonais
dependentes, produzindo (ab)a ou a(ba). Como fórmula generalizadora, Fox propõe
(b0ab0)1
o que permitiria expansões do tipo a, ba, ab, bab, aa, baa, aab, aba, baba, entre outras. A
complexidade desse tipo de estruturas, na verdade, não é tão grande como possa parecer, pois, na
realidade, não há uma equivalência entre a complexidade das estruturas entonacionais e a da
sintaxe. Alguns tipos de estruturas parecem ser simplesmente excluídos. Por exemplo, não é
possível encaixar um grupo tonal em outro (a menos que se trate do encaixamento de uma
sentença em outra), da mesma forma que não se verifica descontinuidade dentro de um grupo
tonal, diferentemente do que freqüentemente ocorre quando se trata de estruturas sintáticas.
De acordo com a proposta de Fox (1984:127), uma estrutura subordinada seria
representada como ba, e uma coordenada, como aa, o que refletiria o status “textual” das partes.
Por essa representação, a estrutura coordenada é aberta, podendo ser continuada
indefinidamente, numa sugestão de concatenação; e a subordinada apresentaria duas partes
complementares, uma “final” e outra “não-final”, sugerindo integração entre as partes.
A relação de subordinação diz respeito diretamente à noção de dependência, ou seja, um
grupo tonal se subordina a outro se sua ocorrência necessariamente depender da ocorrência desse
outro (1984:123). Assim, nesse tipo de relação estão presentes um grupo tonal dependente e um
independente. Da mesma forma que na análise da estruturação sintática, a coordenação se faria
entre grupos tonais independentes.
Diferentes seqüências tonais, em princípio, parecem apresentar diferentes tipos de
relações internas. Ao analisar a combinação H + L (em que H representa qualquer padrão que
não termine em um pitch baixo, e L representa qualquer padrão com terminação baixa), Fox
considera o padrão H como dependente, ou seja, subordinado ao tom L. Como exemplo,
apresenta a seguinte elocução (é mantida, aqui, a representação tonal por meio dos diacríticos
originalmente utilizados):
(20) when I get back / I‟ll give you a `ring
(quando eu voltar / eu lhe darei um telefonema)
60
O primeiro grupo tonal seria subordinado ao segundo. Embora, nesse exemplo, exista também
uma subordinação no nível gramatical, o que se dá é o paralelismo com a subordinação dos
grupos tonais. Caso se inverta a posição das orações, a seqüência dos grupos tonais permanecerá
a mesma:
(21) I‟ll give you a ring / when I get `back
(eu lhe darei um telefonema / quando eu voltar)
Uma vez que a inversão das orações não promoveu a inversão da seqüência aplicada aos grupos
tonais, a evidência se faz no sentido de que o primeiro grupo tonal é, de fato, subordinado ao
segundo. Isso sugere, possivelmente, uma seqüência no alinhamento dos grupos tonais, nesse
caso específico, para que se caracterize a subordinação entonacional. No caso da subordinação
no nível gramatical, essa seqüência não é necessária, como evidenciou o exemplo acima.
As relações estabelecidas internamente à seqüência L + L, por outro lado, parecem se
colocar de forma diferente. O que se verificaria seria uma relação de independência – portanto,
de coordenação – entre esses grupos tonais. Como exemplo, Fox sugere a seguinte seqüência:
(22) I‟ll give you a `ring / when I get `back
(eu lhe darei um anel / quando eu voltar)
Deve-se observar, neste caso, que a subordinação se mantém no nível gramatical, mas não no
entonacional, o que implicaria dizer que a subordinação entre grupos tonais se mostra de forma
autônoma – pelo menos nesses casos analisados – em relação à subordinação gramatical,
havendo situações em que ambas coincidem. Haveria, assim, a possibilidade de, por meio da
utilização das estruturas entonativas, o locutor caracterizar determinadas partes de seu discurso
como sendo mais importantes do que outras. No exemplo abaixo (1984:130), o uso de uma
estrutura de coordenação em (a) implica a existência de duas informações em paralelo, enquanto
que em (b) ou (c), o uso de estruturas subordinativas sugere uma informação central e uma
dependente, organizadas, portanto, de forma diversa:
61
(23) (a) there‟s a `fly / in my `soup (aa)
(há uma mosca / na minha sopa)
(b) there‟s a fly / in my `soup (ba)
(c) there‟s a `fly / in my soup (ab)
Como Fox (1984:125) lembra, a sugestão é a de que ocorre subordinação ou coordenação entre
grupos tonais, não entre padrões entonacionais e, ainda, que essas relações devem ser percebidas
mais como internas à estrutura entonacional do que como um reflexo explícito de alguma função
discursiva direta. Essas estruturas poderiam ser projetadas no discurso, mas considerando-se
estruturas completas ao invés de grupos tonais.
Fox percebe essas relações não como evidenciadoras de uma função sintática da
entonação, mas como uma função geral na articulação do discurso, que seria susceptível de uma
interpretação mais específica quando relacionada a um certo tipo de sentença. Embora alguns
tipos de sentenças possam explorar certas funções gerais da entonação de formas bastante
específicas, ocorrendo uma certa tendência a que determinados tipos de sentenças sejam
regularmente associados a estruturas entonacionais específicas, isso não significaria dizer que
essas estruturas entonacionais ocorram obrigatoriamente com eles. O que seria mais prudente
afirmar é que normalmente há uma convergência entre estruturas sentenciais e entonacionais,
especialmente se se considerar que elas apresentam significância no discurso. Embora a extensão
dessas observações seja limitada, parece ser possível estabelecer algumas correspondências entre
características sintáticas das elocuções e tipos de estruturas entonacionais. Fox (1984:129)
indica, por exemplo, que alguns tipos de elocuções preferem uma estrutura entonativa de
coordenação, incluindo elocuções com elementos dos seguintes tipos (é mantida a notação
originalmente utilizada):
(24) (a) orações relativas (geralmente do tipo não-restritivo se possuem um grupo tonal
separado)
there‟s `Smith / who wrote that book on `speech acts
(há Smith / que escreveu aquele livro sobre atos discursivos)
(b) frases apositivas (também geralmente não-definidoras)
I‟ll introduce you to `John / my `brother
(vou apresentá-lo ao John / meu irmão)
62
(c) orações relativas sentenciais
I missed the `lecture / which was a `pity
(perdi a conferência / o que foi uma pena)
(d) orações adverbiais com caráter de comentário
he‟s `failed / as we ex`pected
(ele fracassou / como esperávamos)
(e) perguntas tag (em sua maioria), com o mesmo ou diferentes padrões em cada grupo
tonal
he‟s from `Birmingham / ´isn‟t he?
(ele é de Birmingham / não é?)
Retomando a noção de unidades entonacionais, como já discutido em 1.2, algumas
tentativas já foram feitas no sentido de tentar determinar um limite para o tamanho gramatical de
uma unidade entonacional. Croft (1995:850) lembra que Halliday (1967:32) já havia sugerido
que os falantes verbalizam seus pensamentos de forma que seja enunciada uma oração de cada
vez. O tamanho da unidade entonacional seria, portanto, o de uma oração simples. Os dados de
Croft, no entanto, apresentam muitas exceções para essa proposta. O máximo que seria possível
identificar, considerando esses dados, seria um limite máximo de duas orações, ao invés de uma.
No entanto, como o autor indica, caso se faça uma restrição às orações principais, um constraint
parecido com “uma oração (principal finita) por vez” parece poder ser considerado. Esse
constraint se aplicaria nos casos em que haveria mais de uma oração constituindo uma estrutura
sintática em paralelo numa única unidade entonacional. Steedman (1991:14) sugere a existência
de uma identidade entre as estruturas exigidas pela teoria da entonação e sua relação com a
informação contextual, de um lado, e as estruturas sintáticas de superfície permitidas pela
gramática combinatória, de outro. Poderia ser estipulado, então, que tudo o que pode ser
coordenado pode ser entendido como um constituinte entonacional, e vice-versa.
Outro fator normalmente sugerido para considerar os limites impostos pela capacidade e
pelo processamento cognitivos é o peso ou tamanho do constituinte, assumido em função do
número ou do nível dos constituintes envolvidos. Croft (1995:856) considera inapropriado
denominar esse fator como “peso” do constituinte, preferindo denominá-lo como o fator
“complexidade”. Da mesma forma que o paralelismo, a complexidade também estaria operando
em diferentes níveis sintáticos, especialmente nos mais baixos. A denominação como
63
“complexidade” evidenciaria a relação de proximidade com o paralelismo, que seria
aparentemente um tipo de complexidade. Um indício interessante da projeção do sistema
cognitivo no nível acústico está no fato de que a fronteira entre os constituintes seria marcada
pelo alongamento da última sílaba. Vaissière (1997) indica que esse alongamento é proporcional
à profundidade da fronteira; ou seja, quanto maior a separação entre os níveis sintáticos dos
constituintes, mais longa a duração da sílaba final anterior à fronteira.
64
3. OS MODELOS ENTONATIVOS
A noção mais ampla de contornos melódicos assume que uma determinada configuração
prosódica, em uma língua, é responsável por sugerir um determinado significado, seja na esfera
lingüística, seja no âmbito do paralingüístico. A tradição descritiva francesa, por exemplo,
assumiu a noção de clichê melódico (“cliché mélodique”), que, em princípio, pode ser definido
da mesma forma que as expressões idiomáticas léxico-sintáticas. Como Ladd (1996:140) indica,
esse significado adicional aos componentes sintáticos e semânticos, numa enunciação, é muito
difícil de descrever em palavras, sendo o equivalente vocal, por exemplo, de levantar os ombros
em sinal de dúvida. Assim, vários clichês melódicos poderiam ser identificados em uma língua.
Fónagy et al. (1983, citado por Marandin, 2004) caracterizou, para o francês, três esquemas de
clichês, um dos quais, a que denominaram “cliché enjambant”, poderia ser identificado como o
contorno continuativo estilizado.
Paralelamente ao conceito de “morfema”, Delattre (1966, 1969) e Rossi (1981) (citados
por Portes, 2005:141) assssumem a noção de “entonema”, que seria o equivalente de um
morfema entonativo (cf. Dellatre, 1966 e a discussão na seção 3.1). Segundo a definição que
adotam, um entonema corresponderia a um contorno entonativo, em que a F0 apresentaria um
movimento contrastivo relacionado a uma função específica. Um exemplo seria o contorno de
finalidade, correspondendo ao movimento descendente da F0 e responsável por indicar o fim do
enunciado.
O estabelecimento de uma determinada configuração melódica como sendo um contorno
prosódico levanta uma série de questionamentos. Por exemplo, se existiria um todo da melodia
projetada sobre uma enunciação que deveria ser considerado como o contorno em si mesmo, ou
se apenas um trecho da melodia (cf. a discussão sobre as visões holística e composicional na
análise dos contornos, na seção 1.2). Também, se a delimitação de um contorno estaria restrita a
um grupo rítmico ou a uma frase entonacional, o que leva, por sua vez, à necessidade de
distinção entre essas duas noções, diretamente relacionadas ao que Vaissière (1997) caracteriza
como a função demarcativa da prosódia.
De uma forma geral, como essa autora indica, é possível distinguir, numa tentativa de
definição das unidades delimitadas pelos parâmetros prosódicos (especificamente, a F0, a
duração e a intensidade), os níveis sub-lexicais, em que estariam classificados a mora, a sílaba e
o pé; o nível lexical, com os tons e os acentos de palavra, melódico etc.; e os níveis pós-lexicais,
em que se situariam a palavra prosódica ou unidade acentual, o grupo clítico, o grupo de sentido
65
ou sintagma prosódico, o sintagma, o grupo entonativo ou grupo de respiração, o enunciado, o
parágrafo, o discurso etc. Em princípio, é possível perceber que a estruturação prosódica
apresenta pontos comuns em relação à estruturação sintática, o que auxilia o ouvinte na
decodificação da enunciação, embora essa relação não seja perfeita, uma vez que normalmente
são possíveis várias realizações prosódicas para uma mesma enunciação.
A noção de grupo rítmico, também conhecido como “grupo acentual”, “grupo
entonativo”, “grupo de respiração (souffle)”, “grupo de sentido” (Dargnat e Jayez, 2007:4) está
na essência do fenômeno que Vaissière (1997) detectou em seus experimentos, na década de
1970, ao perceber que as seqüências de 7 a 8 sílabas tendem a não serem decompostas,
mantendo-se como uma unidade (cf., mais à frente, essa mesma noção discutida por Martin,
2002). Como indicam Delais-Roussarie et al. (2002), um grupo rítmico é demarcado, em sua
fronteira direita, por uma sílaba contendo um acento primário. Normalmente, o grupo rítmico
contém uma palavra lexical e a possibilidade de todas as palavras gramaticais no seu lado não-
recursivo. Já a frase entonacional seria caracterizada pela realização de um tom de fronteira em
sua última sílaba. Assim, qualquer grupo rítmico apresentaria a possibilidade de ser realizado
como uma frase entonacional, especialmente num discurso mais lento. A segmentação nas frases
entonacionais depende, por exemplo, do ritmo do discurso, sendo delimitada por fatores
relacionados aos princípios rítmicos, à dimensão informacional e à própria estrutura sintática.
Além disso, a caracterização de um contorno estaria relacionada ao que se considera como
acento de pitch.
Esses autores distinguem duas categorias de acentos de pitch. A primeira – a dos acentos
de modalidade – seria responsável por expressar a atitude do falante. Esses acentos de
modalidade poderiam estar ancorados em qualquer sílaba proeminente, sendo utilizados ao lado
dos tons de fronteira para a elaboração de tons melódicos específicos. A outra categoria seria a
dos acentos pragmáticos, realizados em uma sílaba acentuada e responsáveis pela caracterização
de diferentes funções pragmáticas, como a ênfase ou a intensificação.
Embora a análise dos conceitos discutidos acima pareça não apresentar grandes
complicações, as segmentações prosódicas feitas pelos usuários da língua normalmente
apresentam uma grande gama de possibilidades. Delais-Roussarie (2000) demonstra esse fato
comparando a segmentação prosódica estabelecida por vários locutores para um mesmo
enunciado com dois postulados que poderiam ser estabelecidos. Em princípio, os constituintes
prosódicos seriam primitivos fonológicos definidos anteriormente à análise dos fenômenos
segmentais e suprassegmentais. Assim, os constituintes prosódicos seriam as únicas unidades a
66
que o componente fonológico da gramática teria acesso. Como segundo postulado, a idéia de que
o componente fonológico é alimentado pelo componente morfossintático da gramática. Com
isso, os constituintes prosódicos se formariam na interface entre esses dois componentes a partir
de informações morfossintáticas.
Um primeiro problema em relação a esses postulados é sugerido pela segmentação
prosódica e pela acentuação no francês. A autora indica que a mesma estrutura sintática presente
nas três enunciações a seguir foi segmentada de três formas diferentes por vários locutores que
deveriam lê-las em voz alta.
(25) a (Jean François) (a aperçu) (les enfants) (de mon voisin)18
b (Jean François) (a vu le fils) (de mon voisin)
c (Jean François) (a aperçu) (le fils de Pierre)
Isso indica, portanto, que a sintaxe, em si mesma, não é suficiente para determinar as
segmentações prosódicas e, por conseguinte, a distribuição dos acentos. Critérios rítmicos, como
o tamanho dos constituintes em número de sílabas e a distância entre os acentos, estariam
interferindo explicitamente na segmentação. Um outro exemplo em que a sintaxe não suplanta a
prosódia é observado nas línguas Bantu. Harford e Demuth (1999:48) indicam que algumas
dessas línguas, como a Chishona, apresentam um caso em que um impedimento sintático contra
o movimento (STAY) é violado, para favorecer um impedimento prosódico de nível mais alto
contra palavras monossilábicas. Segundo as autoras indicam, o impedimento prosódico não
seleciona entre duas construções sintáticas igualmente adequadas, nem contribui apenas quando
a sintaxe não é determinante. A exemplificação é feita a partir de duas estratégias diferentes de
relativização do objeto, uma em que a elevação do verbo a C0 é obrigatória em orações relativas
de objeto, originando uma aparente “inversão de sujeito”, e outra em que a elevação do verbo
não ocorre, produzindo a ordem básica de palavras SV na oração relativa intercalada. Em ambos
os casos, é a condição prosódica do complemetizador relativo que determina a sintaxe da ordem
de palavras.
Um segundo problema relacionado aos postulados apresentados se relaciona à ordem das
palavras, à acentuação e ao ritmo. Delais-Roussarie indicou que alguns enunciados podem ser
18 a. (Jean François) (percebeu) (os filhos) (de meu vizinho)
b. (Jean François) (viu o filho) (de meu vizinho)
c. (Jean François) (percebeu) (o filho de Pierre)
67
linearizados (em sua forma sintática de superfície) de formas diferentes, enquanto outros não
admitem essa possibilidade, como demonstram os exemplos a seguir.
(26) a. J‟ai parlé hier soir à Marie19
J‟ai parlé à Marie hier soir.
b. J‟ai parlé à Marie en fin d‟après-midi.
? J‟ai parlé en fin d‟après-midi à Marie.
A diferença de linearização entre [hier soir] e [à Marie], que se mostra possível em (a), é
discutível em (b), ao que parece, por razões prosódicas. A segmentação prosódica de (b) implica
certos princípios rítmicos, como o equilíbrio silábico e a distância entre os acentos, que estariam
sendo transgredidos em “J‟ai parlé en fin d‟après-midi à Marie”. Esses princípios rítmicos
seriam, assim, um constraint na linearização dos enunciados.
Com base na observação desses problemas, Delais-Roussarie propõe uma nova
abordagem da estrutura prosódica, sustentada por dois outros postulados. O primeiro caracteriza
os constituintes prosódicos não como primitivos fonológicos, mas como determinados em
superfície por diferentes tipos de informações (lingüísticas e extralingüísticas). O segundo
postulado considera que a interface entre os componentes sintático, semântico e fonológico da
gramática não é biunívoca. Em paralelo, estariam intervindo na linearização dos enunciados,
portanto, constraints sintáticos, semânticos e fonológicos. A autora propõe, para suas análises do
francês, um modelo baseado na idéia de que a acentuação é primeira, o que faz que a estrutura
prosódica de superfície se deduza a partir da localização dos acentos. Com isso, os constituintes
prosódicos não seriam mais concebidos como primitivos fonológicos definidos anteriormente à
análise dos fenômenos acentuais.
Como se pode perceber, o estabelecimento dos possíveis contornos prosódicos não deve
levar em consideração apenas a estruturação sintática das enunciações, como constatado para o
francês (e, ao que tudo indica, também para as outras línguas). Uma vez que, na realização
discursiva, os locutores normalmente estabelecem a segmentação prosódica de forma a
evidenciar, sim, a estrutura morfossintática, mas também respeitando princípios rítmicos
fundamentais, esses princípios rítmicos possivelmente representam um ponto importante para a
determinação de um contorno prosódico. Como indicado anteriormente, a questão relativa ao que
19 a. Falei ontem à noite com Marie. / Falei com Marie ontem à noite.
b. Falei com Marie no final da tarde. / Falei no final da tarde com Marie.
68
se deva considerar “contorno prosódico” não está ainda solucionada, nem quanto à extensão de
seus limites, nem quanto à sua localização exata dentro do enunciado. A aplicação de princípios
rítmicos na segmentação de uma enunciação, no caso do francês, talvez possa contribuir, se não
para a definição do que seja um contorno prosódico em si mesmo, pelo menos para a delimitação
de sua área de abrangência.
De acordo com as teorias adotadas para o francês, os eventos fonológicos significativos
ocorreriam essencialmente nas sílabas acentuadas, tanto no nível das palavras quanto no nível
enfático ou contrastivo (Martin, 1978, citado em Delais-Roussarie et al., 2002). As sílabas
acentuadas refletiriam, dessa forma, a organização hierárquica da sentença, a divisão dessa
sentença em tema/rema, e a ênfase. Martin (2002) indica que as realizações efetivas dos
parâmetros dos contornos prosódicos dependerá, portanto, da configuração da estrutura
prosódica considerada.
Segundo esse autor, há uma regra de dependência acentual que estabelece acentos para as
palavras, estando elas numa relação de independência ou de dependência com uma outra
unidade. Deve-se considerar que unidades em relação de solidariedade constituem um grupo
acentual, podendo possuir um único acento. Uma regra contra o conflito de acentos impede que
uma sílaba acentuada se siga a outra sílaba imediatamente acentuada, sem que haja espaço
fonético suficiente entre elas. Associado a isso, Martin caracteriza uma regra rítmica, que
permite a deacentuação de sílabas acentuadas, de acordo com sua posição na estrutura prosódica
correspondente e sua distância em número de sílabas entre a sílaba acentuada inicial e a final, a
fim de manter o tamanho das palavras prosódicas (ou seja, dos grupos acentuais) variando de 6 a
8 sílabas, o que corresponde ao que Vaissière (1997) caracterizou como o grupo rítmico, como
discutido anteriormente.
Na delimitação dos contornos prosódicos, em princípio podem ser identificados dois
movimentos principais da F0, um com tendência ascendente, outro com tendência descendente.
Em muitas línguas, observa-se que o pitch elevado ou ascendente é usado na fronteira de uma
oração para assinalar, como já discutido, a continuidade dessa oração (Chen, 2003:108). Delattre
(1965, citado por Chen, 2003:110) observou que, no inglês, a continuação seria sugerida por um
contorno predominantemente descendente, seguido de um trecho com ligeira subida; no entanto,
no alemão, no francês e no espanhol, o formato dessa subida já se mostraria bem delineado. A
inversão de pente na curva prosódica, ou seja, um contorno ascendente (ou descendente) em uma
primeira unidade prosódica, seguido de um contorno descendente (ou ascendente) na unidade
prosódica seguinte, também se constitui como um recurso amplamente utilizado para marcar
69
oposição, mas, como indica Vaissière (1997), esse procedimento seria inimaginável numa língua
tonal como o chinês.
Essa relação do significado sonoro entre o pitch elevado ou ascendente na posição final
de uma oração e a continuação, normalmente conhecida como a “elevação de continuidade”
(continuation rise), estaria em conexão direta com o que Gussenhoven (2002a) denominou de
Código de Produção (Production Code). Como já discutido, o Código de Produção constituiria
uma parte da teoria do significado paralingüístico entonacional, relacionado à pressão subglotal.
Por conta das condições fisiológicas inerentes ao mecanismo de produção da voz, a pressão
subglotal se mostra mais elevada no início das enunciações, sofrendo uma diminuição com o
volume menor de ar expelido pelos pulmões. Assim, como uma maior pressão subglotal produz a
F0 com freqüências mais elevadas, e essa posição elevada da F0 é normalmente associada ao
início das elocuções, o contorno final de uma oração que apresente o pitch elevado ou
ascendente sugerirá que algo mais será utilizado a partir daquele ponto, caracterizando, então, a
sensação de continuidade. O contorno com pitch baixo ou descendente sugerirá o final da
elocução. Trata-se da mesma associação que Vaissière (1997) estabelece em relação aos grupos
de respiração (groupes de souffle): a sensação de continuidade é sugerida por um grupo de
respiração não-final, ou seja, fisiologicamente ainda haveria ar suficiente nos pulmões para dar
prosseguimento à enunciação, o inverso ocorrendo com um grupo de respiração final.
Comparativamente ao Código de Produção, o Código de Esforço (Effort Code) seria responsável
pelos usos enfáticos da prosódia. Quanto maior a latitude dos movimentos de pitch, maior o grau
de ênfase. Gramaticalmente, esse fenômeno é normalmente observado quando se procura
estabelecer a focalização de um determinado item na enunciação. Vaissière (1997) indica, como
explicação para essa acentuação da F0, a pressão contínua produzida pela tensão gerada sobre as
pregas vocais.
Com a intenção de verificar como o efeito de continuação seria produzido por
estrangeiros aprendendo o inglês, o francês e o alemão, Grover et al. (1987, citados por Chen,
2003:108) mediram a inclinação da F0 sobre a sílaba acentuada anterior à conjunção iniciadora
da oração seguinte em elocuções produzidas por falantes nativos. Esse cálculo foi feito
dividindo-se a variação de F0 entre os pontos máximo e mínimo atingidos pela curva e a
variação de tempo nesse intervalo. Essa inclinação apresentou valores positivos no alemão e no
francês, mas negativos no inglês. Como comentado acima, as elocuções do inglês apresentaram,
ao final, uma ligeira elevação da F0, que teria sido, ao que parece, suficiente para caracterizar a
sensação de continuidade. Na abordagem da teoria métrico-autossegmental, os resultados obtidos
70
por Delattre e Grover et al. parecem sugerir que o inglês, o alemão, o francês e o espanhol
utilizam um tom de fronteira alto (H%) para assinalar a continuação. A particularidade estaria no
inglês, em que o acento de pitch nuclear favoreceria um contorno descendente-ascendente,
enquanto que, nas outras três línguas, esse contorno seria apenas ascendente.
Na marcação de fronteiras no inglês britânico, percebeu-se que os falantes nativos
consideraram como soando mais naturalmente os contornos com uma elevação final na fronteira
entre duas orações coordenadas e/ou na fronteira entre uma oração principal e uma subordinada.
O contorno com queda final foi sentido como menos natural (Sanders, 1996, citado por Chen,
2003:111). Da mesma forma, Féry (1993, citado por Chen, 2003:111) verificou que, para o
alemão, o acento de pitch ascendente L*H foi utilizado para indicar a intenção do falante de
continuar a enunciação.
Para o holandês, Chen reporta o estudo de „t Hart e Cohen (1973), em que se evidenciou
que a fronteira de orações seria marcada predominantemente por meio de um de três contornos,
H*L H%, H* % ou !H*L. Desses três, os dois primeiros teriam apresentado maior índice de
preferência. Ou seja, a fronteira de uma oração a ser continuada é preferentemente marcada, no
holandês, com um contorno ascendente, embora não se possa estabelecer uma preferência clara
entre os contornos descendente-ascendente e os ascendentes.
Em sentido inverso, um contorno descendente pode refletir o grau de finalidade de uma
elocução de forma gradiente. Chen (2003:113), reportando os estudos de Wichmann (1991) e de
Pierrehumbert e Hirschberg (1990), indica que quanto mais baixo estiver o ponto inicial da
queda final (considerando-se a palavra acentuada antes da fronteira oracional), mais a elocução
será percebida como sendo final. A indicação se daria, então, no sentido de que os falantes
explorariam também o espaço fonético das elevações finais para assinalar o grau de continuidade
da elocução, em sintonia com o Código de Produção de Gussenhoven (2002a).
Um exemplo desse uso gradiente seria a percepção do sentido de “surpresa” pelos
ouvintes holandeses e britânicos. Os holandeses estariam acostumados a uma extensão de pitch
padrão mais estreita, ou seja, a extensão de pitch utilizada habitualmente pelos falantes
normalmente não apresenta uma grande latitude. Por outro lado, os britânicos já utilizariam uma
extensão de pitch muito maior. Por conta disso, para um mesmo intervalo de picos de alturas
tonais, os holandeses conseguem perceber uma diferença maior de significado do que os
britânicos. A expectativa, no caso da percepção de elevações finais, seria a de que os ouvintes
britânicos, acostumados a uma variação menor das alturas finais de pitch, perceberiam uma
71
diferença maior na probablidade de continuação de um dado intervalo das elevações finais do
que os holandeses (Chen, 2003:113).
Os resultados obtidos por Chen (2003:133) em seus experimentos evidenciaram uma
clara diferença em relação ao que havia sido preconizado anteriormente, no tocante à percepção
dos contornos finais entre o inglês britânico, o alemão e o holandês. Para os britânicos, o
contorno continuativo preferido parece ser H*L H%; para os alemães, a preferência se daria por
H*L H%, diferente do que preconizaram Delattre (1965) e Grover et al. (1987); para os
holandeses, o contorno preferido seria H* H%. Ficou constatado, também, que quanto mais
elevado se mostrava o pitch final, maior era o grau de probabilidade de a elocução ser proferida
como sendo a primeira de uma seqüência de duas. Além disso, os britânicos e os holandeses
teriam uma maior inclinação a explorar o espaço fonético do pitch final com o objetivo de
assinalar diferentes graus de continuação do que os alemães.
Essa noção de que o significado de um contorno prosódico é uma função dos significados
dos tons constitutivos é sustentada pela maior parte dos adeptos da teoria métrico-
autossegmental. Bartels (1999, segundo Marandin, 2004) também propõe que os acentos de pitch
seriam fonte de informação sobre o status de ativação do conteúdo, sobre a atitude do falante; e
os acentos de fronteira, sobre a interpretação da elocução com relação ao discurso sendo
enunciado. Em relação ao francês, no entanto, Marandin et al. (2004) teriam chegado à
conclusão provisória de que o significado de um contorno não pode ser analisado pela
combinação dos significados dos tons que o constituem. Em primeiro lugar, porque os
significados possivelmente associados a H*, HL* ou H+L* deveriam ser restritos a cada
contorno final a que pertencem, uma vez que, em outros lugares, eles podem aparecer como
elevações continuativas com uma função métrica ou demarcativa e nenhum significado
específico. Além disso, como ocorrem em um único contorno, não haveria como estabelecer se
esses significados são associados ao tom ou ao contorno em si mesmo. Em segundo lugar,
porque mesmo que fossem considerados apenas os contornos finais, não poderiam ser associados
significados específicos nem ao contraste “L vs. H” para os tons frasais realizados na porção
esquerda do domínio focal nem aos tons de fronteira na margem direita. A expectativa de
Marandin é a de que os contornos sejam unidades semânticas globais.
72
3.1 ALGUMAS CARACTERÍSTICAS DO SISTEMA ENTONACIONAL DO FRANCÊS
Com a percepção crescente de que o componente melódico seria responsável por uma
parcela significativa do significado do discurso, algumas tentativas já se estabeleceram no
sentido de definir um inventário de contornos prosódicos para algumas línguas. No inglês, por
exemplo, Pierrehumbert (1980) enumerou 22 contornos. No entanto, Delattre (1966) é quem se
mostra como pioneiro nesse tipo de sistematização. Seu estudo identificou dez contornos básicos
para o francês. A descrição desses contornos considera a variação da F0 em quatro níveis (sendo
o nível 4 o mais elevado), com a utilização da noção explícita dos entonemas. A cada contorno
caberia uma função significativa, que poderia ser representada por um entonema, a que seria
associado um traço distintivo. A tabela 3.1 sintetiza os dez contornos definidos por Delattre.
Observe-se que dois deles são continuativos (continuation mineure, continuation majeure), dois
são contornos pós-focais (echo, parenthèse), e seis são potenciais contornos finais.
função significativa entonema traço distintivo
1. Continuação menor A 2-3
2. Continuação maior B 2-4
3. Questão (sim? não?) C 2-4+
4. Implicação D 2-4-
5. Finalidade E 2-1
6. Interrogação F 4-1 curvas não-distintivas entre si
7. Comando
8. Exclamação
9. Parêntese G 1-1 em distribuição complementar
10. Eco 4-4
Tabela 3.1 – Os dez contornos para o francês definidos por Delattre (1966).
Post (2000:150, citada por Marandin, 2004) sugere, por sua vez, uma outra lista de dez
contornos, mas distintos dos propostos por Delattre. Em seu inventário, três contornos são
internos à frase entonacional (ascendente, ascendente-descendente, descendente), incorporando
os contornos continuativos e os que se realizam sobre domínios focais estreitos. Os sete outros
são contornos relacionados ao final da frase entonacional. A descrição destes últimos envolveria
dois fatores, um tipo de tom e uma direção. A autora sugere três tons (alto (H), baixo (L) e médio
(M)) e quatro direções (ascendente, ascendente-descendente, descendente e descendente a partir
do penúltimo pico). Marandin (2004) e Marandin et al. (2004) admitem um outro inventário,
73
embora em sintonia com a proposta de Post, que será tomado como base para a discussão que se
estabelecerá mais à frente.
Beyssade e Marandin (2007) indicam (como já discutido anteriormente) que, para o
francês, não foi possível identificar um significado para cada tom nos contornos, como foi
possível fazer para o inglês (Pierrehumbert, 1980). No inglês, os constituintes dos contornos
assumem um status morfêmico, o que significa dizer que os diversos acentos de pitch e tons de
fronteira apresentam o mesmo significado nos diferentes contornos em que ocorrem como
constituintes. Assim, é possível, nessa língua, uma abordagem composicional do significado de
um contorno. Beyssade e Maradin reportam que, no francês, não foi possível, por exemplo,
identificar o mesmo significado para os acentos de pitch H* ou HL* em contornos finais ou não-
finais. O que parece é que esses acentos apresentam apenas uma função demarcativa nos
contornos não-finais. O esforço dos autores foi canalizado na consideração dos contornos como
sendo unidades de significado básico da entonação.
Para a caracterização prosódica da língua francesa, é preciso considerar, inicialmente, que
a acentuação apresenta duas características essenciais. Em primeiro lugar, ela não surge do nível
lexical, mas do sintagmático, o que significa dizer que, em um enunciado, nem sempre a última
sílaba das palavras lexicais será acentuada. Em segundo lugar, o acento não apresenta uma
função distintiva, como ocorre no inglês, mas demarcativa: em uma palavra lexical, ele ocorrerá
na última sílaba (Delais-Roussarie, 2000). Com isso, a acentuação no francês é analisada a partir
do sintagma fonológico, cuja formação é definida por Selkirk (1986, como citado por Delais-
Roussarie, 2000) nos seguintes termos:
“Dans une représentation syntaxique de type X-barre, une frontière de syntagme
phonologique est insérée à la droite de toute tête lexicale de projection maximale qui
n’est pas en position de spécifieur. La paramètre utilisé est: ]Xtête.”20
Assim, a segmentação do enunciado “Les jeunes enfants regardent un film grec”21
se apresenta
da seguinte forma:
(27) Les jeunes enfants]Xtête regardent]Xtête un film]Xtête grec]Xtête
20 Numa representação sintática do tipo X-barra, uma fronteira de sintagma fonológico é inserida à direita de toda
cabeça lexical de projeção máxima que não esteja em posição de especificador. O parâmetro utilizado é ]Xcabeça. 21 As crianças estão vendo um filme grego.
74
Beyssade e Marandin (2007) assumem três níveis de fraseamento para o francês. O
primeiro nível seria o das frases acentuais, determinador da localização do acento (stress); o
segundo seria o nível das frases maiores, que consistiria em uma ou várias frases acentuais; e o
terceiro nível seria o da frase entonacional, consistindo em uma ou várias frases maiores.
Embora não seja determinada lexicalmente no francês, a proeminência pode ser determinada
pelo fraseamento prosódico, como já indicado anteriormente (cf. Martin, 2002).
A natureza fonológica do acento, no francês, se reflete na percepção que os usuários da
língua têm do posicionamento do acento lexical nas palavras. Nesse tocante, Vaissière (1997)
identifica a dificuldade que os francófonos apresentam em perceber as proeminências no francês
e nas outras línguas, por conta da ausência, no francês, do acento de palavra fonológica. A noção
de acento de palavra não se mostra como uma realidade na consciência do falante francês
monolíngüe, o que normalmente faz que ele não consiga perceber esse acento também nos outros
idiomas. O estudo de Mora et al. (1997-1998:111), em que se comparou a forma como
hispanófonos e francófonos percebem o acento lexical espanhol, evidenciou que os acentos
lexicais foram bem detectados tanto pelos participantes espanhóis (89,59%) quanto pelos
participantes franceses (87,40%). De uma forma geral, portanto, os acentos seriam percebidos no
lugar ocupado pelo acento lexical. O estudo evidenciou que ocorre o deslocamento do acento à
esquerda ou à direita tanto para um grupo quanto para o outro, assim como a adição de acentos à
esquerda ou à direita de um acento lexical percebido de forma correta. No entanto, foi verificada
uma tendência dos francófonos em deslocar à direita o acento percebido (79,13% dos casos), e
dos hispanófonos em produzir esse deslocamento à esquerda (70,37% dos casos), a diferença
entre os dois grupos mostrando-se significativa (Chi2
, df1 = 48,02; p = .0001). A mesma
tendência foi verificada em relação aos acentos adicionados. Entre os acentos adicionados pelos
francófonos, 86,96% foram à direita do acento lexical; pelos hispanófonos, 72,53% foram à
esquerda, sendo também essa diferença significativa (Chi2
, df1 = 27,19; p = 0,0001).
Uma análise possível para esses resultados pode ser feita a partir do efeito da duração
silábica sobre a F0. Prieto et al. (1995, citados por Mora et al., 1997-1998:111) indicam que
quanto mais longa for a sílaba acentuada, mais o pico da F0 será tardio. A tendência dos sujeitos
francófonos envolvidos nos testes em deslocar o acento à direita, associada às características
acentuais do francês (que, como comentado acima, não apresenta o acento de palavra
fonológica), receberia um reforço das manifestações acústicas do acento lexical em espanhol,
colocado em relevo, também, por um pico da F0 sobre a sílaba pós-acentual. A combinação
desses dois fatores teria sido a responsável pela tendência ao deslocamento dos acentos à direita.
75
Quanto à disposição dos hispanófonos em deslocar o acento à esquerda, parece haver
uma tendência a que o acento espanhol induza um alongamento da sílaba sobre a qual ele recai,
assim como uma variação da F0 que, para atingir seu valor máximo de elevação na sílaba
acentuada, deve iniciar sua ascensão na sílaba anterior (Mora, 1996, segundo Mora et al., 1997-
1998:112). Pela observação de Beaugendre e Hermes (1996:184, segundo Mora et al., 1997-
1998:112), haveria uma ligação entre a noção de acentuação e a percepção de uma variação
melódica bem no início do movimento. O correlato acústico da sensação de acentuação estaria
nessa variação melódica, ainda que singela, no início do movimento da F0.
Uma vez que a percepção das flutuações da freqüência fundamental parece variar em
função do comportamento prosódico da língua em questão, não é despropositado, portanto,
imaginar que a percepção dos contornos entonativos também sofra influência desses fatores.
Talvez seja essa uma explicação para Beyssade e Marandin (2007) não terem conseguido
identificar um significado para cada tom nos contornos do francês, como comentado
anteriormente.
Marandin (2004; Beyssade et Marandin, 2007) admite, para o francês, quatro contornos
finais básicos, caracterizados pela direção gerada pelo acento de pitch. No seu entender, esses
contornos são decomponíveis em tons, segundo o esquema a seguir.
(28) a Contorno descendente: H- ... L* (T%)
b Contorno ascendente: L- ... H* (T%)
c Contorno ascendente-descendente (sic): L- ... LH* (T%)
d Contorno descendente a partir de um penúltimo pico: L- ... H+L* (T%)
A idéia mais ampla seria a de que o contorno descendente (ou, no caso, o tom L
relevante) não estaria associado à asserção, mas a asserções consideradas “prototípicas”, a
interrogações ou a ordens. Por outro lado, o contorno não-descendente, como caracterizado pelas
formulações (b), (c) e (d), no esquema acima, não estaria associado à interrogação, mas a
elocuções com um valor discursivo marcado. Assim, uma elocução em forma declarativa poderia
apresentar um valor interrogativo com qualquer um desses quatro contornos finais, inclusive o
contorno descendente. O que se constata, então, é que nenhum dos contornos finais seria
associado especificamente à natureza interrogativa, da mesma forma que nenhum deles também
seria associado à natureza assertiva.
76
Para Marandin (2004), os contornos finais são aqueles associados à porção da extrema
direita dos domínios focais. Neles, o acento de pitch se situa na sílaba mais à direita da unidade
lexical mais à direita no domínio. Nessa localização, existe a possibilidade de uma configuração
em que a fronteira direita dos domínios focais coincide com a fronteira direita da sentença – nas
elocuções com foco amplo; e uma outra configuração em que a fronteira direita dos domínios
focais coincide com a fronteira direita do constituinte que contribui para o foco – nas elocuções
com foco estreito. Os contornos não-finais, por sua vez, estariam ancorados nas frases maiores
(cf. a caracterização dos três níveis de fraseamento no francês, acima), correspondendo a frases
prosódicas terminando com uma elevação continuativa.
Observações a partir de resultados empíricos evidenciam que, no francês, o contorno de
uma asserção prototípica, ou seja, uma sentença declarativa em que o locutor realmente acredita
no que está dizendo e em que o ouvinte é induzido a acreditar no conteúdo enunciado, é
produzido regularmente como um contorno descendente. Uma questão de confirmação
prototípica, ou seja, uma sentença declarativa que solicita uma resposta da parte do ouvinte de
uma forma que pareça ser idêntica ao que as interrogativas fazem, apresenta um contorno
ascendente ou ascendente-descendente. Evidentemente, o inverso dessa descrição também se
observa, ou seja, é possível que uma asserção seja produzida com um contorno ascendente e que
questões de confirmação sejam produzidas com um contorno descendente, embora com menor
freqüência, pelo fato de que os contextos em que esses contornos seriam apropriados se mostram
também menos freqüentes (Marandin, 2004). Marandin (2004) considera os contornos
descendentes como sendo aqueles em que não se observa elevação alguma da F0 no núcleo do
contorno, e a queda da curva melódica se dá ou sobre os últimos grupos rítmicos da elocução, ou
apenas sobre o último grupo rítmico. Os contornos não-descendentes, portanto, são os que
apresentam uma elevação da F0 em seu núcleo.
Um exemplo de contorno descendente, no francês, é o “contorno nananère”,
caracterizado por uma queda estilizada da F0 a partir de seu penúltimo pico. A sugestão desse
contorno é a de que o locutor estaria pronto para revisar seu comprometimento na interação com
o interlocutor. Além desse significado principal, o “contorno nananère” produziria um efeito
secundário de humor ou ironia. A idéia é a de que a elocução emitida é considerada contenciosa,
mas ao mesmo tempo o locutor se mostra pronto para rever seu comprometimento em relação ao
conteúdo da elocução ao interagir com o ouvinte. O efeito humorístico seria decorrente do fato
de que o locutor estaria pronto para concordar com o ouvinte: uma vez que o contorno indica a
disponibilidade do locutor em revisar sua crença em relação ao que está sendo enunciado, um
77
possível comentário feito pelo interlocutor seria aceito sem dificuldade. O efeito irônico, por
outro lado, seria originado no fato de que o locutor não estaria nem um pouco disposto a
concordar com o ouvinte: uma vez que, com o contorno utilizado, o locutor estaria
hipoteticamente disposto a revisar sua crença no que acaba de ser enunciado, o efeito irônico
decorre do fato de o locutor, na verdade, não apresentar essa disponibilidade. Marandin (2004)
indica que, quando usado por crianças, esse contorno é irônico e brincalhão. A configuração
prosódica para a frase (3.1) Bien sûr que j'te crois, Marie va arriver (Claro que eu acredito em
você, Maria vai chegar), a que foi aplicado o “contorno nananère” em laboratório, seria ilustrada
pela figura 3.1.
Figura 3.1 – O “contorno nananère” aplicado à frase Bien sûr que j'te crois, Marie va arriver (Claro que eu acredito
em você, Maria vai chegar) (Marandin, 2004).
Na sua caracterização de dez contornos para o francês, Delattre (1966) observa que três
dos contornos com configuração descendente, associados à asserção, à ordem e à exclamação,
não apresentam diferenciações claras uns dos outros. O debate ainda se desenvolve quanto a
saber se esses contornos seriam realmente distinguíveis. O que parece inquestionável é não
serem eles distinguíveis quanto aos níveis ou configurações da F0 (Marandin et al., 2004). O
contorno descendente que Delattre chama de “finalidade” corresponde ao contorno descendente
de uma elocução longa que possibilita a divisão da porção esquerda da elocução em contornos
continuativos. Esse contorno é verificado tanto em elocuções assertivas como em qualquer um
dos três tipos de elocuções elencados por Delattre (ordem, interrogação e exclamação). Como
Marandin (2004) indica, seria uma família de quatro contornos descendentes, não distinguíveis
entre si em termos de força ilocucionária.
Quanto aos contornos ascendentes, parece haver vários tipos. A constatação de Marandin
(2004) no corpus utilizado é a de que dois são mais freqüentes: um seria caracterizado por um
78
platô baixo e uma elevação acentuada na última sílaba; o outro apresentaria a elevação da F0 de
forma linear até a última sílaba. Em princípio, eles estariam em variação, uma vez que não
apresentam contraste semântico. Já foi sugerido que talvez o contraste no formato da elevação
possa ser distintivo, por exemplo, entre asserções e interrogações, mas o que parece mais certo é
não haver uma correlação estrita entre um formato ascendente e um tipo de significado.
Grundstrom (1973:50, em citação de Beyssade e Marandin, 2007) indica não ter sido possível
identificar um contorno essencialmente distintivo no sentido de que cada ocorrência sua
estivesse necessariamente associada a uma questão22
. A ascensão da F0 seria a marca mais
evidente de uma questão, mas esse movimento nem sempre corresponderia a uma questão.
Vaissière (1997) também apresenta as interrogativas como podendo ser retratadas tanto por
contornos ascendentes quanto por contornos descendentes. No entender de Zwanenburg (1965,
também citado por Beyssade et Marandin, 2007), um contorno assume um determinado valor
apenas quando em combinação com outros elementos da elocução num determinado contexto e
numa determinada situação.
Ainda no âmbito dos contornos ascendentes, é possível a caracterização dos chamados
contornos continuativos. Delattre (1966) e Rossi (1981) (citados por Portes, 2005:142) fazem a
distinção de dois tipos diferentes, um contorno continuativo menor e um contorno continuativo
maior. Essencialmente, ambos apresentam os mesmos movimentos ascendentes, sendo
distinguidos pelo valor máximo atingido pela F0, mais baixo no continuativo menor e mais alto
no continuativo maior. A continuação maior teria o papel, sob um ponto de vista funcional, de
agrupar várias continuações menores em uma unidade maior, na condição de que essa unidade
maior não corresponda ao fim da frase.
22 De forma semelhante, quando comentam a escolha de um contorno para expressar uma determinada atitude,
Pierrehumbert e Hirschberg (1990:284) sugerem que a atitude é melhor entendida como sendo derivada de um
significado entonativo interpretado em um certo contexto, ao invés de ser considerada como representante daquele
significado em si mesmo. Em outras palavras, um mesmo contorno entonacional pode sugerir atitudes diferentes,
segundo o contexto em que se insira.
79
Figura 3.2 – A continuação maior agrupando várias continuações menores em uma unidade maior (Portes, 2005).
Globalement il réalise pas trop, l’état dans l(e)quel il est (Globalmente, ele não realiza muito, no estado em
que se encontra).
Para o contorno final no francês, Beyssade e Marandin (2007) propõem uma análise que
privilegia a interação discursiva entre os interlocutores. A escolha de um contorno possibilitaria
ao locutor indicar como ele antecipa a recepção da elocução por parte do ouvinte. Essa
abordagem, portanto, se basearia na imagem que o locutor constrói em relação às crenças do
ouvinte quanto ao assunto em questão, nos termos apresentados acima em relação ao “contorno
nananère” e discutidos como a seguir.
O uso de um contorno descendente sugeriria que o locutor estaria apresentando sua
elocução como não-controversa, além de indicar que não estaria esperando nenhuma revisão ou
questionamento em relação ao conteúdo de sua enunciação. Por outro lado, se o locutor fizesse
uso de um contorno não-descendente, estaria sendo antecipado um possível conflito entre sua
crença (como sugerido pelo conteúdo de sua enunciação) e a crença do ouvinte em relação ao
que estaria sendo dito. O uso de um contorno ascendente, embora antecipando que a crença do
locutor quanto ao conteúdo da enunciação talvez não seja compatível com o que assume ser a
crença do ouvinte, também indicaria que o locutor não estaria pronto para rever sua posição em
relação ao assunto. Ainda, o uso de um contorno descendente a partir de um penúltimo pico da
F0 indicaria, nesse caso, que o locutor antecipa uma possível necessidade de revisão de seu
posicionamento em relação ao conteúdo enunciado.
Beyssade e Marandin (2007) citam três trabalhos que assumem a noção do
comprometimento como sendo indicada pelos contornos também no inglês. Bartels (1999),
considerando a questão do comprometimento do locutor ou do ouvinte em relação ao enunciado
da elocução numa abordagem composicional dos contornos, indica que o tom de frase L-
assinala o comprometimento do locutor. Gunlogson (2001), numa abordagem holística e restrita
à análise das declarativas, sugere que os contornos descendentes indicam o comprometimento do
80
locutor, e os contornos ascendentes, o comprometimento do ouvinte. Steedman (2003) reformula
esta última hipótese e analisa a entonação em termos do comprometimento do locutor e a
atribuição, por parte do locutor, de comprometimento ao ouvinte. Esse tipo de generalização, no
entanto, não se aplicaria ao francês, uma vez que uma elocução na forma declarativa pode
sugerir o comprometimento do locutor tanto com um contorno descendente quanto com um
contorno ascendente. O exemplo que Beyssade e Marandin apresentam, transcrito abaixo, indica
que a asserção ascendente compromete o locutor, mas não seu alocutário.
(29) [Contexto: um homem num centro social entrevistado no rádio]
Nous, on est dans des centres d’hébergement. Bon, moi personnellement, j’ai trois
enfants, mais je ne peux pas recevoir mes enfants.23
Figura 3.3 – Asserção ascendente comprometendo o locutor, mas não seu alocutário (Beyssade e Marandin, 2007).
Como a definição de “comprometimento” (commitment) em termos de responsabilidade
não estaria ainda muito bem definida, Beyssade e Marandin (2007) sugerem que ela seja
caracterizada como sendo a atribuição pública de uma crença pelo falante a si mesmo. Assim, o
falante estaria comprometido com p quando ele se atribui publicamente a crença que p. Com essa
caracterização, a definição do comprometimento entrecruza os contrastes presentes na hierarquia
dos contornos franceses. Um locutor, então, se apresenta como comprometido com p ao usar
tanto um contorno ascendente quanto um contorno descendente.
O esquema geral da proposta de contornos para o francês sugerido por Beyssade e
Marandin (2007) se apresenta como na figura 3.4.
23 Moramos num centro social. Bom, pessoalmente, eu tenho três filhos, mas eu não posso receber meus filhos.
81
Figura 3.4 – Esquema geral dos contornos finais para o francês, segundo Beyssade e Marandin (2007).
3.2. ALGUMAS CARACTERÍSTICAS DO SISTEMA ENTONACIONAL DO PORTUGUÊS
Embora os estudos prosódicos do PB ainda possam ser considerados bastante recentes,
portanto sem uma tradição estabelecida como em relação ao inglês ou ao francês, alguns
aspectos da entonação modal (cf. Aubert e Hochgreb, 1981; Hochgreb, 1983; Moraes, 1984,
1991; Gebara, 1976) e do acento lexical (Fernandes, 1976; Moraes, 1987, 1995a, 1995b; Leite,
1974; Costa, 1978), como citado por Moraes (1998:179), já apresentam uma boa sustentação (cf.
também, para a relação prosódia-sintaxe no PB, Freitas, 1995; Gonçalves, 1997; Orsini, 2003).
Ainda é necessário que a pesquisa se dedique intensamente à relação da prosódia com a sintaxe,
mas também com a organização informacional e com a análise conversacional.
No PB, o acento lexical está estreitamente ligado à posição que a palavra ocupa ao longo
da elocução. É possível, também, que ele varie de acordo com o padrão acentual da palavra,
embora de forma menos significativa. Como Moraes (1998:180) indica, caso a palavra se
localize dentro de um grupo prosódico, o que caracteriza uma posição fraca, a marcação do
acento se colocará como uma combinação da intensidade e da duração.
Normalmente, quando é necessário destacar uma sílaba com fins expressivos em uma
enunciação, a F0 dessa sílaba sofre uma elevação significativa em relação à média verificada ao
longo da frase. Segundo Vaissière (comunicação pessoal), é bastante comum no francês que, ao
invés de elevar o pico da F0 em uma sílaba, o locutor rebaixe o nível global da F0 ao longo da
enunciação, e mantenha o pico da F0, na sílaba a ser destacada, no nível em que normalmente
entoaria essa enunciação. Assim, não se altera o padrão médio de variação da curva melódica,
82
preservando-se o valor máximo normalmente atingido, e conseguindo-se o efeito de destaque
sobre a sílaba. Pode-se fazer uma analogia entre esse comportamento verificado no francês para
a F0 em conjunto com o comportamento da intensidade, e a duração, no PB, para a
caracterização da proeminência acentual. Moraes (1998:180) indica que a intensidade,
diferentemente da duração, diminui na sílaba pós-tônica, ao invés de aumentar na sílaba tônica.
Ainda, se uma palavra oxítona se encontrar em uma posição fraca ao longo da enunciação, não
será detectada, via de regra, nenhuma pista acústica explícita para esse acento. O efeito
psicoacústico gerado por essa característica é bastante interessante: numa seqüência de sílabas
dentro de um grupo prosódico, o acento (stress) será percebido como descendente na sílaba final
caso as sílabas do grupo sejam entoadas com um peso prosódico constante. Já no final de um
grupo prosódico, ou seja, em uma posição forte, a freqüência fundamental se associaria à
duração e à intensidade como uma pista acentual. Isso parece decorrer do fato de que, numa
posição forte, o acento (stress) no nível frasal ou sentencial se superimpõe ao acento lexical.
No PB, tanto a freqüência fundamental quanto a duração e a intensidade são utilizadas na
demarcação da sílaba acentuada em uma palavra. Em níveis mais elevados, como o frasal ou o
sentencial, a freqüência fundamental se mostra como o principal correlato do acento, além de se
colocar como uma pista adicional para o acento lexical numa posição forte. No sistema
entonativo do PB, uma sílaba acentuada sempre contará com um movimento de pitch, com o seu
formato variando de acordo com o padrão entonativo imposto à elocução. O estudo de Moraes e
Espesser (1988) indicou a existência de uma hierarquia para a importância dos correlatos
acústicos relacionados à marcação da sílaba acentuada: quando em posição final na elocução, a
F0 é a marca mais característica do acento, seguida pela duração e, somente depois, pela
intensidade.
Quando se pensa a caracterização do acento secundário, ele ocorrerá, no PB, sempre
sobre uma sílaba pré-tônica. Verifica-se uma regra de alternância rítmica entre sílabas fortes e
fracas, contadas da direita para a esquerda a partir da sílaba tônica final (doravante, STF). Essa
alternância rítmica será a responsável direta pela localização do acento secundário. Como
exemplo, Moraes (1998:181) apresenta a forma verbal infinita “aproximar” e seu substantivo
derivado “aproximação”. Ambos os vocábulos são oxítonos. Na forma verbal, o acento
secundário recai sobre a sílaba <pro>; no substantivo, verificam-se dois acentos secundários,
sobre as sílabas <a> e <xi> (esta última, em ambos os casos, realizada como [si]). Na
representação abaixo, “F” indica um acento forte, e “f”, um acento fraco.
83
(30) (a) a `pro xi mar (forma verbal)
f F f F
(b) `a pro `xi ma ção (substantivo)
F f F f F
Um papel consideravelmente importante que pode ser atribuído aos acentos nos níveis
frasal e sentencial e no nível da palavra diz respeito à caracterização da coesão sintática
estabelecida entre os termos de uma enunciação. Verifica-se que os constituintes que se
mostrarem dominados por um mesmo acento estarão numa relação de maior coesão sintática do
que os que apresentarem acentos diferentes (Moraes, 1998:182). Caso se considere, por exemplo,
uma relação de coordenação entre dois verbos numa elocução, por um lado, e uma relação de
subordinação entre um verbo e seu complemento, por outro, o comportamento prosódico tanto
das formas verbais quanto do complemento refletirá a relação de independência ou de
dependência sintática estabelecida entre uns e outros. A expectativa é a de que, tanto no nível da
palavra quanto no nível frasal, as características prosódicas com que os verbos se realizem numa
elocução sejam semelhantes caso esses verbos estejam em relação de coordenação. Assim, as
curvas melódicas, por exemplo, apresentariam a mesma configuração, atingindo o mesmo nível
de pico em ambas as formas verbais. Já a configuração prosódica do complemento verbal se
mostraria diferente da configuração do verbo, refletindo a subordinação: muito provavelmente, a
média da F0 até o verbo seria maior do que a média no complemento, para citar apenas um
aspecto prosódico dessa diferenciação. Moraes (1998:191) demonstra esses comportamentos
com um exemplo em que o tamanho dos constituintes acaba por determinar a existência e a
localização de alguns acentos:
(31)
a.
b.
As variações (a) e (b) acima apresentam padrões acentuais idênticos, embora os padrões
melódicos sejam diferentes. O primeiro ponto a observar é a amplitude da variação de pitch na
84
sílaba <ti>, em “ser combaTIdo”: ela é maior em (a) do que em (b). Na variação (a), essa
amplitude tem o mesmo peso que sobre a sílaba <ci> em “esqueCIdo”, o que implica dizer que
os dois constituintes (“ser combatido” e “ser esquecido”) estão num mesmo nível sintático, ou
seja, estão coordenados entre si. Na variação (b), a amplitude da variação de pitch sobre a sílaba
<ten>, em “incompeTÊNcia”, apresenta um peso maior que sobre a sílaba <ti>, em
“combaTIdo”. Essa diferença de amplitude indica que os constituintes “ser combatido” e “por
sua incompetência” mantêm uma relação de subordinação, isto é, de dependência, entre si.
Com isso, percebe-se que a segmentação de uma elocução em grupos prosódicos é um
elemento extremamente significativo para a organização sintática. A localização dos acentos de
frase ou de sentença tornará possível, como em várias línguas, a desambigüização de enunciados
como os seguintes, sugeridos por Moraes (1998:191):
(32) A profeSSOra de prosódia brasiLEIra.
(33) A professora de proSÓdia brasiLEIra.
Na frase (32), a interpretação é a de que a professora ensina a prosódia brasileira; na frase (33),
trata-se de uma professora de prosódia que é brasileira.
No PB, os acentos de frase e de sentença se sobrepõem ao acento lexical caso a sílaba
acentuada coincida com uma sílaba acentuada (stressed) de uma palavra. Por outro lado, não é
possível que uma sílaba não-acentuada venha a receber acento ao longo de uma elocução, a não
ser que se procure enfatizar um morfema, caracterizando-se, assim, um uso metalingüístico
(Moraes, 1998:182). É o que ocorre no exemplo a seguir:
(34) Ele falou em IMportar, não em EXportar.
Esse mesmo procedimento pode ser verificado em relação ao uso das palavras
gramaticais. No PB, a diferença de tonicidade pode caracterizar um par mínimo, como por
(preposição) e pôr (verbo). A preposição por é uma palavra gramatical e, devido ao seu papel
como conector entre palavras de uma elocução, não é acentuada. Essa mesma função impede que
as palavras gramaticais sejam utilizadas em fim de unidade sintática. A única possibilidade de
essas partículas serem acentuadas ocorre quando são usadas de forma metalingüística, no mesmo
procedimento indicado para a ênfase dos morfemas, no exemplo acima. Observe-se o exemplo
abaixo, em que as preposições passam a ser acentuadas (Moraes, 1998:182):
85
(35) Você disse DE ou PAra?
Da mesma forma que em várias outras línguas, também o PB apresenta um padrão
entonativo com a média de pitch mais elevada para as sentenças interrogativas do que para as
declarativas. Embora, algumas vezes, o ordenamento das palavras ou partículas gramaticais
possa ser um fator identificador da modalidade interrogativa, é a entonação que desempenha esse
papel de forma predominante (Hochgreb, 1983; Moraes, 1984, citados em Moraes, 1998:184).
Uma questão total é evidenciada pela elevação de pitch na última sílaba acentuada. Na
diferenciação entre essa modalidade interrogativa e a modalidade declarativa, Moraes indica
ainda dois outros contrastes como potencialmente pertinentes. Numa questão total, o pitch inicial
se mostra ligeiramente mais elevado do que nas declarativas, assim como, na sílaba pré-tônica
final24
(doravante SPreTF) da questão total, ele se mostra mais baixo do que na SPreTF das
declarativas. Isso significa dizer que o contraste criado na STF será muito maior. E ainda, o que
se perceberá é que uma sílaba pós-tônica (caso exista) numa declarativa apresentará o pitch ainda
mais baixo do que na interrogativa.
Essas marcas melódicas verificadas nas sílabas inicial e pré-tônica de uma sentença
interrogativa total podem ser percebidas como indícios antecipatórios da modalidade em que a
elocução será produzida, como indica Fónagy (Fónagy e Galvagny, 1974; Fónagy 1981, segundo
Moraes, 1998:185). Os experimentos realizados por Moraes (1984) a partir de ressínteses, no
entanto, evidenciaram que é sobre a STF que a diferenciação entre as modalidades interrogativa
e declarativa efetivamente ocorre. Os resultados evidenciaram que as oposições promovidas pela
entonação modal não se localizam de forma dispersa sobre a elocução, mas sobre pontos
específicos; e que a interpretação da modalidade da sentença sofre variação em pontos
perfeitamente definíveis ao longo do contínuo dos níveis de altura.
Para que uma elocução seja percebida como interrogativa, é preciso que a média da
elevação de pitch na STF esteja acima do nível melódico médio da sentença. Caso isso não
ocorra, mesmo com a elevação na STF, a elocução será percebida como declarativa. De forma
inversa, se houver uma queda no pitch da STF, mas a média de pitch da sentença permanecer
24 Ao se considerar a sílaba pré-tônica final como um referencial na composição de um contorno prosódico, está-se
em sintonia com a abordagem composicional hierárquica, quer do tipo proposto pela Escola Britânica, formado por
uma pré-cabeça (prehead), uma cabeça (head), um núcleo (nucleus) e uma coda (tail); quer do tipo proposto por Di
Cristo (ambos citados por Di Cristo, 2004:117), em que a Unidade Entonativa é dividida em elementos denominados
ataque, pretônica e tônica. Como será observado ao longo do capítulo 4 e subseqüentes, essa sílaba é também
tomada como referencial nesta pesquisa.
86
elevada, a elocução será interpretada como uma questão total. Em relação à importância da
SPreTF, os experimentos de Moraes (1998:186) a partir da ressíntese de uma enunciação
assertiva com uma sílaba pré-tônica rebaixada (típica, portanto, da questão total) e de uma
questão total com uma elevação de pitch na sílaba pré-tônica (típica de uma frase declarativa)
evidenciaram dois pontos distintos. Em primeiro lugar, a frase interrogativa com a sílaba pré-
tônica modulada como em uma declarativa foi interpretada como questão total por 94% dos
ouvintes, o que caracteriza o papel secundário da STF na produção do efeito interrogativo. Em
segundo lugar, a frase declarativa com a conformação de interrogativa total na sílaba pré-tônica
(ou seja, com rebaixamento de pitch) foi interpretada pela metade exata dos ouvintes como sendo
declarativa e pela outra metade, como questão total.
Como mencionado mais acima, as pistas prosódicas presentes no início de uma elocução
podem sugerir tratar-se ela de uma interrogação ou não. Um outro exemplo no PB, em que o
comportamento prosódico pode ser percebido como índice de predição de uma modalidade
interrogativa, é a elevação de pitch a um nível mais alto na sílaba acentuada que preceda a
partícula alternativa “ou”, sugerindo tratar-se de uma questão alternativa. No exemplo a seguir,
Moraes (1998:187) assume que a elevação verificada sobre a sílaba <do> já antecipa o sentido da
questão alternativa.
(36)
Embora não haja indicação em Moraes, parece que a elevação de pitch nessa sílaba deve ser
consideravelmente maior que a elevação necessária para produzir uma questão total. Esse nível
mais elevado que o pico da F0 atinge nessa sílaba <do> é que talvez seja responsável pelo valor
preditivo da questão alternativa em comparação com a questão total.
A noção de tema (relacionada ao já-dado, ou seja, o assunto em questão) e o rema
(relacionada ao novo, ou seja, a nova informação prestada sobre o assunto em questão) é
caracterizada melodicamente também no PB. O rema apresenta o movimento melódico na sílaba
acentuada final, podendo ser uma descida, no caso de uma sentença declarativa, ou uma subida,
no caso de uma questão total. Já o comportamento melódico do tema dependerá de seu
posicionamento na elocução. Como Moraes (1998:188) indica, caso o tema preceda o rema,
haverá um contraste entre os dois padrões melódicos, com uma elevação de pitch na sílaba
87
acentuada final, caso se trate de uma assertiva, ou com uma queda final, caso se trate de uma
questão total. Por outro lado, se o tema ocorrer após o rema, o padrão melódico utilizado sobre o
tema reproduzirá o que foi precedentemente utilizado sobre o rema, com uma queda, se se tratar
de uma assertiva, e uma subida, se se tratar de uma questão total.
Esse comportamento prosódico identificador das noções de tema e rema, no PB, parece
estar também na base de certas distinções de funções gramaticais organizadas de formas
diferentes segundo a hierarquia das informações apresentadas. Como já foi discutido
anteriormente (cf. as relações de coordenação e subordinação), é freqüente que se confundam as
noções de causalidade (no binômio causa-conseqüência25
) e de explicação. Essas relações se
estabelecem, respectivamente, no campo da subordinação e da coordenação. As duas variações
apresentadas a seguir ilustram essa problemática (Moraes, 1998:189) .
(37) a.
b.
Em (37a), observa-se uma ordem neutra para a informação, em que “ele saiu logo” é a
informação dada (tema) e “porque tinha muito o que fazer” é a informação nova (rema). Trata-
se, nesse caso, do processo de subordinação, em que a oração principal (que contém o tema)
apresenta a conseqüência para a causa informada na oração subordinada (que contém o rema).
Observe-se que existe uma elevação de pitch sobre a STF da oração principal/tema, sugerindo
uma continuidade, nos mesmos modelos do padrão continuativo anteriormente discutido para o
francês.
25 Di Cristo (2004:115) indica que, nos parâmetros da análise do discurso, a interpretação das funções da prosódia
sugere que as significações conferidas às enunciações pelas unidades entonativas derivam das relações sintagmáticas
que elas contraem. Como exemplo, apresenta o enunciado
Marie est infidèle, Pierre boit (Marie é infiel, Pierre bebe),
que pode sugerir a noção de causa a uma das orações (por conseguinte, cabendo à outra a noção de conseqüência).
Caso se verifique a seqüência prosódica [Implicação + Parêntese baixo], a inferência será a de que Marie é infiel
porque Pierre bebe, enquanto que a seqüência [Parêntese baixo + Implicação] sugerirá que Pierre bebe porque Marie
é infiel.
88
Em (37b), a informação mais importante (rema) está contida na primeira oração.
Observe-se que o movimento de pitch na STF dessa oração é descendente, o que poderia ser
analisado como o término da informação relevante no contexto comunicativo. A segunda oração
apresentaria, assim, uma informação suplementar, que não se enquadraria na relação
(necessariamente subordinativa) entre conseqüência e causa. Trata-se, nesse caso, da
evidenciação do processo de coordenação.
Outra situação em que o padrão entonacional será responsável por distinguir entre duas
interpretações, ainda nesse âmbito da coordenação/subordinação, diz respeito à presença de uma
negação na oração principal seguida de uma oração adverbial que exprima razão. Como indica
Moraes (1998:189), o mesmo ocorre também no francês e no inglês. Observem-se as variações a
seguir.
(38) a.
b.
Existe um comportamento diferente do locutor, considerando-se a segunda enunciação de
cada variação acima, em relação ao que fora enunciado anteriormente. Em (38a), a ordem da
informação é neutra, da mesma forma que em (37a), como discutido acima: o tema se posiciona
antes do rema. O que se percebe com essa enunciação é que o locutor não foi à casa do outro. Já
em (38b), o que se percebe é a contestação da afirmação anterior. Observe-se que o elemento
negativo “não” se destaca do restante da elocução por meio do movimento de pitch. O
comportamento prosódico indica, assim, que a nova informação, ou seja, o rema, está
posicionada sobre esse elemento negativo. Na interação entre os dois locutores, o segundo deseja
informar que ele não foi à casa do outro, sem dúvida, mas não em decorrência da chuva (um
outro motivo o teria impedido).
Esse último exemplo reflete também um efeito contrastivo entre as informações. Moraes
(1998:190) caracteriza o perfil das elocuções apresentando ênfase contrastiva, no PB, da seguinte
forma:
89
a) verifica-se um pitch baixo sobre a sílaba acentuada da palavra enfatizada;
b) o pitch da sílaba imediatamente anterior à sílaba acentuada será alto, produzindo-se um
contraste entre essas duas sílabas;
c) a parte da elocução que preceder a palavra acentuada apresentará o mesmo padrão
entonacional que o de uma sentença declarativa neutra, e o que se seguir ao ponto de ênfase
será pronunciado com um tom baixo parentético;
d) a sílaba acentuada (stressed) da palavra acentuada apresentará maior intensidade e maior
duração.
Comparem-se os exemplos (39a) e (39b) (Moraes, 1998:190 e 191). Em (39a), observa-se
o efeito contrastivo sobre uma única palavra. Em (39b), o contraste se estabelece entre uma
expressão maior do que uma palavra e uma única palavra que foi utilizada na sentença anterior à
do contraste.
(39) a.
b.
No caso de (39b), não foi a “senhora” a pessoa cumprimentada, mas a “garota de preto”.
Embora o acento contrastivo principal esteja sobre a última sílaba tônica do enunciado (<pre>), a
posição elevada do pitch se iniciou na primeira palavra da expressão contrastiva, estendendo-se
até o início da queda final.
90
4. METODOLOGIA
Adotou-se, para a formação dos corpora utilizados neste trabalho, tanto para o PB quanto
para o FR, a forma canônica do período composto por subordinação, caracterizada por uma
oração principal (doravante OP) seguida de uma oração subordinada adverbial (doravante,
OSAdv). Esta pesquisa assume que os resultados finais obtidos aplicam-se apenas a essa
disposição canônica das orações. Caso se faça a inversão dessas posições, perde-se o efeito da
pré-indicação, uma vez que o período passa a ser iniciado pela própria conjunção. No entanto,
deve-se levar em consideração que algumas categorias apresentam uma disposição a se
posicionarem antes da OP, como é o caso das subordinadas adverbiais condicionais e temporais.
Diessel (2001) propõe, para o grupo de línguas analisadas em seu estudo, a existência de uma
hierarquia no posicionamento da oração adverbial em relação à principal, com a maior
disposição a essa antecipação sendo verificada nas condicionais, seguidas, seqüencialmente,
pelas temporais, pelas causais e pelas finais (as outras cinco categorias presentes no português
não foram contempladas: como é possível perceber, não há uma uniformidade para essa tipologia
entre as diversas línguas). As orações subordinadas adverbiais finais seriam, nessas línguas, as
que apresentariam a maior disposição à posposição. O mesmo se aplica para o inglês e,
possivelmente, também para o PB e o FR, embora não tenha sido encontrada confirmação para
isso.
Ao que parece, as orações subordinadas adverbiais são pré-indicadas, no caso do PB, por
conformações prosódicas próprias de cada uma de suas nove subcategorias (cf. as figuras 4.1 e
4.2, mais à frente). Essas conformações prosódicas, projetadas sobre as OPs, aplicam-se, em
princípio, apenas quando observada a ordem canônica discutida acima. Assim, caso a OSAdv se
posicione após a OP, a tendência deverá ser a de que sua F0 apresente uma conformação
semelhante para todas as subcategorias, com possível elevação acentuada sobre o conectivo
(refletindo a ênfase atribuída ao valor semântico) seguida de uma declinação constante (devida a
fatores propriamente fisiológicos; cf. Gussenhoven, 2002a). A OP, posposta à OSAdv, tenderá a
apresentar uma mesma conformação em sua modulação, também refletindo o processo de
declinação natural de uma frase assertiva. Assim, na ordem canônica “oração principal –
(conectivo) oração subordinada adverbial”, caberá à conformação prosódica da OP o papel de
pré-indicar a relação sintático-semântica que se processará com a OSAdv. Caso a OSAdv inicie
o período, a conjunção se responsabilizará por explicitar todo o campo semântico envolvido, e o
componente prosódico perderá essa função.
91
4.1 A FORMAÇÃO DO CORPUS PARA O PB
Duas orações principais distintas – Ficava infeliz [] e Mostrava-se cansado
[] –, a partir de agora denominadas, respectivamente, OP 1 e OP 2,
constituíram a base do corpus para o PB. A primeira contém seis sílabas fonológicas, que se
reduzem a cinco sílabas fonéticas (Moraes e Leite, 1992), pela elisão de [a] ao se combinarem as
sílabas <va> e <in>; e a segunda, sete sílabas fonológicas, que podem reduzir-se a seis sílabas
fonéticas, pela queda da vogal [] em <se>. A STF ocupa a última posição na OP 1, e a
penúltima, na OP 2.
O objetivo de a OP 2 conter uma sílaba pós-tônica é verificar de que forma a posição da
STF pode interferir no estabelecimento da função pré-indicativa. Como a percepção de variações
na F0 é mais eficaz antes de pausa (Mertens, 2004, citando House, 1990), e normalmente a STF
concentra a expressividade do contorno melódico, uma das hipóteses é a de que o índice de
reconhecimento dos valores pré-indicativos seja mais elevado nas OPs 1 que nas OPs 2. Para a
formulação do Teste 1, conforme será discutido em 4.3.1, as OPs foram isoladas das OSAdvs,
constituindo arquivos sonoros independentes. Como os participantes do teste ouviram apenas as
OPs, estabeleceu-se necessariamente uma pausa após suas últimas sílabas. No caso das OPs 1,
essa pausa seguiu-se imediatamente à STF.
Cada uma das OPs se fez seguir das mesmas nove OSAdvs, como descrito na tabela 4.1.
O objetivo de as duas OPs serem sempre repetidas foi o de poderem constituir pares-mínimos,
quando da formação do Teste 1, como será discutido mais à frente (cf. Chen, 2003).
Em relação aos cinco critérios que Diessel (2001:438, citando Stassen, 1985) utilizou
para classificar as orações adverbiais (cf. capítulo 2), nenhum deles pôde ser aplicado às orações
formadoras desse corpus, porque, no PB: 1) não se verifica uma forma verbal específica, como o
subjuntivo, para as orações subordinadas; 2) não há sufixos marcadores de caso; 3) não há
marcadores de tópico e definidos; 4) a ordem de palavras é bastante flexível; 5) não há restrições
na ocorrência de marcadores de negação, de foco ou de atos discursivos nas orações
subordinadas. No entanto, a confirmação do valor subordinado dessas OSAdvs foi feita pelos
dois critérios pragmáticos e por três dos cinco critérios sintáticos reportados pelo mesmo autor
(437) (dois dos cinco critérios não se mostram pertinentes ao tipo de estruturação utilizada nos
períodos formadores do corpus para o PB), como comentado a seguir.
92
Oração Principal Relação
Semântica
Oração Subordinada Adverbial
OP 1
Ficava infeliz
causal porque o trabalho não produzia frutos.
comparativa como uma pessoa que não via resultados.
concessiva embora o trabalho o motivasse.
condicional se os exercícios não fossem adequados.
conformativa conforme convinha a um pessimista.
consecutiva que dava pena ver seu rosto.
final para que todos sentissem pena dele.
proporcional à medida que via seus planos desabarem.
temporal quando não lhe permitiam falar.
OP 2
Mostrava-se cansado
causal porque o trabalho não produzia frutos.
comparativa como uma pessoa que não via resultados.
concessiva embora o trabalho o motivasse.
condicional se os exercícios não fossem adequados.
conformativa conforme convinha a um pessimista.
consecutiva que dava pena ver seu rosto.
final para que todos sentissem pena dele.
proporcional à medida que via seus planos desabarem.
temporal quando não lhe permitiam falar.
Tabela 4.1 – Orações principais e subordinadas adverbiais utilizadas como base para a formação do corpus para o
PB.
Quanto aos critérios pragmáticos, em primeiro lugar, as OSAdvs fornecem informações
de segundo plano – a informação central está contida na OP, estabelecendo-se a informação
prestada pela OSAdv como um comentário à contida na OP. Em segundo lugar, percebe-se que
não se pode utilizar, por exemplo, “(para que) todos sentissem pena dele” como ato discursivo, o
que neutraliza o valor ilocucionário da enunciação.
Quanto aos critérios sintáticos, observa-se que:
1) as OSAdvs permitem a inclusão de um pronome catafórico controlado por um nome
correferencial na OP seguinte (Porque o seu1 trabalho não produzia frutos, Paulo1 ficava
infeliz.);
2) as OSAdvs podem ocorrer em posições variadas, relativamente à ordem canônica (Ficava,
porque o trabalho não produzia frutos, infeliz.);
3) as OSAdvs não podem ocorrer com uma pergunta tag (*? Ficava infeliz porque o trabalho não
produzia frutos, produzia?).
Tradicionalmente, a OSAdv consecutiva apresenta a forma combinada tão... que,
responsável por imprimir à OP, que conterá o advérbio de intensidade tão (ou tanto), o valor de
uma causa, que gerará, na OSAdv, sua conseqüência, introduzida pela conjunção que. No
93
entanto, caso esse advérbio seja utilizado na OP, torna-se ele o responsável – semântico – pela
pré-indicação consecutiva.
Há, no PB, construções populares que eliminam esse advérbio, transferindo a elevação de
F0 que se processaria sobre ele para o termo que ele estaria modificando. Frases como era feio
que dava dó apresentam, via de regra, o ataque da F0 no início de feio, atingindo o seu ápice na
vogal tônica dessa mesma palavra lexical. Optou-se, assim, por eliminar esse advérbio, o que
permitiu a homogeneidade das orações principais do corpus.
A proposta desta pesquisa se restringe ao português falado no Rio de Janeiro. Por tal
razão, todos os dezoito períodos foram gravados por uma locutora carioca, foneticista e
experiente na locução expressiva, em estúdio acusticamente isolado, em mídia digital, utilizando
o programa computacional Sound Forge v. 6.0. Os arquivos sonoros foram registrados em mídia
digital (CD-rom), formato WAV-PCM, mono, 16 bits e 22.050Hz. Para não permitir dúvidas
quanto aos valores semânticos sugeridos por cada uma das orações subordinadas adverbiais,
todos os períodos foram inseridos em contextos que explicitam esses valores semânticos,
conforme indicado no Anexo 1.
A locutora foi gravada três vezes, com direcionamento específico para a expressividade
que se desejava obter em cada um dos períodos. Foram gravados não apenas os períodos para a
formação do corpus, mas também o contexto em que eles se inseriam. A seguir, procedeu-se à
eliminação dos contextos dos arquivos sonoros, de forma a isolar apenas os períodos a serem
testados. As três versões produzidas foram submetidas à apreciação de quatro ouvintes
brasileiros, já iniciados nos estudos prosódicos, para que indicassem, numa escala de 0 a 4, qual
a nota que atribuiriam a cada uma das elocuções, considerando a adequação prosódica ao campo
semântico sugerido pelas conjunções subordinativas. A nota “0” sugeriria que a melodia
utilizada não seria apropriada para aquela frase, e a nota “4”, que ela seria perfeita. Foram
escolhidas, a partir desse julgamento, as elocuções que obtiveram as melhores notas.
Cada uma dessas orações principais selecionadas como referência, detentoras de um valor
pré-indicativo, será denominada, a partir de agora, OP de referência, Caso seja necessário
estabelecer a subcategoria em que se insere, por exemplo, “causal”, será denominada OP causal
de referência. As figuras 4.1 e 4.2 ilustram a F0 das orações principais tomadas como referência
para o PB.
94
OP 1 causal OP 1 comparativa OP 1 concessiva
OP 1 condicional OP 1 conformativa OP 1 consecutiva
OP 1 final OP 1 proporcional OP 1 temporal
Figura 4.1 – Freqüência fundamental das OPs 1 – Ficava infeliz – para o PB.
Time (s)
0 1.392270
300f i k a v i f e l i
Time (s)0 1.37667
0
300f i k a v i f e l i
Time (s)
0 1.363610
300f i k a v i f e l i
Time (s)0 1.44771
0
300f i k a v i f e l i
Time (s)
0 1.446870
300f i k a v i f e l i
Time (s)
0 1.471810
300f i k a v i f e l i
Time (s)
0 1.406050
300f i k a v i f e l i
Time (s)0 1.39587
0
300f i k a v i f e l i
Time (s)
0 1.34980
300f i ak v i f e l i
95
OP 2 causal OP 2 comparativa OP 2 concessiva
OP 2 condicional OP 2 conformativa OP 2 consecutiva
OP 2 final OP 2 proporcional OP 2 temporal
Figura 4.2 – Freqüência fundamental das OPs 2 – Mostrava-se cansado – para o PB.
4.2 A FORMAÇÃO DO CORPUS PARA O FR
Da mesma forma que para o PB, foram formadas para o FR duas orações principais
distintas – Il est ennuyé [] (ele está preocupado) e Il se montre irritable
[] (ele se mostra irritado) –, igualmente denominadas, respectivamente, OP 1 e
OP 2. A primeira contém cinco sílabas fonológicas, correspondendo a cinco sílabas fonéticas; e
a segunda, oito sílabas fonológicas, que se reduzem a cinco ou a seis sílabas fonéticas, caso se
verifique a queda da vogal [schwa] em <se> e em <ble>, ou em apenas uma delas. A STF ocupa
a última posição na OP 1, e virtualmente a penúltima, na OP 2. O objetivo dessa escolha é
verificar de que forma a posição da STF pode interferir no estabelecimento da função pré-
indicativa. Da mesma forma que para o PB, como discutido em 4.1, uma das hipóteses é a de que
o índice de reconhecimento dos valores pré-indicativos seja mais elevado nas OPs 1.
Time (s)
0 1.690290
300m o t r a v a s i k a s a d u
Time (s)0 1.66964
0
300m o t a v s i k a s a d u
Time (s)
0 1.554470
300mo t r a v a s k a s a d u
Time (s)0 1.48351
0
300m o t a v s k a s a du
Time (s)
0 1.556080
300m o t r a v a s k a s a d u
Time (s)
0 1.557190
300mo t r a v a s k a s a d u
Time (s)
0 1.658930
300m o t r a v a s i k a s a d u
Time (s)0 1.53957
0
300m o t a v s k a s a du
Time (s)
0 1.565710
300mo t r a v a s k a s a d u
96
Cada uma dessas OPs se fez seguir das mesmas nove OSAdvs, como descrito na tabela
4.2.
Oração Principal Relação
Semântica
Oração Subordinada Adverbial
OP 1
Il est ennuyé
[Ele está preocupado]
causal car le marché du travail est très exigeant. [porque o mercado de trabalho é muito exigente.]
comparativa comme s‟il allait échouer à tous ses examens.
[como se ele fosse fracassar em todos os
exames.]
concessiva alors que tous les résultats sont positifs.
[embora todos os resultados sejam positivos.]
condicional si les exercices ne lui sont pas adaptés.
[se os exercícios não lhe são adaptados.]
conformativa d’après ce qu‟a dit la petite fille de sa voisine.
[conforme disse a filha da vizinha.]
consecutiva du coup il est désagréable avec ses amis.
[a ponto de ser desagradável com seus amigos.]
final pour obtenir une autorisation de sortie.
[para obter uma autorização de saída.]
proporcional à mesure qu‟il voit ses plans professionnels
échouer.
[à medida que vê seus planos profissionais
fracassarem.]
temporal après avoir travaillé des heures sans comprendre.
[depois de ter trabalhado horas sem
compreender.]
OP 2
Il se montre irritable
[Ele se mostra irritado]
causal car le marché du travail est très exigeant.
comparativa comme s‟il allait échouer à tous ses examens.
concessiva alors que tous les résultats sont positifs.
condicional si les exercices ne lui sont pas adaptés.
conformativa d’après ce qu‟a dit la petite fille de sa voisine.
consecutiva du coup il est désagréable avec ses amis.
final pour obtenir une autorisation de sortie.
proporcional à mesure qu‟il voit ses plans professionnels
échouer.
temporal après avoir travaillé des heures sans comprendre.
Tabela 4.2 – Orações principais e subordinadas adverbiais utilizadas como base para a formação do corpus para o
FR.
Da mesma forma que para o estabelecimento do corpus para o PB (cf. seção 4.1, acima),
as OSAdvs utilizadas no corpus do FR atendem aos critérios estabelecidos por Diessel (2001),
utilizados como referência nesta pesquisa.
Como a proposta desta pesquisa, no que diz respeito ao francês, restringe-se ao francês
falado em Paris, todos os dezoito períodos foram gravados por uma locutora parisiense, com
97
formação em fonética, em estúdio acusticamente isolado, em mídia digital, utilizando o
programa computacional Sound Forge v. 6.0. Os arquivos sonoros foram registrados em mídia
digital (MD), formato WAV-PCM, mono, 16 bits e 22.050Hz. Para não permitir dúvidas quanto
aos valores semânticos sugeridos por cada uma das OSAdvs, todos os períodos foram inseridos
em contextos que explicitam esses valores semânticos, conforme indicado no Anexo 2.
Do mesmo modo que para a formação do corpus para o PB, a locutora foi gravada três
vezes, com direcionamento específico para a expressividade que se desejava obter em cada um
dos períodos. Foram registrados não apenas os períodos para a formação do corpus, mas também
o contexto em que eles se inseriam. A seguir, procedeu-se à eliminação dos contextos dos
arquivos sonoros, de forma a ficarem isolados apenas os períodos a serem testados. As três
versões produzidas foram submetidas à apreciação de quatro ouvintes franceses, já iniciados nos
estudos prosódicos, para que indicassem, numa escala de 0 a 4, qual a nota que atribuiriam a
cada uma das elocuções, segundo o campo semântico sugerido pelas conjunções subordinativas,
nos mesmos moldes utilizados para o PB. Foram escolhidas, a partir desse julgamento, as
elocuções que obtiveram as melhores notas.
Cada uma dessas orações principais selecionadas como referência será denominada, a
partir de agora, OP de referência. Caso seja necessário estabelecer a subcategoria em que se
insere, por exemplo, “causal”, será denominada OP causal de referência. As figuras 4.3 e 4.4
ilustram a F0 das orações principais tomadas como referência para o FR.
98
OP 1 causal OP 1 comparativa OP 1 concessiva
OP 1 condicional OP 1 conformativa OP 1 consecutiva
OP 1 final OP 1 proporcional OP 1 temporal
Figura 4.3 – Freqüência fundamental das OPs 1 – Il est ennuyé – para o FR.
Time (s)
0 1.045490
500i l t ã n i j e
Time (s)
0 1.059950
500i l t a n i j e
Time (s)
0 1.085220
500i l t a n i j e
Time (s)
0 1.016550
500i l t a n i j e
Time (s)
0 1.052740
500i l t a n i j e
Time (s)
0 1.05020
500i l t a n i j e
Time (s)
0 1.034060
500i l t a n i j e
Time (s)
0 1.16050
600i l t a n i j e
Time (s)
0 1.127070
500i l t a n i j e
99
OP 2 causal OP 2 comparativa OP 2 concessiva
OP 2 condicional OP 2 conformativa OP 2 consecutiva
OP 2 final OP 2 proporcional OP 2 temporal
Figura 4.4 – Freqüência fundamental das OPs 2 – Il se montre irritable – para o FR.
4.3 TESTE 1
O primeiro teste realizado teve por objetivo identificar a existência ou não da pré-
indicação prosódica para as OSAdvs. Para isso, os períodos escolhidos como referência foram
segmentados, de forma que as OPs constituíssem arquivos sonoros independentes das OSAdvs.
4.3.1 O Teste 1 para o PB
Como no português se manifesta a regra fonológica segundo a qual a fricativa alveolar
surda se sonoriza quando seguida por uma vogal, foi necessário fazer uma adaptação desse
segmento final nas realizações das OPs 1 que antecediam as OSAdvs concessivas (introduzidas
por embora) e proporcionais (introduzidas por à medida que). Com o programa computacional
Time (s)
0 1.415920
500i l s m o n t i i t a b l
Time (s)
0 1.357870
500i l s m o n t i i t a b l
Time (s)
0 1.424220
500i l s m o n t i i t a b l
Time (s)
0 1.415330
500i l s m o t i i t a b l
Time (s)
0 1.397960
500i l s m o n t i i t a b l
Time (s)
0 1.375280
500i l s m o n t i i t a b l
Time (s)
0 1.386890
500i l s m o n t i i t a b l
Time (s)
0 1.317820
500i l s m o n t i i t a b l
Time (s)
0 1.386390
500i l s m o n t i i t a b l
100
Sound Forge v. 6.0, substituiu-se a realização dessa fricativa sonora por uma realização surda
extraída de uma outra OP 1, de forma que essa oração apresentasse, nas suas nove variações
melódicas, a mesma constituição fonética . Caso isso não fosse feito, a
sonorização da fricativa atuaria como pré-indicação de uma vogal, o que direcionaria a escolha
dos ouvintes durante a realização do Teste 1.
Para identificar se os ouvintes nativos do PB conseguem perceber a função pré-indicativa
das OSAdvs nas OPs, procedeu-se ao cruzamento, por análise combinatória, das nove
modalidades das duas OPs, de forma que todas elas pudessem ser contrastadas entre si, duas a
duas (9 subcategorias pré-indicativas X 8 combinações = 72 associações para a OP 1. Como
foram estabelecidos cruzamentos para as subcategorias pré-indicativas duas a duas, tem-se 72 : 2
= 36 cruzamentos para a OP 1, e 36 cruzamentos para a OP 2, num total de 72 cruzamentos).
Os cruzamentos foram apresentados em folhas de tamanho A4, com as informações e os
dados dispostos em seis colunas. Na primeira, o número de ordem do cruzamento; na segunda, as
letras “A” e “B”, dispostas verticalmente, rotulando as OPs, presentes na terceira coluna; na
quarta coluna, as mesmas letras “A” e “B”, dispostas horizontalmente e com espaçamento entre
si; na quinta coluna, os algarismos “1” e “2”, rotulando as OSAdvs, presentes na sexta coluna.
As OSAdvs apresentadas em cada par eram, necessariamente, complementos da modulação
prosódica apresentada para as OPs do par, ou seja, não havia a possibilidade de estar presente
uma modulação indicativa de uma OSAdv diferente das apresentadas naquele cruzamento,
tratando-se, portanto, de um teste com escolha forçada. Isso significa dizer que, a partir do
momento em que o participante identificasse uma associação, a outra estaria automaticamente
determinada. Uma forma de minimizar um possível efeito negativo dessa escolha forçada foi
estabelecer os cruzamentos por análise combinatória, de forma que todas as OPs fossem
cruzadas com todas as OSAdvs. Assim, caso a escolha forçada em um dos cruzamentos
beneficiasse uma determinada associação entre uma OP e uma OSAdv do par, a outra OP
possivelmente prejudicada pelo automatismo da associação seria necessariamente testada em
outros pares26
. A opção por esse tipo de cruzamento se deu por conta da extrema sutileza
envolvida nos dados em análise. Embora a conformação do Teste 1 sugira uma grande
dificuldade para os participantes, a expectativa foi a de que, caso se obtivesse um resultado
significativo, esse resultado seria ainda mais expressivo do ponto de vista perceptivo. Ou seja,
quanto maior a dificuldade do teste, maior a expressividade de seus resultados. Cada sessão de
aplicação foi precedida de uma prática, com o objetivo de familiarizar os participantes com os
26 A apresentação das OPs em pares aos ouvintes segue o sugerido por Chen (2003), assumindo o paradigma das
comparações em par proposto por Scheffé (1952).
101
procedimentos envolvidos. Uma amostra do Teste 1, precedida do comando dado aos
participantes, é apresentada na figura 4.5.
Você ouvirá, para cada item, o mesmo trecho inicial entoado de duas formas diferentes. O
objetivo é você escolher qual dessas entonações é sonoramente adequada à intenção semântica
sugerida por cada uma das frases no segundo trecho. Assinale sua escolha na coluna central (por
exemplo, A1 B2).
1 A Ficava infeliz
A B 1 porque o trabalho não produzia frutos.
B Ficava infeliz 2 como uma pessoa que não via resultados.
2 A Mostrava-se cansado
A B 1 embora o trabalho o motivasse.
B Mostrava-se cansado 2 se os exercícios não fossem adequados.
Figura 4.5 – Modelo gráfico para aplicação do Teste 1 no PB. Na terceira coluna, aos pares de orações princiais são
associadas duas modulações prosódicas diferentes, necessariamente complementadas por uma das orações
subordinadas adverbiais presentes na última coluna. O conectivo que introduz cada uma das OSAdvs evidencia
o valor semântico em questão, a que corresponde uma das modulações prosódicas atribuídas às OPs.
Foram apresentados aos ouvintes apenas os arquivos sonoros referentes às OPs, presentes
na terceira coluna, de forma que, a partir da entonação com que essas orações fossem realizadas,
se procedesse à escolha das OSAdvs, presentes na sexta coluna. A partir dessa audição, deveriam
assinalar, na quarta coluna, o cruzamento de sua preferência, como, por exemplo, A2 B1,
indicando que para a OP “A” a escolha foi a da OSAdv “2” e, para a OP “B”, foi escolhida a
OSAdv “1”.
Cada par de OPs foi repetido três vezes, com um intervalo de 400ms entre cada oração do
par, e de 700ms entre cada par. Caso algum ouvinte solicitasse, o arquivo sonoro poderia ser
ouvido novamente.
O Teste 1 foi aplicado a 40 alunos do curso de graduação em Letras da Universidade
Federal do Rio de Janeiro, todos voluntários, durante duas aulas, numa mesma semana, e
dividido em quatro partes, no início e no fim de cada aula, de forma que a percepção dos
ouvintes não fosse prejudicada com a repetição exaustiva das OPs. Os participantes
permaneceram em suas salas de aula. Os arquivos sonoros foram executados utilizando-se um
reprodutor de CD convencional (Aiwa, modelo CSD-SR510), com os alto-falantes embutidos no
aparelho. Como as salas de aula não contavam com tratamento acústico, haveria a possibilidade
de, durante o teste, os participantes ouvirem ruídos externos.
102
4.3.2 O Teste 1 para o FR
Devido às diferenças entre as estruturas de ensino brasileira e francesa, a aplicação do
Teste 1 em Paris precisou sofrer uma adaptação em relação à metodologia utilizada no Rio de
Janeiro. Como não foi possível reunir todos os participantes durante duas aulas, o teste foi
realizado individualmente, nos computadores pessoais dos próprios participantes. Para isso, a
diagramação utilizada não foi apresentada em folhas de papel, mas sob o formato de um arquivo
Excel, acompanhado dos arquivos sonoros a serem utilizados. Os participantes receberam um
envelope contendo uma folha explicativa dos passos a seguir para a realização do teste, e um
CD-rom contendo o arquivo Excel e os arquivos sonoros. Solicitou-se que o teste fosse feito com
fones de ouvido, em duas sessões distintas. Os resultados foram enviados ao pesquisador por
correio eletrônico.
As OPs foram separadas das OSAdvs seguindo-se o mesmo procedimento adotado para o
PB, cruzando-se, por análise combinatória, as nove modalidades das duas OPs, de forma que
todas elas pudessem ser contrastadas entre si, duas a duas.
Os cruzamentos foram apresentados em uma formatação contínua, com as informações e
os dados dispostos em seis colunas. Na primeira, o número de ordem do cruzamento; na
segunda, as letras “A” e “B”, dispostas verticalmente, rotulando as OPs, presentes na terceira
coluna; na quarta coluna, as mesmas letras “A” e “B”, dispostas horizontalmente e com
espaçamento entre si; na quinta coluna, os algarismos “1” e “2”, rotulando as OSAdvs, presentes
na sexta coluna. As OSAdvs apresentadas em cada par eram, necessariamente, complementos da
modulação prosódica apresentada para as OPs do par, ou seja, não havia a possibilidade de
ocorrer uma modulação indicativa de uma OSAdv diferente das apresentadas naquele
cruzamento. Uma amostra do Teste 1, precedida do comando dado aos participantes, é
apresentada na figura 4.6.
103
Choisissez quelle des intonations est adéquate à l‟intention sémantique suggérée par chacune des
propositions dans le dernier segment.27
Figura 4.6 – Modelo gráfico para aplicação do Teste 1 no FR. Na coluna D, aos pares de orações principais são
associadas duas modulações prosódicas diferentes, necessariamente complementadas por uma das orações
subordinadas presentes na coluna J. O conectivo que introduz cada uma das OSAdvs evidencia o valor
semântico em questão, a que corresponde uma das modulações prosódicas atribuídas às OPs. Para ouvir os
arquivos sonoros, o participante deveria acionar os alto-falantes presentes na coluna B.
Da mesma forma que para o PB, foram apresentados aos ouvintes apenas os arquivos
sonoros referentes às OPs, presentes na quarta coluna, de forma que, a partir da entonação com
que essas orações fossem realizadas, se procedesse à escolha das OSAdvs, presentes na última
coluna. Para ouvir esses arquivos sonoros, os participantes deveriam acionar os alto-falantes
presentes na segunda coluna. A partir dessa audição, deveriam, então, assinalar, nas sexta e
oitava colunas, o cruzamento de sua preferência, como, por exemplo, A2 B1, indicando que para
a OP “A” a escolha foi a da OSAdv “2” e, para a OP “B”, foi escolhida a OSAdv “1”.
Cada par de OPs foi repetido três vezes, com um intervalo de tempo de 400ms entre cada
oração do par, e de 700ms entre cada par. Caso houvesse necessidade, o arquivo sonoro poderia
ser ouvido novamente. Havia, da mesma forma que para a aplicação do Teste 1 ao PB, uma
sessão de prática.
O Teste 1 foi aplicado a 11 alunos dos segundo, terceiro e quarto ciclos das
Universidades de Paris 3 e 7, todos voluntários.
4.4 O PROCESSO DE RESSÍNTESE
Uma vez identificados os contornos melódicos que mais facilmente são reconhecidos
como pré-indicativos de algumas das OSAdvs, tornou-se necessário caracterizar o
comportamento dos componentes prosódicos nessas manifestações pré-indicativas. Como será
27 Escolha qual das entonações é adequada à intenção semântica sugerida por cada uma das orações no último
segmento.
104
discutido à frente, os resultados obtidos com o Teste 1 para o FR indicaram menos possibilidades
de contornos pré-indicativos (se consideradas as OPs 1 e 2 individualmente) segundo os critérios
adotados para a constituição do Teste 2 (cf. seção 5.3). Assim, o processo de ressíntese para
elaboração do Teste 2 foi aplicado apenas ao PB.
Solicitou-se a um locutor masculino carioca, experiente em fonética e no uso estilizado
da voz, que registrasse uma versão neutra das duas OPs. Foram feitas três gravações, submetidas,
da mesma forma que para a identificação das melhores gravações para o Teste 1, ao julgamento
de quatro brasileiros, também iniciados nos estudos prosódicos, que deveriam indicar, numa
escala de 0 a 4, qual a nota que atribuiriam a cada uma das elocuções, considerando o valor de
“neutralidade”. As gravações foram apresentadas aos juízes, de forma aleatória, em conjunto
com gravações das OPs (moduladas de forma a pré-indicar OSAdvs) realizadas também por esse
mesmo locutor. Tomaram-se, então, as versões das OPs 1 e 2 que obtiveram o melhor
julgamento como neutras como referência para todo o processo de ressíntese que será descrito a
seguir. Essas orações serão denominadas, a partir de agora, OP 1 neutra e OP 2 neutra.
Há duas considerações, no entanto, que devem ser feitas antes dessa descrição. A
primeira diz respeito à escolha de um locutor masculino para o registro da OP neutra, uma vez
que, no Teste 1, foram utilizadas as gravações realizadas por um locutor feminino. A preferência
por essa alternância se deu como forma de, caso os novos resultados obtidos a partir do processo
de ressíntese viessem a se mostrar satisfatórios, fortalecer a importância desse comportamento
prosódico pré-indicativo, independentemente da qualidade vocal utilizada. Em outras palavras, a
conformação prosódica reconhecida para cada um dos contornos pré-indicativos detectados
poderia ser aplicada tanto a vozes masculinas quanto a vozes femininas.
Em segundo lugar, a opção por uma gravação neutra das OPs, quando poderia ser obtida
uma frase monotônica, utilizando-se o processo de ressíntese, a partir de uma das gravações
realizadas para o Teste 1. A discussão maior se dá quanto ao que se possa considerar uma versão
entonacional “neutra” de uma frase (cf. Aubergé et al., 2004; Bänziger et al., 2003, para a
aplicação de uma versão prosodicamente neutra ao estudo das emoções). Assume-se, aqui, que a
neutralidade da elocução indica que as OPs não tenham favorecido uma pré-indicação específica
de quaisquer das subcategorias adverbiais em análise. Uma vez que, com base na análise
prosódica efetuada para as OPs de referência utilizadas no Teste 1, a configuração prosódica de
cada pré-indicação parecia se caracterizar a partir de pontos específicos – como a STF –, mas
também contando com movimentos prosódicos expressivos em outros segmentos, a utilização de
uma frase monotônica poderia prejudicar a naturalidade final da ressíntese, causando uma
105
interferência negativa no julgamento que deveria ser feito durante o Teste 2. Em prol dessa
naturalidade, a opção foi feita, então, pela gravação com uma entonação neutra, ainda porquê,
sendo ela a mesma base para todas as ressínteses, o controle das variações efetuadas se manteria
de forma rigorosa. Uma vez que, no entanto, não seria prudente deixar de verificar o resultado
obtido a partir de uma modulação completamente monotônica, decidiu-se aplicar o mesmo
processo de ressíntese utilizado para a versão neutra a uma versão monotônica das OPs, com a
F0 nivelada em 132Hz para a OP 1 e em 127Hz para a OP 2 (cf. a descrição da “linha de
referência”, no início do capítulo 6). Essas versões monotônicas serão denominadas, a partir de
agora, OP 1 monotônica e OP 2 monotônica.
A figura 4.7 ilustra a F0 das OPs, em suas versões neutras.
OP 1 neutra OP 2 neutra
Figura 4.7– Freqüência fundamental e alinhamento das orações principais neutras.
Todo o processo de ressíntese consistiu em procurar adaptar a conformação prosódica das
OPs de referência às suas versões neutra e monotônica. Assumiu-se a conformação prosódica das
OPs 1 de referência para as ressínteses das variedades neutra e monotônica tanto da OP 1 quanto
da OP 2, uma vez que os resultados obtidos a partir do Teste 1 (cf. seção 4.1) confirmaram a
hipótese segundo a qual os contornos prosódicos pré-indicativos apresentariam um índice de
reconhecimento inferior nas OPs 2, por contarem elas com uma sílaba pós-tônica. Utilizou-se o
programa de processamento sonoro Praat, versão 4.5.15 (Boersna e Weenink, 1996),
empregando a técnica PSOLA. Como procedimento inicial, após a transformação dos arquivos
sonoros originais (versões neutras) para a manipulação por ressíntese, determinou-se a
estilização de pitch em dois semitons. Para atingir o resultado de cada subcategoria, essas
versões foram ressintetizadas, levando-se em consideração, de um lado, as variações da
freqüência fundamental e, de outro, a duração. Procurou-se seguir uma seqüência na modificação
desses parâmetros, elevando-se a F0 em um determinado segmento, por exemplo, em um
percentual mais baixo que o verificado nas OPs de referência e, sucessivamente, aumentando-se
Time (s)
0 1.576210
250f i k a v i f e l i
Time (s)
0 1.746370
250mo t r a v a s i k a s a d u
106
esse percentual, inclusive ultrapassando o ponto em que se obteve um resultado auditivo
satisfatório. Assim, a F0 foi sendo gradativamente elevada em 0,5 valor de referência (VR), até
atingir 6 VRs28
(para a discussão sobre o valor de referência, cf. o capítulo 6). Ressintetizaram-se
a F0 e a duração isoladamente e, em determinadas ressínteses, houve a combinação dos dois
parâmetros, simultaneamente. Houve situações em que a variação da duração de segmentos não
pareceu necessária para obter o resultado sonoro desejado, não sendo esse parâmetro, portanto,
explorado. O julgamento quanto à aproximação das ressínteses às OPs de referência foi feito
pelo próprio pesquisador.
A partir da análise visual da curva representativa da freqüência fundamental das OPs de
referência, é possível estabelecer dois grupos distintos, segundo seja ela ascendente ou
descendente na STF. Para o processo de ressíntese, foram consideradas apenas as subcategorias
que, de acordo com os critérios estabelecidos (cf. a seção 5.3, mais à frente), apresentaram maior
expressividade contrastiva. Assim, para o contorno ascendente da F0, consideraram-se as OPs de
referência causal, consecutiva e final; para o contorno descendente da F0, as OPs de referência
concessiva, conformativa e temporal.
Todos os valores numéricos expressos no capítulo 6, referente à descrição das ressínteses,
refletem as mensurações obtidas para a freqüência fundamental e a duração das OPs de
referência (cf. anexo 3). O ponto de segmentação fonética foi estabelecido, no caso das vogais,
tomando-se como referência o segundo formante (Jacqueline Vaissière, comunicação pessoal) e,
tanto para as vogais quanto para as consoantes, ampliou-se a imagem representativa dos ciclos
do sinal acústico, de forma que fosse identificado o ponto mais provável em que se processou o
início ou o fim da regularidade dos ciclos formadores do segmento (Bernard Gautheron,
comunicação pessoal). Caso não houvesse a necessidade dessa ampliação da imagem, como, por
exemplo, na determinação do ponto mínimo da F0 ao longo da consoante de ataque da sílaba
tônica, nas subcategorias com F0 ascendente nessa sílaba, utilizou-se a ferramenta do programa
Praat que permite a detecção automática do ponto mínimo de pitch.
Deve-se levar em consideração, ainda, que as medidas indicadas podem sofrer variação
de um programa para outro. A mensuração do pitch na fronteira inicial da vogal /e/, na SPreTF
da OP neutra para o PB, apresentou o valor de 132Hz, segundo o programa Praat; 118Hz,
segundo o programa WinPitchPro; e 135Hz, segundo o programa WinSnoori, todos os três
28 No entanto, algumas vezes houve uma diferença entre os valores de pitch esperados com as elevações da F0
aplicadas durante o processo de ressíntese e os valores reais obtidos. De uma forma geral, os valores reais estiveram
alguns Hertz abaixo do esperado. É importante observar que houve casos em que os valores esperados e os atingidos
coincidiram.
107
utilizando o método de autocorrelação, seguindo-se, no uso dos três programas, o mesmo
processo de detecção de fronteira de segmento descrito acima. Os valores apresentados no
capítulo 6 foram obtidos a partir do programa Praat, utilizado ao longo de todo o processo de
ressíntese. O silêncio referente à oclusão da consoante /k/, para efeitos de segmentação, foi
incorporado ao todo da consoante, inclusive uma possível pausa anterior a essa oclusão.
Utilizou-se o recurso de obtenção semi-automática dos dados, por meio da ferramenta “Log 1”,
no menu “Query”. Foram excluídos os valores decimais, sem se proceder à aproximação dos
valores inteiros. A título de lembrança, houve manifestação da F0 na consoante da STF por se
tratar, no corpus utilizado, de uma sonante.
Quanto aos resultados obtidos a partir da elevação da F0 na STF, como será descrito no
capítulo 6, deve-se levar em consideração que a qualidade auditiva final nem sempre se mostra
satisfatória. Uma vez que a F0 é definida como
F0 = 1 ,
período
sendo que período refere-se à duração, em milissegundos, de um ciclo do sinal sonoro, para
elevá-la é necessário aumentar o número de ciclos formadores do segmento sonoro. Isso implica
a diminuição de tempo (período) para cada ciclo. Por exemplo, se um período apresentar a
duração de 20ms (0,020seg), a F0 será de 50Hz (ou seja, 1/0,020). Se a duração do período for
de 10ms (0,010seg), a F0 será de 100Hz.
Para promover essa elevação por meio da ressíntese sonora, os algoritmos dos programas
computacionais selecionam amostras dos ciclos do sinal e inserem, progressivamente, cópias
desses ciclos no mesmo período. Normalmente, obtém-se um resultado auditivo satisfatório com
até duas vezes o valor original da F0 (Philippe Martin, comunicação pessoal). Assim, as
ressínteses produzidas a partir das OPs 1 e 2, tanto neutras quanto monotônicas, produziram um
efeito de voz não-natural quando a F0 foi elevada acima de determinados limites.
No sexto capítulo, após a apresentação e discussão dos resultados do Teste 1, serão
apresentadas as ressínteses promovidas para as OPs 1 e 2 neutras e monotônicas para o PB.
108
4.5 TESTE 2
O objetivo do Teste 2 foi verificar, dentre as ressínteses feitas para cada uma das OPs
neutras e monotônicas, quais apresentariam um índice de reconhecimento significativo por parte
dos ouvintes como pré-indicativas de cada uma das seis subcategorias adverbiais
significativamente identificadas no Teste 1. Seria inviável testar todas as ressínteses, optando-se,
então, por duas de cada subcategoria. O processo de seleção dessas ressínteses atendeu,
inicialmente, às situações de conflito entre os parâmetros prosódicos modificados. Por exemplo,
o comportamento apenas da F0, dissociada da variação de duração, apresentaria um resultado
final tão satisfatório quanto em combinação com alterações na duração. Selecionou-se, então,
uma versão ressintetizada apenas com variações na F0 e outra, com variações na F0 e na
duração. No entanto, nem todos os pares de ressínteses utilizadas no Teste 2 exploraram
necessariamente esses dois fatores em conjunto. Houve casos em que foi necessário testar
modificações na curva da F0 em pontos distintos, sem a interferência da duração (para maiores
detalhes, cf. o capítulo 6). Como o objetivo dessas ressínteses foi aproximar, ao máximo
possível, as versões neutras e monotônicas às versões originais das OPs de referência, a seleção
de quais ressínteses seriam utilizadas no Teste 2 levou em consideração esse nível de
semelhança.
O modelo utilizado no Teste 2 inspirou-se no utilizado no Teste 1, mas de uma forma
mais simples. No Teste 1, foram testadas, duas a duas, todas as OPs. Como o Teste 2 avaliou
frases não-naturais, optou-se pelo julgamento de cada uma das ressínteses isoladamente. Todas
as ressínteses produzidas a partir da OP neutra e da OP monotônica e selecionadas para o teste
foram também contrastadas com as OSAdvs, por análise combinatória. Como o resultado do
Teste 1 evidenciou o reconhecimento significativo de seis dos nove possíveis contornos pré-
indicativos adverbiais, o Teste 2 explorou apenas essas seis subcategorias (pré-indicações causal,
concessiva, conformativa, consecutiva, final e temporal) (6 subcategorias pré-indicativas X 2
ressínteses = 12 ressínteses; 12 ressínteses X 5 cruzamentos = 60 cruzamentos para a OP 1 e 60
cruzamentos para a OP 2; total de 120 cruzamentos para as ressínteses a partir da OP neutra e
120 cruzamentos para as ressínteses a partir da OP monotônica).
Os cruzamentos foram apresentados em folhas de tamanho A4, com as informações e os
dados dispostos em quatro colunas. Na primeira, o número de ordem do cruzamento; na segunda,
a OP; na terceira, as letras “A” e “B”, dispostas verticalmente e seguidas por parênteses; na
quarta coluna, as OSAdvs. Apenas uma das OSAdvs apresentadas em cada par era o potencial
109
complemento da modulação prosódica apresentada para a OP contida na segunda coluna (versão
ressintetizada). Cada sessão de aplicação do teste foi precedida de uma prática, com o objetivo
de familiarizar os participantes. Uma amostra do Teste 2, precedida do comando dado aos
participantes, é apresentada na figura 4.8.
Você ouvirá, para cada item, o trecho inicial entoado de uma forma específica. O objetivo é você
escolher qual das duas complementações é adequada para a forma como o trecho inicial foi
pronunciado. Indique sua escolha marcando um X na opção A ou na opção B.
1 Ficava infeliz A ( ) porque o trabalho não produzia frutos.
B ( ) que dava pena ver seu rosto.
2 Mostrava-se cansado A ( ) para que todos sentissem pena dele.
B ( ) conforme convinha a um pessimista.
Figura 4.8 – Modelo gráfico para aplicação do Teste 2. Os participantes ouviram uma versão ressintetizada das
orações principais presentes na segunda coluna, à qual deveria ser associada uma das orações subordinadas
presentes na quarta coluna. O valor semântico de cada OSAdv é indicado pelo conectivo que a introduz.
Os arquivos sonoros foram registrados em mídia digital (CD-rom). Cada OP foi repetida
quatro vezes, com um intervalo de tempo de 2300ms entre cada repetição. Apenas após todos os
participantes terem feito sua escolha, procedia-se à audição do grupo seguinte. Caso algum
ouvinte solicitasse, o arquivo sonoro poderia ser ouvido novamente.
O Teste 2 foi aplicado a 40 alunos do curso de graduação em Letras das Universidades
Federais do Rio de Janeiro e do Espírito Santo (20 em cada universidade), distribuídos em dois
grupos: 10 alunos de cada universidade participaram da versão do Teste 2 direcionada às
ressínteses das OPs neutras, e os 10 outros, da versão direcionada às ressínteses das OPs
monotônicas. O teste foi aplicado durante duas aulas, numa mesma semana, e dividido em quatro
partes, no início e no fim de cada aula, de forma que a percepção dos ouvintes não fosse
prejudicada com a repetição exaustiva das OPs. Os participantes permaneceram em suas salas de
aula. Da mesma forma que para a aplicação do Teste 1, os arquivos sonoros foram executados
utilizando-se um reprodutor de CD convencional e os alto-falantes embutidos no aparelho. Como
as salas de aula não contavam com tratamento acústico, haveria a possibilidade de, durante o
teste, os participantes ouvirem ruídos externos.
110
4.6 PROSOGRAMAS
No capítulo 7, destinado à análise dos resultados do Teste 2, será feito uso dos
prosogramas (cf. figuras 7.1 e 7.2), um sistema de transcrição prosódica desenvolvido por Piet
Mertens (2004) como aplicativo do programa Praat, visando a uma representação objetiva e
confiável do comportamento melódico de uma elocução. O resultado final obtido a partir do
emprego dessa ferramenta prevê a estilização das variações de altura e de percepção tonal.
A estilização se processa exclusivamente sobre os segmentos vocálicos. O núcleo desses
segmentos é definido como a parte vozeada em torno do pico de intensidade, com delimitações à
esquerda e à direita, respectivamente, feita pelos pontos situados a -3dB e -9dB desse pico. A
expectativa é a de que os traçados de F0 obtidos representem os movimentos melódicos
efetivamente perceptíveis ao ouvido humano.
Cada prosograma gerado apresenta, no eixo das ordenadas, a variação em semitons. O
espaço entre cada linha pontilhada, paralela ao eixo das abscissas, corresponde a uma variação
de dois semitons. Os semitons são estabelecidos a partir de 1Hz. Verifica-se uma seta no eixo
das ordenadas, com a indicação de 150Hz. Esse ponto é assumido como um valor freqüencial
normalmente presente no escopo de variação tanto da voz masculina quanto da voz feminina.
Para maiores detalhes, conferir Mertens (2004).
A geração e observação dos prosogramas para as OPs de referência utilizadas nesta
pesquisa coloca-se como um recurso adicional para a identificação e confirmação ou não das
hipóteses para os parâmetros prosódicos responsáveis por cada subcategoria pré-indicativa. No
entanto, como será discutido, verificaram-se alguns conflitos entre os resultados obtidos a partir
do Teste 2 e as estilizações dos movimentos melódicos perceptíveis ao ouvido humano sugeridas
pelos prosogramas.
111
5. DESCRIÇÃO E ANÁLISE DOS RESULTADOS DO TESTE 1
5.1. OS RESULTADOS PARA O PB
Como caracterizado na descrição metodológica, o objetivo do Teste 1 foi identificar quais
subcategorias das OSAdvs teriam um bom índice de reconhecimento pré-indicativo. A partir do
cruzamento aleatório de todas as subcategorias, por análise combinatória binária (cf. 4.3.1), o
julgamento dos 40 participantes evidenciou os resultados apresentados nas tabelas 5.1 e 5.2 e
comentados a seguir.
A análise estatística dos resultados foi feita utilizando o Teste Chi-quadrado, uma vez que
o Teste 1 procurou analisar se um determinado cruzamento foi feito dentro da expectativa de
distinção entre as nove subcategorias ou não. Em outras palavras, se as OSAdvs de cada par do
cruzamento foram associadas às modulações prosódicas pré-indicativas correspondentes,
aplicadas às OPs. Isso permitiu estabelecer como pretensamente “correto” o julgamento em que
o cruzamento se realizou dentro dessa expectativa, e como “errado” o cruzamento que não a
preencheu.
Nessa situação específica, o grau de liberdade estabelecido é 1, e para que o valor p seja
igual ou inferior a 0,05, o resultado do Teste Chi-quadrado deve ser igual ou superior a 3,84. Foi
assumido o índice de significância para p de 0,05.
caus
comp 6,4
0,011 comp
conces 14,4
0,0001
2,5
0,114 conces
condic 0,9
0,343
0,9
0,343
0,9
0,343 condic
confor 4,9
0,027
0,9
0,343
10
0,002
0,4
0,527 confor
consec 4,9
0,027
2,5
0,114
8,1
0,004
6,4
0,011
14,4
0,0001 consec
final 0,9
0,343
4,9
0,027
0,9
0,343
0,1
0,752
2,5
0,114
12,1
0,0001 final
propor 0
1
2,5
0,114
4,9
0,027
1,6
0,206
2,5
0,114
10
0,002
2,5
0,114 propor
temp 6,4
0,011
4,9
0,027
10
0,002
0
1
4,9
0,027
10
0,002
4,9
0,027
0,1
0,752
Tabela 5.1 – Resultados de um Teste Chi2 (df=1), para o cruzamento, no Teste 1, entre as 9 subcategorias de OPs 1
para o PB. Em cada célula, a linha superior indica o resultado do Teste Chi2; a inferior, o valor p. As células
destacadas sinalizam os cruzamentos que obtiveram nível de significância p 0,05.
112
caus
comp 2,5
0,114 comp
conces 8,1
0,004
0,1
0,752 conces
condic 0,4
0,527
1,6
0,206
0,9
0,343 condic
confor 0,4
0,527
2,5
0,114
8,1
0,004
0,9
0,343 confor
consec 4,9
0,027
2,5
0,114
22,5
0,0000002
19,6
0,00001
4,9
0,027 consec
final 0,1
0,752
8,1
0,004
10
0,002
0,1
0,752
14,4
0,0001
2,5
0,114 final
propor 0,4
0,527
0,9
0,343
4,9
0,027
1,6
0,206
1,6
0,206
2,5
0,114
0,1
0,752 propor
temp 0,9
0,343
4,9
0,027
4,9
0,027
1,6
0,206
0,4
0,527
0,4
0,527
0,4
0,527
1,6
0,206
Tabela 5.2 – Resultados de um Teste Chi2 (df=1), para o cruzamento, no Teste 1, entre as 9 subcategorias de OPs 2
para o PB. Em cada célula, a linha superior indica o resultado do Teste Chi2; a inferior, o valor p. As células
destacadas sinalizam os cruzamentos que obtiveram nível de significância p 0,05.
5.1.1 Cruzamentos a partir da subcategoria causal
Os resultados obtidos sugerem que, no universo dos participantes do Teste 1, o contorno
pré-indicativo causal, na OP 1, é significativamente distinguível dos contornos pré-indicativos de
comparação, de concessão, de conformidade, de conseqüência e de temporalidade. Ou seja, nas
oito possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo causal foi
significativamente identificado em cinco.
Em relação à OP 2, a distinção é significativa em relação aos contornos pré-indicativos de
concessão e de conseqüência. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o
contorno pré-indicativo causal foi significativamente identificado em duas.
5.1.1.1 Análise dos resultados para a pré-indicação causal
Comparando-se a configuração melódica da OP 1 causal de referência com a da OP 1
comparativa de referência (distinção com índice p=0,011), observa-se que o traçado da F0 é
bastante semelhante nos dois casos, ambos com elevação da F0 na STF. O que parece ser o fator
113
diferenciador é o valor máximo de elevação nesse segmento29
. Enquanto na OP 1 causal de
referência a F0 varia de 131Hz a 236Hz (80%), na OP 1 comparativa de referência a variação
está entre 113Hz e 193Hz (70%), com variação, entre os pontos máximos atingidos, de 22%30
.
Levando-se ainda em consideração o formato ascendente da F0 na STF, o outro contraste
significativo (Chi2=4,9, df=1, p=0,027) se deu em relação à OP 1 consecutiva de referência. A
variação da F0 na STF esteve entre os 126Hz e os 223Hz (76%), bastante próxima, portanto, do
verificado no mesmo segmento da OP 1 comparativa de referência31
(como indicado acima,
esses dois contornos não foram significativamente distinguidos entre si). A hipótese para a
diferenciação dos contornos recai, então, sobre o formato que a F0 assume, na STF da OP 1
consecutiva de referência, que se mostra com uma concavidade mais acentuada,
consideravelmente mais arredondada que nesse mesmo segmento da OP 1 causal de referência e
com o ataque em posição mais aguda na sílaba pré-tônica32
(cf. figura 5.1); e sobre a duração da
consoante inicial da STF, que, na OP 1, é 20% maior na pré-indicação consecutiva que na causal
(140ms contra 116ms) (na OP 2, a diferença é de apenas 3%, com 178ms contra 185ms).
OP 1 causal OP 1 consecutiva
Figura 5.1 - Freqüência fundamental e alinhamento das OPs 1 causal e consecutiva de referência – Ficava infeliz –
para o PB.
Considerando-se o outro grande grupo de configurações melódicas verificado – F0 com
configuração descendente na STF –, a distinção mais significativa se deu em relação à OP 1
concessiva de referência (Chi2=14,4, df=1, p=0,0001). Como esperado, o contraste entre os
29 Embora a elevação da F0, nos casos em análise da OP 1, tenha seu início de sua elevação situado no ataque da
STF, não se devem perder de vista os casos em que essa consoante é surda, como, por exemplo, na OP 2. Como será
apresentado em relação aos processos de ressíntese utilizados para a configuração do Teste 2, caso a consoante seja
surda, será assumida a variação da F0 apenas na VTF. 30 Essa diferença é significativa ao ouvido humano. Segundo Rossi (1971, 1978), o limite de percepção do glissando
está entre 18Hz e 19Hz para uma duração de 200ms, tanto para o movimento ascendente quanto para o movimento
descendente da F0. 31 A variação em relação ao valor máximo atingido pela F0 na STF da OP 1 comparativa de referência é de 5%.
32 Essa diferenciação, no processo de ressíntese (cf. conclusão), se concretiza pela formação do vale da F0.
Time (s)
0 1.392270
300f i k a v i f e l i
Time (s)
0 1.471810
300f i k a v i f e l i
114
formatos de F0 com configuração ascendente seria mais claramente evidenciado em relação ao
formato com configuração descendente na STF. Isso se verificou também no contraste da OP 1
causal de referência com a conformativa (Chi2=4,9, df=1, p=0,027) e com a temporal
(Chi2=6,4, df=1, p=0,011).
A não-significância de contraste, portanto, da OP 1 causal de referência com a
condicional e com a de finalidade (Chi2=0,9, df=1, p=0,343, para ambos os casos) não seria de
todo imprevista. No entanto, o contraste com a proporcional – que apresenta um possível
contorno pré-indicativo com a F0 descendente na STF – mostrou-se totalmente nulo (Chi2=0,
df=1, p=1), contrariando a expectativa inicial.
Comparativamente aos contrastes estabelecidos para a OP 1, a OP 2 causal de referência
evidenciou apenas dois resultados significativos: com as OPs 2 pré-indicativas concessiva
(Chi2=8,1, df=1, p=0,004) e consecutiva (Chi2=4,9, df=1, p=0,027) de referência. O mais
previsível desses dois, segundo a expectativa inicial, seria o contraste com o contorno pré-
indicativo de concessão, que apresenta configuração da F0 descendente na STF.
Observe-se que não se verificou significância contrastiva, nos outros casos, nem mesmo
em relação às outras OPs 2 com essa mesma configuração da F0.
5.1.2 Cruzamentos a partir da subcategoria comparativa
Os índices obtidos sugerem que, no universo dos participantes do Teste 1, o contorno pré-
indicativo comparativo, na OP 1, é significativamente distinguível dos contornos pré-indicativos
de causa e de finalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno
pré-indicativo comparativo é significativamente identificado em duas.
Em relação à OP 2, há distinção significativa em relação aos contornos pré-indicativos de
finalidade e de temporalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o
contorno pré-indicativo comparativo é significativamente identificado em duas.
115
5.1.2.1 Análise dos resultados para a pré-indicação comparativa
Como já discutido na sessão anterior, a diferenciação entre o contorno pré-indicativo
comparativo e o causal parece residir no valor máximo de elevação da F0 na STF, 22% mais
elevado no causal.
Em relação ao contorno pré-indicativo final (Chi2=4,9, df=1, p=0,027, para a OP 1;
Chi2=8,1, df=1, p=0,004, para a OP 2), esse valor máximo de elevação da F0 se colocou
praticamente no mesmo nível: enquanto, no contorno pré-indicativo final, atingiram-se os
202Hz, no comparativo o valor máximo esteve nos 193Hz, ou seja, uma variação de 4%. Como
essa variação se mostra abaixo do limiar de percepção do ouvido humano para os sons da fala
(cf. Rossi, 1971, 1978), a hipótese de diferenciação entre os dois contornos recai, assim, sobre o
formato da F0 que, da mesma forma que no contorno pré-indicativo de conseqüência, apresenta a
forma mais arredondada e com o ataque em posição mais aguda na sílaba pré-tônica.
A diferenciação em relação ao contorno pré-indicativo temporal (Chi2=4,9, df=1,
p=0,027, para a OP 1 e para a OP 2) preencheu a expectativa inicial, uma vez que se trata de dois
formatos da F0 com direcionamento oposto na STF, ascendente para a pré-indicação causal e
descendente para a temporal.
Considerando-se os contrastes significativos obtidos para a OP 2, os mesmos comentários
acima aplicam-se de forma respectiva aos dois casos verificados. Deve-se observar que a F0, na
sílaba tônica da OP 2 final de referência, apresenta uma conformação ascendente, da mesma
forma que a OP 2 comparativa de referência, embora a queda que segue seja mais acentuada. A
caracterização descendente da F0 na STF da OP 2 temporal de referência mostra-se oposta à
conformação ascendente da comparativa.
Contrariando as expectativas iniciais, não se verificou contraste significativo entre a pré-
indicação comparativa e as pré-indicações concessiva, conformativa e proporcional, estas três
últimas com a conformação da F0 na STF em formato descendente.
Provavelmente por conta da similaridade entre os formatos ascendentes da F0 nas sílabas
tônicas finais, não se verificou a diferenciação em relação aos contornos pré-indicativos de
condição e de conseqüência.
116
5.1.3 Cruzamentos a partir da subcategoria concessiva
Os resultados obtidos sugerem que, no universo dos participantes do Teste 1, o contorno
pré-indicativo concessivo, na OP 1, é significativamente distinguível dos contornos pré-
indicativos de causa, de conformidade, de conseqüência, de proporção e de temporalidade. Ou
seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo concessivo é
significativamente identificado em cinco.
Em relação à OP 2, a pré-indicação concessiva é significativamente distinguível dos
contornos pré-indicativos de causa, de conformidade, de conseqüência, de finalidade, de
proporção e de temporalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o
contorno pré-indicativo concessivo é significativamente identificado em seis.
5.1.3.1 Análise dos resultados para a pré-indicação concessiva
A diferenciação significativa da pré-indicação concessiva em relação aos contornos pré-
indicativos causal (Chi2=14,4, df=1, p=0,0001, para a OP 1; Chi2=8,1, df=1, p=0,004, para a
OP 2) e consecutivo (Chi2=8,1, df=1, p=0,004, para a OP 1; Chi2=22,5, df=1, p=0,0000002,
para a OP 2) confirmou as expectativas iniciais, por apresentarem os dois últimos a F0 na STF
com o formato ascendente.
Comparando-se o traçado melódico da OP 1 concessiva de referência, significativamente
diferenciado do da conformativa (Chi2=10, df=1, p=0,002, para a OP 1; Chi2=8,1, df=1,
p=0,004, para a OP 2), verifica-se uma semelhança visual bastante acentuada. A hipótese de
diferenciação entre os dois contornos recai sobre dois pontos.
A F0, na vogal tônica final (doravante, VTF) da pré-indicação concessiva, apresenta um
formato ligeiramente côncavo. Na pré-indicação conformativa, esse formato é ligeiramente
convexo. Menos sutil que essa particularidade, no entanto, percebe-se uma diferença na duração
dessa VTF: 177ms, na pré-indicação concessiva, e 131ms, na pré-indicação conformativa
(variação de 35%), considerando-se as OPs 1. Ao se observarem esses mesmos pontos nas OPs
2, no entanto, verifica-se que o formato da F0 mostra-se ligeiramente côncavo em ambas as
vogais tônicas finais, e que a diferença de duração é praticamente inexistente: 186ms, na pré-
indicação concessiva, e 182ms, na pré-indicação conformativa (2%).
117
O traçado melódico da pré-indicação de proporção mostrou-se também
significativamente diferenciado do de concessão (Chi2=4,9, df=1, p=0,027, tanto para a OP 1
quanto para a OP 2), embora apresentem-se ambos com a configuração descendente da F0 na
STF. A hipótese diferenciadora entre os dois contornos pré-indicativos recai sobre o formato da
F0 na VTF: na pré-indicação concessiva, esse formato mostra-se ligeiramente côncavo, e
acentuadamente convexo na pré-indicação proporcional (embora, em relação à OP 2, não se
possa dizer que essa convexidade seja acentuada). Ainda que essa hipótese seja levantada com
base em um nível de percepção bastante sutil, é interessante lembrar que Delattre (1966), ao
caracterizar as três curvas descendentes identificadas entre os que considerou como os dez
contornos de base do francês, considerou-as como convexa, linear e côncova. Atendendo
também à sugestão de Ladd (1996) quanto à necessidade de observação de detalhes menores
quando da análise prosódica, parece razoável que essa hipótese seja assumida.
Considerando-se a similaridade de contornos descendentes, a pré-indicação concessiva
mostrou-se também significativamente diferente da pré-indicação temporal (Chi2=10, df=1,
p=0,002, para a OP 1; Chi2=4,9, df=1, p=0,027, para a OP 2). Comparando-se as duas pré-
indicações na OP 1, percebe-se também a mesma diferença de concavidade-convexidade
discutida no parágrafo anterior, mas com uma tendência, na pré-indicação temporal, a um certo
nivelamento. Enquanto na pré-indicação concessiva a F0 na VTF varia entre 181Hz e 120Hz
(51%), na temporal essa variação ocorre entre 154Hz e 146Hz (5%). Há ainda uma expressiva
diferença de duração da VTF: 177ms, na pré-indicação concessiva, e 114ms, na pré-indicação
temporal, com uma diferença, portanto, de 55%. Essas diferenças não se verificam em relação às
OPs 2, que apresentam variações semelhantes tanto na F0 (157Hz e 113Hz, perfazendo 39%, na
OP 2 concessiva de referência; 170Hz e 125Hz, perfazendo 36%, na OP 2 temporal de
referência) quanto na duração (186ms, na OP 2 concessiva de referência; 178ms, na OP 2
temporal de referência, perfazendo uma variação de 4%).
Contrariando as expectativas iniciais, o contorno pré-indicativo concessivo não se
diferenciou dos contornos pré-indicativos comparativo e condicional, que apresentam, ambos,
forma ascendente da F0 na STF. Essa expectativa inicial de identificação devida à diferença de
direcionamento ascendente ou descendente da F0, em relação à pré-indicação de finalidade, só se
verificou no universo da OP 2 (Chi2=10, df=1, p=0,002).
118
5.1.4 Cruzamentos a partir da subcategoria condicional
Os índices obtidos sugerem que, no universo dos participantes do Teste 1, o contorno pré-
indicativo condicional, na OP 1, é significativamente distinguível do contorno pré-indicativo de
conseqüência. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-
indicativo concessivo é significativamente identificado apenas em uma.
Em relação à OP 2, da mesma forma que ocorre para a OP 1, há distinção significativa
apenas em relação ao contorno pré-indicativo de conseqüência.
5.1.4.1 Análise dos resultados para a pré-indicação condicional
O contorno pré-indicativo de condição apresentou um comportamento semelhante quanto
aos resultados obtidos no Teste 1 tanto para a OP 1 quanto para a OP 2. Em ambos os casos, o
único contraste significativo se deu em relação à pré-indicação de conseqüência (Chi2=6,4,
df=1, p=0,011, para a OP 1; Chi2=19,6, df=1, p=0,00001, para a OP 2). A hipótese para essa
diferenciação recai sobre a combinação do ponto máximo de elevação atingido pela F0 na VTF
com a duração maior da consoante na STF da pré-indicação consecutiva, sem desprezar, no
entanto, o movimento descendente-ascendente da F0 a partir da VPreTF. É de se observar que
este movimento não se verifica na pré-indicação causal, talvez por isso não ter sido ela
distinguida da pré-indicação condicional.
Considerando-se a hipótese inicial da diferença contrastiva entre os formatos ascendente
e descendente da F0 na STF, a expectativa estaria centralizada sobre uma diferenciação
significativa entre o contorno pré-indicativo condicional (ascendente) e os contornos pré-
indicativos concessivo, conformativo, proporcional e temporal (descendentes). No entanto, isso
não aconteceu em nenhum dos casos.
A não-diferenciação em relação aos contornos pré-indicativos de causa, de comparação e
de finalidade, por sua similaridade no formato ascendente, foi verificada.
Observando-se o índice p=1 obtido a partir do cruzamento entre o contorno pré-
indicativo condicional e o temporal (o que significa dizer que o julgamento feito pelos
participantes do Teste 1 foi totalmente devido ao acaso), percebe-se a existência de uma grande
similaridade entre os dois contornos, muito embora o condicional apresente conformação
ascendente para a F0 na STF, e o temporal, conformação descendente.
119
Há uma discussão considerável em relação à ambigüidade existente entre determinadas
categorias semânticas. Como apresentado na seção 1.3, a desambigüização da oração introduzida
pela conjunção “e”, cujo valor semântico oscila entre a temporalidade e a causalidade, pode ser
feita por via prosódica (cf. Pierrehumbert e Hirschberg, 1990:304). Verifica-se também uma
certa dificuldade de distinção entre a noção de tempo e a de condição (cf. Gouveia et al., 2001;
Dias, Vanderlei, 1999). Efetivamente, ao se afirmar, por exemplo, que alguém ficava infeliz
quando não lhe permitiam falar, há a implicação direta de que esse estado de infelicidade só se
processaria na condição de não lhe permitirem falar; ou seja, caso lhe permitissem falar, não
ficaria infeliz.
Durante a gravação das frases para a formulação do corpus para o PB, a locutora
produziu, num primeiro momento, a OP 1 pré-indicativa temporal com a modulação ascendente
para a F0, de forma semelhante à pré-indicação condicional, conforme se verifica na figura 5.1.
A escolha, no entanto, da conformação descendente para a pré-indicação temporal pelos quatro
avaliadores brasileiros (cf. 4.1) sugere a possibilidade de caracterizar o critério prosódico como
responsável pela desambigüização entre essas duas categorias semânticas. A sugestão, então, é
considerar como essencialmente temporal a OSAdv que apresente modulação descendente da F0
na STF, e como condicional a OSAdv com modulação ascendente33
nesse segmento, mesmo que
a oração seja introduzida por um conectivo tradicionalmente assumido como temporal, como é o
caso de “quando”34
. Philippe Martin (1982) assume posição semelhante para o FR.
33 Pierrehumbert e Hirschberg (1990:304) indicam que a leitura “condicional implícita” da conjunção “e” é
favorecida pelos acentos frasais H, como em:
Eat another cookie and I‟ll kill you (coma outro biscoito e eu te matarei)
H* H H* L L% 34 Durante a formulação do corpus para o francês (cf. 4.2), as pessoas (nativas) envolvidas afirmaram
categoricamente que il est ennuyé quand on ne lui permet pas de s’exprimer evidencia uma relação de condição, e
que para que se tratasse de uma relação de tempo, necessariamente deveria haver um marcador específico numa
escala temporal, como “après” em il est ennuyé après avoir travaillé des heures sans comprendre.
120
OP 1 temporal com valor
condicional
OP 1 temporal sem valor
condicional
OP 1 condicional
Figure 5.1 – Freqüência fundamental e alinhamento das OPs 1 – Ficava infeliz – pré-indicativas de tempo com e
sem valor condicional, e da OP 1 condicional de referência.
Essa ambigüidade entre os valores semânticos condicional e temporal talvez não se
apresente como explicação para a não-significância de contraste entre as OPs condicionais de
referência e as demais pré-indicações. Observe-se, no entanto, que os cruzamentos feitos a partir
da pré-indicação temporal mostraram-se significativos em seis das oito possibilidades, como será
discutido mais à frente (cf. 5.1.9).
5.1.5 Cruzamentos a partir da subcategoria conformativa
Os resultados do Teste 1 sugerem que o contorno pré-indicativo conformativo, na OP 1, é
significativamente distinguível dos contornos pré-indicativos de causa, de concessão, de
conseqüência e de temporalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o
contorno pré-indicativo conformativo é significativamente identificado em quatro.
Em relação à OP 2, a pré-indicação conformativa é significativamente distinguível dos
contornos pré-indicativos de concessão, de conseqüência e de finalidade. Ou seja, nas oito
possibilidades de cruzamentos para a OP 2, o contorno pré-indicativo condicional é
significativamente identificado em três.
5.1.5.1 Análise dos resultados para a pré-indicação conformativa
Se considerado amplamente o formato descendente da F0 na STF, o contorno pré-
indicativo conformativo se assemelha aos contornos concessivo e temporal. Como já discutido
em 5.1.3.1, a hipótese de diferenciação entre a pré-indicação concessiva e a conformativa recai
Time (s)
0 1.268030
300f i k a v i f e l i
Time (s)
0 1.34980
300f i ak v i f e l i
Time (s)0 1.44771
0
300f i k a v i f e l i
121
sobre o formato da F0 (ligeiramente côncavo, no caso da concessão; ligeiramente convexo, no
caso da conformidade) e da duração na VTF (35% maior na pré-indicação concessiva).
Em relação ao contorno pré-indicativo temporal, como já sugerido em 5.1.3.1, o fator
identificador desse contorno parece ser o formato com menor variação de amplitude da F0 na
VTF (5%), mostrando-se, portanto, mais nivelada. É importante lembrar que essa variação se
processou de forma diferente na OP 2 temporal de referência.
A significância de contraste com a pré-indicação consecutiva (Chi2=14,4, df=1,
p=0,0001, para a OP 1; Chi2=4,9, df=1, p=0,027, para a OP 2) e final (Chi2=14,4, df=1,
p=0,0001, para a OP 2) atendeu à expectativa geral devida ao contraste de formato ascendente
ou descendente da F0. No entanto, não houve distinção significativa em relação aos contornos
pré-indicativos (também ascendentes) de comparação, de condição e, considerando-se apenas a
OP 1, de finalidade.
A não-distinção em relação ao contorno pré-indicativo de proporção talvez se tenha dado
por conta da semelhança entre as conformações descendentes da F0 nos dois casos.
5.1.6 Cruzamentos a partir da subcategoria consecutiva
Os índices obtidos com o Teste 1 indicam que o contorno pré-indicativo consecutivo, na
OP 1, é significativamente distinguível dos contornos pré-indicativos de causa, de concessão, de
condição, de conformidade, de finalidade, de proporção e de temporalidade. Ou seja, nas oito
possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo conformativo foi
significativamente identificado em sete.
Esses índices também sugerem que o contorno pré-indicativo consecutivo, na OP 2, é
significativamente distinguível dos contornos pré-indicativos de causa, de concessão, de
condição e de conformidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o
contorno pré-indicativo consecutivo foi significativamente identificado em quatro.
5.1.6.1 Análise dos resultados para a pré-indicação consecutiva
Considerando-se a diferenciação mais ampla esperada por conta da oposição ascendente-
descendente no formato da F0 na STF, a pré-indicação consecutiva (modulação ascendente)
diferenciou-se significativamente dos contornos pré-indicativos concessivo (Chi2=8,1, df=1,
122
p=0,004, para a OP 1; Chi2=22,5, df=1, p=0,0000002, para a OP 2), conformativo (Chi2=14,4,
df=1, p=0,0001, para a OP 1; Chi2=4,9, df=1, p=0,027, para a OP 2), proporcional (Chi2=10,
df=1, p=0,002, apenas para a OP 1) e temporal (Chi2=10, df=1, p=0,002, apenas para a OP 1).
Diferenciou-se também de forma significativa dos contornos pré-indicativos
(ascendentes) causal (Chi2=4,9, df=1, p=0,027, para a OP 1 e a OP 2), condicional (Chi2=6,4,
df=1, p=0,011, para a OP 1; Chi2=19,6, df=1, p=0,00001, para a OP 2) e final (Chi2=12,1,
df=1, p=0,001, apenas para a OP 1). No entanto, não houve diferenciação em relação à pré-
indicação comparativa, em nenhuma das OPs.
Neste caso de semelhança mais ampla do formato ascendente da F0 na STF entre a pré-
indicação consecutiva e as pré-indicações causal, condicional e final, a hipótese de diferenciação
mais ampla recai sobre a duração da consoante inicial da STF (cf. 5.1.1, acima, para as hipóteses
a partir da pré-indicação causal). Considerando-se o contraste com a pré-indicação causal, a
duração desse segmento mostrou-se 20% maior na pré-indicação consecutiva (116ms contra
140ms), se observada apenas a OP 1 (como mencionado, a diferença, se observadas as OPs 2, foi
de 3%). Para a diferenciação obtida para esse cruzamento, levantou-se também a hipótese do
formato mais arredondado da F0 na STF da pré-indicação causal.
Em relação ao contraste com a pré-indicação condicional, a duração da consoante que
introduz a STF mostrou-se também 20% maior na pré-indicação consecutiva (116ms contra
140ms), se observada a OP 1, e 17% maior, se observada a OP 2 (152ms contra 178ms).
Considerando-se a hipótese do valor máximo atingido pela F0 na VTF, a F0, na pré-indicação
consecutiva, atingiu 223Hz na OP 1 e 192Hz na OP 2, contra, na pré-indicação condicional,
194Hz na OP 1 e 171Hz na OP 2, evidenciando uma diferença, respectivamente, de 14% e de
12%.
Considerando-se o terceiro contraste em relação ao formato ascendente da F0 na STF – a
pré-indicação de finalidade –, a duração da consoante inicial da STF mostrou-se 27% maior na
pré-indicação consecutiva (110ms contra 140ms), se observada a OP 1, e 10% maior (161ms
contra 178ms), se observada a OP 2. Também a elevação da F0 na VTF foi superior na pré-
indicação consecutiva em relação à final: 10% (223Hz e 202Hz, respectivamente), se observada
a OP 1, e 29% (192Hz e 149Hz, respectivamente), se observada a OP 2.
123
5.1.7 Cruzamentos a partir da subcategoria final
Os resultados obtidos sugerem que, no universo dos participantes do Teste 1, o contorno
pré-indicativo final, na OP 1, é significativamente distinguível dos contornos pré-indicativos de
comparação, de conseqüência e de temporalidade. Ou seja, nas oito possibilidades de
cruzamentos para a OP 1, o contorno pré-indicativo final é significativamente identificado em
três.
Em relação à OP 2, há distinção significativa em relação aos contornos pré-indicativos de
comparação, de concessão e de conformidade. Ou seja, nas oito possibilidades de cruzamentos
para a OP 2, o contorno pré-indicativo final é significativamente identificado em três.
5.1.7.1 Análise dos resultados para a pré-indicação final
Segundo os resultados obtidos para o Teste 1, a configuração melódica candidata a
contorno pré-indicativo de finalidade apresenta contraste significativo em relação a quatro outros
contornos: comparativo (Chi2=4,9, df=1, p=0,027, para a OP 1; Chi2=8,1, df=1, p=0,004, para
a OP 2), concessivo (Chi2=10, df=1, p=0,002, apenas para a OP 2), conformativo (Chi2=14,4,
df=1, p=0,0001, apenas para a OP 2), consecutivo (Chi2=12,1, df=1, p=0,001, apenas para a OP
1) e temporal (Chi2=4,9, df=1, p=0,027, apenas para a OP 1).
Considerando-se a hipótese de contraste mais amplo, a pré-indicação de finalidade (F0
com formato ascendente na F0 da STF) diferenciou-se dos contornos concessivo (apenas a OP
2), conformativo (apenas a OP 2) e temporal (apenas a OP 1).
A diferenciação em relação ao contorno comparativo, como apresentado em 5.1.2, recai
sobre a forma mais arredondada da F0 na STF da pré-indicação de finalidade, assim como sobre
o ataque em posição mais aguda em sua sílaba pré-tônica.
Como discutido em 5.1.6, a hipótese de diferenciação em relação à pré-indicação
consecutiva recai sobre a maior duração da consoante inicial e da maior elevação da F0 na STF
da pré-indicação consecutiva.
Não houve diferenciação significativa entre as OPs final de referência e as causal e
condicional (estas duas com forma ascendente da F0 na STF), nem em relação às OPs pré-
indicativas de proporção (que apresentam forma descendente da F0).
124
5.1.8 Cruzamentos a partir da subcategoria proporcional
Os resultados sugerem que, no universo dos participantes do Teste 1, o contorno pré-
indicativo proporcional, na OP 1, é significativamente distinguível dos contornos pré-indicativos
de concessão e de conseqüência. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o
contorno pré-indicativo proporcional é significativamente identificado em dois.
No universo da OP 2, ocorre distinção significativa em relação ao contorno pré-indicativo
de concessão. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o contorno pré-
indicativo proporcional é significativamente identificado em apenas um.
5.1.8.1 Análise dos resultados para a pré-indicação proporcional
Das oito possibilidades de cruzamento, o candidato a contorno da pré-indicação
proporcional distinguiu-se significativamente das pré-indicações concessiva (Chi2=4,9, df=1,
p=0,027, para as OPs 1 e 2) e consecutiva (Chi2=10, df=1, p=0,002, apenas para a OP 1).
Como apresentado em 5.1.3.1, a diferenciação em relação à pré-indicação concessiva
talvez se baseie no formato côncavo ou convexo da F0 na VTF, respectivamente para a pré-
indicação de concessão e a de proporção.
A diferenciação em relação à pré-indicação consecutiva atende às expectativas gerais de
contraste entre os formatos ascendente e descendente da F0 na STF.
Não houve diferenciação significativa em relação aos contornos pré-indicativos de
conformidade e de temporalidade, ambos com formatos descendentes da F0 na STF.
No entanto, o contorno pré-indicativo de proporção (formato descendente da F0) não se
diferenciou significativamente de nenhum dos outros contornos com formato ascendente da F0,
se considerada a OP 2, e apenas do contorno consecutivo, se considerada a OP 1. Como
destaque, observe-se que, no universo da OP 1, o contraste com o contorno pré-indicativo de
causa apresentou o valor p=1, o que significa dizer que o julgamento dos participantes do Teste
1 foi totalmente devido ao acaso. Talvez isso se explique pela aparente proximidade semântica
entre os campos da causa e da proporção. Considerando-se a enunciação Ficava infeliz à medida
que via seus planos desabarem, não soa estranho imaginar que a causa da infelicidade seja o
desabamento dos planos. É latente a impressão de ser a proporção uma causa progressiva, da
125
mesma forma que a noção de tempo também parece entremear-se com a de causa (cf. 5.1.4.1) e a
de condição (cf. 5.1.4). Uma quarta combinação promovedora de ambigüidade se estabelece
entre as relações de causa e de finalidade. Dizer que um rapaz ficava infeliz para que todos
sentissem pena dele deixa entrever uma certa noção de causalidade para a sua infelicidade.
Embora esses conflitos nos campos semânticos não sejam objetivo desta pesquisa, parece
apropriada a sugestão de o valor causal se estabelecer como uma “arquicategoria” adverbial, sob
cuja abrangência se localizariam a condição, a finalidade, a proporção e, possivelmente, a
temporalidade. Observando-se os resultados obtidos a partir do Teste 1 (cf. tabelas 5.1 e 5.2),
também se percebe que a pré-indicação causal distinguiu-se significativamente apenas da pré-
indicação temporal na OP 1. Talvez seja o caso de postular que o componente prosódico não
tenha força suficiente para distinguir os valores condicional, final e proporcional do valor causal.
Caso essa hipótese seja verdadeira, percebe-se um caso em que a força semântica anula a força
prosódica.
5.1.9 Cruzamentos a partir da subcategoria temporal
Os índices obtidos sugerem que, no universo dos participantes do Teste 1, o contorno pré-
indicativo temporal, na OP 1, é significativamente distinguível dos contornos pré-indicativos de
causa, de comparação, de concessão, de conformidade, de conseqüência e de finalidade. Ou seja,
nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo temporal é
significativamente identificado em seis.
Em relação à OP 2, a distinção é significativa em relação aos contornos pré-indicativos de
comparação e de concessão. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o
contorno pré-indicativo temporal é significativamente identificado em dois.
5.1.9.3 Análise dos resultados para a pré-indicação temporal
Considerando-se a hipótese mais ampla da diferenciação devida ao contraste ascendente-
descendente do formato da F0 na STF das OPs, o contorno temporal (descendente) diferenciou-
se dos contornos causal (Chi2=6,4, df=1, p=0,011, apenas para a OP 1), comparativo (Chi2=4,9,
df=1, p=0,027, para as OPs 1 e 2), consecutivo (Chi2=10, df=1, p=0,002, apenas para a OP 1) e
final (Chi2=4,9, df=1, p=0,027, apenas para a OP 1).
126
Também se diferenciou do contorno pré-indicativo de concessão (Chi2=10, df=1,
p=0,002, para a OP 1; Chi2=4,9, df=1, p=0,027, para a OP 2), que apresenta formato
descendente da F0. Como sugerido em 5.1.3.1, a diferenciação entre esses dois contornos talvez
resida no nivelamento da F0 na VTF da pré-indicação temporal, com uma variação expressiva
nesse mesmo segmento da pré-indicação concessiva; e na maior duração dessa vogal, na pré-
indicação concessiva (tomando-se em consideração apenas as OPs 1).
Retomando a discussão iniciada em 5.1.4.1 quanto à semelhança semântica entre as
noções de tempo e de condição, é interessante observar que a conformação das OPs temporais de
referência utilizadas no Teste 1 apresentou a F0 descendente na STF, contrastivamente à
conformação das OPs pré-indicativas de condição. Enquanto quase não se percebeu contraste
significativo entre a pré-indicação de condição e as demais subcategorias adverbiais (salvo para a
conseqüência) (cf. 5.1.4.1), a pré-indicação temporal foi significativamente contrastada em
relação a seis dessas subcategorias (mas não em relação à condicional), numa possibilidade
máxima de oito. Esse resultado sugere a confirmação da hipótese de que o valor de pré-indicação
temporal seja construído com a conformação prosódica da F0, na OP, com o formato
descendente na STF, mas não confirma a diferenciação em relação ao valor condicional.
5.2. OS RESULTADOS PARA O FR
A análise dos resultados do Teste 1 para o FR seguirá os mesmos procedimentos que para
o PB. Os resultados, discriminados nas tabelas 5.3 e 5.4, foram obtidos a partir do cruzamento
aleatório de todas as subcategorias, por análise combinatória, a partir do julgamento de 11
participantes (cf. 4.3.2).
127
caus
comp 7,4
0,007 comp
conces 0,8
0,366
2,3
0,132 conces
condic 0,8
0,366
0,1
0,763
0,8
0,366 condic
confor 7,4
0,007
0,8
0,366
0,1
0,763
2,3
0,132 confor
consec 0,1
0,763
4,5
0,035
0,8
0,366
0,8
0,366
7,4
0,007 consec
final 0,8
0,366
2,3
0,132
4,5
0,035
2,3
0,132
2,3
0,132
4,5
0,035 final
propor 0,8
0,366
0
0,8
0,366
0,8
0,366
7,4
0,007
0,8
0,366
4,5
0,035 propor
temp 0,1
0,763
0,8
0,366
0,8
0,366
2,3
0,132
0,8
0,366
0,8
0,366
2,3
0,132
4,5
0,035
Tabela 5.3 – Resultados de um Teste Chi2 (df=1), para o cruzamento entre as 9 subcategorias de OPs 1 para o FR.
Em cada célula, a linha superior indica o resultado do Teste Chi2; a inferior, o valor p. As células destacadas
sinalizam os cruzamentos que obtiveram nível de significância p 0,05.
caus
comp 2,3
0,132 comp
conces 0,8
0,366
0,1
0,763 conces
condic 0,8
0,366
2,3
0,132
0,1
0,763 condic
confor 0,8
0,366
4,5
0,035 0
2,3
0,132 confor
consec 0,8
0,366
7,4
0,007
0,8
0,366
2,3
0,132 0 consec
final 0,1
0,763
4,5
0,035
4,5
0,035
0,1
0,763
7,4
0,007
2,3
0,132 final
propor 0,1
0,763
2,3
0,132
0,8
0,366
0,1
0,763
2,3
0,132
2,3
0,132
0,1
0,763 propor
temp 0,8
0,366
0,1
0,763
0,8
0,366
0,8
0,366
0,1
0,763
0,8
0,366
0,1
0,763
0,1
0,763
Tabela 5.4 – Resultados de um Teste Chi2 (df=1), para o cruzamento entre as 9 subcategorias de OPs 2 para o FR.
Em cada célula, a linha superior indica o resultado do Teste Chi2; a inferior, o valor p. As células destacadas
sinalizam os cruzamentos que obtiveram nível de significância p 0,05.
5.2.1 Cruzamentos a partir da subcategoria causal
Os índices obtidos sugerem que, no universo dos participantes do Teste 1, o contorno pré-
indicativo causal, na OP 1, é significativamente distinguível dos contornos pré-indicativos de
comparação e de conformidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o
contorno pré-indicativo causal foi significativamente identificado em dois.
128
Já em relação à OP 2, não há distinção significativa em relação a nenhum outro contorno
pré-indicativo.
5.2.1.1 Análise dos resultados para a pré-indicação causal
Comparando-se a configuração melódica da OP 1 causal de referência com a da OP 1
comparativa de referência (distinção com índice Chi2=7,4, df=1, p=0,007), observa-se um
traçado da F0 bastante semelhante nos dois casos, ambos com elevação da F0 na STF. O que
parece se apresentar como o fator diferenciador é o acento secundário que se mostra proeminente
sobre a sílaba /t ã/, apenas na OP 1 causal.
Considerando-se o outro grupo de formatos verificado – F0 com configuração
descendente na STF –, a única distinção significativa se deu em relação à OP 1 conformativa de
referência (Chi2=7,4, df=1, p=0,007). Como seria mais provavelmente esperado, o contraste
entre os formatos de F0 com configuração ascendente seria mais claramente evidenciado em
relação ao formato com configuração descendente na STF.
Comparativamente ao verificado para as OPs 1, as OPs 2 não evidenciaram contraste
significativo algum, nem mesmo entre os contornos com F0 ascendente na STF e os com F0
descendente.
5.2.2 Cruzamentos a partir da subcategoria comparativa
Os resultados obtidos sugerem que, no universo dos participantes do Teste 1, o contorno
pré-indicativo comparativo, na OP 1, é significativamente distinguível dos contornos pré-
indicativos de causa, de conseqüência e de proporcionalidade. Ou seja, nas oito possibilidades de
cruzamentos para a OP 1, o contorno pré-indicativo comparativo é significativamente
identificado em três.
No universo da OP 2, houve distinção significativa em relação aos contornos pré-
indicativos de conformidade, de conseqüência e de finalidade. Ou seja, nas oito possibilidades de
cruzamentos para a OP 2, o contorno pré-indicativo comparativo é significativamente
identificado em três.
129
5.2.2.1 Análise dos resultados para a pré-indicação comparativa
Os resultados obtidos a partir do Teste 1 evidenciaram, para os contrastes das OPs pré-
indicativas de comparação, cinco cruzamentos significativos. Como já discutido na sessão
imediatamente anterior, a diferenciação entre o contorno pré-indicativo comparativo e o causal
parece residir, no caso da OP 1, na projeção do acento secundário sobre a sílaba /t ã/, na OP 1
comparativa de referência.
Em relação ao contorno pré-indicativo consecutivo, observa-se tanto na OP 1 quanto na
OP 2 a projeção do acento secundário, realçado pelo formato ascendente da F0, ainda mais
evidente sobre a sílaba // da OP 2. Neste caso, o pico atingido pela F0 mostrou-se 16% mais
elevado no acento secundário (316Hz) que no acento primário (271Hz).
A diferenciação em relação ao contorno pré-indicativo proporcional, na OP 1, mostrou
índice de diferenciação total, ou seja, todos os participantes do Teste 1 reconheceram o contorno
comparativo como distinto do contorno proporcional. O fator diferenciador entre essas duas
modalidades parece ser a duração do segmento //, que foi realizado com 202ms na OP 1
comparativa de referência, e com 296ms na OP 1 proporcional de referência, uma diferença,
portanto, de 46%.
Considerando-se os outros dois contrastes significativos, obtidos apenas para a OP 2,
verificou-se a distinção em relação às modalidades conformativa e final. A primeira hipótese
para a diferenciação em relação à OP 2 conformativa de referência recai sobre a conformação da
F0 na vogal /a/ final, ascendente na modalidade comparativa e descendente na modalidade
conformativa. Associado a esse fator, percebe-se uma projeção mais intensa da F0 sobre a sílaba
// (337Hz) que sobre a sílaba // (271Hz), com uma diferença de 66Hz (24%).
Quanto à diferenciação em relação à OP 2 final de referência, talvez o fator significativo
para esta modalidade seja o valor máximo atingido pela F0 no segmento // (279Hz),
semelhante ao atingido no segmento // (289Hz). Na OP 2 comparativa de referência, não se
verificou essa equivalência.
5.2.3 Cruzamentos a partir da subcategoria concessiva
Os índices obtidos no Teste 1 sugerem que o contorno pré-indicativo concessivo, na OP
1, é significativamente distinguível do contorno pré-indicativo de finalidade. Ou seja, nas oito
130
possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo concessivo é
significativamente identificado em um.
Em relação à OP 2, a distinção significativa se deu em relação aos contornos pré-
indicativos de conformidade e de finalidade. Ou seja, nas oito possibilidades de cruzamentos
para a OP 2, o contorno pré-indicativo concessivo é significativamente identificado em dois.
5.2.3.1 Análise dos resultados para a pré-indicação concessiva
A diferenciação significativa do valor concessivo em relação ao contorno pré-indicativo
conformativo (p=0, para a OP 2) confirmou as expectativas iniciais, por conta do contraste entre
os formatos da F0 sobre a última vogal tônica (/a/) da oração. Observe-se que, na OP 2
conformativa de referência, forma-se uma linha de declinação completa a partir da sílaba /mõn/,
o que não ocorre na OP 2 concessiva de referência. Destaque-se, ainda, que houve um índice de
diferenciação total entre as duas OPs.
Comparando-se o traçado melódico da OP 1 concessiva de referência, significativamente
diferenciado do de finalidade (Chi2=4,5, df=1, p=0,035, tanto para a OP 1 quanto para a OP 2),
verifica-se uma semelhança visual bastante acentuada no caso da OP 1. A hipótese de
diferenciação entre os dois contornos recai sobre a duração da vogal /ã/. Na OP 1 concessiva de
referência, esse segmento foi realizado em 72ms; na OP 1 final de referência, em 113ms, uma
diferença, portanto, de 57% na duração. Constituiu-se, assim, na OP 1 final de referência, um
acento secundário em comparação com a OP 1 concessiva de referência. No universo da OP 2
final de referência, o formato ascendente da F0 na sílaba /mõn/ contrasta com o formato
descendente na OP 2 concessiva de referência, parecendo, assim, corresponder à marcação de
um acento secundário, de forma semelhante ao que foi verificado para a OP 1 final de referência.
5.2.4 Cruzamentos a partir da subcategoria condicional
Os resultados obtidos indicam que, no universo dos participantes do Teste 1, o contorno
pré-indicativo condicional não foi significativamente contrastado com nenhum outro contorno
pré-indicativo.
131
5.1.4.1 Análise dos resultados para a pré-indicação condicional
Mesmo a expectativa inicial de que haveria uma distinção em relação ao contorno
conformativo, por conta da F0 ascendente nas OPs 1 e 2 condicionais e descendente nas OPs 1 e
2 conformativas de referência, não se verificou.
5.2.5 Cruzamentos a partir da subcategoria conformativa
No universo dos participantes do Teste 1, o contorno pré-indicativo conformativo, na OP
1, foi significativamente distinguível dos contornos pré-indicativos de causa, de concessão e de
proporcionalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-
indicativo conformativo é significativamente identificado em três.
Em relação à OP 2, houve distinção significativa em relação aos contornos pré-
indicativos de comparação, de concessão, de conseqüência e de finalidade. Ou seja, nas oito
possibilidades de cruzamentos para a OP 2, o contorno pré-indicativo condicional é
significativamente identificado em quatro.
5.2.5.1 Análise dos resultados para a pré-indicação conformativa
Se considerado o formato descendente da F0 na sílaba final, tanto da OP 1 quanto da OP
2, o possível contorno pré-indicativo conformativo se diferencia de todos os outros possíveis
contornos, que apresentam a F0 ascendente nesse segmento. Assim, a significância verificada na
distinção entre a modalidade conformativa e as outras seis modalidades indicadas acima se
justificaria por essa inversão de formato.
5.2.6 Cruzamentos a partir da subcategoria consecutiva
Os resultados indicam que, no universo dos participantes do Teste 1, o contorno pré-
indicativo consecutivo, na OP 1, é significativamente distinguível dos contornos pré-indicativos
de comparação, de conformidade e de finalidade. Ou seja, nas oito possibilidades de
cruzamentos para a OP 1, o contorno pré-indicativo conformativo foi significativamente
identificado em três.
132
Quanto à OP 2, a distinção se mostrou significativa em relação aos contornos pré-
indicativos de comparação e de conformidade. Ou seja, nas oito possibilidades de cruzamentos
para a OP 2, o contorno pré-indicativo consecutivo foi significativamente identificado em dois.
5.2.6.1 Análise dos resultados para a pré-indicação consecutiva
Considerando-se a diferenciação mais ampla esperada por conta da oposição ascendente-
descendente no formato da F0 na sílaba final, a pré-indicação consecutiva (modulação
ascendente) diferenciou-se significativamente do contorno pré-indicativo conformativo
(Chi2=7,4, df=1, p=0,007, para a OP 1; p=0, para a OP 2).
Em relação ao contorno pré-indicativo comparativo, como já discutido em 5.2.2.1, a
hipótese de diferenciação recai sobre o acento secundário, realçado pela configuração ascendente
da F0 nas OPs consecutivas de referência. Essa mesma hipótese é assumida para a diferenciação
da modalidade consecutiva em relação à modalidade final na OP 1. É interessante observar que,
na OP 2, os dois contornos se assemelham nesse segmento.
5.2.7 Cruzamentos a partir da subcategoria final
Segundo os resultados obtidos para o Teste 1, a configuração melódica candidata a
contorno pré-indicativo de finalidade apresenta contraste significativo, na OP 1, em relação aos
contornos concessivo, consecutivo e proporcional. Nas oito possibilidades de cruzamentos para a
OP 1, o contorno pré-indicativo de finalidade foi, portanto, significativamente identificado em
três.
Considerando-se a OP 2, a distinção se apresentou significativa em relação aos contornos
pré-indicativos comparativo, concessivo e conformativo. Portanto, a pré-indicação de finalidade
foi significativamente identificada em três cruzamentos.
5.2.7.1 Análise dos resultados para a pré-indicação final
Considerando-se a hipótese de contraste mais amplo, a pré-indicação de finalidade (F0
com formato ascendente na sílaba final) diferenciou-se do contorno conformativo (Chi2=7,4,
df=1, p=0,007) apenas na OP 2.
133
A diferenciação em relação ao contorno comparativo, como apresentado em 5.2.2.1, recai
sobre a semelhança para o valor máximo atingido pela F0 nos segmentos // e //,
para a pré-indicação final. Essa semelhança não ocorre na pré-indicação comparativa.
Como discutido em 5.2.3.1, a hipótese de diferenciação em relação à pré-indicação
concessiva recai sobre a duração da vogal /ã/, para a OP 1; e sobre o contraste entre o formato
ascendente da F0 na sílaba /mõn/ da modalidade final e descendente nesse mesmo segmento da
modalidade concessiva, considerando-se a OP 2.
A diferenciação entre a modalidade final e a consecutiva para a OP 1, como já sugerido
em 5.2.6.1, talvez se deva ao acento secundário, realçado pela configuração ascendente da F0 nas
OPs consecutivas.
Tanto a OP 1 final quanto a OP 1 proporcional de referência apresentam um
comportamento melódico bastante semelhante. A hipótese de diferenciação entre as duas
(Chi2=4,5, df=1, p=0,035) se estabelece em dois pontos, ambos referentes à duração de
segmentos. A vogal /ã/, onde recai o acento secundário, se realizou em 113ms na OP 1 final de
referência, e em 90ms na OP 1 proporcional de referência. Portanto, a duração desse segmento se
mostra 25% mais longa na OP 1 final. O outro ponto parece ser o segmento /ije/, realizado em
167ms na OP 1 final, e em 297ms na OP 1 proporcional de referência (78% de diferença).
5.2.8 Cruzamentos a partir da subcategoria proporcional
Os resultados indicam que, no universo dos participantes do Teste 1, o contorno pré-
indicativo proporcional, na OP 1, é significativamente distinguível dos contornos pré-indicativos
de comparação, de conformidade, de finalidade e de temporalidade. Ou seja, nas oito
possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo proporcional é
significativamente identificado em quatro.
Já no universo da OP 2, o contorno pré-indicativo proporcional não se diferencia de
nenhum dos outros.
134
5.2.8.1 Análise dos resultados para a pré-indicação proporcional
Como apresentado em 5.2.2.1, a diferenciação em relação à pré-indicação comparativa
talvez se localize na duração do segmento //, maior na OP 1 proporcional que na OP 1
comparativa de referência.
A diferenciação em relação à pré-indicação conformativa, como já discutido em 5.2.5.1,
parece se dar pela oposição ascendente/descendente entre os formatos da F0 na sílaba final.
Quanto à diferenciação em relação à pré-indicação final, como já discutido em 5.2.7.1,
parece haver interferência da duração da vogal /ã/ (onde recai o acento secundário), mais longa
na OP 1 final de referência. A outra interferência talvez seja a duração do segmento //, mais
longo na OP 1 proporcional de referência.
Para a diferenciação entre a pré-indicação proporcional e a temporal, no universo da OP
1, o ponto crítico parece ser a elevação máxima atingida pela F0 ao final da oração. Esses índices
corresponderam a 336Hz e 424Hz, respectivamente; uma diferença, portanto, de 88Hz (26%).
5.2.9 Cruzamentos a partir da subcategoria temporal
Os resultados indicam que, no universo dos participantes do Teste 1, o contorno pré-
indicativo temporal, na OP 1, é significativamente distinguível do contorno pré-indicativo de
proporcionalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-
indicativo temporal é significativamente identificado em apenas um.
Quanto à OP 2, não houve distinção significativa em relação a nenhum outro contorno.
5.2.9.1 Análise dos resultados para a pré-indicação temporal
Como sugerido em 5.2.8.1, a diferenciação entre os contornos pré-indicativos temporal e
proporcional parece ser a elevação máxima atingida pela F0 na sílaba final, 26% superior na OP
1 temporal de referência.
135
5.2.10 Considerações sobre o resultado para o FR
Quanto ao resultado obtido para o FR, pelo menos duas análises são feitas. Mejvaldová
(2001), analisando a percepção de atitudes/emoções por franceses e tchecos, verificou que a
latitude da F0 precisa ser consideravelmente maior para que os franceses percebam uma dada
variação expressiva, comparativamente à latitude necessária para a percepção dos tchecos. Em
outros termos, a neutralidade atitudinal/emotiva dos franceses conta com uma variação na
amplitude da F0 muito maior que a neutralidade dos tchecos. O estudo de Chen (2003), já
referido no capítulo 3, apresenta uma relativização semelhante também para os holandeses e os
britânicos. Segundo a autora, a extensão de pitch padrão a que os holandeses estariam
acostumados seria mais estreita do que a dos britânicos, o que permitiria aos primeiros perceber
variações mais sutis no movimento da F0 do que os britânicos. Considerando a capacidade de
percepção das variações extremamente sutis da F0, como demonstrado com os resultados dos
Testes 1 e 2, é possível que os brasileiros se assemelhem aos tchecos e aos holandeses quanto a
essa amplitude da F0 para a manutenção da neutralidade.
A segunda possibilidade de análise, sugerida por Jacqueline Vaissière (comunicação
pessoal), é a de que o FR se coloca como uma língua em que o contorno melódico continuativo
se caracteriza, essencialmente, pelo formato ascendente da F0. Isso explicaria, em princípio, o
fato de praticamente todos os contornos verificados para as F0s das OPs 1 e 2, no FR, terem se
mostrado ascendentes na sílaba tônica final. A única exceção verificada foi para as OPs
conformativas de referência. Como o PB apresentaria a possibilidade de uma entonação
continuativa sem, necessária e freqüentemente, a F0 mostrar-se ascendente, foi possível a
constituição de pelo menos dois contornos melódicos principais, um ascendente e outro
descendente. Talvez seja mais razoável, como possível explicação para a diferença tão
expressiva entre os resultados do Teste 1 para o PB e para o FR, considerar a combinação dessas
duas hipóteses. Em pesquisas futuras, não seria desproposital explorar a variação na amplitude
da F0, por meio do processo de ressíntese, para o FR. Não se descarta a hipótese, portanto, de se
revelarem, de forma mais realçada, os possíveis contornos pré-indicativos de OSAdvs no FR.
136
5.3. CRITÉRIOS DE SELEÇÃO DOS CANDIDATOS A CONTORNOS PRÉ-INDICATIVOS
Identificados os cruzamentos em que houve distinção significativa entre as pré-
indicações, tornou-se necessário estabelecer um critério para a seleção de quais dessas
subcategorias seriam submetidas ao processo de ressíntese e posteriormente utilizadas na
formulação do Teste 2, tanto no PB quanto no FR.
Em princípio, qualquer uma das nove subcategorias que fosse significativamente
contrastada com pelo menos uma das outras oito poderia ser utilizada no processo de ressíntese.
No entanto, alguns fatores relacionados à natureza do fenômeno pesquisado devem ser
considerados:
a) a pré-indicação apresenta-se de forma bastante sutil, não sendo um comportamento
prosódico facilmente identificável como, por exemplo, a linha de declinação natural das
elocuções assertivas;
b) embora não pareça ser um fenômeno idiossincrático, é possível que locutores nativos
produzam curvas melódicas distintas para cada uma das orações principais das nove
subcategorias pesquisadas e, ainda assim, algumas dessas variantes sejam aceitas como
bem produzidas entonacionalmente para sugerir a pré-indicação das orações subordinadas
adverbiais subseqüentes;
c) um contorno melódico pré-indicativo que venha a ser identificado deve apresentar o
mínimo possível de ambigüidade em relação aos demais contornos, de forma que venha a
assumir um valor fonológico efetivo.
Estabeleceu-se, então, um critério quantitativo para selecionar as subcategorias adverbiais
a serem ressintetizadas e utilizadas no Teste 2. No universo do Teste 1, cada uma das nove
subcategorias foi cruzada com as outras oito por análise combinatória (cf. 4.3.1), o que significa
a realização de oito cruzamentos. Decidiu-se utilizar para o processo de ressíntese as
subcategorias que foram significativamente contrastadas em pelo menos cinco cruzamentos, o
que equivale à metade dos cruzamentos mais um. Esse critério objetiva minimizar o impacto dos
três fatores listados acima.
Assim, considerando-se esse critério, em relação à OP 1 no PB houve quatro
subcategorias que foram significativamente reconhecidas como pré-indicadas pelas modulações
da OP: a causal, a concessiva, a consecutiva e a temporal. Em relação à OP 2, apenas uma: a
137
concessiva. No FR, não houve nenhum reconhecimento significativo, tanto em relação à OP 1
quanto em relação à OP 2.
Os resultados obtidos no Teste 1 indicam comportamentos diferentes para a OP 1 e a OP
2, tanto no PB quanto no FR. Nem todos os cruzamentos obtidos para a OP 1 foram equivalentes
aos obtidos para a OP 2. No entanto, como foi assumida a hipótese de que os contornos pré-
indicativos podem ser aplicados a enunciações distintas, contando ou não com uma sílaba pós-
tônica final, caso se faça a sobreposição dos resultados obtidos para a OP 1 com os obtidos para
a OP 2, duas novas subcategorias se apresentam em conformidade com o critério acima
estabelecido, para o PB: a conformativa e a final. No caso do FR, três subcategorias passariam a
ser consideradas: a comparativa, a conformativa e a final. Essas indicações podem ser
visualizadas nas tabelas 5.5 e 5.6.
caus comp conces condic confor consec final propor temp
caus X X X X X
comp X X X
conces X X X X X X
condic X
confor X X X X X X
consec X X X X X X X
final X X X X X
propor X X
temp X X X X X X
/ 8 5 4 6 1 5 7 5 2 6
Tabela 5.5 – Sobreposição dos resultados significativos dos cruzamentos, no Teste 1, da OP2 aos da OP1 para o PB.
As células marcadas com “X” indicam índice de significância p 0,05, a partir de um teste Chi-quadrado. Foi feita a representação dos cruzamentos duas vezes (abaixo e acima da diagonal descendente dividindo as
subcategorias), de forma a facilitar a visualização. As três células hachuradas indicam os resultados para a OP
2 que contribuem para a inclusão de dois novos contornos no critério de metade dos cruzamentos mais um. Na
última linha, as células em cinza indicam as subcategorias que se inserem nesse critério.
138
caus comp conces condic confor consec final propor temp
caus X X
comp X X X X X
conces X X
condic
confor X X X X X X
consec X X X
final X X X X X
propor X X X X
temp X
/ 8 2 5 2 0 6 3 5 4 1
Tabela 5.6 – Sobreposição dos resultados significativos dos cruzamentos, no Teste 1, da OP2 aos da OP1 para o FR.
As células marcadas com “X” indicam índice de significância p 0,05, a partir de um teste Chi-quadrado. Foi feita a representação dos cruzamentos duas vezes (abaixo e acima da diagonal descendente dividindo as
subcategorias), de forma a facilitar a visualização. As sete células hachuradas indicam os resultados para a OP
2 que contribuem para a inclusão de três contornos no critério de metade dos cruzamentos mais um. Na última
linha, as células em cinza indicam as subcategorias que se inserem nesse critério.
Para o processo de ressíntese e a subseqüente elaboração do Teste 2, decidiu-se explorar
apenas o PB, uma vez que o FR, se consideradas as OPs 1 ou 2 isoladamente, não apresentou
resultado satisfatório segundo o critério estabelecido de metade dos cruzamentos mais um.
Paralelamente à ressíntese das OPs de referência das quatro subcategorias identificadas
para a OP 1 no PB – causal, concessiva, consecutiva e temporal –, optou-se por explorar também
as duas outras subcategorias obtidas a partir da sobreposição dos resultados obtidos para a OP 2
à OP 1: a conformativa e a final. De uma forma mais prudente, pode-se dizer que o Teste 1
identificou quatro contornos pré-indicativos de forma mais consistente, com a possibilidade de
dois outros contornos aumentarem o conjunto.
139
6. O PROCESSO DE RESSÍNTESE
Como discutido no capítulo 4, para que se pudessem detectar as configurações dos
componentes prosódicos possivelmente responsáveis pelo valor pré-indicativo de cada
subcategoria adverbial, foi necessário utilizar o processo de ressíntese para reproduzir as OPs 1 e
2 de referência do PB. Essas ressínteses foram realizadas a partir de uma versão neutra e de uma
versão monotônica de cada OP, buscando adaptá-las às configurações da OP1 (cf. seção 4.4)
originalmente verificadas nas gravações utilizadas para o Teste 1 (cf. figuras 4.1 e 4.2).
Foram levados em consideração para a ressíntese, como discutido no final do capítulo
anterior, apenas seis contornos melódicos pré-indicativos das nove subcategorias adverbiais.
Neste capítulo são detalhadas as etapas do processo de ressíntese para as OPs 1 e 2 neutras e
monotônicas.
O formato ascendente da F0
Nas OPs de referência com F0 ascendente na STF, observa-se, recorrentemente, um
formato descendente-ascendente a partir da vogal da sílaba pré-tônica (cf. figuras 4.1 e 4.2). O
movimento descendente se dá até aproximadamente o meio da consoante de ataque dessa sílaba,
passando a ascendente, com valor máximo de elevação próximo ao final da vogal tônica,
formando uma concavidade. Esses trechos da F0 se opõem diametralmente.
Se se considerar a diferença, em Hertz, entre o início e o final do movimento descendente
dessa curva, a subcategoria pré-indicativa causal apresenta 17% de variação; a final, 28%; e a
consecutiva, 40%. A queda da F0 se processa com uma média de 0,30Hz/ms, ou 36Hz em
117ms. Os valores específicos, para a pré-indicação:
. causal: 22Hz em 129ms, ou 0,17Hz/ms, ou 17%;
. consecutiva: 50Hz em 141ms, ou 0,35Hz/ms, ou 40%;
. final: 37Hz em 81ms, ou 0,45Hz/ms, ou 28%.
Estipulou-se, com base nesse movimento descendente da F0 acima descrito, um valor de
referência, a partir de agora denominado simplesmente VR, a ser adotado na manipulação da F0
desses segmentos críticos, nas OPs neutra e monotônica. O VR é baseado, portanto, na variação
descendente da F0, constituída entre o ataque na vogal da SPreTF e o valor mínimo de pitch
140
verificado ao fim do movimento descendente. Uma vez que uma diferença de 2% ou de 3% nos
valores de pitch indicados nos casos das pré-indicações acima mencionados não representa
variação significativa ao ouvido humano35,
36
, as variações para as subcategorias pré-indicativas
causal e final foram aproximadas para 20% e 30%, respectivamente. O VR assume esse
percentual de 20%, o que significa dizer que, para o segundo índice, de 30%, contabiliza-se 1,5
VR e, para o terceiro, de 40%, 2 VRs.
Já entre o início e o final do movimento ascendente total dessa curva, verifica-se que a
variação da F0 na OP consecutiva (82%) mostrou-se próxima da variação na OP causal (91%),
ambas superiores à da OP final de referência (63%). A elevação da F0 se processa com uma
média de 0,43Hz/ms, ou 97Hz em 222ms. Os valores exatos, para a pré-indicação:
. causal: 113Hz em 232ms, ou 0,48Hz/ms, ou 91%;
. consecutiva: 106Hz em 217ms, ou 0,48Hz/ms, ou 86%;
. final: 73Hz em 219ms, ou 0,33Hz/ms, ou 56%.
Esse movimento da F0, iniciado na SPreTF e concluído na STF, com caracterização
descendente-ascendente, forma uma curva côncava que, a partir de agora, será denominada vale
da F0. O vale da F0 é limitado, em seu lado superior, pela linha de referência37
, caracterizada a
seguir.
Considere-se uma linha paralela ao eixo temporal (abscissa), que tangencia a F0 no
primeiro momento de sua manifestação visual38
na vogal pré-tônica final (doravante, VPreTF).
Essa linha será, a partir de agora, simplesmente denominada LR. Na OP neutra, utilizada para a
35 Rossi (1978:14) caracterizou uma lei, segundo a qual um glissando não é jamais percebido em sua totalidade,
sendo que sua altura é determinada pela freqüência situada entre o segundo e o terceiro terços da duração vocálica.
O questionamento que ele estabelece diz respeito a saber se, na língua, o limite de referência para percepção do
glissando é um limite de identificação ou de discriminação. Sua proposta (26) é a de que esse limite de percepção
seja calculado com base em uma taxa de identificação. Assim, a partir dos experimentos realizados, a constatação
foi a de que o limite de percepção dos glissandos, tanto ascendentes quanto descendentes, se estabelece entre 18Hz e
19Hz para uma duração de 200ms, com uma freqüência inicial de 139Hz (para maiores detalhes, cf. Rossi, 1971 e
1978). 36Não se deve perder de vista que nem todo movimento de pitch percebido pelo ouvido humano é fonologicamente
significativo: como indica Fox (2000:285), citando „t Hart, Collier e Cohen (1990), esse movimento deve estar acima de determinados limites físico-psíquicos, mas também ser reconhecido como resultado de uma ação
intencional da parte do falante. 37 Optou-se por linha de “referência”, e não linha de “base”, para não estabelecer um conflito com a linha de base
(linha de declinação baixa, baseline) oposta à linha de declinação alta (topline) tradicionalmente utilizada para
delimitar a linha de declinação da F0 (cf. Di Cristo, 2004). 38 Preferiu-se estabelecer a descrição desta forma por conta da possibilidade de, devido ao fenômeno de co-
articulação, haver manifestação do traçado da F0 ainda durante a consoante que antecede a vogal, mesmo que essa
consoante seja surda. Nos casos em que ocorra uma consoante sonora e, portanto, o traçado representativo da F0
possa ser visualizado ao longo de todo esse segmento, a referência a ser estabelecida é o ponto inicial da vogal.
141
primeira etapa do processo de ressíntese, considere-se também uma LR que atende aos mesmos
princípios anteriores e que, no caso, está a 132Hz, na OP 1, e a 127Hz, na OP 2. Nas OPs
monotônicas, a LR é a própria F0 ao longo de toda a frase prosódica, aproveitando-se esses
mesmos valores; ou seja, a OP 1 monotônica tem sua F0 nivelada a 132Hz e a OP 2 monotônica,
a 127Hz.
Figura 6.1 – Diagramação visual do valor de referência (VR), da linha de referência (LR) e da elevação da F0 acima
da LR, a partir da OP 1 consecutiva de referência. Trata-se, neste caso, de 2 VRs. Os detalhes encontram-se no
texto.
A elevação da F0 acima dessa LR aproxima, diferentemente do verificado acima, quando
se assumiu a elevação da F0 a partir de seu ataque, a OP consecutiva de referência (29% de
variação) da OP final de referência (27% de variação), ambas com aproximadamente a metade
da variação verificada na OP causal de referência (62%). Os valores exatos, para a pré-indicação:
. causal: 91Hz em 167ms, ou 54Hz/ms, ou 62%;
. consecutiva: 51Hz em 101ms, ou 50Hz/ms, ou 29%;
. final: 45Hz em 98ms, ou 45Hz/ms, ou 27%.
A aproximação da OP consecutiva de referência em relação à OP final de referência,
diferentemente do que se verificou quando da análise da F0 a partir de seu ataque, desenvolvida
valor de referência
(VR)
valor de referência
(VR)
linha de
referência (LR)
elevação acima da
linha de referência
142
mais acima, deve-se ao fato de o vale da FO, na OP consecutiva de referência, apresentar maior
variação (2VRs) do que o verificado na subcategoria final (1,5VR).
Uma vez que a F0 na SPreTF, na OP 1 neutra que serviu de base ao processo de
ressíntese para produzir as modulações pré-indicativas da OP1, apresenta um movimento de
modulação descendente, repetindo, de certa forma, esse mesmo movimento verificado nas OPs
de referência, optou-se por manter essa conformação da F0 na sílaba pré-tônica das OPs 1 e 2
neutras, reajustando-se a variação do vale da F0 de forma a igualá-la à variação verificada nas
OPs de referência. A variação nesse segmento descendente da F0, na OP 1 neutra, é de 32%,
aproximada, para efeitos de simplificação, para 30% (ou seja, 1,5VR). Assim, o VR, expresso
percentualmente, foi aplicado levando-se em consideração a variação da F0, em Hz, na OP 1
neutra. Para os processos de ressíntese a partir da F0 das OPs monotônicas, a conformação do
vale da F0 foi criada, também segundo a quantidade de VRs em questão (cf. mais à frente).
O formato descendente da F0
O segundo grupo pré-indicativo é caracterizado pelo formato descendente da freqüência
fundamental (cf. figuras 4.1 e 4.2). Esse movimento da F0 se inicia na SPreTF, evidenciando
queda progressiva até o final da OP. O ataque da F0, no início da VPreTF, se dá em um nível
bastante elevado, e a queda se processa com uma variação média de 0,32Hz/ms, ou 107Hz em
319ms. Os valores exatos, para a pré-indicação:
. concessiva: 127Hz em 343ms, ou 0,37Hz/ms, ou 105%;
. conformativa: 107Hz em 285ms, ou 0,37Hz/ms, ou 81%;
. temporal: 84Hz em 359ms, ou 0,23Hz/ms, ou 57%.
Visualmente, as três subcategorias se assemelham bastante. A diferença extremamente
sutil entre os contornos pré-indicativos concessivo e conformativo parece se localizar na F0 da
VTF: no primeiro, forma-se uma ligeira curva côncava, enquanto que, no segundo, essa curva é
convexa. O processo de ressíntese utilizado na adaptação da F0 das OPs neutras a esses
contornos, como descrito a seguir, assumiu a hipótese de ser esse formato côncavo ou convexo
da F0 nesses segmentos o responsável pela diferenciação entre as duas subcategorias, ainda que
143
essa variação, conforme indicação dos prosogramas produzidos (cf. figuras 7.1 e 7.2, no capítulo
7), não seja perceptível ao ouvido humano39
.
* * *
Embora seja questionável a obtenção de uma frase que possa ser considerada, de fato,
neutra, a modulação que se verifica ao longo dessa frase faz que os resultados finais obtidos com
o processo de ressíntese soem mais naturais. Se, por um lado, isso permite que as possíveis
sensações de estranheza sonora sejam devidas exclusivamente às modificações produzidas
durante o processo de ressíntese, por outro torna questionável o fato de outros segmentos que
não tenham sido manipulados não serem (também) responsáveis pela caracterização do contorno
melódico pesquisado.
Com vistas a essa nova possibilidade, decidiu-se, como já mencionado anteriormente,
aplicar o mesmo processo de ressíntese às variantes monotônicas das OPs. Para obtê-las, bastou,
com o auxílio do programa Praat, eliminar todos os pontos existentes entre o primeiro e o último
pontos de pitch das OPs neutras. O resultado final apresenta a F0 com forma totalmente linear.
Para a OP 1 monotônica, essa linha de F0 foi estabelecida a 132Hz, seguindo o mesmo contorno
utilizado para o estabelecimento da LR para a OP 1 neutra; para a OP 2, o nivelamento se deu a
127Hz.
O processo de ressíntese das OPs 1 e 2 monotônicas seguiu, basicamente, as mesmas
etapas utilizadas para a OP 1 neutra, com algumas pequenas modificações, que serão
devidamente apresentadas. A escolha das ressínteses a serem utilizadas no Teste 2, em alguns
casos, não coincidiu com as realizadas em relação às OPs 1 e 2 neutras.
Buscou-se, ao máximo possível, que as etapas ao longo do processo de ressíntese fossem
semelhantes inter e intracategorialmente. Assim, as ressínteses da OP 2, produzidas para cada
subcategoria pré-indicativa, seguiram na maior parte das vezes as mesmas etapas utilizadas para
as ressíntes da OP 1. Os casos em que isso não se verificou são decorrentes da natureza
prosódica específica a uma ou a outra das OPs.
39 No entanto, como será discutido quando da análise dos resultados para o Teste 2 (cf. 7.2.3), alguns resultados
parecem contradizer essa previsão dos prosogramas.
144
RESSÍNTESE DAS ORAÇÕES PRINCIPAIS 1
6.1. RESSÍNTESE DAS OPS 1 NEUTRAS COM F0 ASCENDENTE
6.1.1 Pré-indicação consecutiva
A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 consecutiva de referência,
seguiu os seguintes passos:
6.1.1.1 adição de 0,5VR ao vale da F0;
6.1.1.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.1.1.3 cumulativamente, acima da LR, na OP neutra, elevação da F0 da VTF segundo as
quantidades de VR indicadas abaixo, na primeira coluna, com o objetivo de atingir o
valor máximo, em Hertz, indicado na segunda coluna. A terceira coluna indica os valores
obtidos40
após a ressíntese:
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 158 153
b) 1,5 171 168
c) 2 184 184
d) 2,5 198 192
e) 3 211 200
f) 3,5 224 212
g) 4 237 225
h) 4,5 250 240
i) 5 264 248
j) 5,5 277 260
k) 6 290 277
6.1.1.4 cumulativamente, aumento da duração da consoante na STF em 97%, assemelhando-a à
duração verificada na OP de referência;
6.1.1.5 cumulativamente, realocação de toda a F0 anterior à SPreTF 4% abaixo da LR.
A tabela apresentada na descrição da ressíntese (6.1.1.3) indica que os valores atingidos a
partir da aplicação do VR se mostraram diferentes dos valores esperados.
40 Conferir nota 28.
145
Como o vale da F0, na OP consecutiva de referência, apresenta variação de 2VRs, o vale
da F0 na OP neutra (que apresenta variação de 32%) foi aumentado de 0,5VR.
A implementação da ressíntese (6.1.1.5) se deu porque, comparando-se o traçado
melódico da OP neutra com o da OP consecutiva de referência, percebe-se que a F0 no segmento
anterior ao ponto crítico (ou seja, do início da oração até a VPreTF) nivela-se, aproximadamente,
com o traçado verificado na VPreTF. Enquanto na OP neutra a média da F0 nesse segmento está
11% abaixo da LR, na OP consecutiva de referência a média está 4% abaixo dessa linha. Isso
significa dizer que, para assemelhar esse segmento da OP neutra ao seu equivalente na OP
consecutiva de referência, é preciso que esta última tenha a média de seu segmento da F0 em
questão 4% abaixo da LR.
A audição, pelo Autor, das ressínteses produzidas indicou que a transformação (6.1.1.2)
não interfere no resultado final, assim como a (6.1.1.5), e que, para as transformações realizadas
em (6.1.1.3), o ponto crítico é o item (i): abaixo desse percentual, não se obtém a pré-indicação
consecutiva; acima desse percentual, ocorre a ênfase da pré-indicação. A transformação (6.1.1.4)
torna o todo da ressíntese mais próximo do original e, aplicada aos itens de (a) a (e) de (6.1.1.3),
não é capaz de lhes conferir o valor consecutivo. A centralização do vértice da F0, indicada em
(6.1.1.2), mostrou-se dispensável.
Para a realização do Teste 2, utilizaram-se, portanto, as ressínteses (6.1.1.3.i) e (6.1.1.4),
ilustradas pelas figuras 6.2 e 6.3, abaixo:
Figura 6.2 – Processo de ressíntese (6.1.1.3.i) da OP 1 neutra para a pré-indicação consecutiva
146
Figura 6.3 – Processo de ressíntese (6.1.1.4) da OP 1 neutra para a pré-indicação consecutiva
6.1.2. Pré-indicação causal
A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 causal de referência, seguiu
os seguintes passos:
6.1.2.1 redução do vale da F0 em 0,5VR;
6.1.2.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.1.2.3 cumulativamente, acima da LR, na OP neutra, elevação da F0 da VTF em:
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 158 155
b) 1,5 171 165
c) 2 184 177
d) 2,5 198 191
e) 3 211 201
f) 3,5 224 213
g) 4 237 225
h) 4,5 250 238
i) 5 264 251
j) 5,5 277 262
k) 6 290 273
6.1.2.4 cumulativamente, realocação de toda a F0 anterior à SPreTF 3% acima da LR.
147
A tabela apresentada na descrição da ressíntese 6.1.2.3 indica que os valores atingidos a
partir da aplicação do VR se mostraram diferentes dos valores esperados.
Como o vale da F0, na OP causal de referência, apresenta variação de 1VR, o vale da F0
na OP neutra (que apresenta variação de 32%), foi reduzido de 0,5VR.
Comparando-se o traçado melódico da OP neutra com o da OP causal de referência,
percebe-se que a F0 no segmento anterior ao ponto crítico (ou seja, do início da oração até a
VPreTF) nivela-se, aproximadamente, com o traçado verificado na VPreTF. Enquanto na OP
neutra a média da F0 nesse segmento está 11% abaixo da LR, na OP causal de referência a média
está 3% acima dessa linha (ou seja, a variação é negativa, considerando-se que a LR está abaixo
da média da F0 no segmento em questão). Isso significa dizer que, para assemelhar esse
segmento da OP neutra ao seu equivalente na OP causal de referência, é preciso que ela tenha a
média da F0 desse seu segmento elevado 3% acima da LR. Esse procedimento se efetuou com a
ressíntese 6.1.2.4.
A audição, pelo Autor, das ressínteses produzidas indicou que a transformação (6.1.2.3.i)
já parece ser suficiente para conferir à OP monotônica o valor pré-indicativo causal, e que a
transformação (6.1.2.4), cumulativa a (6.1.2.3.i), torna o resultado melhor. A centralização do
vértice da F0, indicada em (6.1.2.2) mostrou-se dispensável.
Para a realização do Teste 2, utilizaram-se, portanto, as ressínteses (6.1.2.3.i) e (6.1.2.4),
ilustradas pelas figuras 6.4 e 6.5, abaixo:
Figura 6.4 – Processo de ressíntese (6.1.2.3.i) da OP 1 neutra para a pré-indicação causal
148
Figura 6.5 – Processo de ressíntese (6.1.2.4) da OP 1 neutra para a pré-indicação causal
6.1.3. Pré-indicação final
Visualmente, o que parece diferenciar o contorno pré-indicativo final do causal, na OP 1,
é o valor máximo de elevação da F0 na vogal da STF. Nas OPs de referência, a F0 ascendente da
STF na pré-indicação causal apresenta uma variação de 113Hz, ou 91%, enquanto que, na pré-
indicação final, essa variação é de 82Hz, ou 63%. Tomando-se como referência a LR, na pré-
indicação causal a F0 da VTF sofre uma elevação de 91Hz, ou 62% (3,1VR) e, na pré-indicação
final, de 45Hz, ou 27% (1,35VR). Uma vez que o vale da F0, na OP final de referência, sofre
variação de 28%, optou-se por não modificar esse mesmo segmento na manipulação da OP
neutra, em que a variação é de 32%.
A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 final de referência, seguiu os
seguintes passos:
6.1.3.1 centralização do vértice do vale da F0 na consoante de ataque da STF;
6.1.3.2 cumulativamente, acima da LR, na OP neutra, elevação da F0 da VTF em:
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 158 157
b) 1,5 171 168
c) 2 184 176
d) 2,5 198 191
e) 3 211 203
f) 3,5 224 213
149
g) 4 237 226
h) 4,5 250 238
i) 5 264 249
j) 5,5 277 263
k) 6 290 274
6.1.3.3 a duração da consoante de ataque da STF (/l/), na OP de referência, é 54% maior que na
OP neutra. Cumulativamente, aplicação dessa transformação;
6.1.3.4 a duração da vogal (/i/) e da consoante de coda (/s/) na STF é, respectivamente, 23% e
117% maior na OP neutra que na OP final de referência. Cumulativamente, redução da
duração desses segmentos, na OP neutra, portanto, em 18% e 53%41
, respectivamente;
6.1.3.5 a duração da sílaba /ka/, na OP final de referência, é 39% maior do que na OP neutra.
Cumulativamente, redução da duração da sílaba /ka/, na OP neutra, portanto, em 27%;
6.1.3.6 cumulativamente, realocação de toda a F0 anterior à SPreTF 8% abaixo da LR;
6.1.3.7 ressíntese (6.1.3.6) excluindo (6.1.3.5).
A audição, pelo Autor, das ressínteses produzidas indicou que parece ser necessário que a
transformação (6.1.3.2.g) seja acompanhada por (6.1.3.3). As transformações (6.1.3.4) e
(6.1.3.5), cumulativamente a (6.1.3.1) e (6.1.3.2), tornam as ressínteses mais próximas do
original, embora não pareçam ser indispensáveis. A centralização do vértice da F0, indicada em
(6.1.3.1), mostrou-se desnecessária.
Utilizaram-se, portanto, para o Teste 2, as ressínteses (6.1.3.2.g) e (6.1.3.3), ilustradas
pelas figuras 6.6 e 6.7, abaixo:
41 Para obter o percentual de redução da duração, tornam-se os valores de 23% e 117% os novos valores referenciais
e, por meio de uma regra de 3, calcula-se em que percentual os segmentos devem ser reduzidos na OP neutra. Por
exemplo, para o cálculo relativo à vogal /i/:
/i/ OP final 0,149ms – 100% /i/ OP neutra 0,184ms – x x = 23%
Assumindo esse novo valor como referencial:
0,184ms – 23%
0,149ms – x x = 18%
Para comprovar esses cálculos, basta subtrair 18% da duração do segmento na OP neutra e o resultado será a
duração do segmento na OP de referência:
0,184ms – 18% = 0,151ms (a diferença se deve à variação no número de casas decimais no cálculo do percentual,
desprezadas)
150
Figura 6.6 – Processo de ressíntese (6.1.3.2.i) da OP 1 neutra para a pré-indicação final
Figura 6.7 – Processo de ressíntese (6.1.3.3) da OP 1 neutra para a pré-indicação final
6.2. RESSÍNTESE DAS OPS 1 NEUTRAS COM F0 DESCENDENTE
6.2.1. Pré-indicação concessiva
Para iniciar o processo de ressíntese da OP 1 neutra, o primeiro ponto a determinar seria o
referencial a partir do qual se localizaria o valor máximo de elevação da F0 na VPreTF.
Estipulou-se que esse referencial seria o valor máximo de pitch da vogal nasal (no caso da OP 1),
núcleo da sílaba anterior à SPreTF. Na OP 1 concessiva de referência, a variação entre esse valor
151
máximo da vogal da sílaba anterior à SPreTF e o valor máximo da F0 na vogal da SPreTF foi de
27Hz, ou 12%.
Acompanhando a queda da F0 (segundo ponto a determinar), observa-se que, nessa
mesma oração tomada como base, entre o início e o fim da VPreTF, há uma variação de –10Hz,
ou –4%; entre o início e o fim da consoante de ataque da STF, a variação é de –56Hz, ou –30%;
e entre o início e o fim da VTF, de –61Hz, ou –50%.
O terceiro ponto a determinar seria o grau de concavidade aplicado quando da formação
da curva ligeiramente côncava. Na OP 1 concessiva de referência, estabeleceu-se o ponto médio
da VTF, no eixo temporal imaginário (abscissa), registrando-se o valor da F0. A seguir, projetou-
se uma reta que unisse o ponto inicial e o ponto final da F0 dessa VTF. A partir do ponto médio
temporal, projetou-se uma reta paralela ao eixo vertical (ordenada) e, na intersecção dessa reta
vertical com a reta de união dos pontos extremos da F0, calculou-se o potencial valor da F0. A
variação entre esses valores, medidos em Hz, foi de 10%. Ou seja, a F0, na VTF, apresenta uma
modulação de formato côncavo em 10%.
Figura 6.8 – Diagramação visual para cálculo da variação da F0 na concavidade formada na VTF da OP 1
concessiva de referência. A variação é obtida pela diferença entre o valor potencial da F0 e o valor de pitch
mensurado no ponto médio da VTF.
A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 concessiva de referência,
seguiu, então, os seguintes passos:
ponto médio da
VTF
valor potencial
da F0
152
6.2.1.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 12% acima do valor máximo de pitch da
vogal na sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 4%;
c. variação descendente da F0, na consoante da STF, em 30%;
d. variação descendente da F0, na VTF, em 50%;
e. elevação de toda a frase em 30%;
f. formação de ponto de pitch no ponto médio da VTF;
6.2.1.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato côncavo. Para
isso, criou-se um ponto de pitch na F0, tomando como referência seu ponto médio
temporal,
a. com concavidade em 10%;
b. com concavidade em 15%;
c. com concavidade em 20%;
6.2.1.3 cumulativamente, redução da duração da sílaba /ka/ em 54%.
Como o tom da voz masculina utilizada na gravação da OP neutra era bastante grave, os
rebaixamentos da F0 produzidos em (6.2.1.1) tornaram o resultado auditivo da ressíntese
inadequados. Como solução, elevou-se a F0 de toda a frase em 30% (6.2.1.1.e), o que produziu
um resultado sonoro satisfatório.
Comparando-se o resultado sonoro obtido com a OP 1 concessiva de referência, a
duração da sílaba /ka/ pareceu interferir no valor pré-indicativo concessivo. Na OP 1 concessiva
de referência, a duração dessa sílaba mostrou-se 54% menor que na OP 1 neutra. Por conta disso,
a transformação (6.2.1.3).
A audição, pelo Autor, das ressínteses produzidas indicou que a transformação (6.2.1.1)
já parece ser suficiente para conferir à OP 1 neutra o valor pré-indicativo concessivo, e que a
transformação (6.2.1.3), cumulativa a (6.2.1.1), torna a similaridade com a OP concessiva de
referência maior, embora não pareça um acréscimo essencial.
A aplicação de (6.2.1.2.c) acentua a modulação da voz na VTF, embora (6.2.1.2.b) soe
mais natural.
Utilizaram-se, para o Teste 2, as ressínteses (6.2.1.1) e (6.2.1.2.b), ilustradas pelas figuras
6.9 e 6.10, abaixo:
153
Figura 6.9 – Processo de ressíntese (6.2.1.1) da OP 1 neutra para a pré-indicação concessiva
Figura 6.10 – Processo de ressíntese (6.2.1.2.b) da OP 1 neutra para a pré-indicação concessiva
6.2.2. Pré-indicação conformativa
Como discutido anteriormente, o elemento diferenciador entre o contorno pré-indicativo
conformativo e o concessivo parece ser a curva, convexa ou côncava, formada ao longo do
traçado da freqüência fundamental ao longo da VTF. Partindo desse pressuposto, o processo de
ressíntese da OP 1 neutra, para produzir o valor pré-indicativo conformativo, assumiu os mesmos
passos iniciais utilizados para a ressíntese da pré-indicação concessiva, descritos em 6.2.1 acima,
respeitando-se a diferença de variação da F0 existente em cada segmento. Assim, para o
referencial a partir do qual o valor máximo de elevação da F0 na VPreTF seria estipulado,
adotou-se, da mesma forma, o valor máximo de pitch da vogal nasal, núcleo da sílaba anterior à
154
SPreTF. Na OP 1 conformativa de referência, a variação entre esse valor máximo da vogal da
sílaba anterior à SPreTF e o valor máximo da F0 na vogal da SPreTF foi de 35Hz, ou 17%.
A queda da F0, a partir do início da VPreTF até a fronteira com a consoante seguinte,
sofreu uma variação de –22Hz, ou –10%; entre o início e o fim da consoante da STF, a variação
foi de –59Hz, ou –37%; e entre o início e o fim da VTF, de –26Hz, ou –19%.
Quanto ao grau de convexidade da curva formada pela F0 na VTF, estabeleceu-se, da
mesma forma que para a pré-indicação concessiva, o seu ponto médio, no eixo temporal,
registrando-se o valor da F0. A seguir, foi feita a projeção de uma reta que tangenciasse o ponto
inicial e o ponto final da F0 dessa VTF. A partir do ponto médio temporal, projetou-se uma reta
paralela ao eixo vertical e, na intersecção dessa reta vertical com a reta de união dos pontos
extremos da F0, calculou-se o potencial valor da F0. A variação, neste caso, foi de 3%.
Observando-se atentamente esse trecho da F0 na OP conformativa de referência, verifica-se uma
irregularidade do traçado. Caso a medição seja feita com base no ponto mais pronunciado da
curva, essa diferença se eleva a 5%. Embora esse percentual de variação possa parecer irrisório,
deve-se considerar que, em paralelo com a variação verificada para a pré-indicação concessiva, a
diferença entre os extremos da curva côncava e da curva convexa somará 15%.
A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 conformativa de referência,
seguiu, então, os seguintes passos:
6.2.2.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 17% acima do valor máximo de pitch da
vogal na sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 10%;
c. variação descendente da F0, na consoante da STF, em 37%;
d. variação descendente da F0, na VTF, em 19%;
e. elevação de toda a frase em 30%;
f. formação de ponto de pitch no ponto médio da VTF;
6.2.2.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato convexo. Para
isso, criou-se um ponto de pitch na F0, tomando como referência seu ponto médio
temporal,
a. com convexidade em 5%;
b. com convexidade em 10%;
c. com convexidade em 15%;
d. com convexidade em 20%;
6.2.2.3 cumulativamente, redução da duração da sílaba /ka/ em 26%.
155
Da mesma forma que para a ressíntese para o valor pré-indicativo concessivo, foi
necessário elevar toda a F0, e 30% de elevação se mostraram igualmente satisfatórios.
Comparando-se o resultado obtido com a OP 1 conformativa de referência, a duração da
sílaba /ka/ talvez pudesse interferir no valor pré-indicativo concessivo. Na OP 1 conformativa de
referência, a duração dessa sílaba mostrou-se 26% menor que na OP 1 neutra, o que gerou a
ressíntese (6.2.2.3).
A audição, pelo Autor, das ressínteses produzidas indicou que a transformação (6.2.2.3)
não produziu efeito importante. Houve apenas uma maior aproximação com o verificado na OP 1
conformativa de referência. Quanto ao aspecto da formação da convexidade na curva de F0 da
VTF, o melhor efeito foi obtido com a ressíntese 6.2.2.2.c.
Para a realização do Teste 2, utilizaram-se, assim, as ressínteses (6.2.2.1) e (6.2.2.2.d),
ilustradas pelas figuras 6.11 e 6.12, abaixo:
Figura 6.11 – Processo de ressíntese (6.2.2.1) da OP 1 neutra para a pré-indicação conformativa
156
Figura 6.12 – Processo de ressíntese (6.2.2.2.d) da OP 1 neutra para a pré-indicação conformativa
6.2.3. Pré-indicação temporal
Entre as três subcategorias que compõem o grupo pré-indicativo com modulação
descendente da freqüência fundamental, a temporal apresenta o contorno da F0 na VTF com
menor variação. Enquanto as subcategorias concessiva e conformativa apresentam esse segmento
com uma variação de –50% e de –19%, respectivamente, a VTF da pré-indicação temporal sofre
uma variação, em Hz, de apenas –5%. O seu contorno, portanto, mostra-se mais plano. O
processo de ressíntese, descrito a seguir, assume essa particularidade como sendo o elemento
diferenciador em relação às outras duas subcategorias.
Uma vez que, anteriormente à VTF, a F0 apresenta um comportamento semelhante ao
verificado tanto para a pré-indicação concessiva quanto para a conformativa, o processo de
ressíntese da OP 1 neutra, para produzir o valor pré-indicativo temporal, retoma os mesmos
passos iniciais utilizados para aquelas duas. Da mesma forma, o referencial a partir do qual o
valor máximo de elevação da F0 na VPreTF seria calculado foi estipulado no valor máximo de
pitch da vogal nasal, núcleo da sílaba anterior à SPreTF. Na OP 1 temporal de referência, a
variação entre esse valor máximo da vogal da sílaba anterior à SPreTF e o valor máximo da F0
na vogal da SPreTF foi de 26Hz, ou 12%.
A variação que a F0 sofreu, entre o início da VPreTF e a fronteira com a consoante
seguinte, foi de –23Hz, ou –11%; entre o início e o fim da consoante da STF, de –53Hz, ou –
34%; e entre o início e o fim da VTF, de –8Hz, ou –5%, como já mencionado acima.
157
O processo de ressíntese da OP 1 neutra para obtenção da pré-indicação temporal seguiu,
então, os seguintes passos:
6.2.3.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 14% acima do valor máximo de pitch da
vogal na sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 11%;
c. variação descendente da F0, na consoante da STF, em 34%;
d. variação descendente da F0, na VTF, em 5%;
e. elevação de toda a frase em 30%;
6.2.3.2 cumulativamente, manipulação da F0 na VPreTF, tornando-a mais linear;
6.2.3.3 cumulativamente, redução da duração da VTF em 61%;
6.2.3.4 cumulativamente, redução da duração da sílaba /ka/ em 45%;
6.2.3.5 ressíntese (6.2.3.4) excluindo a ressíntese (6.2.3.3).
Da mesma forma que para a ressíntese para os valores pré-indicativos concessivo e
conformativo, toda a F0 foi elevada em 30%, como indicado em (6.2.3.1.e), com resultado
sonoro igualmente satisfatório.
As ressínteses (6.2.3.4) e (6.2.3.5) não mostraram um resultado sonoro apropriado. A
transformação promovida em (6.2.3.2) tornou o resultado auditivo perceptualmente mais
próximo do verificado na OP 1 temporal de referência, e a ressíntese (6.2.3.3) tornou esse
resultado ainda mais próximo do original.
Utilizaram-se, então, para o Teste 2, as ressínteses (6.2.3.2) e (6.2.3.3), ilustradas pelas
figuras 6.13 e 6.14, abaixo:
158
Figura 6.13 – Processo de ressíntese (6.2.3.2) da OP 1 neutra para a pré-indicação temporal
Figura 6.14 – Processo de ressíntese (6.2.3.3) da OP 1 neutra para a pré-indicação temporal
A partir dessas observações, talvez se possa afirmar que a duração maior das vogais pré-
tônica e tônica final, na OP 1 neutra, não prejudica o estabelecimento do contorno pré-indicativo
temporal, embora sua redução melhore o efeito global, tornando o resultado obtido com a
ressíntese muito mais próximo do verificado na oração de referência. Parecem ser marcas do
contorno pré-indicativo temporal, então, a VTF com um formato de F0 mais nivelado,
cumulativamente com a duração reduzida, e a VPreTF mais enfatizada, especialmente por meio
de uma queda mais linear de sua F0.
159
6.3. RESSÍNTESE DAS OPS 1 MONOTÔNICAS COM F0 ASCENDENTE
6.3.1. Pré-indicação consecutiva
A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 consecutiva de
referência, seguiu os seguintes passos:
6.3.1.1 formação do vale da F0, com 2VRs;
6.3.1.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.3.1.3 cumulativamente, acima da LR, na OP 1 monotônica, elevação da F0 da VTF segundo as
quantidades de VR indicadas abaixo, na primeira coluna, com o objetivo de atingir o
valor máximo, em Hertz, indicado na segunda coluna. A terceira coluna indica os valores
obtidos após a ressíntese:
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 158 158
b) 1,5 171 170
c) 2 184 182
d) 2,5 198 195
e) 3 211 211
f) 3,5 224 218
g) 4 237 235
h) 4,5 250 248
i) 5 264 263
j) 5,5 277 265
k) 6 290 279
6.3.1.4 cumulativamente, aumento da duração da consoante na STF em 97%, assemelhando-a à
duração verificada na OP consecutiva de referência.
6.3.1.5 cumulativamente, realocação de toda a F0 anterior à SPreTF 4% abaixo da LR.
Como se pode perceber, foi necessária a formação do vale da F0, uma vez que a F0 da
OP 1 monotônica se mostra totalmente nivelada. Essa formação adotou a mesma variação de
modulação verificada na OP 1 neutra.
Para o Teste 2, escolheram-se as ressínteses (6.3.1.3.i) e (6.3.1.4), ilustradas pelas figuras
6.15 e 6.16, abaixo:
160
Figura 6.15 – Processo de ressíntese (6.3.1.3.i) da OP 1 monotônica para a pré-indicação consecutiva
Figura 6.16 – Processo de ressíntese (6.3.1.4) da OP 1 monotônica para a pré-indicação consecutiva
6.3.2. Pré-indicação causal
A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 causal de referência,
seguiu os seguintes passos:
6.3.2.1 formação do vale de F0, com 1VR;
6.3.2.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.3.2.3 cumulativamente, acima da LR, na OP 1 monotônica, elevação da F0 da VTF em:
161
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 158 158
b) 1,5 171 169
c) 2 184 182
d) 2,5 198 194
e) 3 211 210
f) 3,5 224 218
g) 4 237 237
h) 4,5 250 249
i) 5 264 262
j) 5,5 277 267
k) 6 290 279
6.3.2.4 cumulativamente, realocação de toda a F0 anterior à SPreTF 3% acima da LR.
A diferença básica em relação à manipulação da OP 1 neutra se situa na formação do vale
da F0, neste caso, com 1VR.
Para a realização do Teste 2, utilizaram-se as ressínteses (6.3.2.3.i) e (6.3.2.4), ilustradas
pelas figuras 6.17 e 6.18, abaixo:
Figura 6.17 – Processo de ressíntese (6.3.2.3.i) da OP 1 monotônica para a pré-indicação causal
162
Figura 6.18 – Processo de ressíntese (6.3.2.4) da OP 1 monotônica para a pré-indicação causal
6.3.3. Pré-indicação final
A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 final de referência,
seguiu os seguintes passos:
6.3.3.1 formação do vale da F0 com 1,5VR;
6.3.3.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.3.3.3 cumulativamente, acima da LR, na OP 1 monotônica, elevação da F0 da VTF em:
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 158 158
b) 1,5 171 170
c) 2 184 182
d) 2,5 198 196
e) 3 211 206
f) 3,5 224 214
g) 4 237 237
h) 4,5 250 249
i) 5 264 263
j) 5,5 277 266
k) 6 290 280
6.3.3.4 a duração da consoante de ataque da STF (/l/), na OP 1 final de referência, é 54% maior
que na OP 1 monotônica. Cumulativamente, aplicação dessa adaptação;
163
6.3.3.5 a duração da vogal (/i/) e da consoante (/s/) na STF é, respectivamente, 23% e 117%
maior na OP 1 monotônica que na OP 1 final de referência. Cumulativamente, redução da
duração desses segmentos, na OP 1 monotônica, portanto, em 18% e 53%42
,
respectivamente;
6.3.3.6 a duração da sílaba /ka/, na OP 1 final de referência, é 39% maior do que na OP 1
monotônica. Cumulativamente, redução da duração da sílaba /ka/, na OP 1 monotônica,
portanto, em 27%42
;
6.3.3.7 cumulativamente, realocação de toda a F0 anterior à SPreTF 8% abaixo da LR;
6.3.3.8 ressíntese (6.3.3.6) excluindo (6.3.3.5).
Na manipulação da OP 1 neutra para produzir as ressínteses para o contorno pré-
indicativo final, não foi necessário modificar o vale da F0, que já se mostrava com 1,5VR. Para a
OP 1 monotônica, necessariamente, houve a formação do vale, o que, comparativamente ao
processo para a OP 1 neutra, produziu uma ressíntese a mais.
Utilizaram-se, para o Teste 2, as ressínteses (6.3.3.3.g) e (6.3.3.4), ilustradas pelas figuras
6.19 e 6.20, abaixo:
Figura 6.19 – Processo de ressíntese (6.3.3.3.g) da OP 1 monotônica para a pré-indicação final
42 cf. nota 41.
164
Figura 6.20 – Processo de ressíntese (6.3.3.4) da OP 1 monotônica para a pré-indicação final
6.4. RESSÍNTESE DAS OPS 1 MONOTÔNICAS COM F0 DESCENDENTE
6.4.1. Pré-indicação concessiva
A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 concessiva de
referência, seguiu os seguintes passos:
6.4.1.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 12% acima da LR no início da vogal da
sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 4%;
c. variação descendente da F0, na consoante da STF, em 30%;
d. variação descendente da F0, na VTF, em 50%;
e. elevação de toda a frase em 30%;
f. formação de ponto de pitch no ponto médio da VTF;
6.4.1.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato côncavo. Para
isso, criou-se um ponto de pitch na F0, tomando como referência seu ponto médio
temporal,
a. com concavidade em 10%;
b. com concavidade em 15%;
c. com concavidade em 20%;
6.4.1.3 cumulativamente, redução da duração da sílaba /ka/ em 54%.
165
Como observado, não houve necessidade de modificação alguma nas etapas do processo
de ressíntese, comparativamente à OP 1 neutra.
Utilizaram-se, para o Teste 2, as ressínteses (6.4.1.1) e (6.4.1.2.b), ilustradas pelas figuras
6.21 e 6.22, abaixo:
Figura 6.21 – Processo de ressíntese (6.4.1.1) da OP 1 monotônica para a pré-indicação concessiva
Figura 6.22 – Processo de ressíntese (6.4.1.2.b) da OP 1 monotônica para a pré-indicação concessiva
6.4.2. Pré-indicação conformativa
A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 conformativa de
referência, seguiu os seguintes passos:
166
6.4.2.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 17% acima da LR no início da vogal da
sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 10%;
c. variação descendente da F0, na consoante da STF, em 37%;
d. variação descendente da F0, na VTF, em 19%;
e. elevação de toda a frase em 30%;
f. formação de ponto de pitch no ponto médio da VTF;
6.4.2.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato convexo. Para
isso, criou-se um ponto de pitch na F0, tomando como referência seu ponto médio
temporal,
a. com convexidade em 5%;
b. com convexidade em 10%;
c. com convexidade em 15%;
d. com convexidade em 20%;
6.4.2.3 cumulativamente, redução da duração da sílaba /ka/ em 26%.
Também para este grupo não houve necessidade de modificação alguma nas etapas do
processo de ressíntese, comparativamente à OP 1 neutra.
Para a realização do Teste 2, utilizaram-se as ressínteses (6.4.2.1) e (6.4.2.2.d), ilustradas
pelas figuras 6.23 e 6.24, abaixo:
Figura 6.23 – Processo de ressíntese (6.4.2.1) da OP 1 monotônica para a pré-indicação conformativa
167
Figura 6.24 – Processo de ressíntese (6.4.2.2.d) da OP 1 monotônica para a pré-indicação conformativa
6.4.3. Pré-indicação temporal
O processo de ressíntese da OP 1 monotônica para obtenção da pré-indicação temporal
seguiu os seguintes passos:
6.4.3.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 14% acima da LR no início da vogal da
sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 11%;
c. variação descendente da F0, na consoante da STF, em 34%;
d. variação descendente da F0, na VTF, em 5%;
e. elevação de toda a frase em 30%;
6.4.3.2 cumulativamente, manipulação da F0 na VPreTF, tornando-a mais linear;
6.4.3.3 cumulativamente, redução da duração da VTF em 61%;
6.4.3.4 cumulativamente, redução da duração da sílaba /ka/ em 45%;
6.4.3.5 ressíntese (6.4.3.4) excluindo a ressíntese (6.4.3.3).
Mais uma vez, o processo de ressíntese mostrou-se idêntico ao utilizado para a OP 1
neutra.
Utilizaram-se, para o Teste 2, as ressínteses (6.4.3.2) e (6.4.3.3), ilustradas pelas figuras
6.25 e 6.26, abaixo:
168
Figura 6.25 – Processo de ressíntese (6.4.3.2) da OP 1 monotônica para a pré-indicação temporal
Figura 6.26 – Processo de ressíntese (6.4.3.3) da OP 1 monotônica para a pré-indicação temporal
De uma forma geral, as ressínteses obtidas a partir da OP 1 monotônica não apresentaram
um resultado sonoro final muito diferente do obtido para a manipulação da OP 1 neutra. A
ausência da modulação da F0 verificada na OP 1 monotônica (excluindo-se, evidentemente, os
segmentos manipulados durante a ressíntese), parece se diluir por força do número reduzido de
sílabas constituindo a frase. Isso, como se verá mais à frente, não ocorre em relação à OP 2
monotônica, que apresenta um maior número de sílabas.
169
RESSÍNTESE DAS ORAÇÕES PRINCIPAIS 2
A OP 2 – Mostrava-se cansado – foi constituída de forma a existir uma sílaba pós-tônica
final, com o objetivo de verificar se esse fator causaria alguma interferência potencial na
caracterização da função pré-indicativa. Enquanto a OP 1 – Ficava infeliz – apresenta quatro
sílabas fonéticas anteriores à STF (recorrentemente, houve elisão de [a] ao se combinarem as
sílabas <va> e <in>, produzindo-se, então, [] [] [] []), a OP 2 apresenta cinco sílabas
([] [] [] [] []). Paralelamente à existência de uma sílaba a mais, deve-se ainda
considerar que, entre os fonemas constituintes da frase, há um número maior de fricativas, classe
fonêmica que apresenta uma duração intrínseca mais longa (Di Cristo, 1985).
A OP 2 neutra apresentou a manifestação do fonema [], da sílaba <si>, em sua gravação.
Nas OPs 2 de referência, esse fonema não se realizou quatro vezes: nas concessivas, nas
conformativas, nas consecutivas e nas temporais. Essa não-realização implica a diminuição de
uma sílaba antes da STF. No entanto, como as ressínteses foram produzidas a partir da OP 2
neutra (em que não houve a elisão do fonema []), houve a manutenção das cinco sílabas
originais.
Em relação à duração, a OP 2 neutra apresentou o segmento anterior à STF com 831ms,
enquanto a OP 1 neutra, com 660ms, uma diferença, portanto, de 26%. Somando-se a isso a
presença de uma sílaba pós-tônica, a manipulação da OP 2 implica duas hipóteses:
1. o grau de naturalidade obtido com a manipulação da OP 2 monotônica não será o
mesmo verificado em relação à manipulação da OP 1 monotônica;
2. a presença de uma sílaba pós-tônica exige uma configuração melódica, para cada
contorno pré-indicativo, diferente da configuração estabelecida para os casos em que
não há uma sílaba pós-tônica.
Um outro ponto que deve ser levado em consideração, quando da manipulação da OP 2, é
o fato de a STF ser constituída, em seu ataque, por uma consoante fricativa surda, o que elimina,
nesse segmento, a manifestação visual da freqüência fundamental. Comparativamente à OP 1,
que apresenta, nessa posição, uma consoante lateral, a F0 da OP 2, nessa STF, mostra um ataque
bastante elevado, sem, portanto, uma transição harmônica do contorno entre as vogais da SPreTF
e da STF, como se pode perceber na figura 4.7, reproduzida abaixo como 6.27 para conveniência
do leitor.
170
OP 1 neutra OP 2 neutra
Figura 6.27 – Processo de ressíntese (6.4.3.3) da OP 1 monotônica para a pré-indicação temporal.
O processo de ressíntese da OP 2 procurou seguir, ao máximo possível, as modificações
produzidas para as ressínteses da OP 1. Uma vez que se procura estabelecer um contorno pré-
indicativo, é razoável que a manipulação de todas as possíveis OPs siga os mesmos parâmetros.
Basicamente, as diferenças se verificaram em relação à duração dos segmentos, com
características próprias diferentes na OP 1 e na OP 2. Como sugerido no parágrafo anterior, o
ponto de partida da manipulação da F0 na STF também foi diferente na OP 2.
A LR para a OP 2, como citado anteriormente, foi estabelecida a 127Hz, atendendo aos
mesmos princípios utilizados para a OP 1, ou seja, o valor máximo de elevação da F0 na vogal
da SpreTF na OP neutra.
6.5. RESSÍNTESE DAS OPS 2 NEUTRAS COM F0 ASCENDENTE
6.5.1. Pré-indicação consecutiva
A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 consecutiva de referência,
seguiu os seguintes passos:
6.5.1.1 formação do vale da F0 a 2VRs abaixo da LR;
6.5.1.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.5.1.3 cumulativamente, acima da LR, na OP 2 neutra, elevação da F0 da VTF segundo as
quantidades de VR indicadas abaixo, na primeira coluna, com o objetivo de atingir o
valor máximo, em Hertz, indicado na segunda coluna. A terceira coluna indica os valores
obtidos após a ressíntese:
Time (s)
0 1.576210
250f i k a v i f e l i
Time (s)
0 1.746370
250mo t r a v a s i k a s a d u
171
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 152 153
b) 1,5 165 165
c) 2 177 178
d) 2,5 190 191
e) 3 203 203
f) 3,5 215 216
g) 4 228 229
h) 4,5 241 242
i) 5 254 254
j) 5,5 266 266
k) 6 279 280
6.5.1.4 cumulativamente, aumento da duração da consoante na STF em 18%, assemelhando-a à
duração verificada na OP de referência;
6.5.1.5 cumulativamente, realocação de toda a F0 anterior à SPreTF 4% abaixo da LR.
Para o Teste 2, escolheram-se as ressínteses (6.5.1.3.i) e (6.5.1.4), ilustradas pelas figuras
6.28 e 6.29, abaixo. Comparativamente aos resultados sonoros obtidos para as ressínteses da OP
1 neutra, as ressínteses escolhidas para o Teste 2 foram equivalentes. Observe-se que o
percentual de duração na consoante da STF mostrou-se diferente em uma e em outra OP (na OP
1, aumento de 97%; na OP 2, aumento de 18%), por conta das durações verificadas nas OPs de
referência.
Figura 6.28 – Processo de ressíntese (6.5.1.3.i) da OP 2 neutra para a pré-indicação consecutiva
172
Figura 6.29 – Processo de ressíntese (6.5.1.4) da OP 2 neutra para a pré-indicação consecutiva
6.5.2. Pré-indicação causal
A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 causal de referência, seguiu
os seguintes passos:
6.5.2.1 formação do vale da F0 a 1VR abaixo da LR;
6.5.2.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.5.2.3 cumulativamente, acima da LR, na OP 2 neutra, elevação da F0 da VTF segundo as
quantidades de VR indicadas abaixo, na primeira coluna, com o objetivo de atingir o
valor máximo, em Hertz, indicado na segunda coluna. A terceira coluna indica os valores
obtidos após a ressíntese:
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 152 153
b) 1,5 165 165
c) 2 177 178
d) 2,5 190 191
e) 3 203 203
f) 3,5 215 216
g) 4 228 229
h) 4,5 241 242
i) 5 254 254
j) 5,5 266 266
k) 6 279 280
173
6.5.2.4 cumulativamente, aumento da duração da consoante na STF em 23%, assemelhando-a à
duração verificada na OP de referência;
6.5.2.5 cumulativamente, realocação de toda a F0 anterior à SPreTF 3% acima da LR.
Para a realização do Teste 2, utilizaram-se as ressínteses (6.5.2.3.f) e (6.5.2.4), ilustradas
pelas figuras 6.30 e 6.31, abaixo. As ressínteses da OP 2 neutra selecionadas para o Teste 2 não
se mostraram equivalentes às selecionadas para a OP 1 neutra, considerando-se os percentuais de
variação empregados. Observe-se que, para as ressínteses da OP 1 neutra, na modalidade pré-
indicativa causal, a ressíntese com manipulação da F0 na vogal da STF (6.5.2.3.i) apresentou
variação de 5VRs, enquanto que, para a OP 2 neutra, 3,5VRs.
Figura 6.30 – Processo de ressíntese (6.5.2.3.f) da OP 2 neutra para a pré-indicação causal
Figura 6.31 – Processo de ressíntese (6.5.2.4) da OP 2 neutra para a pré-indicação causal
174
6.5.3. Pré-indicação final
A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 final de referência, seguiu os
seguintes passos:
6.5.3.1 formação do vale da F0 a 1,5VR abaixo da LR;
6.5.3.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.5.3.3 cumulativamente, elevação da F0 no início da VTF 28% acima da LR; no ápice da VTF,
31%; no final da vogal pós-tônica final, 13% abaixo da LR;
6.5.3.4 cumulativamente, localização do ápice da F0 na VTF a 56% do seu início, e localização
da F0 no fim da VTF 27% abaixo de seu ápice;
6.5.3.5 cumulativamente, acima da LR, na OP 2 neutra, elevação da F0 da VTF segundo as
quantidades de VR indicadas abaixo, na primeira coluna, com o objetivo de atingir o
valor máximo, em Hertz, indicado na segunda coluna. A terceira coluna indica os valores
obtidos após a ressíntese:
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 152 152
b) 1,5 165 164
c) 2 177 177
d) 2,5 190 190
e) 3 203 202
f) 3,5 215 215
g) 4 228 228
h) 4,5 241 241
i) 5 254 253
j) 5,5 266 266
k) 6 279 280
6.5.3.6 cumulativamente, redução da duração da VTF em 15%;
6.5.3.7 cumulativamente, F0 anterior à SPreTF 14% acima da LR.
Utilizaram-se, para o Teste 2, as ressínteses (6.5.3.5.c) e (6.5.3.6), ilustradas pelas figuras
6.32 e 6.33, abaixo. A seleção das ressínteses da OP 2 neutra para o Teste 2 não se mostrou
equivalente, também neste caso, à seleção feita para a OP 1 neutra, considerando-se os
percentuais de variação empregados. Observe-se que, para as ressínteses da OP 1 neutra, na
175
modalidade pré-indicativa final, a ressíntese com manipulação da F0 na vogal da STF (6.1.3.2.g)
apresentou variação de 4VRs, enquanto que, para a OP 2 neutra, 2VRs.
Figura 6.32 – Processo de ressíntese (6.5.3.5.c) da OP 2 neutra para a pré-indicação final
Figura 6.33 – Processo de ressíntese (6.5.3.6) da OP 2 neutra para a pré-indicação final
6.6. RESSÍNTESE DAS OPS 2 NEUTRAS COM F0 DESCENDENTE
6.6.1. Pré-indicação concessiva
A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 concessiva de referência,
seguiu os seguintes passos:
176
6.6.1.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 12% acima do valor máximo de pitch da
vogal na sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 4%;
c. variação descendente da F0, na consoante da STF, em 30%;
d. variação descendente da F0, na VTF, em 50%;
e. elevação de toda a frase em 30%;
f. formação de ponto de pitch no ponto médio da VTF;
6.6.1.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato côncavo, a
partir do ponto de pitch criado na F0,
a. com concavidade em 10%;
b. com concavidade em 15%;
c. com concavidade em 20%;
6.6.1.3 cumulativamente, adaptação da duração de todos os fones da frase, assimilando-a à OP
de referência.
A única modificação nas etapas do processo de ressíntese, comparativamente à OP 1
neutra, se deu em relação ao parâmetro da duração. Uma vez que não foi possível estabelecer, da
mesma forma que para a OP 1 neutra, uma única sílaba anterior à STF a ter sua duração
modificada, optou-se por fazer a adaptação completa da duração em toda a frase. De toda forma,
essa modificação não pareceu importante na obtenção do valor pré-indicativo concessivo.
Utilizaram-se, para o Teste 2, as ressínteses (6.6.1.1) e (6.6.1.2.b), ilustradas pelas figuras
6.34 e 6.35, abaixo:
Figura 6.34 – Processo de ressíntese (6.6.1.1) da OP 2 neutra para a pré-indicação concessiva
177
Figura 6.35 – Processo de ressíntese (6.6.1.2.b) da OP 2 neutra para a pré-indicação concessiva
6.6.2. Pré-indicação conformativa
A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 conformativa de referência,
seguiu os seguintes passos:
6.6.2.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 17% acima do valor máximo de pitch da
vogal na sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 10%;
c. variação descendente da F0, na consoante da STF, em 37%;
d. variação descendente da F0, na VTF, em 19%;
e. elevação de toda a frase em 30%;
f. formação de ponto de pitch no ponto médio da VTF;
6.6.2.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato côncavo, a
partir do ponto de pitch criado na F0,
a. com convexidade em 5%;
b. com convexidade em 10%;
c. com convexidade em 15%;
d. com convexidade em 20%;
6.6.2.3 cumulativamente, adaptação da duração de todos os fones da frase, assimilando-a ao
verificado na OP de referência.
Da mesma forma que para o grupo precedente, a única modificação no processo de
ressíntese, comparativamente ao desenvolvido para a OP 1 neutra, se deu em relação à duração
178
da frase. Também aqui, o resultado final decorrente dessa modificação não pareceu interferir na
obtenção do contorno pré-indicativo desejado.
Para a realização do Teste 2, utilizaram-se as ressínteses (6.6.2.1) e (6.6.2.2.d), ilustradas
pelas figuras 6.36 e 6.37, abaixo:
Figura 6.36 – Processo de ressíntese (6.6.2.1) da OP 2 neutra para a pré-indicação conformativa
Figura 6.37 – Processo de ressíntese (6.6.2.2.d) da OP 2 neutra para a pré-indicação conformativa
6.6.3. Pré-indicação temporal
O processo de ressíntese da OP 2 neutra para obtenção da pré-indicação temporal seguiu
os seguintes passos:
179
6.6.3.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 14% acima do valor máximo de pitch da
vogal na sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 11%;
c. variação descendente da F0, na consoante da STF, em 34%;
d. variação descendente da F0, na VTF, em 5%;
e. elevação de toda a frase em 30%;
6.6.3.2 cumulativamente, linearização da F0 na VPreTF;
6.6.3.3 cumulativamente, redução da duração da VTF em 10%;
6.6.3.4 cumulativamente, aumento da duração da consoante da STF em 19%;
6.6.3.5 cumulativamente, redução da duração do segmento /travasi/, assemelhando-a ao
verificado na OP 2 temporal de referência;
6.6.3.6 ressíntese (6.6.3.5) excluindo a ressíntese (6.6.3.4);
6.6.3.7 ressíntese (6.6.3.5) excluindo a ressíntese (6.6.3.3);
6.6.3.8 ressíntese (6.6.3.5), excluindo as ressínteses (6.6.3.3) e (6.6.3.4).
Comparativamente ao processo de ressíntese para a OP 1 neutra, houve, aqui, algumas
alterações significativas. Além da variação na duração da VTF, devido às características próprias
das OPs de referência, o aumento da duração da consoante na STF mostrou-se como uma
adaptação indispensável para a obtenção de um resultado sonoro próximo ao verificado na OP 2
temporal de referência.
A escolha do segmento /travasi/ (ressíntese 6.6.3.5) para ter a duração modificada se deu
porque, como já comentado em relação ao processo de ressíntese para a pré-indicação concessiva
(cf. 6.6.1.3 e parágrafo subseqüente), não foi possível selecionar uma única sílaba a ter a duração
modificada. Observe-se que, no caso das ressínteses para a pré-indicação concessiva, não houve
necessidade de alterar a duração de segmentos específicos a partir da SPreTF. Neste caso da pré-
indicação temporal, no entanto, houve alterações de duração indispensáveis, como mencionado
no parágrafo anterior. Por outro lado, não pareceu necessário modificar a duração da primeira
sílaba da frase, optando-se, então, apenas pela modificação nesse segmento <trava se>.
Utilizaram-se, para o Teste 2, as ressínteses (6.6.3.2) e (6.6.3.4), ilustradas pelas figuras
6.38 e 6.39, abaixo:
180
Figura 6.38 – Processo de ressíntese (6.6.3.2) da OP 2 neutra para a pré-indicação temporal
Figura 6.39 – Processo de ressíntese (6.6.3.4) da OP 2 neutra para a pré-indicação temporal
RESSÍNTESE DA OP 2 MONOTÔNICA
O processo de ressíntese da OP 2, como dito, procurou seguir, ao máximo possível, as
modificações produzidas para a ressíntese da OP 1. Essas mesmas transformações, respeitadas as
peculiaridades da OP 2 em relação à OP 1, foram aplicadas também à OP 2 monotônica,
conforme as descrições a seguir.
181
6.7. RESSÍNTESE DAS OPS 2 MONOTÔNICAS COM F0 ASCENDENTE
6.7.1. Pré-indicação consecutiva
A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 consecutiva de
referência, seguiu os seguintes passos:
6.7.1.1 formação do vale da F0 a 2VRs abaixo da LR;
6.7.1.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.7.1.3 cumulativamente, acima da LR, na OP 2 monotônica, elevação da F0 da VTF segundo as
quantidades de VR indicadas abaixo, na primeira coluna, com o objetivo de atingir o
valor máximo, em Hertz, indicado na segunda coluna. A terceira coluna indica os valores
obtidos após a ressíntese:
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 152 152
b) 1,5 165 165
c) 2 177 178
d) 2,5 190 191
e) 3 203 203
f) 3,5 215 216
g) 4 228 229
h) 4,5 241 241
i) 5 254 254
j) 5,5 266 267
k) 6 279 279
6.7.1.4 cumulativamente, aumento da duração da consoante na STF em 18%, assemelhando-a à
duração verificada na OP de referência;
6.7.1.5 cumulativamente, realocação de toda a F0 anterior à SPreTF 4% abaixo da LR.
Para o Teste 2, escolheram-se as ressínteses (6.7.1.3.g) e (6.7.1.4), ilustradas pelas figuras
6.40 e 6.41, abaixo. Comparativamente aos resultados sonoros obtidos para a OP 2 neutra, houve
redução de dois níveis de variação do VR na elevação da F0 na STF para essa escolha.
182
Figura 6.40 – Processo de ressíntese (6.7.1.3.g) da OP 2 monotônica para a pré-indicação consecutiva
Figura 6.41 – Processo de ressíntese (6.7.1.4) da OP 2 monotônica para a pré-indicação consecutiva
6.7.2. Pré-indicação causal
A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 causal de referência,
seguiu os seguintes passos:
6.7.2.1 formação do vale da F0 a 1VR abaixo da LR;
6.7.2.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.7.2.3 cumulativamente, acima da LR, na OP 2 monotônica, elevação da F0 da VTF segundo as
quantidades de VR indicadas abaixo, na primeira coluna, com o objetivo de atingir o
183
valor máximo, em Hertz, indicado na segunda coluna. A terceira coluna indica os valores
obtidos após a ressíntese:
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 152 152
b) 1,5 165 165
c) 2 177 178
d) 2,5 190 191
e) 3 203 203
f) 3,5 215 216
g) 4 228 229
h) 4,5 241 241
i) 5 254 254
j) 5,5 266 267
k) 6 279 279
6.7.2.4 cumulativamente, aumento da duração da consoante na STF em 23%, assemelhando-a à
duração verificada na OP de referência;
6.7.2.5 cumulativamente, realocação de toda a F0 anterior à SPreTF 3% acima da LR.
Para a realização do Teste 2, da mesma forma verificada para as ressínteses da OP 2
neutra, utilizaram-se as ressínteses (6.7.2.3.f) e (6.7.2.4), ilustradas pelas figuras 6.42 e 6.43,
abaixo:
Figura 6.42 – Processo de ressíntese (6.7.2.3.f) da OP 2 monotônica para a pré-indicação causal
184
Figura 6.43 – Processo de ressíntese (6.7.2.4) da OP 2 monotônica para a pré-indicação causal
6.7.3. Pré-indicação final
A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 final de referência,
seguiu os seguintes passos:
6.7.3.1 formação do vale da F0 a 1,5VR abaixo da LR;
6.7.3.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;
6.7.3.3 cumulativamente, elevação da F0 no início da VTF 28% acima da LR; no ápice da VTF,
31%; no final da vogal pós-tônica final, 13% abaixo da LR;
6.7.3.4 cumulativamente, localização do ápice da F0 na VTF a 56% do seu início e da F0 no fim
da VTF, 27% abaixo de seu ápice;
6.7.3.5 cumulativamente, acima da LR, na OP 2 monotônica, elevação da F0 da VTF segundo as
quantidades de VR indicadas abaixo, na primeira coluna, com o objetivo de atingir o
valor máximo, em Hertz, indicado na segunda coluna. A terceira coluna indica os valores
obtidos após a ressíntese:
185
VR aplicado à
elevação da F0
Valores esperados
(Hz)
Valores atingidos
(Hz)
a) 1 152 152
b) 1,5 165 165
c) 2 177 178
d) 2,5 190 191
e) 3 203 203
f) 3,5 215 216
g) 4 228 229
h) 4,5 241 241
i) 5 254 254
j) 5,5 266 267
k) 6 279 279
6.7.3.6 cumulativamente, redução da duração da VTF em 15%;
6.7.3.7 cumulativamente, F0 anterior à SPreTF 14% acima da LR.
Utilizaram-se, para o Teste 2, da mesma forma que para a OP 2 neutra, as ressínteses
(6.7.3.5.c) e (6.7.3.6), ilustradas pelas figuras 6.44 e 6.45, abaixo:
Figura 6.44 – Processo de ressíntese (6.7.3.5.c) da OP 2 monotônica para a pré-indicação final
186
Figura 6.45 – Processo de ressíntese (6.7.3.6) da OP 2 monotônica para a pré-indicação final
6.8. RESSÍNTESE DAS OPS 2 MONOTÔNICAS COM F0 DESCENDENTE
6.8.1. Pré-indicação concessiva
A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 concessiva de
referência, seguiu os seguintes passos:
6.8.1.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 12% acima da LR no início da vogal da
sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 4%;
c. variação descendente da F0, na consoante da STF, em 30%;
d. variação descendente da F0, na VTF, em 50%;
e. elevação de toda a frase em 30%;
f. formação de ponto de pitch no ponto médio da VTF;
6.8.1.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato côncavo, a
partir do ponto de pitch criado na F0,
a. com concavidade em 10%;
b. com concavidade em 15%;
c. com concavidade em 20%;
6.8.1.3 cumulativamente, adaptação da duração de todos os fones da frase, assimilando-a ao
verificado na OP de referência.
Também para o processo de ressíntese da OP 2 monotônica, optou-se pela adaptação da
duração de toda a frase à duração verificada na OP 2 concessiva de referência.
187
Utilizaram-se, para o Teste 2, as ressínteses (6.8.1.1) e (6.8.1.2.b), ilustradas pelas figuras
6.46 e 6.47, abaixo, da mesma forma que para a OP 2 neutra:
Figura 6.46 – Processo de ressíntese (6.8.1.1) da OP 2 monotônica para a pré-indicação concessiva
Figura 6.47 – Processo de ressíntese (6.8.1.2.b) da OP 2 monotônica para a pré-indicação concessiva
6.8.2. Pré-indicação conformativa
A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 conformativa de
referência, seguiu os seguintes passos:
188
6.8.2.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 17% acima da LR no início da vogal da
sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 10%;
c. variação descendente da F0, na consoante da STF, em 37%;
d. variação descendente da F0, na VTF, em 19%;
e. elevação de toda a frase em 30%;
f. formação de ponto de pitch no ponto médio da VTF;
6.8.2.2 modulação da F0, na VTF, conferindo-lhe um formato côncavo, a partir do ponto de pitch
criado na F0,
a. com convexidade em 5%;
b. com convexidade em 10%;
c. com convexidade em 15%;
d. com convexidade em 20%;
6.8.2.3 cumulativamente, adaptação da duração de todos os fones da frase, assimilando-a à OP
de referência.
Para a realização do Teste 2, utilizaram-se as ressínteses (6.8.2.1) e (6.8.2.2.d), ilustradas
pelas figuras 6.48 e 6.49, abaixo:
Figura 6.48 – Processo de ressíntese (6.8.2.1) da OP 2 monotônica para a pré-indicação conformativa
189
Figura 6.49 – Processo de ressíntese (6.8.2.2.d) da OP 2 monotônica para a pré-indicação conformativa
6.8.3. Pré-indicação temporal
O processo de ressíntese da OP 2 monotônica para obtenção da pré-indicação temporal
seguiu os seguintes passos:
6.8.3.1 modulação da F0 englobando, simultaneamente, as seguintes características:
a. ponto inicial da curva descendente elevado 14% acima da LR no início da vogal da
sílaba anterior à SPreTF;
b. variação descendente da F0, na VPreTF, em 11%;
c. variação descendente da F0, na consoante da STF, em 34%;
d. variação descendente da F0, na VTF, em 5%;
e. elevação de toda a frase em 30%;
6.8.3.2 cumulativamente, manipulação da F0 na VPreTF, tornando-a mais linear;
6.8.3.3 cumulativamente, redução da duração da VTF em 10%;
6.8.3.4 cumulativamente, aumento da duração da consoante da STF em 19%;
6.8.3.5 cumulativamente, redução da duração do segmento /travasi/, assemelhando-a ao
verificado na OP 2 temporal de referência;
6.8.3.6 ressíntese (6.8.3.5) excluindo a ressíntese (6.8.3.4);
6.8.3.7 ressíntese (6.8.3.5) excluindo a ressíntese (6.8.3.3);
6.8.3.8 ressíntese (6.8.3.5) excluindo as ressínteses (6.8.3.3) e (6.8.3.4).
190
Esse processo de ressíntese manteve as mesmas modificações utilizadas para a OP 2
neutra, aplicando-se a mesma justificativa para a escolha por modificar a duração do segmento
/travasi/.
Utilizaram-se, para o Teste 2, as ressínteses (6.8.3.2) e (6.8.3.4), ilustradas pelas figuras
6.50 e 6.51, abaixo:
Figura 6.50 – Processo de ressíntese (6.8.3.2) da OP 2 monotônica para a pré-indicação temporal
Figura 6.51 – Processo de ressíntese (6.8.3.4) da OP 2 monotônica para a pré-indicação temporal
191
7. DESCRIÇÃO E ANÁLISE DOS RESULTADOS DO TESTE 2
O objetivo do Teste 2 foi identificar, a partir do julgamento de vinte falantes nativos do
PB, quais parâmetros prosódicos modificados nas ressínteses produzidas para as versões neutra e
monotônica das OPs 1 e 2 seriam responsáveis pelo caráter identitário de cada uma das seis
subcategorias pré-indicativas selecionadas no Teste 1. O Teste 2 consistiu no cruzamento por
análise combinatória de cada uma das duas versões ressintetizadas escolhidas das OPs 1 e 2,
isoladamente, com todas as possibilidades (remanescentes do Teste 1) de OSAdvs. Como
discutido em 5.3, o Teste 2 foi construído a partir apenas dos seis contornos pré-indicativos que
apresentaram pelo menos cinco contrastes significativos (num universo de oito) no Teste 1,
quando em contraste com as outras subcategorias, ou seja, os contornos causal, consecutivo,
final, concessivo, conformativo e temporal.
Para a análise estatística dos resultados obtidos, utilizou-se o Teste Chi-quadrado, uma
vez que o Teste 2 buscou analisar se uma determinada OSAdv foi associada à OP ressintetizada
dentro das expectativas semânticas iniciais (o objetivo, como já discutido, foi adaptar, por meio
da modificação dos componentes prosódicos, as versões neutra e monotônica das OPs 1 e 2 aos
contornos pré-indicativos de referência utilizados para o Teste 1), distinguindo, assim, as seis
subcategorias pré-indicativas detectadas a partir do resultado obtido com o Teste 1. Estabeleceu-
se, então, como pretensamente “correta” a associação da OP ressintetizada com a OSAdv que
estaria sendo pré-indicada. Assim, as expectativas iniciais foram as de que uma OP ressintetizada
de forma a produzir a pré-indicação de causa fosse associada à OSAdv causal.
Nessa situação específica, o grau de liberdade estabelecido é 1, e para que o valor p seja
igual ou inferior a 0,05, o resultado do Teste Chi-quadrado deve ser igual ou superior a 3,84. O
índice de significância considerado foi p ≤ 0,05. Como será observado, alguns índices
mostraram-se significativos em sentido inverso ao da expectativa do cruzamento, sugerindo que
a ressíntese que pretensamente deveria pré-indicar um valor causal, por exemplo, estaria, na
verdade, indicando um valor de finalidade.
A análise estatística a partir de um Teste T pareado sugeriu não haver diferença
significativa entre o total dos resultados obtidos para as ressínteses considerando-se apenas as
OPs neutras ou apenas as OPs monotônicas. De uma forma geral, portanto, parece razoável
considerar que um parâmetro prosódico específico que tenha sido modificado na ressíntese a ou
na ressíntese b seja considerado como responsável pela pré-indicação em questão, mesmo que o
192
contraste dessa pré-indicação com outra subcategoria tenha sido significativo apenas na
ressíntese, por exemplo, da OP 1 neutra, mas não da OP 1 monotônica.
Test T séries emparelhadas
Desvio teórico = 0
Desvio médio df t p
OP1 neutra, OP2 neutra
OP1 neutra, OP1 monoton
OP1 neutra, OP2 monoton
OP2 neutra, OP1 monoton
OP2 neutra, OP2 monoton
OP1 monoton, OP2 monoton
Tabela 7.1 – Resultados obtidos a partir de um Teste T pareado, indicando que os números totais de reconhecimento
das ressínteses a e b não são significativamente distintos.
Os resultados ideais para o Teste 2 seriam aqueles em que, de cada grupo de duas
ressínteses produzidas para cada OP (neutra ou monotônica) em uma subcategoria pré-indicativa,
apenas uma fosse significativamente escolhida – e não as duas, ou nenhuma delas. Esse ponto
ideal, no entanto, não foi atingido, como se observará a seguir, com a descrição dos resultados.
7.1 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CAUSAL
As OPs 1 e 2, em suas versões neutra e monotônica, foram ressintetizadas de 24 formas
diferentes, explorando a formação do vale da F0, com a centralização da concavidade formadora
dessa vale; a elevação da F0 acima da LR; o posicionamento da F0 anteriormente à SPreTF (cf.
6.1.2, 6.3.2, 6.5.2 e 6.7.2).
Constituíram o Teste 2, na modalidade neutra das OPs, as ressínteses 6.1.2.3.i (OP 1) e
6.5.2.3.f (OP 2) (versão a), 6.1.2.4 (OP 1) e 6.5.2.4.f (OP 2) (versão b); e na modalidade
monotônica, as ressínteses 6.3.2.3.i (OP 1) e 6.7.2.3.f (OP 2) (versão a), 6.3.2.4 (OP 1) e 6.7.2.4
(OP 2) (versão b).
Considerando-se as OPs 1 neutra e monotônica, e a OP 2 neutra, a versão a foi
caracterizada pela redução de 0,5 VR no vale da F0, com sua concavidade centralizada, e a F0 na
VTF elevada a 5 VRs acima da LR – segundo a indicação original do programa Praat, a 264Hz
tanto para a OP 1 neutra quanto para a monotônica e, na realidade, a 251Hz para a OP 1 neutra, e
-,667 5 -,542 ,6109
-,333 5 -,415 ,6952
,667 5 ,474 ,6554
,333 5 ,271 ,7971
1,333 5 1,865 ,1212
1,000 5 ,745 ,4896
193
a 262Hz para a OP 1 monotônica. Considerando-se as OPs 2 neutra e monotônica, essa elevação
da F0 se faz a 216Hz.
No caso das OPs 1, a versão b consistiu dos parâmetros utilizados para a versão a,
acrescidos da elevação da F0 anterior à SPreTF 3% acima da LR, produzindo uma média, nesse
segmento, de 136Hz. Já para as OPs 2, a versão b foi caracterizada pelas modificações nos
parâmetros prosódicos utilizadas na versão a e, cumulativamente, o aumento da duração da
consoante na STF em 23%, assemelhando-a à duração desse mesmo segmento na OP 2 causal de
referência (cf. figuras 6.3 e 6.4 (OP 1 neutra); 6.28 e 6.29 (OP 2 neutra); 6.15 e 6.16 (OP 1
monotônica); 6.40 e 6.41 (OP 2 monotônica)).
Os resultados referentes ao cruzamento das ressínteses a e b para a subcategoria causal,
obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.2, e discutidos a seguir.
CAUSAL
OP 1 neutra
causal a x
conces
causal b x
conces
causal a x
confor
causal b x
confor
causal a x
consec
causal b x
consec
causal a x
final
causal b x
final
causal a x
tempor
causal b x
tempor
Chi2(a) 0 5 1,8 5 0,8 0,2 0,2 5 0,8 0,8
p 1 0,025 0,180 0,025 0,371 0,655 0,655 0,025 0,371 0,371
CAUSAL
OP 1 monoton
causal a x
conces
causal b x
conces
causal a x
confor
causal b x
confor
causal a x
consec
causal b x
consec
causal a x
final
causal b x
final
causal a x
tempor
causal b x
tempor
Chi2(a) 0,2 0,8 5 9,8 5 0,8 5 0 5 7,2
p 0,655 0,371 0,025 0,002 0,025 0,371 0,025 1 0,025 0,007
CAUSAL
OP 2 neutra
causal a x
conces
causal b x
conces
causal a x
confor
causal b x
confor
causal a x
consec
causal b x
consec
causal a x
final
causal b x
final
causal a x
tempor
causal b x
tempor
Chi2(a) 5 1,8 1,8 5 5 3,2 9,8 3,2 5 1,8
p 0,025 0,180 0,180 0,025 0,025 0,074 0,002 0,074 0,025 0,180
CAUSAL
OP 2 monoton
causal a x
conces
causal b x
conces
causal a x
confor
causal b x
confor
causal a x
consec
causal b x
consec
causal a x
final
causal b x
final
causal a x
tempor
causal b x
tempor
Chi2(a) 1,8 0,2 0,2 1,8 0,2 0 0 1,8 1,8 5
p 0,180 0,655 0,655 0,180 0,655 1 1 0,180 0,180 0,025
(a) 0 células (,0%) com freqüências esperadas menor do que 5. A freqüência de célula esperada é
10,0.
Tabela 7.2 – Resultados de um Teste Chi2 (df=1) para a subcategoria causal, a partir do cruzamento das ressínteses
a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza ou hachuradas apresentam índice de
significância p 0,05. As células hachuradas indicam que o resultado se obteve em sentido inverso: a ressíntese foi reconhecida como pré-indicativa das outras subcategorias que não a causal.
7.1.1 OP 1 ressintetizada para a pré-indicação de causa
Os resultados obtidos indicam que, no universo dos participantes do Teste 2, a versão a
da ressíntese da OP 1 neutra para produzir a pré-indicação causal não se apresentou de forma
significativa em nenhum dos cruzamentos. Já a versão b distinguiu-se significativamente das
modalidades concessiva e conformativa.
194
Observe-se que o cruzamento entre a versão b e a modalidade final produziu um índice de
significância em sentido inverso, ou seja, o percentual de votos negativos para a OSAdv causal
(no caso, 75%) acabou por sugerir que a versão b é, na verdade, pré-indicativa de finalidade.
Considerando-se a OP 1 monotônica, os resultados indicam que a versão a da ressíntese
da OP 1 monotônica para produzir a pré-indicação causal apresentou-se de forma significativa
nos cruzamentos com as modalidades conformativa, consecutiva e final. Já a versão b distinguiu-
se significativamente da modalidade conformativa. Portanto, tanto a versão a quanto a versão b,
quando em contraste com a modalidade conformativa, mostraram-se significativas (embora o
índice de significância da versão a tenha sido consideravelmente inferior ao da versão b).
O cruzamento entre as versões a e b e a modalidade temporal produziu um índice de
significância em sentido inverso, ou seja, o percentual de votos negativos para a OSAdv causal
(75%, no caso da versão a; 80%, no caso da versão b) acabou por sugerir que a versão b é, na
verdade, pré-indicativa de temporalidade.
7.1.2 OP 2 ressintetizada para a pré-indicação de causa
No universo dos participantes do Teste 2, a versão a da ressíntese da OP 2 neutra para
produzir a pré-indicação causal apresentou-se de forma significativa nos cruzamentos com as
modalidades concessiva e temporal. Já a versão b distinguiu-se significativamente da modalidade
conformativa.
Observe-se que o cruzamento entre a versão a e as modalidades consecutiva e final
produziu um índice de significância em sentido inverso, ou seja, o percentual de votos negativos
para a OSAdv causal (75%, em contraste com a consecutiva; 85%, em contraste com a final)
acabou por sugerir que a versão b é, na verdade, pré-indicativa de conseqüência e de finalidade.
No tocante à OP 2 monotônica, a versão a da ressíntese para produzir a pré-indicação
causal não se apresentou de forma significativa em nenhum dos cruzamentos. Já a versão b
distinguiu-se significativamente da modalidade temporal.
195
7.1.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação causal
A título de recapitulação, no Teste 1, a OP 1 causal foi significativamente reconhecida
quando em contraste com as OPs 1 comparativa, concessiva, conformativa, consecutiva e
temporal. A OP 2, no entanto, contrastou-se apenas em relação às OPs concessiva e consecutiva.
De acordo com o critério utilizado para a seleção das pré-indicações mais bem contrastadas –
contraste significativo em relação a cinco outros contornos pré-indicativos, no total de oito
possíveis cruzamentos –, as ressínteses das OPs 1 e 2 causais foram analisadas em cruzamento
com os contornos concessivo, conformativo, consecutivo, final e temporal, lembrando que, no
Teste 1, a pré-indicação causal não foi significativamente reconhecida quando em contraste com
a pré-indicação final.
Como observado, as ressínteses para a pré-indicação causal produziram contraste
significativo em relação à OSAdv concessiva tanto para a OP 1 quanto para a OP 2, mas apenas
na modalidade neutra das OPs. Para a OP 1, o resultado sugere a pré-indicação a partir da
ressíntese b; para a OP 2, a partir da ressíntese a. A diferença entre essas duas ressínteses, no
caso das OPs 1, está na elevação da F0 anterior à SPreTF, realizada apenas na ressíntese b; no
caso das OPs 2, essa elevação não foi utilizada, sendo, por outro lado, aumentada a duração da
consoante da STF. Os índices de significância mostraram-se idênticos em ambos os casos
(Chi2=5, df=1, p=0,025), sugerindo, no caso da OP 1, que essa elevação da F0 poderia ser
considerada facultativa para a caracterização do contorno pré-indicativo causal e, no caso da OP
2, que o aumento da duração não é necessário. No entanto, não parece razoável desconsiderar
que, no caso da OP 1 neutra, a ressíntese a foi igualmente atribuída às OSAdvs causal e
concessiva (Chi2=0, df=1, p=1). Uma vez que a pré-indicação causal apresenta formato
ascendente de F0 na STF, e a concessiva, formato descendente, o fato de tanto a ressíntese a
quanto a ressíntese b terem obtido os mesmos índices de reconhecimento talvez seja reflexo de o
contraste entre as duas pré-indicações fazer-se de forma suficiente apenas pela oposição dos
formatos da F0.
O segundo contraste significativo para as ressínteses para a pré-indicação causal se deu
em relação à OSAdv conformativa, tanto para a OP 1 (neutra e monotônica) quanto para a OP 2
(apenas neutra). Exceto na OP 1 monotônica, em que ambas as ressínteses a e b foram
significativamente reconhecidas como pré-indicativas de causa, foi a ressíntese b que prevaleceu
no cômputo geral, considerando-se inclusive que, no caso da OP 1 monotônica, o índice de
significância da ressíntese b (Chi2=9,8, df=1, p=0,002) foi melhor que o da ressíntese a
(Chi2=5, df=1, p=0,025). O resultado desse cruzamento sugere, então, que a elevação da F0
196
anterior à SPreTF, diferenciador das duas ressínteses, é indispensável, no caso da OP 1, da
mesma forma que o aumento da duração, no caso da OP 2. No entanto, não se deve perder de
vista o fato de que, como no cruzamento anterior, a pré-indicação conformativa apresenta
formato descendente da F0, em contraste com o formato ascendente da pré-indicação causal.
O terceiro contraste significativo se deu em relação à OSAdv consecutiva, embora de
forma um tanto quanto problemática. Apenas a ressíntese a na OP 1 monotônica para produzir a
pré-indicação de causa apresentou índice significativo de diferenciação, o que sugere que, no
contraste causa/conseqüência, a elevação da F0 anterior à SPreTF da OP 1 não é necessário. No
entanto, observe-se que, considerando-se a OP 2 neutra, o contraste se deu de forma inversa, ou
seja, a ressíntese a para a OP 2 causal de referência (que não contém o aumento da duração da
consoante na STF, reservado à ressíntese b) foi reconhecida como pré-indicativa de
conseqüência43
. Uma vez que essas duas pré-indicações apresentam a F0 com contorno
ascendente, duas hipóteses precisam ser levantadas: ou os índices prosódicos para a pré-
indicação de causa não são, estritamente, os manipulados nas ressínteses a e b; ou há uma
interferência da estrutura da OP 2 (que apresenta uma sílaba pós-tônica final) sobre esse
contraste44
.
Em situação semelhante se encontra o quarto contraste, estabelecido em relação à OSAdv
final. Apenas a ressíntese a foi reconhecida como pré-indicativa de causa, e apenas na OP 1
monotônica. No caso da OP 1 neutra, a ressíntese b e, no caso da OP 2 neutra, a ressíntese a
foram reconhecidas de forma inversa, ou seja, como pré-indicativas de finalidade (contorno
ascendente da F0). Como já discutido em relação ao formato ascendente da F0, no início do
capítulo 6, a hipótese de diferenciação entre os contornos pré-indicativos causal e final reside no
valor máximo de elevação da F0 na VTF (mais elevado no causal que no final). O que se
percebe, portanto, é um conflito entre os resultados, sugerindo que algum outro fator prosódico
estaria interferindo nessa diferenciação. No entanto, como será analisado em 7.5, mais à frente, a
pré-indicação final foi bem diferenciada da OSAdv causal, considerando-se apenas esse
componente prosódico.
43 Como será analisado em 7.4, o aumento na duração da consoante na STF parece se colocar como índice prosódico
significativo para a construção do contorno pré-indicativo de conseqüência. 44 Deve-se levar em consideração que, embora estejam sendo manipulados dois parâmetros distintos (elevação da F0
anteriormente à SPreTF, na OP 1, e aumento da duração da consoante na STF, na OP 2), essas manipulações
ocorreram com o intuito de assemelhar o resultado auditivo final das ressínteses ao verificado nas OPs de referência,
a partir do Teste 1. Embora, em princípio, essa diferença de parâmetros possa parecer metodologicamente
incoerente, ela se fez necessária por conta da própria estrutura inerente a cada uma das OPs. Foram escolhidas para
constituir o Teste 2 as ressínteses que, consideradas as OPs 1 e 2 isoladamente, realmente pareciam mostrar conflito
entre os parâmetros prosódicos manipulados.
197
No último contraste significativo, as ressínteses para a pré-indicação causal talvez
possam ser diferenciadas da OSAdv temporal. A ressíntese a, como já descrito, foi reconhecida
de forma significativa no caso da OP 2 neutra, e a b, no caso da OP 2 monotônica. Isso sugeriria
que o aumento da duração na consoante da STF não se colocaria como condição indispensável
para a pré-indicação causal, considerando-se a OP 2. Reconhecimento inverso, no entanto, se
processou para ambas as ressínteses, quando considerada a OP 1 monotônica, ou seja, as
ressínteses estariam caracterizando a pré-indicação temporal.
O reconhecimento em sentido inverso, verificado nos cruzamentos das ressínteses das
OPs 1 e 2 pré-indicativas de causa com as OSAdvs consecutiva e final está, de certa forma,
dentro de uma certa previsibilidade, uma vez que as três modalidades apresentam a F0 com
contorno ascendente. No entanto, caso se desprezem esses reconhecimentos em sentido inverso,
os resultados obtidos para a ressíntese a, que tem como ponto central o valor máximo atingido
pela F0 na VTF, confirmariam a hipótese de ser esse ponto de elevação da F0 o fator prosódico
responsável pela diferenciação entre as três pré-indicações.
A comparação entre os prosogramas gerados para essas três subcategorias (cf. figura 7.1)
indica que a variação de F0 na VTF da OP 1 é sensível ao ouvido humano. A variação da F0
nesse segmento é de 10 semitons, para a OP 1 causal, contra 8 semitons para a OP 1 consecutiva
e 6 semitons para a OP 1 final de referência (valores aproximados). Considerando-se a OP 2, a
subcategoria causal foi a única que apresentou, segundo os prosogramas, variação interna de
pitch, com aproximadamente 6 semitons. As subcategorias consecutiva e final não apresentaram
variação sensível nesse segmento, embora, se considerada em relação à vogal da sílaba pré-
tônica, em ambos os casos a variação ascendente foi também de aproximadamente seis semitons.
A análise a partir dos prosogramas, em ambas as OPs, confirma a indicação de ser a variação de
pitch na VTF o diferencial entre a pré-indicação causal e a final (como será discutido mais à
frente, a duração da consoante de ataque nessa sílaba parece ter papel indispensável na pré-
indicação consecutiva). Se realmente for possível diferenciar essas três subcategorias
prosodicamente, não se deve descartar, no entanto, a hipótese de haver algum outro componente
que não tenha sido explorado nos processos de ressíntese utilizados nesta pesquisa.
O resultado obtido em sentido inverso não seria previsível no cruzamento com a OSAdv
temporal. Esse resultado talvez se deva a fatores não-prosódicos, uma vez que o contorno aqui
assumido como pré-indicativo de temporalidade apresenta a F0 com modulação descendente na
STF. Embora não seja objeto desta pesquisa, não parece inapropriado sugerir que a interferência
do fator semântico pode ter se colocado de forma significativa. Não se descarta uma certa
198
ambigüidade entre a noção de causa e a de tempo (cf. seção 5.1.4.1). Assim, alguém ficar infeliz
porque o trabalho não produz frutos implica, subjacentemente, que, quando o trabalho não
produz frutos, essa pessoa se torna infeliz. Da mesma forma, alguém ficar infeliz quando não lhe
permitem falar, implica que o fato de não lhe permitirem falar é causador de sua infelicidade.
199
OP 1 causal OP 1 comparativa
OP 1 concessiva OP 1 condicional
OP 1 conformativa OP 1 consecutiva
OP 1 final OP 1 proporcional
OP 1 temporal
Figura 7.1 – Prosogramas para as OPs 1 de referência. No eixo vertical, os algarismos representam a quantidade de
semitons, referenciados a partir de 1Hz. A seta indica a equivalência a 150Hz. O espaço entre as linhas
horizontais pontilhadas indica uma variação de 2 semitons.
200
OP 2 causal OP 2 comparativa
OP 2 concessiva OP 2 condicional
OP 2 conformativa OP 2 consecutiva
OP 2 final OP 2 proporcional
OP 2 temporal
Figura 7.2 – Prosogramas para as OPs 2 de referência. No eixo vertical, os algarismos representam a quantidade de semitons, referenciados a partir de 1Hz. A seta indica a equivalência a 150Hz. O espaço entre as linhas
horizontais pontilhadas indica uma variação de 2 semitons.
201
7.2. CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONCESSIVA
As OPs 1 e 2, em suas versões neutra e monotônica, foram ressintetizadas de 7 formas
diferentes, adaptando a F0 a partir da VPreTF a um formato descendente, com elevação da F0 de
toda a frase em 30%; formação de concavidade na F0 da VTF; redução da duração da sílaba /ka/,
na OP 1, e de todos os segmentos, na OP 2, de forma a assemelhar a duração da OP a ser
ressintetizada à duração da versão original da OP 2 concessiva de referência (cf. 6.2.1, 6.4.1,
6.6.1 e 6.8.1).
Constituíram o Teste 2, na modalidade neutra das OPs, as ressínteses 6.2.1.1 (OP 1) e
6.6.1.1 (OP 2) (versão a), 6.2.1.2.b (OP 1) e 6.6.1.2.b (OP 2) (versão b); e na modalidade
monotônica, as ressínteses 6.4.1.1 (OP 1) e 6.8.1.1 (OP 2) (versão a), 6.4.1.2.b (OP 1) e 6.8.1.2.b
(OP 2) (versão b).
Em ambos os casos, a versão a foi caracterizada pela conformação descendente da F0 a
partir da VPreTF (cf. detalhes em 6.2.1.1). A versão b consistiu dos parâmetros utilizados para a
versão a, acrescidos da formação de uma concavidade de 15% na F0 da VTF (cf. figuras 6.7 e
6.8 (OP 1 neutra); 6.32 e 6.33 (OP 2 neutra); 6.19 e 6.20 (OP 1 monotônica); 6.44 e 6.45 (OP 2
monotônica)).
Os resultados referentes ao cruzamento das ressínteses a e b para a subcategoria
concessiva, obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.3, e
discutidos a seguir.
202
CONCESSIVA
OP 1 neutra
conces a x
causal
conces b x
causal
conces a x
confor
conces b x
confor
conces a x
consec
conces b x
consec
conces a x
final
conces b x
final
conces a x
tempor
conces b x
tempor
Chi2(a) 0,8 0,2 5 5 0,8 12,8 5 0,8 3,2 1,8
p 0,371 0,655 0,025 0,025 0,371 0,0003 0,025 0,371 0,074 0,180
CONCESSIVA
OP 1 monoton
conces a x
causal
conces b x
causal
conces a x
confor
conces b x
confor
conces a x
consec
conces b x
consec
conces a x
final
conces b x
final
conces a x
tempor
conces b x
tempor
Chi2(a) 5 0 7,2 9,8 5 7,2 5 9,8 0,8 0
p 0,025 1 0,007 0,002 0,025 0,007 0,025 0,002 0,371 1
CONCESSIVA
OP 2 neutra
conces a x
causal
conces b x
causal
conces a x
confor
conces b x
confor
conces a x
consec
conces b x
consec
conces a x
final
conces b x
final
conces a x
tempor
conces b x
tempor
Chi2(a) 5 1,8 0,8 0 9,8 7,2 9,8 7,2 0,8 5
p 0,025 0,180 0,371 1 0,002 0,007 0,002 0,007 0,371 0,025
CONCESSIVA
OP 2 monoton
conces a x
causal
conces b x
causal
conces a x
confor
conces b x
confor
conces a x
consec
conces b x
consec
conces a x
final
conces b x
final
conces a x
tempor
conces b x
tempor
Chi2(a) 5 5 0,2 5 5 16,2 7,2 7,2 0,8 5
p 0,025 0,025 0,655 0,025 0,025 0,0001 0,007 0,007 0,371 0,025
(a) 0 células (,0%) com freqüências esperadas menor do que 5. A freqüência de célula esperada é
10,0.
Tabela 7.3 – Resultados de um Teste Chi2 (df=1) para a subcategoria concessiva, a partir do cruzamento das
ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza ou hachuradas
apresentam índice de significância p 0,05. A célula hachurada indica que o resultado se obteve em sentido inverso: a ressíntese foi reconhecida como pré-indicativa de outra subcategoria que não a concessiva.
7.2.1 OP 1 ressintetizada para a pré-indicação de concessão
Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da
ressíntese da OP 1 neutra para produzir a pré-indicação concessiva apresentou-se de forma
significativa nos cruzamentos com as modalidades conformativa e final. A versão b distinguiu-se
significativamente das modalidades conformativa e consecutiva.
Em relação à OP 1 monotônica, a versão a da ressíntese para produzir a pré-indicação
concessiva apresentou-se de forma significativa nos cruzamentos com as modalidades causal,
conformativa e final. Já a versão b distinguiu-se significativamente das modalidades
conformativa e consecutiva. Portanto, tanto a versão a quanto a versão b, quando em contraste
com as modalidades conformativa e final, mostraram-se significativas.
Observe-se que, no caso da versão a em contraste com a modalidade consecutiva, a
significância se deu em sentido inverso, ou seja, os votos negativos para a OSAdv concessiva
acabaram por sugerir que a versão a é, na verdade, pré-indicativa de conseqüência.
203
7.2.2 OP 2 ressintetizada para a pré-indicação de concessão
A indicação dos resultados obtidos é a de que, no universo dos participantes do Teste 2, a
versão a da ressíntese da OP 2 neutra para produzir a pré-indicação concessiva apresentou-se de
forma significativa nos cruzamentos com as modalidades causal, consecutiva e final. A versão b
distinguiu-se significativamente das modalidades consecutiva, final e temporal. Observa-se,
portanto, que ambas as versões a e b mostraram-se significativas quando em contraste com as
modalidades consecutiva e final.
Em relação à OP 2 monotônica, a versão a da ressíntese para produzir a pré-indicação
concessiva apresentou-se de forma significativa nos cruzamentos com as modalidades causal,
consecutiva e final. Já a versão b distinguiu-se significativamente das modalidades causal,
conformativa, consecutiva, final e temporal. Portanto, ambas as versões a e b mostraram-se
significativas quando cruzadas com as OSAdvs causal, consecutiva, final e temporal. Observe-se
que a versão b, no caso do cruzamento com a OSAdv consecutiva, apresentou melhor índice de
significância que a versão a.
7.2.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação
concessiva
No Teste 1, a pré-indicação de concessão foi significativamente distinguida das OSAdvs
causal, conformativa, consecutiva, proporcional e temporal, considerando-se a OP 1, e também
da OSAdv final, considerando-se a OP 2. Pelo critério adotado para a seleção das OPs a serem
utilizadas no Teste 2, as ressínteses das OPs 1 e 2 neutras e monotônicas, versões a e b, foram
cruzadas, então, com as OSAdvs causal, conformativa, consecutiva, final e temporal.
De acordo com os resultados do Teste 2, as ressínteses para a pré-indicação concessiva
(movimento descendente da F0) produziram contraste significativo em relação à OSAdv causal
(movimento ascendente da F0), considerando-se a OP 1 monotônica e as OPs 2 neutra e
monotônica. A ressíntese a foi reconhecida como pré-indicativa do valor concessivo nas três
situações, e também a ressíntese b na OP 2 monotônica. A diferença entre as duas ressínteses
reside apenas na formação de uma concavidade na F0 durante a VTF, conforme descrito em
6.2.1.2.b. Uma vez que o índice de significância nesses contrastes foi o mesmo (Chi2=5, df=1,
p=0,025); que a ressíntese b mostrou-se significativamente contrastada apenas na OP 2
monotônica; que a ressíntese b foi totalmente confundida com a OSAdv causal na OP 1
204
monotônica (Chi2=0, df=1, p=1), a indicação parece se colocar no sentido de a formação dessa
concavidade, utilizada para a ressíntese b, ser dispensável na configuração prosódica da pré-
indicação concessiva.
Considerando-se o cruzamento com a OSAdv conformativa (movimento descendente da
F0), tanto a ressíntese a quanto a b foram significativamente reconhecidas como pré-indicativas
de concessão nas OPs 1 neutra e monotônica. Na OP 2 monotônica, apenas a ressíntese b foi
significativamente reconhecida. O índice de significância tendo sido o mesmo (Chi2=5, df=1,
p=0,025) em três cruzamentos (OP 1 neutra, a e b; OP 2 monotônica, b), a tendência para a
indicação de uma das ressínteses como contendo os parâmetros prosódicos apropriados para a
pré-indicação concessiva talvez se estabeleça em direção à ressíntese b, uma vez que, na OP 1
monotônica, seu índice de significância (Chi2=9,8, df=1, p=0,002) foi o melhor de todos (muito
embora a ressíntese a, nessa mesma OP 1 monotônica, apresente Chi2=7,2, df=1, p=0,007).
Assumindo-se esse referencial, a formação da concavidade na F0 da VTF, verificada na
ressíntese b, seria, então, necessária para a pré-indicação concessiva, considerando-se que, para a
conformação prosódica da pré-indicação conformativa, foi assumida a hipótese de que o formato
convexo da F0 na VTF seria o índice prosódico indispensável a essa pré-indicação.
No cruzamento com a OSAdv consecutiva, houve reconhecimento significativo da pré-
indicação concessiva em todas as quatro OPs. No universo das OPs 1 neutra e monotônica,
apenas a ressíntese b foi reconhecida significativamente, sendo que a ressíntese a, na OP 1
monotônica, apresentou índice de significância em sentido inverso: a pré-indicação seria não a
de concessão, mas a de conseqüência (movimento ascendente da F0). De uma forma geral, a
ressíntese b apresenta os melhores índices de significância, se comparados aos da ressíntese a, o
que levaria à sugestão, mais uma vez, de que, para a pré-indicação concessiva, o formato
côncavo da F0 na VTF é indispensável.
Em relação ao cruzamento com a OSAdv final, houve reconhecimento significativo da
pré-indicação concessiva também em todas as quatro OPs. A distinção só não se mostrou
significativa em relação à ressíntese b na OP 1 neutra. Como a ressíntese b evidenciou um índice
de significância (Chi2=9,8, df=1, p=0,002) mais elevado do que a ressíntese a (Chi2=5, df=1,
p=0,025) na OP 1 monotônica, o inverso ocorrendo na OP 2 neutra (ressíntese a com Chi2=9,8,
df=1, p=0,002 e ressíntese b com Chi2=7,2, df=1, p=0,007), a propensão a identificar a
ressíntese a como a mais apropriada para a distinção em relação à pré-indicação final
(movimento ascendente da F0) seria decorrência do cruzamento a partir da OP 1 neutra, em que
apenas essa ressíntese a foi significativamente contrastada.
205
No universo do cruzamento com a OSAdv temporal, os reconhecimentos significativos
da pré-indicação concessiva se deram apenas nas OPs 2, tanto neutra quanto monotônica, e
apenas para a ressíntese b, sugerindo, mais uma vez, que a formação da concavidade na F0 da
VTF seria indispensável para a caracterização do contorno pré-indicativo concessivo.
Analisando-se esses resultados como um todo, a ressíntese a parece mostrar-se mais
relevante que a b nos contrastes com as OSAdvs causal e final. É interessante observar que,
nesses casos específicos, as pré-indicações de causalidade e de finalidade têm os contornos
prosódicos assumidos com a F0 ascendente na STF. Uma vez que a pré-indicação concessiva
apresenta a F0 descendente nesse segmento, a formação ou não de uma concavidade na F0 da
VTF não seria indispensável. A diferenciação seria feita, essencialmente, pelo caráter ascendente
ou descendente da F0.
Por outro lado, a ressíntese b parece mostrar-se como tendência nos cruzamentos com as
OSAdvs conformativa, consecutiva e temporal. À exceção da pré-indicação consecutiva, que
apresenta movimento ascendente da F0, as outras duas pré-indicações são assumidas a partir do
movimento descendente da F0, da mesma forma que a pré-indicação concessiva. Isso parece
sugerir que a formação da concavidade da F0 na VTF (em associação com as outras
características descritas em 6.2.1.1) seria o parâmetro prosódico diretamente responsável pela
identidade da pré-indicação concessiva.
Se consideradas as representações obtidas com os prosogramas (cf. figuras 7.1 e 7.2), a
formação da concavidade na F0 da VTF não seria perceptível ao ouvido humano, o que, de certa
forma, contradiz os resultados obtidos com o Teste 2. É preciso analisar os cruzamentos entre as
subcategorias com movimento descendente de F0 de forma isolada.
Caso se considere o contraste entre a pré-indicação concessiva e a temporal, o resultado
indica que a ressíntese b foi a única significativa. No entanto, deve-se observar que a hipótese
central assumida para a caracterização da pré-indicação temporal (cf. 7.6) é a forma plana da F0
na VTF, em oposição à forma descendente nas pré-indicações concessiva e conformativa. Se
essa hipótese for verdadeira, a formação da concavidade na forma descendente seria dispensável.
Deve-se observar, no entanto, que a ressíntese a para a pré-indicação concessiva não foi
reconhecida significativamente em nenhum dos cruzamentos com a pré-indicação temporal.
O cruzamento entre a pré-indicação concessiva e a conformativa (ambas com formato
descendente da F0 na VTF), no entanto, indicou a ressíntese b como a detentora da melhor
freqüência de reconhecimento contrastivo. Esse resultado sugere, por si só, que a formação da
concavidade na VTF seria um fator significativo na caracterização da pré-indicação concessiva.
206
Como dito acima, no entanto, a análise produzida pelo prosograma não apresentou essa
indicação. Não é possível afirmar categoricamente que isso se deva a uma falha nessa
representação, mas é interessante observar (cf. figura 7.1) que ambas as OPs 1 condicional e
final de referência apresentam, na VTF, um movimento ascendente-descendente da F0, que foi
identificado no prosograma apenas da OP 1 final.
7.3 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONFORMATIVA
As OPs 1 e 2, em suas versões neutra e monotônica, foram ressintetizadas de 9 formas
diferentes, adaptando a F0 a partir da VPreTF a um formato descendente, com elevação da F0 de
toda a frase em 30%; formação de convexidade na F0 da VTF; redução da duração da sílaba /ka/,
na OP 1, e de todos os segmentos, na OP 2, de forma a assemelhar a duração da OP a ser
ressintetizada à duração do(s) segmento(s) das OPs 1 e 2 conformativas de referência (cf. 6.2.2,
6.4.2, 6.6.2 e 6.8.2).
Constituíram o Teste 2, na modalidade neutra das OPs, as ressínteses 6.2.1.1 (OP 1) e
6.6.2.1 (OP 2) (versão a), 6.2.2.2.d (OP 1) e 6.6.2.2.d (OP 2) (versão b); na modalidade
monotônica, as ressínteses 6.4.2.1 (OP 1) e 6.8.2.1 (OP 2) (versão a), 6.4.2.2.d (OP 1) e 6.8.2.2.d
(OP 2) (versão b).
Em ambos os casos, a versão a foi caracterizada pela conformação descendente da F0 a
partir da VPreTF (cf. detalhes em 6.2.2.1). A versão b consistiu dos parâmetros utilizados para a
versão a, acrescidos da formação de uma convexidade de 20% na F0 da VTF (cf. figuras 6.9 e
6.10 (OP 1 neutra); 6.34 e 6.35 (OP 2 neutra); 6.21 e 6.22 (OP 1 monotônica); 6.46 e 6.47 (OP 2
monotônica)).
Os resultados referentes ao cruzamento das ressínteses a e b para a subcategoria
conformativa, obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.4, e
discutidos a seguir.
207
CONFORMATIVA
OP 1 neutra
confor a
x causal
confor b
x causal
confor a
x conces
confor b
x conces
confor a
x consec
confor b
x consec
confor a
x final
confor b
x final
confor a
x tempor
confor b
x tempor
Chi2(a) 5 0,2 0 1,8 9,8 0,2 0,8 5 5 1,8
p 0,025 0,655 1 0,180 0,002 0,655 0,371 0,025 0,025 0,180
CONFORMATIVA
OP 1 monoton
confor a
x causal
confor b
x causal
confor a
x conces
confor b
x conces
confor a
x consec
confor b
x consec
confor a
x final
confor b
x final
confor a
x tempor
confor b
x tempor
Chi2(a) 5 1,8 0,8 7,2 9,8 0 1,8 0,2 0,2 0
p 0,025 0,180 0,371 0,007 0,002 1 0,180 0,655 0,655 1
CONFORMATIVA
OP 2 neutra
confor a
x causal
confor b
x causal
confor a
x conces
confor b
x conces
confor a
x consec
confor b
x consec
confor a
x final
confor b
x final
confor a
x tempor
confor b
x tempor
Chi2(a) 0,8 0,2 3,2 0,8 5 0,2 0,8 1,8 0,2 1,8
p 0,371 0,655 0,074 0,371 0,025 0,655 0,371 0,180 0,655 0,180
CONFORMATIVA
OP 2 monoton
confor a
x causal
confor b
x causal
confor a
x conces
confor b
x conces
confor a
x consec
confor b
x consec
confor a
x final
confor b
x final
confor a
x tempor
confor b
x tempor
Chi2(a) 0 1,8 5 5 0,8 0,2 1,8 1,8 1,8 0,8
p 1 0,180 0,025 0,025 0,371 0,655 0,180 0,180 0,180 0,371
(a) 0 células (,0%) com freqüências esperadas menor do que 5. A freqüência de célula esperada é
10,0.
Tabela 7.4 – Resultados de um Teste Chi2 (df=1) para a subcategoria conformativa, a partir do cruzamento das
ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza ou hachuradas
apresentam índice de significância p 0,05. As células hachuradas indicam que o resultado se obteve em sentido inverso: as ressínteses foram reconhecidas como pré-indicativas de outra subcategoria que não a
conformativa.
7.3.1 OP 1 ressintetizada para a pré-indicação de conformidade
Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da
ressíntese da OP 1 neutra para produzir a pré-indicação conformativa apresentou-se de forma
significativa nos cruzamentos com as modalidades causal, consecutiva e temporal. A versão b
distinguiu-se significativamente da modalidade final.
Em relação à OP 1 monotônica, a versão a da ressíntese para produzir a pré-indicação
conformativa apresentou-se de forma significativa nos cruzamentos com a modalidade
consecutiva. Já a versão b distinguiu-se significativamente da modalidade concessiva, mas em
sentido inverso. Ou seja, os votos negativos para a OSAdv conformativa acabaram por sugerir
que a versão b é, na verdade, pré-indicativa de concessão.
7.3.2 OP 2 ressintetizada para a pré-indicação de conformidade
Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da
ressíntese da OP 2 neutra para produzir a pré-indicação conformativa apresentou-se de forma
208
significativa no cruzamento com a modalidade consecutiva. A versão b não se distinguiu
significativamente em nenhum dos cruzamentos.
Considerando-se a OP 2 monotônica, o único cruzamento que mostrou índice
significativo de diferenciação se deu em relação à OSAdv concessiva, tanto na versão a quanto
na versão b, mas em sentido inverso. Isso significa dizer que, também nesse caso, os votos
negativos para a OSAdv concessiva sugerem que ambas as ressínteses seriam pré-indicativas de
concessão.
7.3.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação
conformativa
A pré-indicação de conformidade, no Teste 1, foi significativamente diferenciada das
OSAdvs causal, concessiva, consecutiva e temporal, considerando-se a OP 1; e das OSAdvs
concessiva, consecutiva e final, considerando-se a OP 2. Pelos critérios assumidos para a
elaboração do Teste 2, as ressínteses a e b das OPs 1 e 2 neutra e monotônica foram cruzadas
com as OSAdvs causal, concessiva, consecutiva, final e temporal.
Os resultados do Teste 2 evidenciaram que, no cruzamento com a OSAdv causal, houve
apenas um reconhecimento significativo da pré-indicação conformativa: a ressíntese a da OP 1
neutra. Esse resultado está abaixo das expectativas gerais, uma vez que a pré-indicação
conformativa apresenta a F0 com movimento descendente, e a pré-indicação causal, com
movimento ascendente. Caso se considere, então, que a ressíntese a contenha os parâmetros
prosódicos necessários à pré-indicação conformativa, o formato convexo da F0 na VTF,
característica adicional da ressíntese b, deve ser visto como dispensável.
O cruzamento com a OSAdv concessiva apresentou índices significativos de
reconhecimento, mas apenas em sentido inverso: na ressíntese b da OP 1 monotônica, e nas
ressínteses a e b da OP 2 monotônica. A indicação, então, é a de que as ressínteses utilizadas
seriam pré-indicativas de concessão, não de conformidade. Uma vez que ambas as pré-
indicações assumem um movimento descendente da F0, essa não-discriminação encontra-se
dentro do previsível. Isso significa também dizer que o formato convexo da F0 na VTF, utilizado
na ressíntese b, não foi percebido como característica prosódica diferenciadora. Observe-se, no
entanto, que, como discutido na sessão imediatamente anterior, o formato côncavo foi percebido
como identificador da pré-indicação concessiva.
209
Em relação ao cruzamento com a OSAdv consecutiva, apenas a ressíntese a foi
reconhecida de forma significativa como pré-indicativa de conformidade. Esse resultado se
verificou para as OPs 1 neutra e monotônica, e para a OP 2 neutra. Também neste caso, trata-se
de dois contornos da F0 opostos: descendente, para a pré-indicação conformativa; ascendente,
para a consecutiva. A escolha da ressíntese a sugere que, também neste caso, o formato convexo
da F0 na VTF é dispensável.
O cruzamento com a OSAdv final indicou significância de reconhecimento apenas para a
ressíntese b, na OP 1 neutra. Da mesma forma que no cruzamento com a OSAdv causal, a
expectativa seria a de diferenciação significativa também nas outras ressínteses, uma vez que a
pré-indicação de finalidade apresenta formato ascendente da F0 na VTF. Neste caso específico, o
formato convexo da F0 nesse segmento parece ter se mostrado importante. No entanto, para uma
afirmação categórica nesse sentido, seria necessário que a ressíntese b tivesse sido
significativamente contrastada também na OP 1 neutra e nas OPs 2 neutra e monotônica.
No último cruzamento verificado, com a OSAdv temporal, houve também apenas um
reconhecimento significativo, no caso, para a ressíntese a na OP 1 neutra. Partindo da idéia de
que o contorno pré-indicativo de temporalidade apresenta formato descendente da F0, o formato
convexo na VTF não se colocaria como índice indispensável.
Pela observação desses resultados, a única indicação consistente para a ressíntese a se
apresenta quando em contraste com a OSAdv consecutiva, embora, na verdade, isso talvez se
deva mais ao fato de o contorno pré-indicativo de conseqüência se mostrar com a F0 modulada
de forma oposta ao formato verificado na pré-indicação de conformidade. Como discutido
acima, o mesmo se dá em relação ao contraste com a OSAdv causal. O único cruzamento que,
efetivamente, parece dever ser considerado, é o estabelecido entre a pré-indicação conformativa
e a OSAdv temporal, uma vez que ambos os contornos pré-indicativos apresentariam forma
descendente da F0. Nesse cruzamento a ressíntese a foi a única identificada significativamente,
ainda que apenas na ressíntese da OP 1 neutra.
O prosograma produzido para a OP 1 neutra (cf. figura 7.1) não identificou a forma
convexa na F0 da VTF45
. Sob esse referencial, a hipótese de ser esse movimento da curva
melódica uma característica significativa do contorno pré-indicativo de conformidade é refutada,
da mesma forma sugerida pelos resultados do Teste 2.
45 A expectativa seria a de que o prosograma, caso essa variação melódica se mostrasse perceptível ao ouvido
humano, estilizasse a curva da F0, produzindo, nesse caso, duas retas em formação angular.
210
7.4 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONSECUTIVA
As OPs 1 e 2, em suas versões neutra e monotônica, foram ressintetizadas de 35 formas
diferentes, explorando a formação do vale da F0, com a centralização da concavidade
identificadora desse vale; a elevação da F0 acima da LR; o aumento da duração da consoante na
STF; o posicionamento da F0 anteriormente à SPreTF (para detalhes, cf. 6.1.1, 6.3.1, 6.5.1 e
6.7.1).
Constituíram o Teste 2, na modalidade neutra das OPs, as ressínteses 6.1.1.3.i (OP 1) e
6.5.1.3.i (OP 2) (versão a), 6.1.1.4 (OP 1) e 6.5.1.4 (OP 2) (versão b); e na modalidade
monotônica, as ressínteses 6.3.1.3.i (OP 1) e 6.7.1.3.g (OP 2) (versão a), 6.3.1.4 (OP 1) e 6.7.1.4
(OP 2) (versão b).
A versão a foi caracterizada pela redução de 0,5 VR no vale da F0, com sua concavidade
centralizada, e a F0 na VTF elevada a 5 VRs acima da LR – teoricamente a 264Hz tanto para a
OP 1 neutra quanto para a monotônica e, na realidade, a 248Hz para a OP 1 neutra, e a 263Hz
para a OP 1 monotônica. A OP 2 neutra teve esse segmento elevado a 254Hz, e a OP 2
monotônica, a 229Hz.
A versão b consistiu dos parâmetros utilizados para a versão a, acrescidos do aumento da
duração da consoante na STF em 97%, no caso das OPs 1, e 18%, no caso das OPs 2,
assemelhando-as à duração verificada na versão original das OPs pré-indicativas de
conseqüência utilizadas no Teste 1 (cf. figuras 6.1 e 6.2 (OP 1 neutra); 6.26 e 6.27 (OP 2 neutra);
6.13 e 6.14 (OP 1 monotônica); 6.38 e 6.39 (OP 2 monotônica)).
Os resultados referentes ao cruzamento das ressínteses a e b para a subcategoria
consecutiva, obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.5, e
discutidos a seguir.
211
CONSECUTIVA
OP 1 neutra
consec a
x causal
consec b
x causal
consec a
x conces
consec b
x conces
consec a
x confor
consec b
x confor
consec a
x final
consec b
x final
consec a
x tempor
consec b
x tempor
Chi2(a) 0,2 5 5 7,2 1,8 0,2 0,8 0,8 0,2 9,8
p 0,655 0,025 0,025 0,007 0,180 0,655 0,371 0,371 0,655 0,002
CONSECUTIVA
OP 1 monoton
consec a
x causal
consec b
x causal
consec a
x conces
consec b
x conces
consec a
x confor
consec b
x confor
consec a
x final
consec b
x final
consec a
x tempor
consec b
x tempor
Chi2(a) 1,8 1,8 16,2 9,8 0 0,2 1,8 1,8 0,8 5
p 0,180 0,180 0,0001 0,002 1 0,655 0,180 0,180 0,371 0,025
CONSECUTIVA
OP 2 neutra
consec a
x causal
consec b
x causal
consec a
x conces
consec b
x conces
consec a
x confor
consec b
x confor
consec a
x final
consec b
x final
consec a
x tempor
consec b
x tempor
Chi2(a) 7,2 5 5 1,8 9,8 16,2 0,8 5 5 12,8
p 0,007 0,025 0,025 0,180 0,002 0,0001 0,371 0,025 0,025 0,0003
CONSECUTIVA
OP 2 monoton
consec a
x causal
consec b
x causal
consec a
x conces
consec b
x conces
consec a
x confor
consec b
x confor
consec a
x final
consec b
x final
consec a
x tempor
consec b
x tempor
Chi2(a) 1,8 7,2 1,8 5 0,8 12,8 0,8 5 7,2 5
p 0,180 0,007 0,180 0,025 0,371 0,0003 0,371 0,025 0,007 0,025
(a) 0 células (,0%) com freqüências esperadas menor do que 5. A freqüência de célula esperada é
10,0.
Tabela 7.5 – Resultados de um Teste Chi2 (df=1) para a subcategoria consecutiva, a partir do cruzamento das
ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza apresentam índice de
significância p 0,05.
7.4.1 OP 1 ressintetizada para a pré-indicação de conseqüência
Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da
ressíntese da OP 1 neutra para produzir a pré-indicação consecutiva apresentou-se de forma
significativa no cruzamento com a modalidade concessiva. A versão b distinguiu-se
significativamente das modalidades causal, concessiva e temporal. Observe-se que, no
cruzamento com a modalidade concessiva, tanto a ressíntese a quanto a ressíntese b
apresentaram índices significativos de julgamento, embora a ressíntese b tenha obtido melhor
índice de significância.
Em relação à OP 1 monotônica, a versão a da ressíntese para produzir a pré-indicação
consecutiva apresentou-se de forma significativa nos cruzamentos com a modalidade concessiva.
Já a versão b distinguiu-se significativamente das modalidades concessiva e temporal. Portanto,
tanto a versão a quanto a versão b, quando em contraste com a modalidade concessiva,
mostraram-se significativas (embora o índice de significância da versão a tenha sido
consideravelmente melhor que o da versão b).
212
7.4.2 OP 2 ressintetizada para a pré-indicação de conseqüência
Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da
ressíntese da OP 2 neutra para produzir a pré-indicação consecutiva apresentou-se de forma
significativa nos cruzamentos com as modalidades causal, concessiva, conformativa e temporal.
A versão b distinguiu-se significativamente nos cruzamentos com as modalidades causal,
conformativa e temporal. Isso significa dizer que tanto a versão a quanto a versão b foram
significativamente contrastadas em relação às modalidades causal, conformativa e temporal,
embora a versão a tenha se mostrado consideravelmente mais significativa no contraste com a
modalidade causal, e a versão b, no contraste com as modalidades conformativa e temporal.
No universo da OP 2 monotônica, a versão a da ressíntese para produzir a pré-indicação
consecutiva apresentou-se de forma significativa no cruzamento com a modalidade temporal. Já
a versão b distinguiu-se significativamente das modalidades causal, concessiva, conformativa,
final e temporal. Ambas as versões, portanto, mostraram-se significativas quando em contraste
com a modalidade temporal, embora a versão a tenha obtido melhor índice de significância.
7.4.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação
consecutiva
Os cruzamentos realizados no Teste 1 evidenciaram a pré-indicação consecutiva como
significativamente reconhecida quando em contraste com as pré-indicações de causa, de
concessão, de condição e de conformidade, nas OPs 1 e 2, e também com as pré-indicações de
finalidade, de proporcionalidade e de tempo, considerando a OP 1. Segundo os critérios
utilizados para a elaboração do Teste 2, as ressínteses a e b para as OPs 1 e 2, neutras e
monotônicas, foram contrastadas com as OSAdvs causal, concessiva, conformativa, final e
temporal.
O cruzamento com a OSAdv causal, segundo os resultados do Teste 2, evidenciou índice
significativo de identificação da ressíntese a como pré-indicativa de conseqüência apenas na OP
2 neutra. A ressíntese b foi significativamente identificada nas OPs 1 e 2 neutras, e na OP 2
monotônica. Embora o índice de significância do reconhecimento da ressíntese a na OP 2 neutra
(Chi2=7,2, df=1, p=0,007) tenha sido consideravelmente melhor do que o da ressíntese b
(Chi2=5, df=1, p=0,025), a comparação entre os resultados dos cruzamentos evidencia que a
ressíntese b mostrou-se mais expressiva em um maior número de cruzamentos. A diferença entre
213
essas duas ressínteses reside, no caso da b, no aumento da duração da consoante na STF,
associada à modulação da F0 já desenvolvida na ressíntese a (cf. 6.1.1.4). Considerando que
tanto a pré-indicação consecutiva quanto a causal assumem contornos ascendentes da F0, esse
resultado sugere que o aumento da duração verificado na ressíntese b é o responsável pela
identidade do contorno pré-indicativo consecutivo, nesse cruzamento.
O cruzamento com a OSAdv concessiva indicou significativamente a ressíntese a como
pré-indicativa de conseqüência nas OPs 1 neutra e monotônica, e na OP 2 neutra. A ressíntese b
foi reconhecida significativamente também nas OPs 1 neutra e monotônica, e na OP 2
monotônica. Os índices com melhor significância, quando ambas as ressínteses foram
significativamente reconhecidas, aplicaram-se à ressíntese b, na OP 1 neutra, e à ressíntese a, na
OP 1 monotônica. Considerando também que os índices de significância foram idênticos para a
ressíntese a, na OP 2 neutra, e para a b, na OP 2 monotônica, não é possível chegar a uma
indicação precisa de ser a ressíntese a ou a b a responsável pela identidade da pré-indicação
consecutiva nesse cruzamento. A expectativa mais ampla de se diferenciarem os contornos pré-
indicativos de conseqüência (formato ascendente da F0) e de concessão (formato descendente da
F0) por conta dos formatos diferentes da F0 se confirmou.
Em relação ao cruzamento com a OSAdv conformativa, houve reconhecimento
significativo das ressínteses a e b como pré-indicativas de conseqüência apenas nas OPs 2. A
ressíntese a foi identificada na OP 2 neutra, e a ressíntese b, nas OPs 2 neutra e monotônica.
Uma vez que o índice de reconhecimento da ressíntese b foi consideravelmente mais
significativo que o da ressíntese a na OP 2 neutra, a indicação é a de que a ressíntese b contenha
a característica prosódica identificadora da pré-indicação consecutiva. Deve-se observar que na
OP 1 monotônica a ressíntese a foi totalmente confundida com a pré-indicação de conformidade
(Chi2=0, df=1, p=1), embora os dois contornos assumam formatos opostos da F0.
O cruzamento com a OSAdv final evidenciou reconhecimento significativo apenas da
ressíntese b, e apenas nas OPs 2, como pré-indicativa de conseqüência. Uma vez que tanto o
contorno pré-indicativo consecutivo quanto o final apresentam a F0 com formato ascendente,
esse resultado sugere que a pré-indicação consecutiva deve contar com o aumento da duração da
consoante na STF.
Em relação ao cruzamento com a OSAdv temporal, a ressíntese a foi reconhecida como
pré-indicativa de conseqüência nas OPs 2 neutra e monotônica. Já a ressíntese b, nas OPs 1 e 2
neutras e monotônicas. Apenas na OP 2 monotônica o índice de reconhecimento da ressíntese a
foi melhor que o da b. Considerando, no entanto, o resultado geral para esses cruzamentos, a
214
indicação se dá no sentido de, mais uma vez, considerar a ressíntese b como contendo a
configuração prosódica caracterizadora da pré-indicação de conseqüência.
Excetuando-se o cruzamento com a OSAdv concessiva, em que tanto a ressíntese a
quanto a b foram reconhecidas como significativas de forma semelhante, em todos os outros
cruzamentos a ressíntese b foi a que obteve os melhores índices. A sugestão clara, a partir desses
dados, é a de que a pré-indicação de conseqüência é caracterizada pela configuração da F0, como
descrito de 6.1.1.1 a 6.1.1.3, somada ao aumento da duração da consoante na STF, nos
percentuais discutidos em 6.1.1.4.
Como indicado nos prosogramas relativos às OPs 1 e 2 consecutivas (cf. figuras 7.1 e
7.2), a elevação da F0 na VTF é perceptível ao ouvido humano. No caso da OP 1, a F0
apresentou um movimento ascendente, com variação de 8 semitons. Embora na OP 2 o ligeiro
movimento ascendente nesse segmento não tenha sido detectado pelo prosograma, a F0 da VTF
se apresenta 6 semitons acima da F0 da vogal na sílaba pré-tônica. As indicações dos
prosogramas, nesse caso, confirmam a percepção, pelo ouvido humano, da variação ascendente
da F0, transformação que deve ser associada ao aumento da duração na consoante de ataque da
STF para que se produza o valor pré-indicativo consecutivo.
7.5 CRUZAMENTOS A PARTIR DA SUBCATEGORIA FINAL
A OP 1, em suas versões neutra e monotônica, foi ressintetizada de 67 formas diferentes,
explorando a formação do vale da F0, com a centralização da concavidade formadora desse vale;
a elevação da F0 na STF acima da LR; a redução da duração da vogal e da consoante finais; a
redução da duração da sílaba /ka/; o posicionamento da F0 anteriormente à SPreTF (para
detalhes, cf. 6.1.3 e 6.3.3).
A OP 2, em suas versões neutra e monotônica, foi ressintetizada de 37 formas diferentes,
explorando também a formação do vale da F0 e a centralização de sua concavidade; a elevação
da F0 na STF acima da LR; o posicionamento do ápice da F0 na VTF; a redução da duração da
VTF; a elevação da F0 anterior à SPreTF acima da LR (para detalhes, cf. 6.5.3 e 6.7.3).
Constituíram o Teste 2, na modalidade neutra, as ressínteses 6.1.3.2.i (OP 1) e 6.5.3.5.c
(OP 2) (versão a), 6.1.3.3 (OP 1) e 6.5.3.6 (OP 2) (versão b); e na modalidade monotônica, as
ressínteses 6.3.3.3.g (OP 1) e 6.7.3.5.c (OP 2) (versão a), 6.3.3.4 (OP 1) e 6.7.3.6 (OP 2) (versão
b).
215
Considerando-se a OP 1, as versões a foram caracterizadas pela (criação, centralização e)
aplicação de 1,5 VR ao vale da F0, com sua concavidade centralizada, e a F0 na VTF elevada 4
VRs acima da LR – teoricamente a 238Hz, tendo sido esse valor de fato atingido apenas na OP
1 monotônica (na OP 1 neutra, o valor atingido foi de 226Hz).
As versões b das OPs 1 consistiram nas transformações utilizadas para a versão a,
adicionando-se o aumento da duração da consoante da STF em 54%, assemelhando-a à duração
verificada na versão original da OP pré-indicativa de finalidade utilizada no Teste 1 (cf. figuras
6.5 e 6.6 (OP 1 neutra); 6.17 e 6.18 (OP 1 monotônica)).
Considerando-se a OP 2, as versões a foram caracterizadas pela (criação, centralização e)
aplicação de 1,5 VR ao vale da F0, com sua concavidade centralizada, e adaptação do formato da
STF ao verificado na OP 1 final de referência. A F0 da VTF foi elevada 2 VRs acima da LR,
atingindo-se 177Hz.
As versões b das OPs 2 utilizaram as transformações aplicadas para a versão a, reduzindo
a duração da VTF em 15%, para também assemelhá-la à duração verificada na versão original da
OP pré-indicativa de finalidade (cf. figuras 6.30 e 6.31 (OP 2 neutra); 6.42 e 6.43 (OP 2
monotônica)).
Os resultados referentes ao cruzamento das ressínteses a e b para a subcategoria final,
obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.6, e discutidos a seguir.
216
FINAL
OP 1 neutra
final a x
causal
final b x
causal
final a x
conces
final b x
conces
final a x
confor
final b x
confor
final a x
consec
final b x
consec
final a x
tempor
final b x
tempor
Chi2(a) 9,8 7,2 0,8 1,8 7,2 9,8 1,8 1,8 1,8 1,8
p 0,002 0,007 0,371 0,180 0,007 0,002 0,180 0,180 0,180 0,180
FINAL
OP 1 monoton
final a x
causal
final b x
causal
final a x
conces
final b x
conces
final a x
confor
final b x
confor
final a x
consec
final b x
consec
final a x
tempor
final b x
tempor
Chi2(a) 5 0 0,2 9,8 5 9,8 5 0 0,8 0
p 0,025 1 0,655 0,002 0,025 0,002 0,025 1 0,371 1
FINAL
OP 2 neutra
final a x
causal
final b x
causal
final a x
conces
final b x
conces
final a x
confor
final b x
confor
final a x
consec
final b x
consec
final a x
tempor
final b x
tempor
Chi2(a) 0,8 5 5 5 7,2 5 0 0,2 5 9,8
p 0,371 0,025 0,025 0,025 0,007 0,025 1 0,655 0,025 0,002
FINAL
OP 2 monoton
final a x
causal
final b x
causal
final a x
conces
final b x
conces
final a x
confor
final b x
confor
final a x
consec
final b x
consec
final a x
tempor
final b x
tempor
Chi2(a) 5 0,2 7,2 7,2 0,2 0,8 1,8 0 1,8 5
p 0,025 0,655 0,007 0,007 0,655 0,371 0,180 1 0,180 0,025
(a) 0 células (,0%) com freqüências esperadas menor do que 5. A freqüência de célula esperada é
10,0.
Tabela 7.6 – Resultados de um Teste Chi2 (df=1) para a subcategoria final, a partir do cruzamento das ressínteses a
e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza apresentam índice de significância p 0,05.
7.5.1 OP 1 ressintetizada para a pré-indicação de finalidade
Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da
ressíntese da OP 1 neutra para produzir a pré-indicação final apresentou-se de forma significativa
nos cruzamentos envolvendo as categorias causal e conformativa. Da mesma forma, a versão b.
Isso implica dizer que ambas as versões foram significativamente reconhecidas como pré-
indicativas de finalidade, embora o índice de significância tenha sido ligeiramente melhor para a
versão a, em cruzamento com a causalidade, e b, em cruzamento com a conformidade.
Quanto à OP 1 monotônica, a versão a da ressíntese para produzir a pré-indicação final
apresentou-se de forma significativa nos cruzamentos com as modalidades causal e
conformativa. Já a versão b distinguiu-se significativamente das modalidades concessiva e
conformativa. Portanto, tanto a versão a quanto a versão b, quando em contraste com a
modalidade conformativa, mostraram-se significativas (embora o índice de significância da
versão b tenha sido consideravelmente melhor que o da versão a).
217
7.5.2 OP 2 ressintetizada para a pré-indicação de finalidade
Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da
ressíntese da OP 2 neutra para produzir a pré-indicação final apresentou-se de forma significativa
nos cruzamentos com as modalidades concessiva, conformativa e temporal. A versão b
distinguiu-se significativamente das modalidades causal, concessiva, conformativa e temporal.
Ou seja, tanto a versão a quanto a versão b foram reconhecidas significativamente como pré-
indicativas de finalidade quando em contraste com as OSAdvs concessiva, conformativa e
temporal. A versão a apresentou melhor índice de significância quando em contraste com a
OSAdv conformativa, e a b, em contraste com a temporal.
Quanto à OP 2 monotônica, a versão a da ressíntese para produzir a pré-indicação final
apresentou-se de forma significativa nos cruzamentos com as modalidades causal e concessiva.
Já a versão b distinguiu-se significativamente das modalidades concessiva e temporal. Tanto a
versão a quanto a versão b foram reconhecidas com o mesmo índice de significância como pré-
indicativas de finalidade quando em cruzamento com a modalidade concessiva.
7.5.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação final
No Teste 1, os cruzamentos evidenciaram a pré-indicação final como significativamente
reconhecida quando em contraste com as pré-indicações comparativa, consecutiva e temporal,
considerando a OP 1, e com as pré-indicações comparativa, concessiva e conformativa,
considerando a OP 2. Os critérios utilizados para a elaboração do Teste 2 estabeleceram o
cruzamento das ressínteses a e b das OPs 1 e 2 neutras e monotônicas com as OSAdvs causal,
concessiva, conformativa, consecutiva e temporal.
O cruzamento da ressíntese a com a OSAdv causal mostrou-se com índice significativo
de reconhecimento como pré-indicativa de finalidade na OP 1 neutra e nas OPs 2 neutra e
monotônica. A ressíntese b mostrou-se significativa nas OPs 1 e 2 neutras. Embora os índices de
significância tenham sido idênticos (Chi2=5, df=1, p=0,025) para as ressínteses a, na OP 1
monotônica, e b, na OP 2 neutra, o da ressíntese a apresentou melhor índice de significância
(Chi2=9,8, df=1, p=0,002) que o da b (Chi2=7,2, df=1, p=0,007) na OP 1 neutra. Esses
resultados talvez sugiram que a ressíntese a seja a que contenha os parâmetros prosódicos
apropriados à pré-indicação de finalidade, em oposição à pré-indicação de causa. A hipótese
inicial foi a de que a diferenciação entre o contorno pré-indicativo causal e o final estaria no
218
nível de elevação da F0 na VTF, mais elevada no primeiro que no segundo. Como a ressíntese b,
além das modificações da F0 processadas na ressíntese a, incorporou a variação da duração na
consoante da STF (cf. 6.1.3.3 e 6.5.3.6), esses resultados parecem indicar que essa variação de
duração não se mostra necessária para a caracterização do contorno pré-indicativo final, quando
em oposição ao causal.
O cruzamento com a OSAdv concessiva evidenciou a ressíntese b como pré-indicativa de
finalidade na OP 1 monotônica, e tanto a ressíntese a quanto a b, nas OPs 2 neutra e monotônica.
Os índices obtidos para a ressíntese b mostraram-se semelhantes aos índices para a ressíntese a
nas OPs 2, o que impede sugerir uma das ressínteses como contendo os parâmetros prosódicos
responsáveis pela pré-indicação de finalidade. Como no universo da OP 1 apenas a ressíntese b
foi reconhecida como pré-indicativa de finalidade, este resultado torna-se o responsável pela
sugestão de ser ela a que contém esses parâmetros prosódicos. Isso significa dizer, embora muito
discretamente, que, nesse cruzamento, há uma tendência a que a variação de duração na
consoante da STF deva ser adicionada à modulação da F0 promovida na ressíntese a. A não-
diferenciação expressiva entre as duas ressínteses talvez decorra do fato de o contorno pré-
indicativo final apresentar forma ascendente da F0 na STF, e a pré-indicação concessiva, uma
forma descendente. Essa variação no direcionamento da F0, pura e simplesmente, já se prestaria
à distinção entre as duas pré-indicações.
O cruzamento com a OSAdv conformativa evidenciou ambas as ressínteses a e b como
pré-indicativas de finalidade nas manipulações das OPs 1 neutra e monotônica, e da OP 2 neutra.
Embora o índice de significância da ressíntese a (Chi2=7,2, df=1, p=0,007) tenha sido
consideravelmente melhor do que o da b (Chi2=5, df=1, p=0,025) na OP 2 neutra, os índices da
ressíntese b mostraram-se melhores que os da ressíntese a nas OPs 1 neutra (respectivamente,
Chi2=9,8, df=1, p=0,002 e Chi2=7,2, df=1, p=0,007) e monotônica (respectivamente,
Chi2=9,8, df=1, p=0,002 e Chi2=5, df=1, p=0,025). Da mesma forma que verificado no
cruzamento com a OSAdv concessiva, parece haver uma tendência a considerar a ressíntese b
como a que contém os parâmetros prosódicos caracterizadores da pré-indicação de finalidade.
Também neste caso vale lembrar que a forma da F0 na STF da pré-indicação conformativa é
descendente, o que bastaria, por si só, para estabelecer a diferenciação em relação à pré-
indicação final.
Em relação à OSAdv consecutiva, o cruzamento evidenciou que apenas a ressíntese a, na
OP 1 monotônica, foi reconhecida como pré-indicativa de finalidade. Considerando que a
hipótese assumida para a diferenciação entre a pré-indicação final e a consecutiva reside no valor
219
máximo de elevação da F0 na VTF (mais elevado na consecutiva que na final); e que, na
ressíntese b, foi aumentada a duração da consoante na STF, da mesma forma que processado na
ressíntese b para a pré-indicação consecutiva, esse resultado sugere, ainda que timidamente, que
a diferenciação entre essas duas pré-indicações reside na elevação da F0 (cf. 6.3.1.3.i
(consecutiva) e 6.3.3.3.g (final)).
O último cruzamento, com a OSAdv temporal, evidenciou significância de
reconhecimento da ressíntese a na OP 2 neutra, e da ressíntese b nas OPs 2 neutra e monotônica.
A tendência, então, é a de sugerir a ressíntese b como a que contém os parâmetros prosódicos
apropriados à pré-indicação final. No entanto, é preciso lembrar que a pré-indicação temporal
apresenta formato descendente da F0 na STF, o que, como já sugerido, por si só já bastaria para a
diferenciação entre as duas pré-indicações. Observe-se, ainda, que a ressíntese b foi totalmente
confundida com a pré-indicação temporal na OP 1 monotônica.
De uma forma geral, a ressíntese b para a pré-indicação final (movimento ascendente da
F0) tendeu a se mostrar mais significativa que a ressíntese a nos contrastes com as pré-
indicações concessiva, conformativa e temporal, as três com movimento descendente da F0,
situação em que o contraste se mostra facilitado. Para uma caracterização efetiva da pré-
indicação final em contraste com as outras duas subcategorias que apresentam movimento
ascendente da F0 – a causal e a consecutiva –, talvez seja razoável considerar apenas a variação
na elevação da F0, como efetuado na ressíntese a, como marca da pré-indicação final.
Essa diferença de pico da F0 na VTF é confirmada pela representação dos prosogramas
obtidos para as OPs 1 (cf. figura 7.1). O segmento apresenta variação de 10 semitons, na OP 1
causal; de 6 semitons, na OP 1 final; e de 8 semitons, na OP 1 consecutiva. No caso das OPs 2, a
F0 foi representada com movimento ascendente apenas na modalidade causal, com uma variação
de 6 semitons. No caso das modalidades final e consecutiva, a diferença entre a F0 (plana, na
representação dos prosogramas) da VTF e a da VPreTF foi, em ambos os casos, também de 6
semitons.
Se forem isoladas apenas as ressínteses produzidas para as OPs 2 com movimento
ascendente da F0 na STF, percebe-se que os resultados foram idênticos (Chi2=5, df=1, p=0,025)
para as ressínteses a e b, no caso da pré-indicação causal, e sem significância para a pré-
indicação consecutiva. Para analisar esses resultados, é interessante lembrar que, para o processo
de ressíntese, foram utilizados para a modulação da F0 das OPs 2 os mesmos parâmetros
utilizados para as OPs 1, e a diferença quanto ao valor máximo de elevação atingido pela F0 foi
mantida (elevação maior na pré-indicação causal que na final; cf. 6.1.2 e 6.1.3) (os prosogramas
220
foram obtidos a partir das OPs de referência). Como a ressíntese a mostrou-se significativa de
forma idêntica à ressíntese b, a possível conclusão a que se chega é a de que a diferença na
duração da consoante de ataque da STF não interfere no contraste entre as pré-indicações causal
e final, mas apenas a diferença entre os pontos máximos de elevação da F0 na VTF. Já no caso
do contraste com a pré-indicação consecutiva, essa variação da duração parece ter interferido,
uma vez que também essa pré-indicação se sustenta pela variação de duração nesse segmento.
7.6 CRUZAMENTOS A PARTIR DA SUBCATEGORIA TEMPORAL
As OPs 1 e 2, em suas versões neutras, foram ressintetizadas de 5 formas diferentes e, em
suas versões monotônicas, de 8 formas, adaptando a F0 a partir da VPreTF a um formato
descendente, assemelhando-o à conformação originalmente verificada para a OP 1 temporal de
referência, com elevação da F0 de toda a frase em 30%; nivelamento da F0 na vogal anterior à
STF; redução da duração da VTF; redução da duração da sílaba /ka/, no caso da OP 1, e da
consoante /s/ da STF, no caso da OP 2 (para detalhes, cf. 6.2.3, 6.4.3, 6.6.3 e 6.8.3).
Constituíram o Teste 2, na modalidade neutra das OPs, as ressínteses 6.2.3.2 (OP 1) e
6.6.3.2 (OP 2) (versão a), 6.2.3.3 (OP 1) e 6.6.3.4 (OP 2) (versão b); na modalidade monotônica,
foram utilizadas as ressínteses 6.4.3.2 (OP 1) e 6.8.3.2 (OP 2) (versão a), 6.4.3.3 (OP 1) e 6.8.3.4
(OP 2) (versão b).
Considerando as OPs 1, as versões a consistiram na adaptação da F0, como descrito
acima e remetido a 6.2.3 e 6.4.3, com o nivelamento da F0 na vogal anterior à STF; as versões b
acrescentaram às versões a a redução da duração da VTF em 61%, assemelhando-a ao verificado
na OP 1 temporal de referência.
Considerando-se as OPs 2, as versões a também consistiram na adaptação da F0, nos
moldes utilizados para as ressínteses das OPs 1, com o nivelamento da F0 na vogal anterior à
STF; as versões b acrescentaram às versões a o aumento da duração da consoante da STF em
19% (cf. figuras 6.11 e 6.12 (OP 1 neutra); 6.36 e 6.37 (OP 2 neutra); 6.23 e 6.24 (OP 1
monotônica); 6.48 e 6.49 (OP 2 monotônica)).
Os resultados referentes ao cruzamento das ressínteses a e b para a subcategoria
temporal, obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.7, e discutidos
a seguir.
221
TEMPORAL
OP 1 neutra
tempor a
x causal
tempor b
x causal
tempor a
x conces
tempor b
x conces
tempor a
x confor
tempor b
x confor
tempor a
x consec
tempor b
x consec
tempor a
x final
tempor b
x final
Chi2(a) 5 1,8 0,2 0,8 0,8 5 0,2 5 5 5
p 0,025 0,180 0,655 0,371 0,371 0,025 0,655 0,025 0,025 0,025
TEMPORAL
OP 1 monoton
tempor a
x causal
tempor b
x causal
tempor a
x conces
tempor b
x conces
tempor a
x confor
tempor b
x confor
tempor a
x consec
tempor b
x consec
tempor a
x final
tempor b
x final
Chi2(a) 7,2 5 0 0,2 0,2 0 9,8 12,8 5 7,2
p 0,007 0,025 1 0,655 0,655 1 0,002 0,0003 0,025 0,007
TEMPORAL
OP 2 neutra
tempor a
x causal
tempor b
x causal
tempor a
x conces
tempor b
x conces
tempor a
x confor
tempor b
x confor
tempor a
x consec
tempor b
x consec
tempor a
x final
tempor b
x final
Chi2(a) 0 0 0,8 1,8 5 0,8 5 3,2 0,2 0,2
p 1 1 0,371 0,180 0,025 0,371 0,025 0,074 0,655 0,655
TEMPORAL
OP 2 monoton
tempor a
x causal
tempor b
x causal
tempor a
x conces
tempor b
x conces
tempor a
x confor
tempor b
x confor
tempor a
x consec
tempor b
x consec
tempor a
x final
tempor b
x final
Chi2(a) 0,2 0,2 1,8 0,8 1,8 0 0 0,8 1,8 0,8
p 0,655 0,655 0,180 0,371 0,180 1 1 0,371 0,180 0,371
(a) 0 células (,0%) com freqüências esperadas menor do que 5. A freqüência de célula esperada é
10,0.
Tabela 7.7 – Resultados de um Teste Chi2 (df=1) para a subcategoria temporal, a partir do cruzamento das
ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza apresentam índice de
significância p 0,05.
7.6.1 OP 1 ressintetizada para a pré-indicação de temporalidade
Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da
ressíntese da OP 1 neutra para produzir a pré-indicação temporal apresentou-se de forma
significativa nos cruzamentos com as modalidades causal e final. A versão b distinguiu-se
significativamente das modalidades conformativa, consecutiva e final. Observa-se, portanto, que
ambas as versões foram significativamente reconhecidas (com índices idênticos) como pré-
indicativas de temporalidade.
Em relação à OP 1 monotônica, a versão a da ressíntese para produzir a pré-indicação
temporal apresentou-se de forma significativa nos cruzamentos com as modalidades causal,
consecutiva e final, da mesma forma que a versão b. Portanto, tanto a versão a quanto a versão b,
quando em contraste com as modalidades causal, consecutiva e final, mostraram-se
significativas. A versão a apresentou melhor índice de significância quando em contraste com a
modalidade causal; e a versão b, quando em contraste com as modalidades consecutiva e final.
222
7.6.2 OP 2 ressintetizada para a pré-indicação de temporalidade
Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da
ressíntese da OP 2 neutra para produzir a pré-indicação temporal apresentou-se de forma
significativa nos cruzamentos com as modalidades conformativa e consecutiva. A versão b não
se distinguiu significativamente de nenhuma das modalidades.
Em relação à OP 2 monotônica, nenhuma das versões mostrou-se significativamente
contrastada com nenhuma das outras cinco subcategorias.
7.6.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação
temporal
Os cruzamentos realizados no Teste 1 evidenciaram que a pré-indicação temporal
distingue-se significativamente das pré-indicações causal, comparativa, concessiva,
conformativa, consecutiva e final, considerando-se a OP 1. No universo da OP 2, a distinção
mostrou-se significativa em relação às pré-indicações comparativa e concessiva. Segundo os
critérios utilizados para a elaboração do Teste 2, estabeleceu-se o cruzamento das ressínteses a e
b das OPs 1 neutras e monotônicas com as OSAdvs causal, concessiva, conformativa,
consecutiva e final.
Os resultados do cruzamento com a OSAdv causal evidenciaram que a ressíntese a foi
identificada como pré-indicativa de temporalidade nas OPs 1 neutra e monotônica. A ressíntese b
foi identificada na OP 1 monotônica, embora com índice de significância (Chi2=5, df=1,
p=0,025) inferior ao da ressíntese a (Chi2=7,2, df=1, p=0,007). Esses resultados parecem
sugerir que a ressíntese a, por si só, contém os parâmetros prosódicos responsáveis pela pré-
indicação temporal. Essa ressíntese a consistiu da modulação da F0 a partir da SPreTF, como
descrito em 6.2.3.2, com atenção ao nivelamento da F0 na VPreTF e ao nivelamento da F0 na
VTF. A ressíntese b incorporou a essas modificações a variação na duração da VTF (cf. 6.2.3.3).
A sugestão, portanto, é a de que essa variação da duração não se coloca como índice
significativo para a pré-indicação temporal, muito embora a pré-indicação causal seja assumida
com forma ascendente da F0 na STF e a pré-indicação temporal, com forma descendente, o que
já bastaria para caracterizar a diferença entre as duas.
No cruzamento com a OSAdv concessiva, não houve reconhecimento significativo algum
das ressínteses. Uma vez que ambos os formatos da F0 na STF são descendentes, essa não-
223
distinção não seria de todo inesperada. Observe-se, no entanto, que, como já analisado em 7.2,
acima, a ressíntese b para a pré-indicação concessiva mostrou-se significativamente distinguida
da pré-indicação temporal.
O cruzamento com a OSAdv conformativa indicou que a ressíntese b se mostra como
pré-indicativa de temporalidade na OP 1 neutra, e a ressíntese a, na OP 2 neutra. Como ambos os
índices foram idênticos (Chi2=5, df=1, p=0,025), não é possível estabelecer um direcionamento
para uma das ressínteses como sendo a que contém os parâmetros prosódicos apropriados a essa
pré-indicação. Observe-se que, da mesma forma que o contorno pré-indicativo temporal, o
conformativo também apresenta formato descendente da F0 na STF.
No cruzamento com a OSAdv consecutiva, a ressíntese a foi significativamente
reconhecida como pré-indicativa de temporalidade na OP 1 monotônica e na OP 2 neutra; a
ressíntese b, nas OPs 1 neutra e monotônica. Como os índices de significância mostraram-se
idênticos para a ressíntese b na OP 1 neutra e para a ressíntese a na OP 2 neutra, a tendência para
a caracterização da ressíntese b como a pré-indicativa de temporalidade se dá pelo melhor índice
de significância na OP 1 monotônica (Chi2=12,8, df=1, p=0,0003) que na ressíntese a
(Chi2=9,8, df=1, p=0,002). O primeiro fator a considerar é o contorno consecutivo apresentar
forma ascendente da F0 na STF, em oposição à pré-indicação temporal, o que facilitaria a
distinção. O segundo fator, no entanto, que parece beneficiar a ressíntese b é o fato de a VTF ter
sofrido uma redução em sua duração. É importante lembrar que, no caso da ressíntese b para a
pré-indicação consecutiva, houve um aumento de duração na consoante dessa mesma sílaba.
Embora a variação de duração tenha se processado, em um caso, na vogal, e no outro, na
consoante, houve variação de duração da sílaba como um todo, e talvez esse fator tenha se
mostrado como significativo.
O cruzamento com a OSAdv final evidenciou que tanto a ressíntese a quanto a b foram
reconhecidas significativamente como pré-indicativas de temporalidade nas OPs 1 neutra e
monotônica. Como os índices mostraram-se idênticos para as ressínteses a nas OPs 1 neutra e
monotônica e b na OP 1 neutra (Chi2=5, df=1, p=0,025), a diferenciação entre elas parece ser
sugerida pelo índice significativamente melhor da ressíntese b na OP 1 monotônica (Chi2=7,2,
df=1, p=0,007). Também neste caso, não se deve perder de vista o fato de o contorno pré-
indicativo final ser caracterizado pela forma ascendente da F0 na STF, em oposição ao que
ocorre na pré-indicação temporal.
De forma geral, a pré-indicação temporal (formato descendente da F0) parece ter a
ressíntese b como diferenciadora em relação a dois dos contornos ascendentes (consecutivo e
224
final), e a ressíntese a em relação ao terceiro (causal). Como se trata de contornos opostos,
parece inapropriado distinguir uma das ressínteses como responsável por essa diferenciação. Na
comparação com os outros dois contornos descendentes (concessivo e conformativo), no entanto,
não foi possível, de fato, estabelecer uma das ressínteses como responsável pela pré-indicação
temporal, considerando, inclusive, que no cruzamento com a OSAdv concessiva não houve um
único reconhecimento significativo. Um outro fator que se destaca é não ter havido
reconhecimento significativo algum para as ressínteses produzidas a partir da OP 2 monotônica.
A observação dos prosogramas gerados para as OPs 1 concessiva, conformativa e
temporal (contornos descendentes da F0) (cf. figura 7.1) indica que a F0 na VTF é percebida
pelo ouvido humano como constituída a partir de um movimento descendente nos dois primeiros
casos, mas não no terceiro. Essa indicação corroboraria, em princípio, a hipótese de que a forma
da F0 nesse segmento da pré-indicação temporal deve ser plana, sem apresentar variação
descendente. Essa sugestão, no entanto, não é confirmada para a OP 2 temporal (cf. figura 7.2),
em que a forma da F0 também se mostra descendente.
7.7 CRITÉRIOS PARA ESCOLHA DAS RESSÍNTESES REPRESENTATIVAS DOS PADRÕES
PROSÓDICOS PRÉ-INDICATIVOS
Como se pôde observar em relação aos resultados obtidos com o Teste 2, na maior parte
dos cruzamentos estabelecidos não foi possível identificar uma das duas ressínteses testadas
como a única a conter os parâmetros prosódicos responsáveis pelo valor pré-indicativo em
questão. É mais prudente entender que uma delas se mostrou como mais propensa a caracterizar
o contorno pré-indicativo representado, embora a outra também não possa ser desconsiderada. É
interessante lembrar que foram contrastadas, para cada subcategoria, duas ressínteses que
pareciam conter os pontos críticos na manipulação quer da F0, quer da duração, quer desses dois
parâmetros em conjunto, com a expectativa de que um deles pudesse suplantar o outro. No
entanto, como os resultados indicaram, parece mais apropriado, para a maior parte das
subcategorias pré-indicativas (à exceção da consecutiva), afirmar que ambas as ressínteses
representam o valor pré-indicativo em questão, embora a que tenha obtido maior freqüência de
reconhecimento no Teste 2 se apresente como a melhor candidata a conter as características
prosódicas específicas desse contorno. Isso, provavelmente, porque essa ressíntese apresentou
225
um resultado auditivo muito mais próximo da OP de referência, o que, em princípio, lhe confere
uma maior naturalidade.
As tabelas 7.2 a 7.7 evidenciam que, por vezes, nenhuma das duas ressínteses foi
significativamente identificada como pré-indicativa dos respectivos valores adverbiais. Em
outras, ambas as ressínteses obtiveram o mesmo índice de significância. Em outras ainda, uma
das ressínteses, ou ambas, foi reconhecida como pré-indicando a subcategoria adverbial oposta à
expectativa inicial testada no cruzamento. Em vista dessa irregularidade observada nos
resultados, decidiu-se indicar uma das duas ressínteses de cada subcategoria como a melhor
candidata a conter as especificações necessárias à configuração do contorno prosódico pré-
indicativo em questão a partir dos seguintes critérios:
a) inicialmente, desconsiderar os casos em que, nos cruzamentos com uma mesma
OSAdv (e.g., causal a x concessiva; causal b x concessiva), os índices de
significância tenham se mostrado idênticos para ambas as ressínteses. Assim, uma
ocorrência de um dado índice de significância para a ressíntese a anula uma
ocorrência desse mesmo índice para a ressíntese b;
b) desconsiderar os casos em que houve reconhecimento do valor pré-indicativo de
forma oposta à expectativa inicial (e.g., a ressíntese b para a pré-indicação causal ter
sido reconhecida como pré-indicativa de finalidade);
c) ainda que os índices de significância tenham sido p ≤ 0,05 para ambas as ressínteses,
selecionar aquela que obteve o melhor índice absoluto de significância;
d) eliminados os casos especificados em (a) e (b) acima, verificar nos cruzamentos com
cada OSAdv qual ressíntese prevalece quantitativamente sobre a outra (e.g., na tabela
7.3, desconsideram-se os cruzamentos com a OSAdv conformativa nos cruzamentos
relativos à OP 1. O resultado para a ressíntese b é numericamente superior ao da
ressíntese a: enquanto esta foi reconhecida significativamente no cruzamento para a
OP 1 monotônica, aquela foi reconhecida para a OP 1 monotônica e também para a
OP2 monotônica);
e) executado o procedimento listado em (d), acima, para os cruzamentos com todas as
OSAdvs, indicar como melhor ressíntese a que prevalecer por maioria absoluta (e.g.,
na tabela 7.3, a ressíntese a prevaleceu nos cruzamentos com as OSAdvs causal e
final; a ressíntese b, nos cruzamentos com as OSAdvs conformativa, consecutiva e
226
temporal. Portanto, a ressíntese b mostra-se como a melhor candidata a conter a
configuração prosódica responsável pela pré-indicação concessiva).
Aplicando-se esses critérios, verificam-se as seguintes indicações de ressínteses como
representativas das pré-indicações adverbiais:
a) causal: ressíntese a;
b) consecutiva: ressíntese b;
c) final: ressíntese b;
d) concessiva: ressíntese b;
e) conformativa: ressíntese a;
f) temporal: ressíntese b.
227
8. CONCLUSÃO
A pesquisa que ora se conclui teve por principais objetivos a confirmação do fenômeno
pré-indicativo prosódico, nos termos de Fónagy (1974), para o português brasileiro (PB) e para o
francês falado na França (FR); e a caracterização fonético-fonológica de contornos prosódicos
pré-indicativos de orações subordinadas adverbiais. Para isso, focalizaram-se as nove
subcategorias oracionais listadas pela gramática tradicional do PB (Bechara, 1992), cada uma
delas assumindo um dos seguintes valores circunstanciais: causa, comparação, concessão,
condição, conformidade, conseqüência, finalidade, proporcionalidade e temporalidade.
De acordo com os critérios listados na seção 5.3, os resultados do Teste 1 mostraram-se
consideravelmente diferentes no PB e no FR. No PB, foi possível identificar quatro pré-
indicações de forma estatitiscamente mais segura – a causal, a concessiva, a consecutiva e a
temporal. Caso se faça uma expansão do critério de reconhecimento das pré-indicações, a essas
quatro somam-se duas outras – a conformativa e a final. Para o FR, pelo critério mais restrito,
não foi possível identificar nenhum valor pré-indicativo; pelo critério expandido, três pré-
indicações passam a ser consideradas – a comparativa, a conformativa e a final. Por uma questão
de fiabilidade dos resultados, optou-se por dar prosseguimento à pesquisa da caracterização
fonético-fonológica dos contornos pré-indicativos apenas para o PB, incluindo-se, no caso, os
dois contornos verificados na expansão do critério seletivo.
Os resultados do Teste 1 confirmaram as duas hipóteses principais: a da existência do
fenômeno pré-indicativo prosódico em relação às orações subordinadas adverbiais, e a da
interferência negativa de uma sílaba pós-tônica na percepção do núcleo do contorno pré-
indicativo. Assim, parece razoável afirmar que o movimento central de um contorno prosódico
pré-indicativo terá um melhor nível de percepção caso seja imediatamente seguido de silêncio.
Um aspecto interessante a observar é o comportamento dos traçados melódicos nas
sílabas tônicas finais da OP 1 e da OP 2 para o PB (cf. figuras 4.1 e 4.2). A análise visual indica
um movimento da F0 muito mais acentuado na OP 1 que na OP 2, considerando-se a amplitude
da sua variação. Uma vez que a OP 2 conta com um número maior de sílabas que a OP 1
(inclusive uma sílaba pós-tônica final), a primeira impressão é a de que o contorno prosódico
dispõe de maior espaço para sua manifestação na OP 2. Moraes e Colamarco (2008) indicam, ao
discutir a questão da adequação de um contorno a uma enunciação quer pelo processo de
compressão, quer pelo processo de truncamento, que, no PB, a tendência se coloca no sentido da
compressão. Assim, ao invés de haver a supressão de determinado tom do contorno (suprimindo-
228
se, portanto, partes da F0), existe uma adequação da F0 a um menor espaço de movimentação,
comprimindo-se. Comparando-se as durações das vogais tônicas finais das OPs 1 e das OPs 2 de
referência (cf. Anexo 3), constata-se que, à exceção da OP 1 condicional, todas as demais OPs 1
apresentam esse segmento com durações menores que as verificadas nas OPs 2. Considerando-
se, portanto: a) que as OPs 2 de referência apresentam maior número de sílabas que as OPs 1; b)
que as durações das vogais tônicas finais das OPs 1 de referência são, quase em sua totalidade,
menores que as das OPs 2, parece possível afirmar que, nas OPs 1 de referência, houve
compressão dos contornos prosódicos pré-indicativos. Isso explicaria, em princípio, o
movimento visualmente mais acentuado da F0 nas sílabas tônicas finais das OPs 1.
Metaforicamente, pode-se estabelecer uma analogia à concentração do sal na água: uma mesma
quantidade de sal será mais intensamente percebida pelo paladar caso esteja diluída em uma
menor quantidade de água; quanto maior a quantidade de água, menor será a percepção do sal
pelo paladar.
No PB, o Teste 1 indicou, considerando a expansão do critério de seleção, como discutido
acima e remetido à seção 5.3, seis contornos pré-indicativos, que podem ser subdivididos em
dois grupos principais: a) os que apresentam contorno ascendente da F0 na sílaba tônica final –
causal, consecutivo, final; e b) os que apresentam contorno descendente da F0 na sílaba tônica
final – concessivo, conformativo, temporal.
Em termos absolutos, e assumindo-se a monotonização da OP, as características
prosódicas dos contornos pré-indicativos de OSAdvs no PB, segundo as tendências observadas
com os resultados obtidos a partir do Teste 2, podem ser sintetizadas da seguinte forma:
1. Contornos pré-indicativos com F0 ascendente na sílaba tônica final
a) causal (ressíntese a):
. formação do vale da F046
, com 1VR47
(20% abaixo da LR48
);
. centralização do vale da F0 na consoante (C) de ataque da STF;
. elevação da F0 5VRs (100%) acima da LR.
46 Como definido no capítulo 6, o vale da F0 se inicia na SPreTF e se conclui na STF, com caracterização
descendente-ascendente, formando uma curva côncava. O vale da F0 é limitado, em seu lado superior, pela linha de
referência. 47 Como definido no capítulo 6, o valor de referência (VR) é baseado na variação descendente da F0, constituída
entre o ataque na vogal da SpreTF e o valor mínimo de pitch verificado ao fim do movimento descendente. 1VR
corresponde a uma variação, em Hz, de 20%. 48 Como definido no capítulo 6, a linha de referência (LR) é uma linha paralela ao eixo temporal (abscissa), que
tangencia a F0 no primeiro momento de sua manifestação visual na vogal pré-tônica final. No caso de uma
monotonização, a LR será a própria F0.
229
b) consecutivo (ressíntese b):
. formação do vale da F0, com 2VRs (40% abaixo da LR);
. centralização do vale da F0 na consoante (C) de ataque da STF;
. elevação da F0 5VRs (100%) acima da linha de referência;
. duração da C de ataque da STF 31% maior que a média das durações das C da
OP, e 7% maior que a duração da VTF;
. duração da VTF 54% maior que a média da duração das vogais (V) da OP.
c) final (ressíntese b):
. formação do vale da F0, com 1,5VR (30% abaixo da LR);
. centralização do vale da F0 na C de ataque da STF;
. elevação da F0 4VRs (80%) acima da linha de referência;
. duração da C de ataque da STF 19% maior que a média das durações das C da
OP, e 26% menor que a duração da VTF;
. duração da VTF 65% maior que a média da duração das V da OP.
Figura 8.1 – Representação esquemática dos contornos prosódicos pré-indicativos de consequência, de causa e de
finalidade, para o PB. O movimento descendente da F0 se inicia na sílaba pré-tônica final. LR: linha de
referência; STF: sílaba tônica final; OP: oração principal; C-dur: duração da consoante; V-dur: duração da
vogal tônica.
C-dur V-dur
Na STF, em relação à média na OP:
+31%
+19%
+54%
+65%
+100%
+80%
-20%
-30%
-40%
LR
pré-indicação consecutiva
pré-indicação causal
pré-indicação final
230
2. Contornos pré-indicativos com F0 descendente na sílaba tônica final
a) concessivo (ressíntese b):
. início do movimento descendente da F0 12% acima do pitch máximo da V na
sílaba anterior à sílaba pré-tônica final (SAPreTF);
. variação de -4% na F0 da VPreTF;
. variação de -30% na F0 da C de ataque da STF;
. variação de -50% na F0 da VTF;
. elevação do pitch de toda a frase em 30% (para compensar o rebaixamento
total);
. criação de um formato côncavo na F0 da VTF, com variação de 15%.
b) conformativo (ressíntese a):
. início do movimento descendente da F0 17% acima do pitch máximo da V na
SAPreTF;
. variação de -10% na F0 da VPreTF;
. variação de -37% na F0 da C da STF;
. variação de -19% na VTF;
. elevação do pitch de toda a frase em 30% (para compensar o rebaixamento
total);
c) temporal (ressíntese b):
. início do movimento descendente da F0 14% acima do pitch máximo da V na
SAPreTF;
. variação de -11% na F0 da VPreTF;
. variação de -34% na F0 da C da STF;
. variação de -5% na F0 da VTF;
. elevação do pitch de toda a frase em 30% (para compensar o rebaixamento
total);
. duração da VTF 47% maior que a média da duração das V da OP.
231
Figura 8.2 – Representação esquemática dos contornos prosódicos pré-indicativos de concessão, de conformidade e
de tempo, para o PB. O pico máximo da F0 se localiza na vogal da sílaba anterior à sílaba pré-tônica final. LR:
linha de referência; STF: sílaba tônica final; OP: oração principal; C-dur: duração da consoante; V-dur:
duração da vogal tônica.
Em relação à discussão estabelecida na seção 1.2 quanto a considerar os contornos
prosódicos como um todo ou como constituídos por partes, os dados obtidos para esta pesquisa
parecem indicar um direcionamento para a postura de Marandin (2004), que considera, para o
francês, os contornos como sendo constituídos de forma holística, ou seja, a informação
veiculada por um dado contorno não é devida a um tom específico, mas à combinação dos vários
eventos fonológicos verificados ao longo desse contorno. A observação das figuras 8.1 e 8.2, em
que três contornos prosódicos (portanto, com valores fonológicos distintos) estão representados
em dois tipos básicos de movimento da F0 na sílaba tônica final – ascendente ou descendente –,
parece indicar que os valores pré-indicativos desses contornos se devem à combinação de todos
os tons constitutivos simultaneamente.
No entanto, percebe-se também que a distinção entre cada contorno de um mesmo grupo
decorre de variações de ordem fonética. Uma vez que a identidade de cada um desses contornos
se deve à combinação dos tons como um todo49
, mas também e necessariamente a essas
variações de ordem fonética, coloca-se o questionamento quanto a não ser mais apropriado
assumir uma postura semelhante à de Aubergé et al. (2004), em que se considera o contorno
prosódico como sendo global (holístico), mas haver nele pontos-chave responsáveis por sua
49 E, em alguns casos, também a valores duracionais.
-5%
-19%
-50%
+17%
+14%
+12%
-34%
-45%
-47%
concavidade em 15%
LR
pré-indicação concessiva
pré-indicação conformativa
pré-indicação temporal
V-dur
Na STF, em relação à média na OP:
+47%
232
identidade. Resta ainda à teoria definir qual a melhor postura a ser adotada para a rotulação
desses contornos.
233
9. ÍNDICE ANALÍTICO
Contornos Prosódicos
abordagem composicional, 3, 25
abordagem holística, 24, 231
adição, 35
asserção prototípica, 76
atitudes/emoções, 44
atos discursivos prototípicos, 35
autonomia da F0, 45
comportamento constante, 21
compressão-truncamento, 25, 227
metáfora sal-água, 228
consciência do falante, 42
conteúdo proposicional, 40
contexto referencial
desambiguação, 42
continuação maior contendo continuações
menores, 78
contorno de continuação, 40, 70
contorno de finalização, 70
contorno estilizado, 31
contorno nananère, 76
contornos entonativos básicos, 35–36
contornos primitivos, 25
contradição, 35
declinação
grau em lookahead, 48
desambiguação, 40, 84, 87
acento frasal, 40
descrição melódica, 43
discurso real, 36
eventos localizados, 39
extensão de pitch, 70
identidade masculina/feminina, 31
idiossincrasia, 30
incompatibilidade, 35
interação com ouvinte, 41
interrogação, 22, 78, 85
questão alternativa, 86
main clause phenomena, 39
normalização/inicialização, 43
orações explicativas, 54
orações subordinadas adverbiais, 4
pares-mínimos, 36, 78
parte significativa, 29
questão total, 42
tema/rema, 86
testes contrastivos, 26–29
tons, 26
tons constitutivos, 71
valor de não-controvérsia, 34
valor emotivo-atitudinal, 22
valor fonológico, 21
valor lingüístico, 30
valor paralingüístico, 30
Função Entonativa
contorno interrogativo, 12
explicatura, 20
falante, 9
função atitudinal, 43
função gramatical, 9
inferências pragmáticas, 14
interação locutor-ouvinte, 10
interferências pragmáticas, 11, 18
sentido frasal, 8, 11
simbologia social, 21
valor semântico, 9
Metodologia
corpus
pares-mínimos, 91
critérios para escolha final das ressínteses,
225
critérios seleção para Teste 2, 136
fricativa alveolar surda, 99
gravação FR, 96
gravação PB, 93
OP1/OP2 FR, 95
OP1/OP2 PB, 91
prosograma, 110, 197, 205
ressíntese
alinhamento, 106
apenas PB no Teste 2, 104
elevação máxima F0, 107
justificativa para OP monotônica, 105
justificativa para OP neutra, 104
OP neutra, 104
Praat
configuração, 105
seqüenciação do processo, 105
Teste 2, 108
cruzamento, 108
diagramação, 108
variação entre programas, 106
234
voz masculina, 104
schwa, 95
sílaba pós-tônica, 91, 95
tão, 92
Teste 1 FR
aplicação, 103
cruzamento, 102
diagramação, 102
Teste 1 PB
aplicação, 101
cruzamento, 100
diagramação, 100
Modelos Entonativos
contornos prosódicos
estabelecimento, 67
francês
10 contornos (Delattre, 1966), 72
10 contornos (Post, 2000), 72
4 contornos descendentes (Marandin,
2004), 77
4 contornos finais (Marandin, 2004), 75
acentuação em primeiro nível, 67
acentuação no nível sintagmático, 73
asserção prototípica, 76
comprometimento (commitment), 80
conflito de acentos, 68
contorno nananère, 76
contornos ascendentes (Marandin,
2004), 77
controvérsia, 79
eventos fonológicos, 68
não-controvérsia, 79
níveis de fraseamento, 74
percepção de proeminências, 74
percepção do acento lexical, 74
inglês
22 contornos (Pierrehumbert 1980), 72
abordagem composicional, 73
status morfêmico, 73
inversão de pente, 68
português
acento frasal, 82
acento lexical, 81
acento secundário, 82
alternância rítmica, 82
antecipação, 85
causa-conseqüência, 87
coesão sintática, 83
desambiguação, 84
elevação expressiva da F0, 81
ênfase contrastiva, 88
hierarquia correlatos acústicos, 82
intensidade, 82
interrogação, 85
metalinguagem, 84
negação na OP, 88
questão alternativa, 86
sílaba acentuada, 82
sílaba pós-tônica, 82
tamanho dos constituintes, 83
tema/rema, 86
Pré-Indicação
adversidade, 47
atitudes/emoções, 44
definição, 3
downstep, 48
aumento na extensão do pitch, 49
cancelamento, 49
dagará, 49
elevação antecipatória, 51
iorubá, 48
japonês, 50
resetting, 50
enumeração, 47
índices antecipatórios, 85
ocorrência, 45
oração principal, 39
processamento do sinal, 36
tamanho do enunciado, 37, 46
valor cognitivo, 4, 37
valor probabilístico, 43
Ressíntese
cálculo grau concavidade, 151
cálculo grau convexidade, 154
cálculo redução da duração, 149
duração intrínseca fricativas, 169
F0 ascendente
descrição, 139, 140
F0 descendente
cálculo queda, 150
descrição, 142
formato côncavo/convexo, 142
linha de referência (LR), 140
modalidade monotônica, 143
modalidade neutra, 143
ressínteses OP1 ~ OP2, 170
valor de referência (VR), 139
Resultados
hipóteses para o FR, 135
Teste 2
235
OP neutra ~ OP monotônica, 191
Resultados FR
hipótese
diferença causal-comparativa, 128
diferença causal-consecutiva, 129
diferença comparativa-conformativa,
129
diferença comparativa-final, 129
diferença comparativa-proporcional,
129
diferença concessiva-final, 130
diferença final-proporcional, 133
diferença proporcional-temporal, 134
Resultados PB
hipótese
diferença causal-consecutiva, 113
diferença comparativa-final, 115
diferença concessiva-proporcional, 117
diferença concessiva-temporal, 117
diferença condicional-consecutiva, 118
diferença consecutiva-causal, 122
diferença consecutiva-condicional, 122
diferença consecutiva-final, 122
diferenciação concessiva-conformativa,
116
Sintaxe
arquicategoria adverbial (causa), 125
articulação do discurso, 61
atividade discursiva, 53
auto-suficiência, 8
coesão sintática, 83
condição de igualdade OP/coordenada, 57
coordenação, 52
equivalência semântica, 54
estrutura entonacional
estruturas internas múltiplas, 58
grupos tonais, 58
significado continuativo, 58
tipos de seqüências, 58
forma canônica OP-OSAdv, 90
Gramática Gerativa, 1
hierarquia OSAdv-OP, 90
hipotaxe, 52
de tom H a tom L, 59
grupos tonais, 57
subordinação gramatical sem
entonacional, 60
subordinação tonal sem sintática, 60
interface sintaxe-fonologia, 14
línguas OV/VO, 56
orações adjetivas, 53
orações adverbiais, 53, 54
orações completivas, 54
orações coordenadas adversativas, 4
orações subordinadas adverbiais, 4
orações substantivas, 53
parataxe, 52
período, 52
polissemia causa-condição / finalidade /
proporção / tempo, 124
polissemia causa-proporção, 124
polissemia tempo-condição, 119, 126
sentença complexa, 53
sentença composta, 53
subordinação, 53
testes sintáticos, 56, 91
critério pragmático, 57
deranking, 56
Teoria Prosódica
acento primário, 17
acentos de pitch, 65
alvo da F0, 32
análise fina, 44
categorias prosódicas, 15
clichê melódico, 64
códigos biológicos
código de esforço, 23
código de freqüência, 23
código de produção, 24, 69
condição de unidade de sentido, 16
constituinte entonacional
complexidade, 62
coordenação, 62
fronteira sintática, 63
contorno prosódico
questionamentos, 64
contornos entonacionais, 15
crítica ao não-detalhamento, 13
duração silábica, 74
entonação igualando léxico, 12
entonema, 64
escala tonal, 33
estrutura da F0, 46
cálculo da inclinação, 69
estrutura informacional, 12
estrutura sintática armazenada, 19
evento, 32
falha de detalhamento, 13
fraseamento entonacional, 16, 82
Gramática Gerativa, 8
236
grupo rítmico, 65
idiossincrasia, 21
independência prosódica, 2, 15
interface sintaxe-fonologia, 8, 16, 19
Linguist’s Theory of Intonational
Meaning, 2, 13
memória de curto-termo, 19
modelos normalizadores, 33
nível pós-lexical, 10
normalização de pitch, 34
pausa, 17
performance, 8
procursão, 45
segmentação prosódica, 65
princípios rítmicos, 67
sintaxe, 66
Sense Unit Condition, 11
sintagma fonológico, 73
sistema prosódico, 44
teoria métrico-autossegmental, 26, 32
transição, 32
unidade de sentido, 15
unidade entonacional, 16, 18, 64, 65
groupes de souffle, 69
tamanho, 62
tamanho médio, 19
unidade gramatical, 18
unidades entonacionais
tamanho médio, 68
unidades gramaticais totais, 18
valor específico, 23
valor fonológico, 3, 22
valor lingüístico, 3, 13, 45
valor paralingüístico, 1, 3, 12, 13, 22, 33
valor universal, 23
237
10. REFERÊNCIAS BIBLIOGRÁFICAS
ANDERSON, J. M. (2005) The non-autonomy of syntax. In: Folia Linguistica XXXIX:3-4, 223-
250.
AUBERGÉ, V.; PILLAT, T. Gr; RILLIARD, A. (1997) Can we perceive attitudes before the end
of sentences - the gating paradigm for prosodic contours. In: Proceedings of Eurospeech
1997. Rhodes/Athens, Greece.
AUBERGÉ, V.; AUDIBERT, N.; RILLIARD, A. (2004) Acoustic morphology of expressive
speech: what about contours? In: Proceedings of the 2nd International Conference on Speech
Prosody 2004. Nara, Japan.
BÄNZIGER, T.; MOREL, M; SCHERER, K. (2003) Is there an emotion signature in
intonational patterns? And can it be used in synthesis? In: Proceedings of the Eurospeech
2003. Geneva.
BARBIZET, J.; LEDERER, M.; PERGNIER, M.; SELESKOVITCH, D. (1979) Vouloir-dire,
intonation et structures des phrases. In: Folia Linguistica XIII:3-4, 237-245.
BECHARA, E. (1992) Moderna gramática portuguesa. 34a ed. São Paulo : Companhia Editora
Nacional.
BERMÚDEZ-OTERO, R.; HONEYBONE, P. (2006) Phonology and syntax: a shifting
relationship. In: Lingua 116, 543-561.
BEYSSADE, C.; MARANDIN, J.-M. (2007) French Intonation and Attitude Attribution. In:
DENIS, P.; McCREADY, E.; PALMER, A.; REESE, B. (eds.) Proceedings of the 2004
Texas Linguistics Society Conference: Issues at the Semantics-Pragmatics Interface.
Disponível em http://www.lingref.com/cpp/tls/2004/.
BOERSMA, P., & WEENINK, D. (2005). Praat: doing phonetics by computer (Version 4.3.01)
[Computer program]. Disponível em http://www.praat.org/.
238
BOLINGER, D. (1985). The inherent iconism of intonation. In: HAIMAN, J. (ed.) Iconicity in
syntax. Proceedings of a symposium on iconicity in syntax, Stanford, June 24-6, 1983.
Amsterdam, Philadelphia : John Benjamins.
CHEN, A.-J. (2003) Language-specificity in the perception of continuation intonation. In:
Proceedings of the 15th
International Congress of Phonetic Sciences.
CHOMSKY, N.; HALLE, M. (1968) The sound pattern of English. New York : Harper and
Row; Boston : MIT Press.
COUPER-KUHLEN, E. (1985) An introduction to English prosody. Tübungen : Niemeyer,
1985.
CROFT, W. (1995) Intonation units and grammatical structure. In: Linguistics 33, 839-882.
Mouton de Gruyter, Berlin, New York.
CUNHA, C.; CINTRA, L. (1985) Nova gramática do português contemporâneo. 34a ed. Rio de
Janeiro : Nova Fronteira.
DARGNAT, M.; JAYES, J. (2007) La cohésion paratactique: une approche constructionnelle.
In: BÉGUELIN, J. (ed.) Actes du colloque La Parataxe (Neuchâtel). Manuscrito inédito.
DELAIS-ROUSSARIE, E.; RIALLAND, A.; DOETJES, J.; MARANDIN, J.-M. (2002) The
prosody of post-focus sequences in French. In: Proceedings of the 1st International
Conference on Speech Prosody 2002, 239-242.
DELATTRE, P. (1966) Les dix intonations de base du français. French Review, XL:1, 1-14.
DI CRISTO, A. (1985) De la microprosodie à l'intonosyntaxe. Publications Université de
Provence.
DI CRISTO, A. (2004) La prosodie au carrefour de la phonétique, de la phonologie et de
l'articulation formes-fonction. In: Travaux interdisciplinaires du Laboratoire Parole et
Langage d’Aix-en-Provence. Aix-en-Provence : Université de Provence.
239
DIAS, M.G.B.B.; VANDERLEI, R.B. (1999) A habilidade para diferenciar se de quando. In:
Psicologia: reflexão e crítica, 12:197-208.
DIESSEL, H. (2001) The ordering distribution of main and adverbial clauses: a typological
study. In: Language 77:3, 433-455.
D‟IMPERIO, M.; ELORDIETA, G.; FROTA, S.; PRIETO, P.; VIGÁRIO, M. (2005) Intonation
phrasing in Romance: the role of syntactic and prosodic structure. In: FROTA, S.;
VIGÁRIO, M.; FREITAS, M.J. (eds.) Prosodies. Berlin/New York : Mouton de Gruyter, 59–
97.
FÓNAGY, I. (1974) La fonction préindicative de l‟intonation en français et en hongrois. In :
Travaux de l’Institut d’Études Linguistiques et Phonétiques. Vol. I, 44-75.
FOX, A. (1984) Subordinating and co-ordinating intonation structures in the articulation of
discourse. In: GIBBON, D.; RICHTER, H. (eds.) Intonation, accent and rythm studies –
phonology. Berlin : Walter de Gruyter.
FOX, A. (2000) Prosodic features and prosodic structure. Oxford : Oxford University Press.
FREITAS, M. A. de (1995) Prosódia e sintaxe: delimitação e contraste de estruturas. Tese de
doutorado. Rio de Janeiro : Universidade Federal do Rio de Janeiro. 228 fls. mimeo.
GOLDSMITH, J. A. (1976) Autosegmental phonology. Bloomington, Indiana : Indiana
University Linguistics Club.
GONÇALVES, C. A. V. (1997) Focalização no português do Brasil. Tese de doutorado. Rio de
Janeiro : Universidade Federal do Rio de Janeiro.
GOUVEIA, E. L.; ROAZZI, A.; O‟BRIEN, D. P.; MOUTINHO, K.; DIAS, M. da G. B. B.
(2001) Se e quando: sinônimos?!!! In: Psicologia: teoria e pesquisa. Vol. 17, 3:265-273.
240
GRICE, H. P. (1975) Logic and conversation. In: COLE, P.; MORGAN, J. (eds.) Syntax and
semantics. (3:41-58) New York : Academic Press.
GRØNNUM, N.; VIANA, M. (1999) Aspects of European Portuguese intonation. In:
Proceedings of the 14th International Congress of Phonetic Sciences, São Francisco, 1-7
August 1999, vol. 3, 1997-2000.
GROSJEAN, F. (1983) How long is the sentence? Prediction and prosody in the on-line
processing of language. In: Linguistics 21-3, 501-529.
GUSSENHOVEN, C. (2002a) Intonation and interpretation: phonetics and phonology. In:
Proceedings of the 1st International Conference on Speech Prosody 2002, 47-57.
GUSSENHOVEN, C. (2002b) Phonology of intonation. Cap. 11. The phonology of intonation.
Glot Internation. 6, No. 9/10, 271-284.
HARFORD, C.; DEMUTH, K. (1999) Prosody outranks syntax: an optimality approach to
subject inversion in Bantu relatives. In: Linguistic Analysis, 29 (1-2), 47-68.
HOUSE, J. (2006) Constructing a context with intonation. In: Journal of Pragmatics 38, 1542-
1558.
LADD, D. R., Jr. (1978) Stylized intonation. In: Language, 54:3, 517-540.
LADD, D. R., Jr. (1980) Intonation, main clause phenomena, and point of view. In: WAUGH, L.
R.; VAN SCHOONEVELD, C.H. The melody of language. Intonation and prosody.
Baltimore : University Park Press, 149-163.
LADD, D.R., Jr. (1996) Intonational phonology. Cambridge : Cambridge University Press.
MARANDIN, J.-M. (2004) Contours as constructions. In: ICCG-3: The Third International
Conference on Construction Grammars.
241
MARANDIN, J.-M.; BEYSSADE, C.; DELAIS-ROUSSARIE, E.; RIALLAND, A.; DE
FRONEL, M. (2004) The meaning of final contour in French. Disponível em
http://www.llf.cnrs.fr/fr/Marandin/
MARTIN, Ph. (1982) Phonetic realizations of prosodic contours in French. In: Speech
communication 1, 283-294.
MARTIN, Ph. (2002) The continuation contour in French. In: Proceedings of the 1st
International Conference on Speech Prosody 2002, Proceedings of the First International
Conference on Prosody, 239-242.
MATEUS, M. H. M.; BRITO, A. M.; DUARTE, I.; FARIA, I. H. (2003) Gramática da língua
portuguesa. Lisboa : Editorial Caminho.
MEJVALDOVÁ, J. (2001) Expressions prosodiques de certaines attitudes en tchèque et en
français: étude comparative. Thèse de Doctorat. Université Paris 7, Université Charles.
MERTENS, P. (2004) The prosogram: semi-automatic transcription of prosody based on a tonal
perception model. In: Proceedings of the 2nd International Conference on Speech Prosody
2004. Nara, Japan.
MORA, E.; COURTOIS, F.; CHRISTIAN, C. (1997-1998) L‟accent lexical espagnol: perception
par des francophones et des hispanophones. In: Travaux de l’Institut de Phonétique d’Aix.
18:105-112.
MORAES, J. A. (1984) Recherches sur l'intonation modale du portugais parlé à Rio de Janeiro.
Doctorat de 3ème cycle. Paris : Université de Paris III.
MORAES, J. A. (1998) Intonation in Brazilian Portuguese. In: HIRST, D.; DI CRISTO, A.
Intonation systems. A survey of twenty languages. Cambridge : Cambridge University Press.
MORAES, J. A.; COLAMARCO, M. (2008) Accomodation of intonational patterns in Brazilian
Portuguese short utterances: compression or truncation? Manuscrito inédito.
242
MORAES, J. A.; ESPESSER, R. (1988) La hiérarchie des indices prosodiques de l‟accent en
portugais. Une étude basée sur la synthèse de la parole. Texto lido na First International
Conference on Experimental Phonostylistics, Sociophonology and Speech Acoustic
Variability. Florianópolis, Universidade de Santa Catarina.
MORAES, J. A.; LEITE, Y. (1992) Ritmo e Velocidade da Fala na Estratégia do Discurso. In:
ILARI, R. (org.) Gramática do Português Falado. Vol. II: Níveis de Análise Lingüística.
Campinas: Editora Unicamp, pp. 65-77.
MORAES, J. A.; STEIN, C. C. (2006) Attitudinal patterns in Brazilian Portuguese intonation:
analysis and synthesis. In: Proceedings of the 3rd International Conference on Speech
Prosody 2006.
ORSINI, M. T. (2003) As construções de tópico no tortuguês do Brasil: uma análise sintático-
discursiva e prosódica. Tese de doutorado. Rio de Janeiro : Universidade Federal do Rio de
Janeiro.
PIERREHUMBERT, J. 1980 (1988) The phonology and phonetics of English intonation.
Bloomington : Indiana University Linguistics Club.
PIERREHUMBERT, J.; HIRSCHBERG, J. (1990) The meaning of intonational contour in the
interpretation of discourse. In: COHEN, P.; MORGAN, J.; POLLACK, M. (Eds.) Intentions
in communication. Cambridge, Massachussets : MIT Press.
PINEK, B.; CAVE, C. (1993) Temporal auditory integration and the pitch of glissandi:
differential perceptual effects. In: Travaux de l’Institut de Phonétique d’Aix, 15, 253-274.
PORTES, C.; BERTRAND, R. (2005) De la valeur interactionnelle du “contour continuatif” en
français. Résultats préliminaires. In: Travaux Interdisciplinaires du Laboratoire Parole et
Langage d'Aix-en-Provence 24, 139-157.
POST, B. (2000) Tonal and phrasal structures in French intonation. Holland Academic
Graphics, The Hague.
243
PREVOST, S.; STEEDMAN, M. (1994) Specifying intonation from context for speech
synthesis. Speech Communication.
RIALLAND, A. (2001) Anticipatory raising in downstep realization: evidence for preplanning in
tone production. In: KAJI, S. (ed.) Cross-linguistics studies of tonal phenomenon:
tonogenesis, typology, and related topics. Vol. 3. Institute for the Study of Languages and
Cultures of Asia and Africa (ILCAA).
ROSSI, M. (1971) Le seuil de glissando ou seuil de perception des variations tonales pour les
sons de la parole. In: Phonetica 23, 1-33.
ROSSI, M. (1978) La perception des glissandos descendants dans les contours prosodiques. In:
Phonetica 35, 11-40.
ROUSSEAU, A. (2002) La question de la subordonné au tournant du siècle (et au delà). In:
Modèles Linguistiques XXIII:1, 147-160.
SELKIRK, E. O. (1980) On prosodic structure and its relation to syntactic structure.
Bloomington : Indiana University Linguistics Club.
SELKIRK, E. O. (1984) Phonology and syntax: the relation between sound and structure.
Cambridge, London : The MIT Press.
SNEDEKER, J.; GLEITMAN, L.; FELBERBAUM, M.; PLACA, N.; TRUESWELL, J. (2000)
Prosodic choice: effects of speaker awareness and referential context. In: Proceedings of the
International Congress in Cognitive Science.
STEEDMAN, M. (1991) Structure and intonation. In: Language 67, 260-296.
STEEDMAN, M. (2000) Information structure and the syntax-phonology interface. In:
Linguistic Inquiry 31:4, 649-689.
244
STEIN, C. C. (2003) Para uma teoria da recepção. Interferências pragmáticas e prosódicas na
leitura. Dissertação de Mestrado. Rio de Janeiro : Universidade Federal do Rio de Janeiro.
139 fls. mimeo.
SWERTS, M.; BOUWHUIS, D. G.; COLLIER, R. (1994) Melodic cues to the perceived
“finality” of utterances. In: Journal of the Acoustic Society of America. 96:4, 2064-2075.
VAISSIÈRE, J. (1997) Langues, prosodie et syntaxe. In: Revue Traitement Automatique des
Langues. Número spécial Prosodie et syntaxe. ATALA, 38:1, 53-82.
VAISSIÈRE, J. (2004) Perception of intonation. In: PISONI, D. B.; REMEZ, R. E. (eds.)
Handbook of speech perception. Oxford : Blackwell.
245
11. ANEXOS
246
Contextualização Oração Principal Relação Oração Subordinada
Era uma pessoa muito dedicada, mas nem sempre tudo corria bem.
01. Ficava infeliz causal porque o trabalho não produzia frutos.
Seus trabalhos eram bons, mas seu nível de
exigência era muito elevado.
comparativa como uma pessoa que não via resultados.
Vislumbrava um grande desafio pela frente. Mas havia muitos problemas.
concessiva embora o trabalho o motivasse.
O atleta era, sem dúvida, muito exigente. condicional se os exercícios não fossem adequados.
Sempre acreditou que para cada dia havia uma
desgraça.
conformativa conforme convinha a um pessimista.
Nunca se contentou com o desempenho mediano dos funcionários.
consecutiva que dava pena ver seu rosto.
Queria se fazer passar por coitado o tempo todo. final para que todos sentissem pena dele.
Já não tinha a mesma garra da época da juventude. proporcional à medida que via seus planos desabarem.
Nunca admitiria ouvir opiniões diferentes sem que pudesse apresentar as suas próprias.
temporal quando não lhe permitiam falar.
Era uma pessoa muito dedicada, mas nem sempre
tudo corria bem.
02. Mostrava-se cansado causal porque o trabalho não produzia frutos.
Seus trabalhos eram bons, mas seu nível de exigência era muito elevado.
comparativa como uma pessoa que não via resultados.
Vislumbrava um grande desafio pela frente. Mas
havia muitos problemas.
concessiva embora o trabalho o motivasse.
O atleta era, sem dúvida, muito exigente. condicional se os exercícios não fossem adequados.
Sempre acreditou que para cada dia havia uma
desgraça.
conformativa conforme convinha a um pessimista.
Nunca se contentou com o desempenho mediano
dos funcionários.
consecutiva que dava pena ver seu rosto.
Queria se fazer passar por coitado o tempo todo. final para que todos sentissem pena dele.
Já não tinha a mesma garra da época da juventude. proporcional à medida que via seus planos desabarem.
Nunca admitiria ouvir opiniões diferentes sem que
pudesse apresentar as suas próprias.
temporal quando não lhe permitiam falar.
Anexo 1 – Contextualização das orações principais 1 e 2 para o PB, seguidas das nove possibilidades de orações subordinadas adverbiais, para a
formação do corpus oral utilizado no Teste 1.
247
Contextualização Oração Principal Relação Oração Subordinada
Paul recherche un emploi. 01. Il est ennuyé cause car le marché du travail est très exigeant.
Paul n‟a pas confiance en lui. comparaison comme s‟il allait échouer à tous ses examens.
Paul est surprenant. concession alors que tous les résultats sont positifs.
Paul est très perfectionniste. condition si les exercices ne lui sont pas adaptés.
Paul n‟a pas donné de nouvelles depuis
longtemps.
conformité d‟après ce qu‟a dit la petite fille de sa voisine.
Paul va être licencié. conséquence du coup il est désagréable avec ses amis.
Paul n’est pas majeur. but pour obtenir une autorisation de sortie.
Paul n‟est plus tout jeune. proportionalité à mesure qu‟il voit ses plans professionnels
échouer.
Paul veut vraiment réussir.
temporalité après avoir travaillé des heures sans comprendre.
Paul recherche un emploi. 02. Il se montre irritable cause car le marché du travail est très exigeant.
Paul n‟a pas confiance en lui. comparaison comme s‟il allait échouer à tous ses examens.
Paul est surprenant. concession alors que tous les résultats sont positifs.
Paul est très perfectionniste. condition si les exercices ne lui sont pas adaptés.
Paul n‟a pas donné de nouvelles depuis
longtemps.
conformité d‟après ce qu‟a dit la petite fille de sa voisine.
Paul va être licencié. conséquence du coup il est désagréable avec ses amis.
Paul n’est pas majeur. but pour obtenir une autorisation de sortie.
Paul n‟est plus tout jeune. proportionalité à mesure qu‟il voit ses plans professionnels
échouer.
Paul veut vraiment réussir.
temporalité après avoir travaillé des heures sans comprendre.
Anexo 2 – Contextualização das orações principais 1 e 2 para o FR, seguidas das nove possibilidades de orações subordinadas adverbiais, para a
formação do corpus oral utilizado no Teste 1.
248
OP 1 neutra OP 1 causal OP 1 comparativa OP 1 concessiva
média dur C 0,105 média dur C 0,087 média dur C 0,087 média dur C 0,082
média dur V 0,101 média dur V 0,091 média dur V 0,091 média dur V 0,092
F0 dur% média
durF0 dur
% média
durF0 dur
% média
durF0 dur
% média
dur- - - -
123 159 161 168
123 159 161 168
- 134 139 150
- 134 139 150
127 173 191 189
127 173 191 189
122 156 181 186
122 156 181 186
122 141 195 209
122 141 195 209
99 141 178 186
99 141 178 186
132 145 230 258
132 145 230 247
109 131 207 237
109 131 207 237
103 141 154 181
103 141 154 181
120 236 146 120
120 236 146 120
- - - -
a 0,121 21
0,027 -67
i 0,043 -57 i 0,044 -51 i 0,043
f 0,051 -52 f 0,056 -36 f
-53
k 0,113 8 k 0,079 -9 k 0,071 -14
0,057 -30
i~ 0,077 -24 i~ 0,079 -13
0,086 -5 a 0,081 -12
v 0,071 -32 v 0,054
a
0,084 -8
f 0,108 3 f 0,132 51 f 0,099 21
e 0,077 -23 e 0,066 -27 e 0,075 -19
l 0,071 -32 l 0,117 34 l 0,092 12
0,177 93
S 0,214 105 S 0,086 -2 S
i 0,184 83 i 0,179 97
0,145 78
f 0,099 14%
i 0,058 -37%
i
i~
-39 v
k 0,067 -23%
v 0,045 -48%
a 0,077 -15%
i~ 0,083 -9%
f 0,110 26%
l 0,084 -3%
e 0,091 -1%
i 0,147 61%
S 0,116 33%
Anexo 3a – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP1 neutra e das OPs 1causal, comparativa e
concessiva de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em cada OP. Na
quarta coluna das tabelas, a variação percentual dos valores duracionais de cada fone em relação a essa média.
249
OP 1 neutra OP 1 condicional OP 1 conformativa OP 1 consecutiva
média dur C 0,105 média dur C 0,094 média dur C 0,094 média dur C 0,108
média dur V 0,101 média dur V 0,097 média dur V 0,089 média dur V 0,085
F0 dur% média
durF0 dur
% média
durF0 dur
% média
durF0 dur
% média
dur
- - - -
123 161 149 -
123 161 149 -
- 139 135 -
- 139 135 -
127 191 152 174
127 191 152 174
122 181 162 166
122 181 162 166
122 195 180 176
122 195 180 176
99 178 182 162
99 178 182 162
132 230 242 172
132 230 238 172
109 207 216 126
109 207 216 126
103 154 157 149
103 154 157 149
120 146 131 223
120 146 131 223
- - - -
k 0,113 8
i 0,043 -57
f 0,051 -52
i~ 0,077 -24
v 0,071 -32
a 0,121 21
l 0,071 -32
e 0,077 -23
f 0,108 3
S 0,214 105
i 0,184 83
0,050 -42
f 0,090 -17
0,083 -2
k 0,088 -18
0,059 -45
0,075 -13
0,088 3
f 0,138 29
l 0,140 31
f 0,077 -18%
S 0,130 21
i 0,131 54
i 0,060 -38%
e
i~
v
a
i
k 0,077 -18%
v 0,046 -51%
a 0,099 2%
i~ 0,087 -10%
f 0,120 27%
l 0,099 5%
e 0,075 -23%
i 0,165 69%
S 0,144 53%
k 0,098 5
a 0,088 -2
f 0,042 -55
i 0,053 -40
f 0,126 35
e 0,075 -15
v 0,051 -45
i~ 0,098 10
S 0,165 76
l 0,079 -16
i 0,131 47
Anexo 3b – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP1 neutra e das OPs condicional,
conformativa e consecutiva de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em
cada OP. Na quarta coluna das tabelas, a variação percentual dos valores duracionais de cada fone em relação a essa média.
250
OP 1 neutra OP 1 final OP 1 proporcional OP 1 temporal
média dur C 0,105 média dur C 0,093 média dur C 0,077 média dur C 0,093
média dur V 0,101 média dur V 0,090 média dur V 0,080 média dur V 0,078
F0 dur% média
durF0 dur
% média
durF0 dur
% média
durF0 dur
% média
dur
- - - -
123 165 161 161
123 165 161 161
- - 139 139
- - 139 139
127 171 191 191
127 171 191 191
122 142 181 181
122 142 181 181
122 144 195 195
122 144 195 195
99 148 178 178
99 148 178 178
132 166 230 230
132 166 230 230
109 129 207 207
109 129 207 207
103 156 154 154
103 156 154 154
120 202 146 146
120 202 146 146
- - - -
f 0,051 -52
e 0,077 -23
f 0,108 3
i~ 0,077 -24
v 0,071 -32
a 0,121 21
k 0,113 8
i 0,043 -57
S 0,214 105
i 0,184 83
l 0,071 -32
i 0,046 -49 i 0,047 -40
f 0,095 3 f 0,081
a 0,088 -3 a
k 0,080 -13
-13
v 0,045 -52 v 0,059
k 0,085 -9
i~ 0,090 0 i~ 0,082 5
0,077 -2
e 0,078 -13 e
f 0,127 37
-37
47
0,070 -11
l 0,110 19 l 0,106
f 0,129 38
0,101 8
f
S 0,098 6
14
i 0,149 65 i 0,115
i 0,058
S
k 0,066 -15%
0,060 -23%
v
-27%
i~ 0,082
a 0,088 11%
f 0,109 42%
0,041 -47%
l
3%
i 0,159
e 0,091 14%
99%
S 0,141 84%
0,104 35%
Anexo 3c – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP1 neutra e das OPs final, proporcional e
temporal de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em cada OP. Na
quarta coluna das tabelas, a variação percentual dos valores duracionais de cada fone em relação a essa média.
251
OP 2 neutra OP 2 causal OP 2 comparativa OP 2 concessiva
média dur C 0,078 média dur C 0,072 média dur C 0,076 média dur C 0,069
média dur V 0,092 média dur V 0,091 média dur V 0,084 média dur V 0,089
F0 dur% média
durF0 dur
% média
durF0 dur
% média
durF0 dur
% média
dur
- 158 170 -
113 148 148 149
113 148 148 149
103 132 139 147
103 132 139 147
- - - -
- - - -
124 156 - 192
124 156 - 192
116 148 163 187
116 148 163 187
116 147 173 192
116 147 173 192
118 146 178 203
118 146 178 203
110 147 177 201
110 147 177 201
- - - -
- -
- 136
- 136 - -
127 153 219 237
127 153 219 237
100 135 190 221
100 135 190 221
- 146 170 -
- 146 170 -
114 179 125 113
114 179 125 113
120 191 125 114
120 191 125 114
- 171 - -
m 0,033 -53m 0,022 -72 m 0,018 -74
o 0,053 -41o 0,072 -22 o 0,081 -11
S 0,076 10S 0,079 2 S 0,076 6
t 0,049 -29t 0,056 -28 t 0,060 -16
4 0,038 -454 0,044 -43 4 0,040 -45
a 0,078 -13a 0,126 36 a 0,106 16
v 0,049 -29v 0,053 -32 v 0,035 -51
a 0,039 -56a 0,043 -54 a 0,047 -49
s 0,080 16s 0,125 61 s 0,100 39
ii 0,022 -77 i 0,039 -57
k 0,074 8k 0,088 13 k 0,088 23
a~ 0,105 18a~ 0,103 11 a~ 0,100 11
s 0,170 147s 0,151 95 s 0,186 158
a 0,186 109a 0,196 112 a 0,193 113
d 0,052 -25d 0,081 5 d 0,045 -38
u 0,073 -18u 0,086 -7 u 0,069 -24
o 0,071 -16%
m 0,028 -63%
S 0,092 22%
t 0,068 -10%
a 0,107 27%
4 0,019 -74%
v 0,045 -41%
a 0,047 -44%
i 0,036 -58%
s 0,107 41%
k 0,091 20%
a~ 0,105 25%
a 0,175 108%
s 0,175 132%
d 0,055 -27%
u 0,049 -42%
Anexo 3d – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP2 neutra e das OPs 2 causal, comparativa e
concessiva de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em cada OP. Na
quarta coluna das tabelas, a variação percentual dos valores duracionais de cada fone em relação a essa média.
252
OP 2 neutra OP 2 condicional OP 2 conformativa OP 2 consecutiva
média dur C 0,078 média dur C 0,066 média dur C 0,068 média dur C 0,072
média dur V 0,092 média dur V 0,083 média dur V 0,091 média dur V 0,085
F0 dur% média
durF0 dur
% média
durF0 dur
% média
durF0 dur
% média
dur
- 170 173 -
113 148 156 140
113 148 156 140
103 139 163 141
103 139 163 141
- - - -
- - - -
124 - - 155
124 - - 155
116 163 179 143
116 163 179 143
116 173 182 141
116 173 182 141
118 178 196 139
118 178 196 139
110 177 187 144
110 177 187 144
- - - -
-
-
- - - -
127 219 237 145
127 219 237 145
100 190 221 132
100 190 221 132
- 170 207 181
- 170 207 181
114 125 118 192
114 125 118 192
120 125 132 192
120 125 132 192
- - 111 160
m 0,018 -73
o 0,075 -17
S 0,073 7
t 0,056 -17
4 0,033 -51
a 0,104 14
v 0,044 -35
a 0,046 -50
s 0,080 17
i
k 0,093 37
a~ 0,101 11
s 0,165 143
a 0,183 101
d 0,049 -28
u 0,038 -59
o 0,056 -35
m 0,027 -62
S 0,081 13
t 0,042 -42
a 0,095 11
4 0,043 -41
v 0,037 -48
a 0,047 -44
i
s 0,097 35
k 0,097 36
a~ 0,094 11
a 0,157 84
s 0,179 149
d 0,043 -39
u 0,062 -27
o 0,067 -19%
m 0,038 -42%
S 0,107 63%
t 0,051 -22%
a 0,100 20%
4 0,013 -80%
v 0,042 -36%
a 0,046 -45%
i
s 0,092 41%
k 0,080 23%
a~ 0,100 20%
a 0,154 85%
s 0,152 131%
d 0,015 -78%
u 0,033 -61%
S 0,079 2
t 0,056 -28
m 0,022 -72
o 0,072 -22
v 0,053 -32
a 0,043 -54
4 0,044 -43
a 0,126 36
k 0,088 13
a~ 0,103 11
s 0,125 61
i 0,022 -77
d 0,081 5
u 0,086 -7
s 0,151 95
a 0,196 112
Anexo 3e – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP2 neutra e das OPs 2 condicional,
conformativa e consecutiva de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em
cada OP. Na quarta coluna das tabelas, a variação percentual dos valores duracionais de cada fone em relação a essa média.
253
OP 2 neutra OP 2 final OP 2 proporcional OP 2 temporal
média dur C 0,078 média dur C 0,074 média dur C 0,066 média dur C 0,070
média dur V 0,092 média dur V 0,083 média dur V 0,091 média dur V 0,089
F0 dur% média
durF0 dur
% média
durF0 dur
% média
durF0 dur
% média
dur
- - 170 170
113 128 148 148
113 128 148 148
103 128 139 139
103 128 139 139
- - - -
- - - -
124 161 - -
124 161 - -
116 154 163 163
116 154 163 163
116 145 173 173
116 145 173 173
118 143 178 178
118 143 178 178
110 145 177 177
110 145 177 177
- - - -
- -
- -
- - - -
127 143 219 219
127 143 219 219
100 130 190 190
100 130 190 190
- 183 170 170
- 183 170 170
114 149 125 125
114 149 125 125
120 129 125 125
120 129 125 125
- - - -
d 0,081 5
u 0,086 -7
s 0,151 95
a 0,196 112
k 0,088 13
a~ 0,103 11
s 0,125 61
i 0,022 -77
v 0,053 -32
a 0,043 -54
4 0,044 -43
a 0,126 36
S 0,079 2
t 0,056 -28
m 0,022 -72
o 0,072 -22
u 0,040 -57%
0,193 111%
a~ 0,105 15%
4%
u 0,061 -27 u 0,050 -44
0,178 99
o
S 0,071
m 0,041 -38%
d 0,038 -49 d 0,049
s 0,181 159
-30
a
d 0,015
s 0,172 162%
-77%
a 0,171 106 a
s 0,162 117
32
t 0,074 12%
0,074 -19%
a
8%
a~ 0,103 24 a~ 0,095 7
v 0,042
4 0,018 -73%
a 0,047 -49%
0,090 -2%
i
-37%
kk 0,100 35 k 0,092
s 0,089 28
0,068
s 0,092 39%
i 0,027 -67 i
s 0,115 54
-25
a 0,047 -44 a 0,034 -62
0,109 22
v 0,045 -39 v 0,053
4 0,032 -55
a 0,097 17 a
4 0,041 -45
-12
t 0,061 -17 t 0,058 -18
0,069 -22
S 0,081 8 S 0,061
m 0,015 -79
o 0,075 -9 o
m 0,027 -63
Anexo 3f – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP2 neutra e das OPs 2 final, proporcional e
temporal de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em cada OP. Na
quarta coluna das tabelas, a variação percentual dos valores duracionais de cada fone em relação a essa média.
254
Livros Grátis( http://www.livrosgratis.com.br )
Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas
Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo
top related