a prÉ-indicaÇÃo prosÓdica para as oraÇÕes subordinadas...

Universidade Federal do Rio de Janeiro

A PRÉ-INDICAÇÃO PROSÓDICA PARA

AS ORAÇÕES SUBORDINADAS ADVERBIAIS

NO PORTUGUÊS BRASILEIRO E NO FRANCÊS

Cirineu Cecote Stein

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

A PRÉ-INDICAÇÃO PROSÓDICA PARA

AS ORAÇÕES SUBORDINADAS ADVERBIAIS

NO PORTUGUÊS BRASILEIRO E NO FRANCÊS

Tese de Doutorado apresentada ao Programa de

Pós-graduação em Letras Vernáculas da

Universidade Federal do Rio de Janeiro como

quesito para a obtenção do título de Doutor em

Letras Vernáculas (Língua Portuguesa).

Orientador: Prof. Dr. João Antônio de Moraes

Rio de Janeiro

Fevereiro de 2008

A PRÉ-INDICAÇÃO PROSÓDICA PARA AS ORAÇÕES SUBORDINADAS

ADVERBIAIS NO PORTUGUÊS BRASILEIRO E NO FRANCÊS

Orientador: Professor Doutor João Antônio de Moraes

Aprovada por:

_____________________________________________________

Presidente, Prof. Dr. João Antônio de Moraes

_____________________________________________________

Prof. Dr. César Augusto da Conceição Reis – UFMG

_____________________________________________________

Prof. Dr. José Olímpio de Magalhães – UFMG

_____________________________________________________

Profa. Dra. Myrian Azevedo de Freitas - UFRJ

_____________________________________________________

Profa. Dra. Dinah Maria Isensee Callou - UFRJ

_____________________________________________________

Profa. Dra. Maria Jussara Abraçado de Almeida – UFF, Suplente

_____________________________________________________

Profa. Dra. Cláudia de Souza Cunha – UFRJ, Suplente

Rio de Janeiro

Fevereiro de 2008

Stein, Cirineu Cecote.

A Pré-Indicação Prosódica para as Orações Subordinadas Adverbiais no

Português Brasileiro e no Francês/ Cirineu Cecote Stein. - Rio de

Janeiro:UFRJ/ CLA, 2008.

xviii, 253f.:il.; 31 cm.

Orientador: João Antônio de Moraes

Tese (doutorado) – UFRJ / CLA/ Programa de Pós-graduação em Letras

Vernáculas, 2008.

Referências Bibliográficas: f. 237-244.

1. Pré-Indicação Prosódica. 2. Interface Prosódia-Sintaxe. I. Moraes, João

Antônio de. II. Universidade Federal do Rio de Janeiro, Faculdade de

Letras. III. Título.

RECONHECIMENTOS

Embora o trabalho de doutoramento seja essencialmente solitário – em especial os momentos de

escritura –, permanece a minha alegria em ter podido contar, ao longo de quatro anos, com a

preciosa ajuda de algumas pessoas que cederam seu espaço e seu tempo profissionais e pessoais

à concretização desta pesquisa. Assim, gostaria de dirigir meus sinceros reconhecimentos

- ao meu orientador, João Antônio de Moraes, com quem muito aprendi, quer no âmbito

intelectual quer no âmbito pessoal, e à Carmen Moraes, por toda a extrema gentileza e

compreensão quando atendia minhas chamadas telefônicas diurnas e noturnas (a maioria delas),

permitindo que eu retirasse seu esposo do convívio familiar para sanar minhas dúvidas, sempre

urgentes;

- à Cláudia Cunha, que me cedeu sua sempre boa vontade e sua bela voz para as inúmeras

gravações necessárias ao longo desta pesquisa;

- à Mônica Nobre e à Maria Mirtis Caser, que não mediram esforços para, estando eu em Paris,

aplicarem um novo teste de percepção junto aos seus alunos e aos de outros professores, nas

Universidades Federais do Rio de Janeiro e do Espírito Santo. A ambas, o carinho da amizade e

o constante agradecimento;

- à Aparecida Lino, à Dinah Callou, à Myrian Freitas, à Mônica Orsini e, mais uma vez, à

Cláudia Cunha, à Mônica Nobre e ao João Moraes, que sempre disponibilizaram suas aulas e

seus alunos para que eu aplicasse os testes perceptivos necessários a esta pesquisa;

- aos alunos das Faculdades de Letras das Universidades Federais do Rio de Janeiro e do Espírito

Santo, que sempre se mostraram gentis e receptivos aos meus inúmeros testes perceptivos;

- ao Marcus Maia, que não mediu esforços e gentilezas para uma co-orientação em uma possível

prosódia implícita que, infelizmente, não foi possível confirmar no âmbito desta pesquisa e que,

assim, não integra estas páginas;

- à Annie Rialland, ao Bernard Gautheron, à Coralie Vincent, à Cécile Fougeron, à Jacqueline

Vaissière, de Paris III, e ao Philippe Martin, de Paris VII, cujos ensinamentos e convivência

agregaram imensa valia a este doutoramento;

- aos meus colegas do Institut de Phonétique, da Universidade de Paris III, a quem desejo

representar na figura da Aline Santiago, pessoa cuja grandiosidade de espírito supera

enormemente todas as expectativas comuns;

- à agência CAPES, que, além de ter financiado estes quatro anos de pesquisa, também

possibilitou minha estada no Institut de Phonétique da Université de Paris III – Sorbonne

Nouvelle, em Paris, de maio de 2006 a abril de 2008 (processo n. 4431/05-7).

SINOPSE

A confirmação do fenômeno preditivo

prosódico no português brasileiro, em sua

variedade carioca, e no francês falado na

França, em sua variedade parisiense. A

caracterização dos contornos prosódicos

identificadores da pré-indicação de orações

subordinadas adverbiais no português

brasileiro, a partir de dois contornos

principais da F0.

RESUMO

A PRÉ-INDICAÇÃO PROSÓDICA PARA AS ORAÇÕES SUBORDINADAS

ADVERBIAIS NO PORTUGUÊS BRASILEIRO E NO FRANCÊS

Resumo da Tese de Doutorado submetida ao Programa de Pós-graduação em Letras

Vernáculas, Faculdade de Letras, da Universidade Federal do Rio de Janeiro – UFRJ, como parte

dos requisitos necessários à obtenção do título de Doutor em Língua Portuguesa.

A pré-indicação prosódica corresponde à possibilidade de a melodia vocal sugerir, além de

informações sintáticas, pistas que transmitem ao ouvinte informações adicionais sobre o que virá

a ser enunciado. Esta pesquisa objetiva: 1. confirmar a existência do fenômeno preditivo no

português brasileiro (PB) e no francês; 2. identificar, em duas orações principais, os

comportamentos específicos dos componentes prosódicos responsáveis pelo valor pré-indicativo

das nove subcategorias elencadas pela gramática tradicional para as orações subordinadas

adverbiais (causa, comparação, concessão, conformidade, condição, conseqüência, finalidade,

proporção, tempo). Foram realizados dois testes perceptivos. O primeiro, cujo objetivo foi

verificar quais das nove subcategorias seriam mais claramente reconhecidas pré-indicativamente,

evidenciou seis contornos prosódicos para o PB: causa, conseqüência, finalidade (caracterizados

pelo movimento ascendente da F0 a partir da sílaba tônica final), conformidade, concessão e

tempo (caracterizados pelo movimento descendente da F0 a partir da sílaba tônica final); mas

nenhum de forma significativa para o francês. O segundo teste foi realizado a partir da ressíntese

de uma versão neutra e de uma versão monotônica das duas orações principais para o PB,

manipulando-se a duração e a F0. Foi possível isolar os componentes prosódicos responsáveis

por cada uma das pré-indicações, mensurando suas variações. De todas as ressínteses efetuadas,

selecionaram-se duas para cada subcategoria. Foi possível identificar uma delas, em cada

subcategoria, como mais representativa de cada uma das pré-indicações.

Palavras-chave: Prosódia, pré-indicação prosódica, predição prosódica, contorno prosódico,

orações adverbiais, sintaxe.

Rio de Janeiro

Fevereiro de 2008

ABSTRACT

PROSODIC PRE-INDICATION FOR SUBORDINATE ADVERBIAL CLAUSES IN

BRAZILIAN PORTUGUESE AND IN FRENCH

Abstract da Tese de Doutorado submetida ao Programa de Pós-graduação em Letras

Prosodic pre-indication refers to the possibility of the voice melody to suggest, besides syntactic

information, some cues which will present the listener with additional information concerning

what is about to be said in the following sentence. This research aims at: 1. validate the

predictive phenomenon existence in Brazilian Portuguese (BP) and in French; 2. identify, in two

main clauses, the specific behavior of the prosodic components responsible for the pre-indicative

value of the nine subcategories listed by traditional grammar, concerning the subordinate

adverbial clauses (cause, comparison, concession, conformity, condition, consequence, finality,

proportion, and temporality). Two perceptive tests were produced. The first one, whose goal was

to identify which of the nine subcategories would be more clearly recognized pre-indicatively,

evidenced six prosodic contours for BP: cause, consequence, finality (all of them characterized

by an ascending F0 movement from the final stressed syllable on), conformity, concession, and

time (all of them characterized by a descending F0 movement from the final stressed syllable

on); but none significantly for French. The second test was produced with the resyntheses of a

neutral and a monotonous versions of two main clauses for BP. The durational and F0 values

were manipulated. It was possible to isolate the prosodic components responsible for each of the

pre-indications, measuring their variations. Among all of the resyntheses produced, two were

selected for each subcategory. It was possible to identify one of them, for each subcategory, as a

better representative of each of the pre-indications.

Key-words: Prosody, prosodic pre-indication, prosodic prediction, prosodic contour, adverbial

clauses, sintax.

Rio de Janeiro

February, 2008

RESUME

LA PRE-INDICATION PROSODIQUE POUR LES PROPOSITIONS SUBORDONNEES

ADVERBIALES DANS LE PORTUGAIS BRESILIEN ET DANS LE FRANÇAIS

Résumé da Tese de Doutorado submetida ao Programa de Pós-graduação em Letras

La pré-indication prosodique correspond à la possibilité de la mélodie vocale suggérer, au-delà

des pistes syntaxiques, des pistes qui transmettent à l‟écouteur des informations additionnelles

sur ça qui sera énoncé. Cette recherche a pour but : 1. Confirmer l‟existence du phénomène

prédictif dans le portugais brésilien (PB) e dans le français ; 2. Identifier, dans deux propositions

principales, les comportements spécifiques des composants prosodiques responsables pour la

valeur pré-indicative des neuf sous-catégories énumérées par la grammaire traditionnelle pour les

propositions subordonnées adverbiales (cause, comparaison, concession, conformité, condition,

conséquence, but, proportion, temps). Deux tests perceptifs ont été réalisés. Le premier, dont le

but était vérifier lesquelles des neuf sous-catégories seraient clairement reconnues pré-

indicativement, a mis en évidence six contours prosodiques pour le PB : cause, conséquence, but

(caractérisés par le mouvement ascendant de la F0 à partir de la syllabe tonique finale),

conformité, concession et temps (caractérisés par le mouvement descendant de la F0 à partir de

la syllabe tonique finale) ; mais aucune reconnaissance significative a été établie pour le français.

Le deuxième test a été produit à partir de la resynthèse d‟une version neutre et d‟une version

monotonique des deux propositions principales pour le PB, en manipulant leur durée et leur F0.

C‟était possible isoler les composants prosodiques responsables pour chacune des pré-

indications, et faire la mensuration de ses variations. Parmi toutes les resynthèses produites, deux

ont été sélectionnées pour chaque sous-catégorie. C‟était possible identifier une, dans chaque

sous-catégorie, comme la plus représentative de chaque pré-indication.

Mots-clés : Prosodie, pré-indication prosodique, prédiction prosodique, contour prosodique,

propositions adverbiales, syntaxe.

Rio de Janeiro

Février, 2008

Sumário

LISTA DE SIGLAS E ABREVIATURAS .............................................................................. XIII

LISTA DE FIGURAS ............................................................................................................... XIV

LISTA DE TABELAS ........................................................................................................... XVIII

0. INTRODUÇÃO ......................................................................................................................... 1

1. REVISÃO BIBLIOGRÁFICA .................................................................................................. 8

1.1 OS ASPECTOS GRAMATICAIS ............................................................................................. 14

1.2 OS CONTORNOS PROSÓDICOS ............................................................................................ 21 1.3 A RELAÇÃO ORAÇÃO PRINCIPAL – ORAÇÃO SUBORDINADA ................................................ 36

1.4 A PRÉ-INDICAÇÃO ............................................................................................................ 41

2. AS RELAÇÕES DE COORDENAÇÃO E DE SUBORDINAÇÃO ...................................... 52

3. OS MODELOS ENTONATIVOS ........................................................................................... 64

3.1 ALGUMAS CARACTERÍSTICAS DO SISTEMA ENTONACIONAL DO FRANCÊS ............................ 72

3.2. ALGUMAS CARACTERÍSTICAS DO SISTEMA ENTONACIONAL DO PORTUGUÊS ....................... 81

4. METODOLOGIA .................................................................................................................... 90

4.1 A FORMAÇÃO DO CORPUS PARA O PB ................................................................................ 91 4.2 A FORMAÇÃO DO CORPUS PARA O FR ................................................................................ 95

4.3 TESTE 1 ........................................................................................................................... 99 4.3.1 O Teste 1 para o PB ......................................................................................................99

4.3.2 O Teste 1 para o FR .................................................................................................... 102 4.4 O PROCESSO DE RESSÍNTESE .......................................................................................... 103

4.5 TESTE 2 ......................................................................................................................... 108 4.6 PROSOGRAMAS .............................................................................................................. 110

5. DESCRIÇÃO E ANÁLISE DOS RESULTADOS DO TESTE 1 ........................................ 111

5.1. OS RESULTADOS PARA O PB .......................................................................................... 111

5.1.1 Cruzamentos a partir da subcategoria causal.............................................................. 112 5.1.2 Cruzamentos a partir da subcategoria comparativa .................................................... 114

5.1.3 Cruzamentos a partir da subcategoria concessiva ....................................................... 116 5.1.4 Cruzamentos a partir da subcategoria condicional ..................................................... 118

5.1.5 Cruzamentos a partir da subcategoria conformativa ................................................... 120 5.1.6 Cruzamentos a partir da subcategoria consecutiva ..................................................... 121

5.1.7 Cruzamentos a partir da subcategoria final................................................................. 123 5.1.8 Cruzamentos a partir da subcategoria proporcional ................................................... 124 5.1.9 Cruzamentos a partir da subcategoria temporal .......................................................... 125

5.2. OS RESULTADOS PARA O FR .......................................................................................... 126 5.2.1 Cruzamentos a partir da subcategoria causal.............................................................. 127

5.2.2 Cruzamentos a partir da subcategoria comparativa .................................................... 128 5.2.3 Cruzamentos a partir da subcategoria concessiva ....................................................... 129

5.2.4 Cruzamentos a partir da subcategoria condicional ..................................................... 130 5.2.5 Cruzamentos a partir da subcategoria conformativa ................................................... 131

5.2.6 Cruzamentos a partir da subcategoria consecutiva ..................................................... 131 5.2.7 Cruzamentos a partir da subcategoria final................................................................. 132

5.2.8 Cruzamentos a partir da subcategoria proporcional ................................................... 133

5.2.9 Cruzamentos a partir da subcategoria temporal .......................................................... 134

5.2.10 Considerações sobre o resultado para o FR .............................................................. 135 5.3. CRITÉRIOS DE SELEÇÃO DOS CANDIDATOS A CONTORNOS PRÉ-INDICATIVOS .................... 136

6. O PROCESSO DE RESSÍNTESE ........................................................................................ 139

RESSÍNTESE DAS ORAÇÕES PRINCIPAIS 1 .............................................................................. 144

6.1. RESSÍNTESE DAS OPS 1 NEUTRAS COM F0 ASCENDENTE ................................................ 144 6.1.1 Pré-indicação consecutiva .......................................................................................... 144

6.1.2. Pré-indicação causal.................................................................................................. 146 6.1.3. Pré-indicação final..................................................................................................... 148

6.2. RESSÍNTESE DAS OPS 1 NEUTRAS COM F0 DESCENDENTE .............................................. 150 6.2.1. Pré-indicação concessiva ........................................................................................... 150

6.2.2. Pré-indicação conformativa ....................................................................................... 153 6.2.3. Pré-indicação temporal .............................................................................................. 156

6.3. RESSÍNTESE DAS OPS 1 MONOTÔNICAS COM F0 ASCENDENTE ....................................... 159 6.3.1. Pré-indicação consecutiva ......................................................................................... 159

6.4. RESSÍNTESE DAS OPS 1 MONOTÔNICAS COM F0 DESCENDENTE ...................................... 164 6.4.1. Pré-indicação concessiva ........................................................................................... 164

RESSÍNTESE DAS ORAÇÕES PRINCIPAIS 2 .............................................................................. 169 6.5. RESSÍNTESE DAS OPS 2 NEUTRAS COM F0 ASCENDENTE ................................................ 170

6.5.1. Pré-indicação consecutiva ......................................................................................... 170 6.5.2. Pré-indicação causal.................................................................................................. 172

6.5.3. Pré-indicação final..................................................................................................... 174 6.6. RESSÍNTESE DAS OPS 2 NEUTRAS COM F0 DESCENDENTE .............................................. 175

6.6.1. Pré-indicação concessiva ........................................................................................... 175 6.6.2. Pré-indicação conformativa ....................................................................................... 177

6.6.3. Pré-indicação temporal .............................................................................................. 178 RESSÍNTESE DA OP 2 MONOTÔNICA ...................................................................................... 180

6.7. RESSÍNTESE DAS OPS 2 MONOTÔNICAS COM F0 ASCENDENTE ....................................... 181 6.7.1. Pré-indicação consecutiva ......................................................................................... 181

6.8. RESSÍNTESE DAS OPS 2 MONOTÔNICAS COM F0 DESCENDENTE ...................................... 186 6.8.1. Pré-indicação concessiva ........................................................................................... 186

7. DESCRIÇÃO E ANÁLISE DOS RESULTADOS DO TESTE 2 ........................................ 191

7.1 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CAUSAL ..................................................... 192

7.1.1 OP 1 ressintetizada para a pré-indicação de causa ..................................................... 193 7.1.2 OP 2 ressintetizada para a pré-indicação de causa ..................................................... 194

7.1.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação causal195 7.2. CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONCESSIVA ............................................. 201

7.2.1 OP 1 ressintetizada para a pré-indicação de concessão .............................................. 202 7.2.2 OP 2 ressintetizada para a pré-indicação de concessão .............................................. 203

7.2.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação

concessiva ................................................................................................................... 203

7.3 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONFORMATIVA ......................................... 206

7.3.1 OP 1 ressintetizada para a pré-indicação de conformidade ......................................... 207 7.3.2 OP 2 ressintetizada para a pré-indicação de conformidade ......................................... 207

conformativa ............................................................................................................... 208

7.4 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONSECUTIVA ............................................ 210 7.4.1 OP 1 ressintetizada para a pré-indicação de conseqüência ......................................... 211

7.4.2 OP 2 ressintetizada para a pré-indicação de conseqüência ......................................... 212 7.4.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação

consecutiva .................................................................................................................. 212 7.5 CRUZAMENTOS A PARTIR DA SUBCATEGORIA FINAL ........................................................ 214

7.5.1 OP 1 ressintetizada para a pré-indicação de finalidade .............................................. 216 7.5.2 OP 2 ressintetizada para a pré-indicação de finalidade .............................................. 217

7.5.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação final .. 217 7.6 CRUZAMENTOS A PARTIR DA SUBCATEGORIA TEMPORAL ................................................. 220

7.6.1 OP 1 ressintetizada para a pré-indicação de temporalidade........................................ 221 7.6.2 OP 2 ressintetizada para a pré-indicação de temporalidade........................................ 222

temporal ...................................................................................................................... 222

7.7 CRITÉRIOS PARA ESCOLHA DAS RESSÍNTESES REPRESENTATIVAS DOS PADRÕES PROSÓDICOS

PRÉ-INDICATIVOS ........................................................................................................... 224

8. CONCLUSÃO ....................................................................................................................... 227

9. ÍNDICE ANALÍTICO ........................................................................................................... 233

10. REFERÊNCIAS BIBLIOGRÁFICAS ................................................................................ 237

11. ANEXOS .............................................................................................................................. 245

LISTA DE SIGLAS E ABREVIATURAS

PB português brasileiro

FR francês falado na França

OP oração principal

OSAdv oração subordinada adverbial

F0 freqüência fundamental

C consoante

caus causal

comp comparativa

conces concessiva

condic condicional

confor conformativa

consec consecutiva

propor proporcional

STF sílaba tônica final

VPreTF vogal pré-tônica final

SPTF sílaba pré-tônica final

VR valor de referência

LR linha de referência

SAPreTF sílaba anterior à sílaba pré-tônica final

VTF vogal tônica final

V vogal

LISTA DE FIGURAS

Figura 0.1 – Entonação de “o seu trabalho é bom” sugerindo um elogio, 5

Figura 0.2 – Entonação de “o seu trabalho é bom”, a que será acrescentada uma ressalva, 5

Figura 1.1 – As cinco regras adicionais sugeridas por Stockwell (1960, citado por Fox

2000:282) para aprimoramento da proposta fonológica da Gramática Gerativa proposta por

Chomsky (1957), 14

Figuras 1.2 e 1.3 – Contorno da F0 de elocuções contendo apenas tons H e tons H e L no iorubá

(conseqüentemente, com downstep), 49

Figura 1.4 – Contornos da F0 de elocuções com dois a cinco downsteps sobrepostos à linha de

regressão das elocuções contendo apenas tons H, para um dos falantes dagará (Rialland,

2001:305), 50

Figura 3.1 – O “contorno nananère” aplicado à frase Bien sûr que j'te crois, Marie va arriver

(Claro que eu acredito em você, Maria vai chegar) (Marandin, 2004), 77

Figura 3.2 – A continuação maior agrupando várias continuações menores em uma unidade

maior (Portes, 2005), 79

Figura 3.3 – Asserção ascendente comprometendo o locutor, mas não seu alocutário (Beyssade

e Marandin, 2007), 80

Figura 3.4 – Esquema geral dos contornos finais para o francês, segundo Beyssade e Marandin

(2007), 81

Figura 4.1 – Freqüência fundamental das OPs 1 – Ficava infeliz – para o PB, 94

Figura 4.2 – Freqüência fundamental das OPs 2 – Mostrava-se cansado – para o PB, 95

Figura 4.3 – Freqüência fundamental das OPs 1 – il est ennuyé – para o FR, 98

Figura 4.4 – Freqüência fundamental das OPs 2 – il se montre irritable – para o FR, 99

Figura 4.5 – Modelo gráfico para aplicação do Teste 1 no PB, 101

Figura 4.6 – Modelo gráfico para aplicação do Teste 1 no FR, 103

Figura 4.7– Freqüência fundamental e alinhamento das orações principais neutras, 105

Figura 4.8 – Modelo gráfico para aplicação do Teste 2, 109

Figura 5.1 – Freqüência fundamental e alinhamento das OPs 1 causal e consecutiva de

referência – Ficava infeliz – para o PB, 113

Figura 6.1 – Diagramação visual do valor de referência (VR), da linha de referência (LR) e da

elevação da F0 acima da LR, a partir da OP 1 consecutiva de referência, 141

Figura 6.2 – Processo de ressíntese (6.1.1.3.i) da OP 1 neutra para a pré-indicação consecutiva,

Figura 6.3 – Processo de ressíntese (6.1.1.4) da OP 1 neutra para a pré-indicação consecutiva,

Figura 6.4 – Processo de ressíntese (6.1.2.3.i) da OP 1 neutra para a pré-indicação causal, 147

Figura 6.5 – Processo de ressíntese (6.1.2.4) da OP 1 neutra para a pré-indicação causal, 148

Figura 6.6 – Processo de ressíntese (6.1.3.2.i) da OP 1 neutra para a pré-indicação final, 150

Figura 6.7 – Processo de ressíntese (6.1.3.3) da OP 1 neutra para a pré-indicação final, 150

Figura 6.8 – Diagramação visual para cálculo da variação da F0 na concavidade formada na

VTF da OP 1 concessiva de referência, 151

Figura 6.9 – Processo de ressíntese (6.2.1.1) da OP 1 neutra para a pré-indicação concessiva,

Figura 6.10 – Processo de ressíntese (6.2.1.2.b) da OP 1 neutra para a pré-indicação concessiva,

Figura 6.11 – Processo de ressíntese (6.2.2.1) da OP 1 neutra para a pré-indicação conformativa,

Figura 6.12 – Processo de ressíntese (6.2.2.2.d) da OP 1 neutra para a pré-indicação

conformativa, 156

Figura 6.13 – Processo de ressíntese (6.2.3.2) da OP 1 neutra para a pré-indicação temporal, 158

Figura 6.15 – Processo de ressíntese (6.3.1.3.i) da OP 1 monotônica para a pré-indicação

consecutiva, 160

Figura 6.16 – Processo de ressíntese (6.3.1.4) da OP 1 monotônica para a pré-indicação

consecutiva, 160

Figura 6.17 – Processo de ressíntese (6.3.2.3.i) da OP 1 monotônica para a pré-indicação causal,

Figura 6.18 – Processo de ressíntese (6.3.2.4) da OP 1 monotônica para a pré-indicação causal,

Figura 6.19 – Processo de ressíntese (6.3.3.3.g) da OP 1 monotônica para a pré-indicação final,

Figura 6.20 – Processo de ressíntese (6.3.3.4) da OP 1 monotônica para a pré-indicação final,

concessiva, 165

Figura 6.22 – Processo de ressíntese (6.4.1.2.b) da OP 1 monotônica para a pré-indicação

concessiva, 165

conformativa, 166

Figura 6.24 – Processo de ressíntese (6.4.2.2.d) da OP 1 monotônica para a pré-indicação

conformativa, 167

temporal, 168

temporal, 170

Figura 6.28 – Processo de ressíntese (6.5.1.3.i) da OP 2 neutra para a pré-indicação consecutiva,

Figura 6.29 – Processo de ressíntese (6.5.1.4) da OP 2 neutra para a pré-indicação consecutiva,

Figura 6.30 – Processo de ressíntese (6.5.2.3.f) da OP 2 neutra para a pré-indicação causal, 173

Figura 6.31 – Processo de ressíntese (6.5.2.4) da OP 2 neutra para a pré-indicação causal, 173

Figura 6.32 – Processo de ressíntese (6.5.3.5.c) da OP 2 neutra para a pré-indicação final, 175

Figura 6.33 – Processo de ressíntese (6.5.3.6) da OP 2 neutra para a pré-indicação final, 175

Figura 6.34 – Processo de ressíntese (6.6.1.1) da OP 2 neutra para a pré-indicação concessiva,

Figura 6.35 – Processo de ressíntese (6.6.1.2.b) da OP 2 neutra para a pré-indicação concessiva,

Figura 6.36 – Processo de ressíntese (6.6.2.1) da OP 2 neutra para a pré-indicação conformativa,

Figura 6.37 – Processo de ressíntese (6.6.2.2.d) da OP 2 neutra para a pré-indicação

conformativa, 178

Figura 6.40 – Processo de ressíntese (6.7.1.3.g) da OP 2 monotônica para a pré-indicação

consecutiva, 182

Figura 6.42 – Processo de ressíntese (6.7.2.3.f) da OP 2 monotônica para a pré-indicação causal,

Figura 6.43 – Processo de ressíntese (6.7.2.4) da OP 2 monotônica para a pré-indicação causal,

Figura 6.44 – Processo de ressíntese (6.7.3.5.c) da OP 2 monotônica para a pré-indicação final,

Figura 6.45 – Processo de ressíntese (6.7.3.6) da OP 2 monotônica para a pré-indicação final,

concessiva, 187

Figura 6.47 – Processo de ressíntese (6.8.1.2.b) da OP 2 monotônica para a pré-indicação

concessiva, 187

conformativa, 188

Figura 6.49 – Processo de ressíntese (6.8.2.2.d) da OP 2 monotônica para a pré-indicação

conformativa, 189

temporal, 190

Figura 7.1 – Prosogramas para as OPs 1 de referência, 199

Figura 7.2 – Prosogramas para as OPs 2 de referência, 200

Figura 8.1 – Representação esquemática dos contornos prosódicos pré-indicativos de

consequência, de causa e de finalidade, para o PB, 229

Figura 8.2 – Representação esquemática dos contornos prosódicos pré-indicativos de

concessão, de conformidade e de tempo, para o PB, 231

LISTA DE TABELAS

Tabela 3.1 – Os dez contornos para o francês definidos por Delattre (1966), 72

Tabela 4.1 – Orações principais e subordinadas adverbiais utilizadas como base para a

formação do corpus para o PB, 92

Tabela 4.2 – Orações principais e subordinadas adverbiais utilizadas como base para a

formação do corpus para o FR, 96

Tabela 5.1 – Resultados de um Teste Chi2 para o cruzamento, no Teste 1, entre as 9

subcategorias de OPs 1 para o PB, 111

Tabela 5.2 – Resultados de um Teste Chi2 para o cruzamento, no Teste 1, entre as 9

subcategorias de OPs 2 para o PB, 112

Tabela 5.3 – Resultados de um Teste Chi2 para o cruzamento entre as 9 subcategorias de OPs 1

para o FR, 127

Tabela 5.4 – Resultados de um Teste Chi2 para o cruzamento entre as 9 subcategorias de OPs 2

para o FR, 127

Tabela 5.5 – Sobreposição dos resultados significativos dos cruzamentos, no Teste 1, da OP2

aos da OP1 para o PB, 137

Tabela 5.6 – Sobreposição dos resultados significativos dos cruzamentos, no Teste 1, da OP2

aos da OP1 para o FR, 138

Tabela 7.1 – Resultados obtidos a partir de um Teste T pareado, indicando que os números

totais de reconhecimento das ressínteses a e b não são significativamente distintos, 192

Tabela 7.2 – Resultados de um Teste Chi2 para a subcategoria causal, a partir do cruzamento

das ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 193

Tabela 7.3 – Resultados de um Teste Chi2 para a subcategoria concessiva, a partir do

cruzamento das ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 202

Tabela 7.4 – Resultados de um Teste Chi2 para a subcategoria conformativa, a partir do

Tabela 7.5 – Resultados de um Teste Chi2 para a subcategoria consecutiva, a partir do

Tabela 7.6 – Resultados de um Teste Chi2 para a subcategoria final, a partir do cruzamento das

ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 216

Tabela 7.7 – Resultados de um Teste Chi2 para a subcategoria temporal, a partir do cruzamento

das ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica, 221

0. INTRODUÇÃO

Os estudos lingüísticos, assim como freqüentemente ocorre em outras áreas, não

conseguiram escapar a uma tendência comum: em uma ciência, quando um elemento bastante

significativo é descoberto, não é raro que todas as atenções se voltem para ele. Ainda que tal

atitude seja plenamente justificável, quer pelo interesse prático da descoberta, quer pela

possibilidade de resolução de inúmeros outros pontos até então obscuros, há um custo científico

muito grande em relação aos aspectos globais da ciência em questão: outros pontos passam a

merecer menor atenção.

A implicação direta desse tipo de procedimento é, por vezes, o avanço menos rápido da

pesquisa científica em determinadas áreas. Uma teoria pode ser responsável por uma

reformulação completa de paradigmas historicamente instituídos, como o que ocorreu com a

Teoria da Relatividade ou com a Teoria da Gramática Gerativa. No entanto, um conjunto

considerável dentro do universo dos pesquisadores acaba se dedicando exclusivamente a um

único aspecto que, de uma forma ou de outra, recebeu mais foco dentro da nova teoria. Como

decorrência, coloca-se em segundo plano a pesquisa de outros pontos que, num primeiro

momento, pareceriam secundários mas que, ao longo da evolução da ciência em questão, acabam

por se mostrar decisivos na explicação de inúmeros processos. O que ocorre na Lingüística,

grosso modo, não é muito diferente disso.

É inquestionável a importância que os estudos sintáticos, a partir da Gramática Gerativa,

tiveram no desenvolvimento da pesquisa lingüística. A sintaxe se revelou um esqueleto

extremamente bem organizado, capaz de sustentar, em sua estruturação, toda uma série de

configurações (de várias ordens) para a constituição do processo lingüístico como um todo.

Apenas para manter as metáforas no campo biológico, o que veio a acontecer foi a atribuição do

status de “cérebro” à sintaxe. Se é possível que ela sozinha detenha tal importância, ou a

compartilhe com outros “órgãos”, caberá à pesquisa futura estabelecer. O que parece já aceito

dentro da comunidade dos lingüistas é o fato de a sintaxe não se mostrar determinante em todos

os processos lingüísticos, mesmo no conjunto dos de importância primeira no processamento

cognitivo. Alguns pesquisadores já chegam a considerar o culto estabelecido à autonomia da

sintaxe como uma verdadeira aberração (Anderson, 2005).

Os estudos prosódicos, tradicionalmente, foram categorizados na esfera do

paralingüístico – considerados, portanto, de segunda linha. Alguns pontos bastante significativos

já foram elucidados, principalmente no conjunto das expressões de afetividade, embora, pelo

menos ao que consta até o momento, não se tenha conseguido, por exemplo, um processo de

síntese vocal capaz de explorar essa dimensão cognitiva de forma satisfatória. Evidentemente,

cabe aos engenheiros dedicados ao estabelecimento dessa tecnologia o desenvolvimento desses

meios, mas é indispensável que o aparato lingüístico os sustente de forma sólida.

Nos momentos iniciais da Gramática Gerativa, a relação entre as unidades entonacionais

e as unidades sintáticas era vista como um fenômeno de performance. A evolução se deu quanto

a serem essas unidades governadas por regras, ainda que não em relação de igualdade. E, numa

postura mais extrema, Selkirk (1984) chega a defender um nível independente para a estrutura

entonacional na gramática. Percebe-se, com isso, a reação adversa à preponderância da sintaxe

nos estudos gerativos. Historicamente, na evolução das ciências, esse movimento entre os

extremos parece necessário para o estabelecimento de um meio termo mais ponderado.

O fato de alguns fenômenos lingüísticos se explicarem exclusivamente pela sintaxe ou

exclusivamente pela prosódia (como ocorre na desambigüização de algumas sentenças) não

implica, necessariamente, a autonomia de uma ou de outra. Embora tanto a sintaxe quanto a

prosódia desempenhem funções específicas à sua natureza, o resultado do processamento

lingüístico parece se dar com a interação entre as duas (que, por sua vez, interagem com outros

componentes, como o semântico). Ladd (1978) é um dos primeiros a reconhecer essa interação.

Posteriormente (1996), com a Linguist’s Theory of Intonational Meaning, defende que os

elementos da entonação apresentam significado, sem necessariamente estarem dissociados da

sintaxe. Steedman (1991) também questiona a independência da sintaxe, assumindo uma

representação sintática mais flexível.

O interesse deste trabalho está centrado na área da prosódia, buscando identificar

comportamentos melódicos lingüísticos (em oposição aos paralingüísticos) específicos. Mais

exatamente, na possibilidade de ela ser um fator preditivo ao longo de uma elocução. Isso

implica assumir, por conseguinte, a existência de estruturas prosódicas. Ladd (1978:517) indica

que, desde Pike (1945), tem-se prestado atenção, por exemplo, a um contorno que normalmente

é considerado como uma entonação especial de “chamamento” ou “vocativo”. Esse contorno foi

descrito como um “canto falado”, por Pike; como um “canto vocativo”, por Liberman (1975) e

Leben (1976); e por Gibbon (1976), simplesmente como um tipo de contorno numa seção

intitulada “Chamamentos”. Como Ladd (520) sugere, todos esses rótulos têm uma sensação de

uso cotidiano, mesmo doméstico, como se o fenômeno rotulado fizesse parte de uma troca

estereotipada, algo como “Nada que você não pudesse ter antecipado”. No entanto, mesmo que

Ladd não concorde com a idéia de se tratar essencialmente de uma entonação apelativa,

preferindo analisá-la como uma entonação “estilizada” cuja função é assinalar um certo elemento

de previsibilidade ou estereótipo na mensagem, permanece a noção da existência de

determinadas estruturas prosódicas (dir-se-á “contornos prosódicos”) responsáveis por transmitir

informações específicas. Ao que parece, a criação de uma estrutura entonativa se dá pela relação

que partes de um contorno entonativo estabelecem entre si, o que induziria ao questionamento

sobre a significância da escolha de uma determinada estrutura entonacional dentro de um

contexto discursivo (Fox, 1984).

A postura assumida aqui (na mesma linha de Ladd, 1998) é a de que o fenômeno

prosódico deve ser analisado em duas esferas distintas: a do lingüístico e a do paralingüístico.

Nesta última, estaria parte de toda a fenomenologia relacionada à manifestação das atitudes e das

emoções veiculadas pelo locutor, num determinado contexto comunicativo. Assim, uma

expressão de raiva, considerada na esfera paralingüística, pode ser produzida em uma sentença

declarativa ou em uma sentença interrogativa, ambas caracterizadas a partir de contornos

melódicos específicos, constituídos na esfera do lingüístico. Essas variações melódicas são

decorrência da própria natureza idiossincrática que a entonação assume ao ser realizada por

diversos locutores. No entanto, isso não significa dizer que não seja possível identificar uma

configuração prosódica relativamente constante para a expressão paralingüística, o que

aproximaria os aspectos dessa fenomenologia da expressão lingüística.

Admitida a possibilidade de estabelecimento de contornos prosódicos, a expectativa é a

de que a aplicação de um dado contorno permita ao ouvinte, em alguns casos, prever como a

sentença será complementada pelo locutor. Fox (1984) sugere esse fenômeno a partir da

caracterização de grupos tonais aparentemente independentes, que formam estruturas

incompletas a serem completadas pelo interlocutor. Como será discutido (seção 1.4), uma

hipótese para o contorno ascendente comum às sentenças interrogativas totais é ser ele parte de

uma estrutura maior, que seria completada pela resposta. Uma outra possibilidade de pré-

indicação, sugerida por Fónagy e Galvany (1974, citado por Moraes 1998), é a de que

marcadores melódicos situados nas sílabas iniciais de uma enunciação antecipariam a

modalidade da elocução, indicando tratar-se, por exemplo, de uma interrogativa. O fenômeno

preditivo torna-se bastante explícito, como comenta Grosjean (1983), a partir dos cortes feitos

durante a edição de uma entrevista a ser divulgada nos meios midiáticos. Geralmente, esses

cortes respeitam as fronteiras sintáticas e semânticas, mas não as prosódicas. Isso faz que o

ouvinte tenha a impressão de que o entrevistado iria dizer algo mais.

Embora qualquer predição seja, por natureza, probabilística e raramente perfeita, esse

fenômeno pode ser bastante útil ao processamento cognitivo das informações. Como Grosjean

sugere, a predição reduz o leque de possibilidades lingüísticas, permitindo que o ouvinte focalize

um ponto específico. Em decorrência disso, o processamento cognitivo torna-se mais eficiente,

permitindo, por exemplo, a preparação mais rápida de uma resposta. O que não se pode perder de

vista é o fato de, apesar de a noção de uma função entonacional implicar uma distinção total dos

significados a partir de parâmetros do sistema entonacional, raramente isso acontecer (Couper-

Kuhlen, 1985). Não se deve imaginar que a entonação, sozinha, seja responsável pelos contrastes

lingüísticos (ainda que, algumas vezes, isso possa ocorrer, como ocorre em alguns casos de

desambigüização de sentenças). Em situações discursivas de interação, não é raro que uma

melodia utilizada represente uma intenção do locutor diferente da que os campos semântico e

sintático de uma enunciação indiquem.

O objetivo deste estudo é verificar a existência de estruturas pré-indicativas, nos termos

de Fónagy (1974), no português brasileiro – doravante PB – e no francês falado na França – a

partir do capítulo 4, referente à descrição metodológica, FR. Uma vez que a intenção é

caracterizar uma abordagem na esfera lingüística (em oposição à paralingüística), foi feita uma

delimitação à categoria das orações subordinadas adverbiais, numa tentativa de estabelecer a

ligação entre os comportamentos sintático e prosódico dessas relações de subordinação. A

motivação inicial ocorreu a partir da observação de como locutores brasileiros imprimem

modulações diferentes às orações principais de um período, em função das orações subordinadas

subseqüentes. Mais ainda, a possibilidade de um ouvinte complementar uma elocução – em

conformidade com as expectativas do locutor – com base apenas na melodia entonada. Assim,

considerando-se a ordem canônica “oração principal – (conectivo) oração subordinada

adverbial”, a expectativa é a de que existam conformações melódicas específicas que, aplicadas

às orações principais, permitirão prever qual a relação adverbial a ser apresentada na oração

subordinada.

Embora fora da relação de subordinação, e com caráter meramente ilustrativo, um

exemplo bastante claro desse fenômeno pré-indicativo no PB ocorre com as orações coordenadas

adversativas. A oração “o seu trabalho é bom”, de acordo com a entonação que lhe seja

conferida, poderá ser entendida como um elogio ou como um comentário a que se acrescentará

alguma ressalva. Neste último caso, o ouvinte perceberá que o locutor, na verdade, deseja

apresentar alguma crítica ao trabalho efetuado. Uma possível continuação seria “mas não

apresenta consistência metodológica”. Essas duas interpretações são caracterizadas a partir das

curvas melódicas, respectivamente, das figuras 0.1 e 0.2, abaixo.

Figura 0.1 – Entonação de “o seu trabalho é bom” sugerindo um elogio.

Figura 0.2 – Entonação de “o seu trabalho é bom”, a que será acrescentada uma ressalva.

Assim, objetivando caracterizar, ainda que de forma muito breve, o percurso dos estudos

prosódicos com vistas ao fenômeno pré-indicativo, num primeiro momento será apresentada uma

revisão bibliográfica, em que serão consideradas:

a) as noções referentes ao fenômeno entonativo e a evolução dos estudos lingüísticos;

b) a entonação em relação à gramática e, mais especificamente, à sintaxe, numa

interface com a Gramática Gerativa;

c) a caracterização dos sistemas entonativos;

d) a relação da entonação com as orações principais e as orações subordinadas; e

e) um breve histórico da noção de pré-indicação, incluindo-se esse fenômeno prosódico

em algumas línguas tonais africanas.

Num segundo momento, serão discutidas as relações sintáticas de coordenação e de

subordinação, com vistas à extensão dessa caracterização aos fenômenos prosódicos. Ao longo

dessa análise, serão revistos alguns testes utilizados para determinar o status subordinativo ou

coordenativo de um sintagma oracional. Esses testes, quando possível, foram os mesmos

aplicados à constituição do corpus utilizado nesta pesquisa.

Por conta do avanço considerável em que já se encontram os estudos prosódicos

relacionados ao francês, a caracterização do sistema entonativo dessa língua será feita

anteriormente à do sistema entonativo do PB, no terceiro capítulo.

Relacionado ao aspecto empírico deste trabalho, o quarto capítulo apresenta uma

descrição da metodologia empregada na elaboração dos testes de percepção utilizados para

verificar a existência do fenômeno pré-indicativo das orações subordinadas adverbiais no PB e

no francês, bem como a conformação prosódica responsável pela caracterização de cada uma das

subcategorias pré-indicativas.

O quinto capítulo apresenta e analisa os resultados obtidos a partir da bateria de testes

(Teste 1), identificando o nível de reconhecimento das orações principais como pré-indicativas

das subcategorias adverbiais oracionais em estudo.

Com o objetivo de identificar os componentes prosódicos responsáveis por cada uma

dessas pré-indicações, assim como seu comportamento, os arquivos sonoros gerados para as

orações principais tomadas como referência pré-indicativa tiveram suas versões neutra e

monotônica ressintetizadas de forma a reproduzir as elocuções originais. O sexto capítulo é

dedicado à descrição desse processo de ressíntese.

O sétimo capítulo apresenta os resultados obtidos com a bateria de testes (Teste 2), em

que se submeteram duas versões ressintetizadas de uma versão neutra e de uma monotônica das

orações principais de referência ao julgamento de falantes nativos. O objetivo do Teste 2 foi

identificar, dentre as múltiplas manipulações dos componentes prosódicos, aquelas que mais

provavelmente contêm as configurações responsáveis pelas pré-indicações adverbiais oracionais.

Na conclusão, apresenta-se uma síntese dos principais pontos desenvolvidos ao longo

desta pesquisa, analisando-se, de forma mais ampla, os resultados obtidos para os Testes 1 e 2 e

as suas implicações na configuração dos padrões prosódicos pré-indicativos de orações

subordinadas adverbiais no português brasileiro. Apresenta-se, também, a configuração

prosódica, em termos absolutos, para cada um desses padrões, assim como sua representação

esquemática.

1. REVISÃO BIBLIOGRÁFICA

Com o advento da Gramática Gerativa, a tradição dos estudos estabeleceu-se no sentido

de considerar a sintaxe como detentora de uma estrutura auto-suficiente. Essa pretensa

autonomia sugere que a sintaxe seja analisada de forma independente de outras considerações,

tanto em relação ao campo da semântica e da fonologia quanto ao campo da pragmática. Mais

recentemente, essa visão autônoma da sintaxe já tem sido mesmo considerada como uma

aberração da lingüística durante a segunda metade do século XX (cf. Anderson, 2005). O

prestígio dessa visão que os estudos sintáticos adquiriram impôs uma certa obliteração aos outros

segmentos de estudo no âmbito da Gramática Gerativa, especialmente se consideradas as

manifestações prosódicas (Chomsky e Halle, 1968:372) trataram todos as incongruências entre

unidades sintáticas e unidades entonacionais como fenômenos ligados à performance). É

somente a partir do nascimento da abordagem autossegmental da prosódia (segundo Di Cristo

(2004:140), apoiado sobre uma revisão da análise tradicional dos sistemas das línguas tonais,

especialmente os trabalhos de Woo, 1969, e Leben, 1973) que certos traços fonológicos

assumem um domínio de especificação de dimensões menores ou maiores que o segmento

fonêmico tradicional.

Assim como Anderson (2005) propõe ser impossível estabelecer categorias sintáticas a

partir de níveis puramente distribucionais, sendo necessário um vínculo com a semântica,

inúmeros outros trabalhos apresentam propostas de integração direta entre a sintaxe e a fonologia

(cf. Croft, 1995; Freitas, 1995; Bermúdez-Otero, 2004; entre outros). Selkirk (1984) e Nespor e

Vogel (1986) chegam, ainda, a sugerir um nível independente para a estrutura entonacional na

gramática (cf. seção 1.1).

Partindo-se para um direcionamento ainda mais específico dentro dos estudos

fonológicos, já é possível considerar que a entonação também apresenta um papel de

significativa importância na caracterização sintática. Algumas vezes, é mesmo possível sugerir

que a entonação seja a responsável maior pela atribuição do sentido a uma enunciação. É o que

ocorre, por exemplo, quando uma mesma seqüência de palavras, pronunciada com padrões

entonacionais diferentes, é entendida de formas diferentes, ainda que os sentidos lexicais

permaneçam constantes. As diferentes segmentações prosódicas aplicadas em (a) e (b) a seguir,

tomadas de Grosjean (1983:504), evidenciam bem claramente esse papel prosódico:

(1) a [The other day I saw John really anxious]S [I said „Hi‟ to him]S

(Um outro dia eu vi John realmente ansioso. Eu lhe disse “Oi”.)

b [The other day I saw John]S [Really anxious, I said „Hi‟ to him]S

(Um outro dia eu vi John. Realmente ansioso, eu lhe disse “Oi”.)

Se ocorre uma mudança de significado por conta exclusiva da variação entonacional imposta à

enunciação, a conclusão natural se coloca no sentido de a entonação ser significativa.

House (2006:1543) indica que a entonação, no entanto, não é capaz de sugerir um

significado lingüístico independentemente da cadeia de palavras à qual ela seja aplicada, ou seja,

embora a entonação produza significados diferentes, ela o faz sobre um substrato lingüístico

anterior (no caso, uma seqüência de palavras) (cf., no entanto, Bänziger et al., 2003, em que oito

emoções foram prosodicamente caracterizadas a partir de duas sequências de sílabas que não

continham informações nem semânticas nem sintáticas1). A entonação seria, então, parcialmente

icônica, comparável ao gesto, e algumas similaridades entre várias línguas comprovariam sua

natureza não-arbitrária. Essa visão universalista é mais usualmente sustentada pelo fenômeno da

declinação, a associação usual da F0 alta ou ascendente à modalidade interrogativa e à não-

finalidade do enunciado, além da presença de movimentos melódicos pontuais em palavras

novas (tema) ou de alguma outra forma de importância significativa para a informação

transmitida (cf. Ladd, 1996:113).

A sugestão de House (2006:1544) é a de que a entonação seja analisada a partir de três

orientações funcionais distintas, cada uma delas podendo ser mais ou menos importante em uma

determinada enunciação. A primeira orientação se dá em direção ao próprio falante. A partir da

elocução produzida, seria possível identificar elementos próprios da caracterização pessoal do

locutor, tais como grupo social ou região a que pertence, seu sexo, além de propriedades

idiossincráticas. Todo esse conjunto seria responsável pela identidade do locutor. A essas

propriedades idiossincráticas associam-se informações paralingüísticas, como as atitudes e/ou

emoções que o locutor pode, consciente ou inconscientemente, atribuir à sua enunciação.

A segunda orientação proposta seria de ordem explicitamente lingüística, e que House

associa à função gramatical da entonação. A entonação seria utilizada em conjunto com o

conteúdo proposicional, explicitando-lhe, por exemplo, um sentido específico, ainda que o

fraseamento possa apresentar uma ambigüidade. É o que ocorre em (2), abaixo: a versão (a) da

1 A sugestão de House torna-se nula, a menos que não se considerem as emoções no nível lingüístico.

frase, pronunciada sem pausa entre “Labour” e “because”, sugere que o fato de a pessoa não ter

votado em Labour não foi devido ao contato com Tony Blair, mas a outros fatores; a versão (b),

com pausa entre “Labour” e “because”, sugere que o contato entre Labour e Tony Blair foi

responsável por a pessoa não ter votado em Labour.

(2) a. I didn‟t vote Labour because of Tony Blair.

(Eu não votei em Labour por causa de Tony Blair.)

b. I didn‟t vote Labour, because of Tony Blair.

(Eu não votei em Labour, por causa de Tony Blair.)

A terceira orientação da entonação se faria em direção ao processo de construção

discursiva em si mesmo, focalizando a interação entre o locutor e o ouvinte numa conversação,

ou mesmo entre o ouvinte e a estrutura de um texto, como num monólogo. É o que ocorre em

(3), em que a versão (b) evidencia, pela entonação exclamativa, um envolvimento emotivo forte

do locutor com a apresentação do coral.

(3) a. The choir was great. Their standard was really professional.

(O coral foi ótimo. O padrão deles era realmente profissional.)

b. The choir was great. Their standard was really professional!

(O coral foi ótimo. O padrão deles era realmente profissional!)

A entonação utilizada nos exemplos fará que o ouvinte interprete cada uma das

mensagens de uma forma específica. Num universo de inúmeras possibilidades (entre elas, os

fatores pragmáticos, tais como o contexto discursivo, o conhecimento enciclopédico, os

estereótipos culturais; as relações temporais e aspectuais; a ontologia temporal, envolvendo os

tipos de acontecimentos, estados, “acontecimentos negativos”, como sugerem Dargnat e Jayez,

2007:2-3), a entonação permite que várias interpretações sejam eliminadas, prevalecendo uma.

Ladd (1996:7) já havia sugerido esse nível sentencial ou pós-lexical para a entonação,

considerando que, por esses critérios, a entonação exclui características como o acento lexical e

o tom, determinados no léxico e que servem para distinguir uma palavra de outra, como é o caso,

no inglês, do substantivo permit (“permissão”, acentuado na primeira sílaba) e o verbo permit

(“permitir”, acentuado na última sílaba).

Essa proposta de interação entre o comportamento prosódico e o contexto em que a

elocução se produz já havia, de certa forma, sido apresentada por Fox (1984). A idéia seria a de

que certos aspectos do padrão prosódico seriam acessados mais em termos de suas funções

internas dentro da estrutura entonacional do que em relação às referências externas aos

significados discursivos específicos em questão. O que se verificaria, nesse caso, seria o

estabelecimento de relações entre as partes do padrão entonacional, cujo papel pode ser

entendido como o da criação de uma estrutura entonacional que seria, então, projetada no

discurso como um todo. Assim, percebe-se que, na abordagem de Fox, a escolha por uma certa

estrutura entonativa apresenta uma significação especial para o contexto discursivo.

Socialmente, é comum que determinadas frases produzam efeitos distintos dos esperados

pelo locutor no momento da enunciação. Esse fenômeno se explica de várias formas, desde

interferências de ordem cultural, tais como concepções religiosas que o ouvinte projeta sobre a

enunciação, até o mau uso de pistas prosódicas para elucidar um significado específico numa

sentença ambígua (cf. Stein, 2003). Nas situações em que o conteúdo lexical ou a estrutura

sintático-textual se mostra incongruente com a entonação utilizada, geralmente é o significado

produzido a partir da entonação que prevalece, como confirma Couper-Kuhlen (1985:116),

citando Pike (1945:22).

Mesmo que a entonação geralmente suplante o conteúdo lexical ou a estruturação

sintática (Ladd, 1978), deve-se considerar, no entanto, que ela não prevalece sempre. Couper-

Kuhlen (1985:116) apresenta o exemplo de uma aeromoça solicitando a um passageiro que pare

de fumar. Mesmo que ela utilizasse uma entonação cortês, uma frase ofensiva, como Put that

goddam pipe away (“Pare de fumar essa porcaria de cachimbo”), seria sempre interpretada como

ofensiva. Uma outra limitação para a entonação, muitas vezes, se dá por conta das restrições de

significado. Como Steedman (1991:9) menciona, contornos que imponham divisões como as

sugeridas em (4) não são permitidos, uma vez que “in ten” e “prefer corduroy” não formam um

grupo entonacional, devido à restrição imposta pelo que Selkirk (1984) denominou de “Sense

Unit Condition” (condição para a unidade de sentido):

(4) #(Three cats)(in ten prefer corduroy)

(Três gatos)(em dez preferem veludo)

Steedman explica essa impossibilidade de divisão a partir do que denomina “estrutura

informacional” – ou seja, distinções de foco, pressuposição e atitudes proposicionais em

direção às entidades no modelo discursivo (1991:9)2.

Como se pode perceber, o desentendimento dos lingüistas quanto à forma como os

fenômenos entonativos devam ser tratados conduz a uma disputa intensa quanto ao caráter

lingüístico da entonação. Martinet (1962:28, citado por Couper-Kuhlen, 1985:118) afirma

categoricamente que a entonação não passaria de “mera gesticulação com a glote” e que

pertenceria à “mais distante periferia do campo da linguagem”. Sua justificativa se centra no

fato de a entonação não apresentar dupla articulação, não sendo organizada, em um nível, como

uma sucessão de unidades mínimas a que se acoplam significados e, num nível mais baixo, numa

seqüência de segmentos distintos a que falta significação. Vários estudos, no entanto, parecem

conduzir à atribuição de um status lingüístico à entonação (cf. inter alia Selkirk, 1980, que,

como já comentado, assume uma postura incisiva ao considerar a prosódia como um componente

autônomo da gramática), retirando-a, pelo menos parcialmente, da esfera do paralingüístico.

No entanto, embora haja indicações de que a entonação deva ser considerada como um

fenômeno lingüístico – em oposição a “paralingüístico” –, deve ser levantado o questionamento

quanto a ser ela a única responsável pelos contrastes encontrados, por exemplo, nos casos citados

anteriormente. Couper-Kuhlen (1985:116) reflete sobre o fato de tanto a entonação quanto o

conteúdo lexical da enunciação serem responsáveis, em níveis semelhantes, pela caracterização

da atitude do locutor. Da mesma forma, haveria indicação mais explícita das relações textuais

entre as sentenças a partir dos conectores que a partir da configuração prosódica propriamente

dita. Também a interrogação pode ser marcada tanto pela entonação quanto pela forma

interrogativa (observe-se, no entanto, que em línguas como o português, esse papel será

desempenhado predominantemente pela entonação, embora algumas vezes o ordenamento das

palavras ou a presença de partículas gramaticais identifique a modalidade interrogativa; cf.

Moraes, 1998). Haveria, assim, a possibilidade de que a função entonativa estivesse sendo

superestimada. Hultzén (1959, citado em Couper-Kuhlen, 1985:116), sugere que o mecanismo

especificativo da entonação deva ser muito simples e não-específico e, ainda, que o que quer que

seja específico na interpretação talvez se obtenha mais a partir do texto em seu contexto

material e lingüístico do que do refinado contorno da entonação.

De qualquer forma, o problema maior está no fato de muitos estudos não procurarem

estabelecer uma base sólida para a caracterização entonativa. Ladd (1996:20) observa que grande

2 Optamos por apresentar, ao longo deste trabalho, nossa própria tradução para as citações utilizadas.

parte dos autores dos estudos relativos à entonação não busca identificar categorias fonológicas.

Normalmente, o que se faz é considerar um conjunto de funções entonacionais, assumindo que a

descrição mais adequada para essas funções deva ser caracterizada por meio das variantes

prosódicas contínuas do discurso, especialmente a F0, a duração e a intensidade. Um pouco mais

à frente (38), Ladd sugere que, por conta da sua natureza acústica, do seu domínio de extensão e

das mensagens que sugere, a entonação parece se colocar realmente como um fenômeno

paralingüístico, por três razões específicas: muito provavelmente, todas as línguas utilizam os

componentes suprassegmentais da entonação de forma paralingüística; alguns componentes

entonacionais parecem se estender sobre grandes trechos do discurso, sendo tentador analisar o

contorno entonativo como um conjunto de longo termo para a sentença como um todo; e o fato

de o sentido entonacional ser indiscutivelmente afetivo e interpessoal, quase nunca

proposicional, não havendo muitos casos em que o valor de verdade de uma enunciação seja

afetado pela entonação. Seu posicionamento, no entanto, é o de que nenhum desses três fatores

se coloca de forma decisiva. A questão essencial deve ser posta quanto à possibilidade de a

entonação envolver uma estrutura categorial e, para que se possa atingir essa informação, seria

necessário fazer uma distinção metodológica para os diferentes aspectos envolvidos na

entonação. A principal crítica de Ladd está no fato de a pesquisa instrumental tradicional tratar

todos os sentidos entonacionais como paralingüísticos. A metodologia normalmente utilizada

busca encontrar propriedades fonéticas variáveis continuamente nas elocuções que se possam

relacionar diretamente aos aspectos do significado da elocução. Isso se mostra adequado para o

significado paralingüístico, mas não para o lingüístico, eliminando a possibilidade de

reconhecimento de uma estrutura fonológica para a entonação.

Na exemplificação que estabelece (39), Ladd cita o fato de que algumas descrições

(Schubiger, 1958; O‟Connor e Arnold, 1973) estabelecem uma diferença entonacional entre um

contorno „high fall‟ e um contorno „low fall‟ para uma frase como “He didn‟t.” (Ele + passado

negativo), enquanto outras (Palmer, 1922; Crystal, 1969) analisam esses contornos como

variantes paralingüísticas da mesma categoria básica entonacional „fall‟. A grande dificuldade

está, como se pode constatar, em separar o que deve ser entendido como mensagem

paralingüística do que deve ser entendido como mensagem entonacional.

Como solução para a questão, Ladd (1996) propõe o que chamou de “Teoria Lingüística

do Significado Entonacional”, cuja idéia central é a de que os elementos da entonação

apresentam significado. Mesmo sendo bastante gerais, esses significados seriam parte de um

sistema com uma pragmática interpretativa rica, e apresentariam nuance bastante vívida em

determinados contextos. O contraste principal estaria no fato de a abordagem instrumental

tradicional considerar que significados bastante específicos, como a interrogação e a raiva, são

sugeridos por propriedades fonéticas gerais, com pouca intervenção de inferências pragmáticas

dependentes do contexto. Os pressupostos caracterizados por Ladd serão tomados como

referência principalmente nas seções 1.2 e 1.4.

1.1 OS ASPECTOS GRAMATICAIS

A tradição da gramática gerativa estabeleceu, como já comentado, a autonomia da sintaxe

em relação a todos os outros componentes lingüísticos, entre eles o fonológico. A representação

sintática de superfície e a representação fonológica subjacente eram vistas pela teoria padrão

como entidades quase idênticas em suas características, e se defendia que o mapeamento da

sintaxe para a fonologia consistia simplesmente em promover algumas alterações na estrutura de

superfície, adicionando-se elementos de fronteira que seriam responsáveis por representar as

propriedades de junção relevantes a certas regras fonológicas. Como Fox (2000:282) indica, é

Stockwell (1960) quem tenta reconciliar a análise feita por Trager/Smith com a abordagem

formal do primeiro modelo transformacional de Chomsky (1957), com a adição de cinco regras,

como representado na figura 1.1 (figura 5.8, em Fox).

1. S → Nuc + IP (Intonational Pattern)

2. IP → C (Contour) + JP (Juncture Point)

3. C → Disc(ontinuity)

Cont(inuity)

4. Disc → 001 ↓ (=any fall to 1 + terminal fade; 0=any pitch phoneme)

5. Cont → 002↓

003↓

004↓

021↑

032↑

043↑

Figura 1.1 – As cinco regras adicionais sugeridas por Stockwell (1960, citado por Fox 2000:282) para aprimoramento da proposta fonológica da Gramática Gerativa proposta por Chomsky (1957) (Intonation

Pattern = padrão entonacional; Contour = contorno; Juncture Point = ponto de junção; Discontinuity =

descontinuidade; Continuity = continuidade; any fall to 1 + terminal fade = qualquer queda até 1 +

esmaecimento terminal; any pitch phoneme = qualquer fonema de pitch).

Para suprir o fato de cada sentença ter um padrão entonacional, a regra inicial (S → NP +

VP) proposta por Chomsky é modificada para a Regra 1, na figura 1.1; a estrutura sintática da

frase é representa por Nuc, reescrito como NP + VP, como anteriormente. O padrão entonacional

(IP, Intonational Pattern) pode ser gerado pelas Regras 2 a 5, que explicitam as possibilidades.

O padrão consiste de um Contour (C) e de um Juncture Point (JP); o Contour pode representar

quer uma Discontinuity, quer uma Continuity; o primeiro resulta em um pitch descendente, com

esmaecimento terminal; o último, em um pitch final não-baixo, com um esmaecimento terminal,

ou uma elevação terminal.

Na segunda metade do século XX, vários estudos passaram a contemplar a estruturação

prosódica de forma específica, chegando-se ao ponto de sugerir que o componente prosódico

teria uma caracterização – da mesma forma que havia sido postulado para a sintaxe – autônoma.

Selkirk (1980:2), argumentando contra a representação suprassegmental, afirma a necessidade do

estabelecimento de categorias prosódicas, entendidas como subunidades da estrutura prosódica e

que seriam responsáveis por classificar os nós da representação arbórea. Como categorias

prosódicas, estipulou a sílaba, o pé, a palavra prosódica, a frase fonológica, a frase entonacional

e a elocução. A sugestão seria a de não existir isomorfismo entre as estruturas prosódica e

sintática. Pelo contrário, a “estrutura prosódica é uma entidade distinta”, sendo necessário

estabelecer um mapeamento não-trivial entre essas duas estruturas.

Em um outro trabalho (1984:27), após estabelecer a definição de “frases entonacionais”3,

a autora sugere que a necessidade de definição dos contornos entonacionais, relativamente a

alguma unidade de representação simultaneamente mais larga que a palavra e variável na

extensão, é que teria motivado a existência da frase entonacional. Essa unidade não poderia ser

sintática, pela simples razão de a seqüência sintática a que um contorno entonacional esteja

associado não ser, necessariamente, um constituinte de estrutura sintática.

A hipótese defendida é a de que os constituintes imediatos de uma frase entonacional

devem suportar ou uma relação head-argument ou uma relação head-(restrictive) modifier entre

si. Com essa caracterização, Selkirk estipula a frase entonacional como uma “unidade de

sentido”. A proposta de se entender a estrutura prosódica como autônoma é decorrência de a

autora postular que o fraseamento entonacional de uma sentença seja determinado de forma livre

à estrutura de superfície dessa sentença. Fraseamentos específicos estariam condicionados à

3 Esta noção será apresentada mais à frente, quando da discussão de Croft (1995).

aplicação de filtros, reflexo da condição de boa formação, que codificariam os constraints nas

relações semânticas verificadas entre os constituintes dentro de sucessivas frases entonacionais.

Selkirk caracteriza essa condição de boa formação como sendo a “condição de unidade de

sentido”.

Esse mapeamento entre a sintaxe e a fonologia se desenvolveria em duas etapas. Na

primeira, haveria o mapeamento da estrutura sintática em uma estrutura de superfície entonada, o

que significa dizer que a estrutura de superfície passaria a ter associada a si uma estrutura

entonacional. Na segunda etapa, o alinhamento da grade métrica seria construído para a sentença

com base nessa estrutura de superfície entonada. O resultado da segunda etapa seria a

representação fonológica subjacente da sentença.

A estrutura sintática, em si mesma, não teria como determinar, por exemplo, a

localização, o número ou as características tonais dos acentos melódicos atribuídos a uma

sentença. O mesmo aconteceria com o fraseamento entonacional, uma vez que uma mesma

sentença poderia ser dividida em frases entonacionais de formas diferentes, a partir de elocuções

diferentes. Como realça Selkirk (1984:285), não se pode dizer que a estrutura sintática de uma

sentença determine seu fraseamento entonacional, uma vez que uma mesma estrutura sintática

pode dar origem a várias representações entonacionais. Além disso, deve-se levar em

consideração que a estrutura sintática é normalmente um indicador fraco da variação prosódica.

Isso ocorre porque os padrões prosódicos são afetados por inúmeros fatores, como o tamanho e o

padrão acentual das palavras, o ritmo do discurso e, ainda, fatores discursivos como o acento

contrastivo. Vários estudos também já demonstraram que locutores não-informados da existência

de ambigüidades nas frases a que foram expostos durante os experimentos utilizaram pistas

prosódicas menos consistentes para a desambigüização sintática do que os locutores que já

possuíam essas informações (Lehiste, 1973; Wales e Toner, 1979; Allbritton, McKoon e

Ratcliffe, 1996, citados por Snedeker et al., 2000).

A problemática central em relação à proposta de Selkirk está em considerar o elemento

prosódico como constitutivo de uma unidade autônoma da gramática. As posturas extremas,

embora normalmente não se sustentem por longo tempo, apresentam o grande mérito de

promoverem o questionamento a respeito de pontos que, se não fosse por elas, passariam

constantemente despercebidos. A evolução dessas discussões acabou por conduzir a propostas de

certa forma conciliatórias, considerando uma inter-relação entre os vários componentes da

gramática. Nesse processo evolutivo, Croft (1995) propõe a “hipótese de armazenagem da

unidade entonacional”, que estabeleceria um elo entre as unidades entonacionais, a simplicidade

gramatical e a alta freqüência de indicação. O artigo, que será aqui tomado como referência, se

desenvolve a partir da observação de um corpus de narrativas orais no inglês.

O ponto inicial seria a determinação do que se consideraria uma “unidade entonacional”.

Croft assume essa definição em termos do que deve ser percebido como um contorno

entonacional único. Na verdade, trata-se da mesma noção que Selkirk, como comentado acima,

estabeleceu, e que foi assumida também por Nespor e Vogel (1986). Outros rótulos anteriores,

embora essencialmente sem diferenças quanto à caracterização, foram os de Quirk et al.

(1964:6804) propondo “unidade tonal”; Cruttenden (1986:35), com “grupo entonacional”; e

Halliday (1967), com “grupo tonal” e, posteriormente (1970), “unidade tonal”. Selkirk

exemplifica essa noção com duas possibilidades de fraseamento entonacional para “Albernathy

gesticulated” (“Albernathy gesticulou”):

(5) a IP (Albernathy gesticulated) IP

b IP (Albernathy) IP IP (gesticulated) IP

Assim, pode ser atribuída uma única frase entonacional à sentença como um todo, ou uma para o

SN e outra para o SV, o que evidencia não haver isomorfia entre frases entonacionais e

constituintes da estruturação sintática. Essa terminologia (em todas as variações apresentadas

acima) contempla tanto situações em que o tom possa ser considerado de forma mais ampla,

envolvendo seqüências melódicas ascendentes e descendentes (especialmente na tradição

britânica), quanto em seqüências de tons simples nivelados (especialmente na tradição

estadunidense). Por se mostrarem aparentemente como fronteiras naturais, parece haver uma

tendência a considerar as pausas como marcadores das unidades entonacionais. No entanto, elas

não devem ser tomadas dessa forma. Embora se possa, de fato, verificar uma pausa ao final de

um grupo entonacional, nem sempre haverá uma estabelecendo esse tipo de marcação, e nem

sempre uma pausa é produzida com essa intenção demarcativa. No primeiro caso, pode-se fazer

referência ao sistema prosódico do francês, em que o acento primário, delimitador de um grupo

rítmico, é freqüentemente marcado pelo aumento da duração silábica, sem que se constate,

necessariamente, uma pausa silenciosa. A sensação de pausa que se verifica muitas vezes, nesse

caso, é decorrência de um efeito psicológico (Jean-Yves Dommèrgues, comunicação pessoal).

No segundo caso, uma pausa pode ser produzida por conta da própria performance do locutor

durante o ato discursivo, caracterizando, por exemplo, hesitações.

4 Todas as referências mencionadas nesta sessão são as apresentadas em Croft (1995).

Uma sentença pode apresentar uma estruturação mais simples, ou significativamente mais

complexa. A partir dessa constatação, é possível perceber que uma unidade entonacional não

corresponde gramaticalmente a uma sentença, pela simples razão de que a extensão de uma

unidade entonacional é freqüentemente menor do que a daquela. Assim, é possível identificar em

uma mesma sentença, por vezes, várias unidades entonacionais. Croft alerta que se deve

considerar cuidadosamente a relação entre os papéis desempenhados pela sentença, na análise

sintática, e o papel de unidades comparáveis na análise do discurso falado, para que ambos os

sistemas possam ser integrados, evitando-se, assim, que o papel dos grupos entonacionais ou o

das estruturas sintáticas sejam percebidos de forma indevida. Quanto ao tamanho da unidade

gramatical, assume-se que ele seria do mesmo tipo das outras restrições atribuídas à competência

prosódica na interface sintaxe-prosódia.

Para a realização de seus testes, Croft utilizou o corpus de Chafe (1980), formado de

narrativas de “pear-stories” (“histórias de pêra”). Essa denominação se deu por conta da temática

utilizada nas entrevistas realizadas: foi construído um pequeno filme sobre um menino, algumas

peras e pessoas que o menino encontrou. As pessoas entrevistadas na formação do corpus

deveriam descrever os eventos do filme, em vários intervalos após verem as imagens. Os

resultados dos levantamentos realizados por Croft a partir das narrativas produzidas pelos

participantes indicaram que, na quase totalidade das vezes, as unidades entonacionais

correspondiam a unidades gramaticais (97%). Em 91% dos casos, as unidades entonacionais

consistiam de unidades gramaticais que possuíam um conjunto completo de complementos, e

nenhum constituinte disjunto. Essas unidades foram denominadas “unidades gramaticais totais”.

A preferência esmagadora das unidades entonacionais de se concentrarem em unidades

gramaticais totais foi denominada “condição de unidade gramatical total”. No entanto, nem todas

as unidades gramaticais são unidades entonacionais, pela razão de muitas vezes uma unidade

gramatical ser, ela própria, integrante de uma outra unidade gramatical.

Os resultados obtidos a partir dos levantamentos efetuados evidenciaram, por exemplo,

que 81% das orações subordinadas adverbiais5 constituíram unidades entonacionais. Possíveis

explicações para o fato de outras orações adverbiais não terem constituído unidades

entonacionais estariam ligadas a fatores discursivos que estariam interferindo no fato de certas

expressões adverbiais ocorrerem no mesmo grupo entonacional ou não. A previsão de Croft é a

de que fatores discursivos interfeririam na segmentação da unidade entonacional nos casos em

5 Para a análise detalhada dos fatores determinando as condições em que um grupo entonacional de um tipo

específico é total ou não, cf. Croft (1995:849 e 861).

que não houvesse um grau muito forte de integração sintática entre as unidades gramaticais, que

estariam, portanto, relativamente distantes sintaticamente.

Como já mencionado, Croft lançou a “hipótese de unidade entonacional armazenada”

com base na idéia de que nem todas as estruturas sintáticas podem ser armazenadas, por conta da

recursividade da gramática. Paralelamente, a noção de “estrutura sintática armazenada” sugere

que algumas construções, como muito provavelmente NPs/PPs simples encaixadas fariam parte

das estruturas fixas da língua, não sofrendo variações; estariam, assim, armazenadas e

disponíveis para acesso imediato6. Outras estruturas, no entanto, precisariam ser computadas

com base nas estruturas sintáticas armazenadas ou pré-compiladas. A hipótese de Croft tenta

formular um critério independente que seja suficiente para distinguir esses dois tipos de

estruturas sintáticas. Assim, a seguinte formulação é apresentada:

“As construções que são armazenadas ou pré-compiladas são as unidades gramaticais

que (normalmente) ocorrem em uma unidade entonacional simples.” (Croft, 1995:872)

Um outro suporte circunstancial para a hipótese de Croft seria o tamanho médio das

unidades entonacionais. Esse tamanho, no corpus de Altenberg (1990:282), seria de quatro

palavras; no de Crystal (1969:256), cinco palavras; e no de Chafe (1980:14), seis palavras. A

memória de curto-termo teria provavelmente uma capacidade dentro dos limites desses números.

Croft sugere, então, que as construções armazenadas/pré-compiladas, e as próprias unidades

entonacionais, poderiam ser a manifestação das limitações da memória de curto-termo no

processamento. Nessa linha de pensamento, para que o usuário da língua pudesse construir

unidades entonacionais mais longas, seria necessário que essa capacidade de memória fosse

maior. Assim, a estrutura e a organização da gramática teriam evoluído de forma a se adaptarem

às limitações e às capacidades da mente humana7.

Assumindo-se, então, que a entonação desempenha um papel lingüístico em sintonia com

a sintaxe, esse seu papel parece ser o de codificar um conjunto de instruções que seriam

utilizadas na interpretação do conteúdo morfossintático da elocução. Deve-se ainda considerar

que, para que possa haver a combinação de duas categorias sintáticas, é necessário que suas

6 Aubergé et al. (1997) sugerem que a morfologia da entonação deva ser descrita por meio de léxicos mentais de

contornos armazenados, organizados hierarquicamente. Cada classe de contornos se responsabilizaria diretamente

por determinados valores lingüísticos, sem interface fonológica alguma. Seria o caso de uma “estrutura morfológica

armazenda”, por paralelismo à proposta de Croft. 7 Para maiores detalhes sobre as restrições relacionadas à memória de curto-termo, cf. Croft 1995.

categorias prosódicas também se combinem, embora as regras combinatórias prosódicas e

sintáticas não precisem ser as mesmas (cf. a condição do constituinte prosódico, de Steedman,

1991:13, e a seção 3.2).

Assumindo-se também que a prosódia apresente alguma relação com o significado de

uma enunciação, House (2006:1548) sugere que, uma vez que a entonação contribui para a

representação semântica codificada da elocução (assim como para o estabelecimento das

relações sintáticas), necessariamente ela estaria contribuindo também para as explicaturas dessa

elocução. A noção de “explicatura” se diferenciaria, como indica, da de “implicatura”. As

explicaturas seriam as suposições necessárias para que se consiga desenvolver a representação

semântica codificada de uma elocução. As implicaturas, por sua vez, seriam o uso feito das

explicaturas para produzir inferências adicionais. Portanto, numa linha cronológica, as

explicaturas se processam anteriormente às implicaturas. House exemplifica essas noções a partir

da frase “They lack fibre.” (Eles não têm fibra.).

O ouvinte, para interpretar o significado dessa enunciação, deverá, inicialmente, atribuir

um referente para o pronome “they” e, além disso, pressupor o significado que o locutor atribui a

“fibre”. É necessário o uso de procedimentos inferenciais para que se consiga decodificar o que

está implicitamente informado. Parece não haver dúvida de que essa frase produzirá resultados

diferentes em cada um dos contextos (a) e (b) a seguir:

(6) a Parents have been complaining about the quality of school dinners. They say they lack

fibre.

(Os pais têm reclamado da qualidade dos jantares na escola. Dizem que eles não têm

fibra.)

b The army officers have been grumbling about the quality of their new recruits. They say

they lack fibre.

(Os oficiais do exército têm comentado sobre a qualidade dos novos recrutas. Dizem que

eles não têm fibra.)

No contexto (a), após ter inferido que “they” se refere a “dinners” e “fibre” ao conteúdo

da comida (o que corresponde às explicaturas), o ouvinte pode utilizar seu conhecimento para

inferir que não há nem frutas nem legumes nas refeições (o que corresponde às implicaturas).

Quando pronunciada, a frase “they lack fibre” poderá receber entonações diversas, que refletirão

a atitude do falante em relação a essa proposição. Essa atitude do falante em relação à proposição

enunciada seria, como indica House, uma explicatura de nível mais elevado. A entonação,

tomada como fenômeno paralingüístico, seria responsável, portanto, pela interpretação dessas

explicaturas de nível mais elevado.

1.2 OS CONTORNOS PROSÓDICOS

A noção de que as manifestações prosódicas sofrem influência direta de inúmeros

aspectos idiossincráticos já foi amplamente discutida na literatura (cf. Ladd, 1996, para uma

revisão bibliográfica mais detalhada). Inúmeros estudos já demonstraram que um mesmo

contorno entonativo pode apresentar flutuações dependendo do contexto em que esteja sendo

produzido (cf. inter alia, Prevost e Steedman, 1994). A variação, por exemplo, da freqüência

fundamental refletirá diretamente tanto o estado de espírito do locutor, caracterizando emoções

e/ou atitudes particulares, quanto a própria conformação física de seu trato vocal. A relativização

na análise dos fenômenos prosódicos deve ser assumida como fundamento, embora não se deva

desconsiderar que, apesar de toda relativização que se faz necessária, é freqüentemente possível

observar comportamentos prosódicos que se mostram constantes em determinadas situações

enunciativas. Quando se pensa a caracterização de um contorno prosódico8, portanto, deve-se

procurar perceber quais são os limites – muitas vezes tênues – entre o possivelmente absoluto e o

idiossincrático.

Num primeiro momento, parece interessante lembrar que o fenômeno entonativo deve ser

considerado a partir dos múltiplos efeitos que pode causar no ouvinte. Socialmente, constrói-se

toda uma simbologia para os sons e a qualidade vocal. O contato do ser humano com o mundo

animal parece se colocar como uma fonte bastante inspiradora para a construção desse

imaginário lingüístico. Em princípio, talvez seja bastante difícil estabelecer a origem exata de

determinada simbologia. Normalmente, associa-se um tom de voz baixo à idéia de agressividade

ou de domínio, enquanto uma postura submissa é refletida por um tom de voz mais agudo. Uma

possível explicação para esse simbolismo estaria relacionada ao fato de o órgão produtor de uma

vocalização mais grave ser maior que o que produz uma vocalização mais aguda (Gussenhoven,

2002a:48). A observação do mundo animal sugere que os seres maiores (como um elefante) ou

vistos como mais dominadores (como um leão) produzem sons bastante graves. A sociedade

humana, por analogia com o mundo animal, teria incorporado essa relação aos seus valores

8 O termo “padrão prosódico” será empregado nas discussões em que outros autores o tenham utilizado em suas

obras. A partir do capítulo 4, em que se aplicam as informações específicas desta pesquisa, será assumido o termo

“contorno prosódico”, entendendo-se que deve ser utilizado, exclusivamente, para uma conformação melódica com

valor fonológico; portanto, distintivo.

simbólicos, com a mesma noção de domínio sendo atribuída ao ser masculino – que apresenta o

duto vocal mais longo que o da mulher e, por conseguinte, a voz mais grave.

Biemans (2000, citado por Gussenhoven, 2002a:48) encontrou uma correlação positiva

entre registros artificiais superpostos sobre elocuções espontâneas masculinas e femininas e uma

escala de feminilidade, ao lado de uma correlação negativa, considerando-se uma escala de

masculinidade. Isso significa dizer que os tons mais agudos relacionam-se diretamente aos

valores semânticos de polidez, não-agressividade e amizade. Por extensão (provavelmente

devido ao imaginário social construído historicamente), a noção de vulnerabilidade se associaria

a tons mais agudos, e a de confiança, a tons mais baixos.

Assim como esses valores relacionados à qualidade da voz se solidificaram, de certa

forma, dentro da sociedade, alguns contornos entonacionais também se mostram como

tendências genéricas. Mais de 70% das línguas provavelmente apresentam contornos entonativos

ascendentes para a entonação interrogativa, enquanto uma entonação ascendente para uma

afirmação é excepcional. Assim, é razoável afirmar que se trata de uma gramaticalização desse

contorno melódico. Por outro lado, a gramaticalização da altura do pico da freqüência

fundamental seria menos comum, uma vez que essa variação estaria diretamente relacionada a

fatores de ordem mais emotiva e/ou atitudinal (Gussenhoven, 2002a:49).

As funções paralingüísticas do pitch são observadas de igual forma nas línguas tonais.

Também os falantes chineses masculinos apresentam a voz mais grave que a das mulheres, e

suas vozes, elevadas para a expressão da raiva, por exemplo, soam de forma semelhante às

manifestações de raiva em qualquer outra língua. Como sugere Ladd (1996:2), isso não significa

dizer que não se possa atribuir uma função fonológica ao pitch, mas que, na verdade, além de

uma função fonológica, o pitch desempenharia também funções paralingüísticas. A questão

estaria em determinar se línguas como o inglês e o francês, por exemplo, utilizariam o pitch com

funções fonológicas. Caso isso venha a se verificar, a entonação estará, portanto, relacionada aos

aspectos lingüísticos, além dos paralingüísticos.

Uma modulação melódica pode apresentar, normalmente, uma grande variação ao longo

da escala de tempo. Qualquer tentativa de estabelecer um movimento melódico como detentor de

aspectos fonológicos deve levar em consideração que nem toda flutuação da freqüência

fundamental será responsável por uma caracterização fonológica. Variações na F0 sempre

estarão se processando: ainda que não pareça estar acontecendo algo significativo ao longo do

movimento, a queda gradativa da F0, por exemplo, continuará a acontecer, por conta do

fenômeno da declinação. Devido à própria natureza dos mecanismos físicos envolvidos na

produção da elocução (como a diminuição progressiva do volume de ar expelido pelos pulmões,

diminuindo a pressão subglotal), um mesmo movimento de pitch se mostrará mais elevado no

início do que no final de uma elocução.

Ao discutir a questão envolvendo a perspectiva de fenômenos prosódicos poderem ser

considerados universais ou específicos de certas línguas, Gussenhoven (2002a) defende a idéia

de que ambas as possibilidades são verdadeiras, simultaneamente, para qualquer língua. A

diferença estaria em que o aspecto universalista seria exercido a partir da implementação

fonética, enquanto o significado específico à língua se localizaria na morfologia e na fonologia

entonacionais9. Os significados universais estariam fundamentados nos aspectos envolvendo a

F0, caracterizadora do processo de produção do discurso. Para Gussenhoven, os significados

universais se fundamentariam em metáforas das condições biológicas que estariam influenciando

esse processo de produção discursiva. Essas metáforas foram denominadas por ele como

“códigos biológicos”, em número de três e, juntas, elevam-se a uma teoria do significado

paralingüístico na entonação.

A problemática central, na visão de Gussenhoven, estaria sobre qual seria a explicação

para a natureza dos significados paralingüísticos universais. Esse conhecimento seria derivado de

três condições determinadas biologicamente. A primeira, caracterizadora do Código de

Freqüência, estaria relacionada ao tamanho variável que os órgãos com que o discurso é

produzido – em particular a laringe – adquirem nos diversos locutores, produzindo variações na

freqüência fundamental, por exemplo, de uma criança e de um adulto, como já discutido acima.

Laringes menores contêm pregas vocais menores e mais leves, o que possibilita, com uma dada

quantidade de energia, uma maior velocidade nas vibrações do que em uma laringe com pregas

vocais maiores e, por conseguinte, mais pesadas. Esse aumento da velocidade de vibração eleva

os índices da freqüência fundamental, produzindo tons mais agudos. O termo para essa relação

entre forma e função foi aproveitado a Ohala (1983, 1984, 1994).

A segunda condição, caracterizadora do Código de Esforço, diria respeito à energia –

detectável no sinal acústico – necessária para a produção do discurso. O volume de energia pode

ser variado, sendo que a utilização de uma maior quantidade produziria movimentos

articulatórios mais precisos, além de movimentos de pitch mais canônicos e mais numerosos.

Quanto maior o cuidado na produção do discurso, menos difusos serão esses movimentos.

9 Bolinger (1983:100) já havia sugerido a impossibilidade de que as implementações entonacionais de língua para

língua sejam idênticas. Para que fossem, seria necessário que o iconismo da entonação fosse perfeito, o que, como

preconiza, só poderia ser encontrado caso algo fosse o seu próprio ícone.

A terceira condição, caracterizadora do Código de Produção (ou de Fase de Produção), se

relacionaria ao fato de essa energia ser dividida em porções que coincidem com as fases de

exalação durante o processo respiratório. Esse código é que se mostra responsável pelos pitchs

mais elevados no início das elocuções e mais baixos no final.

De acordo com Chen (2003:108), a interpretação informacional (ou seja, o atributo

relacionado ao que está sendo dito) do Código de Produção é a de que inícios com pitch elevado

indicam novos tópicos, enquanto inícios com pitch rebaixados, a continuação de tópicos. No fim

de uma elocução, os finais com pitch elevado indicam continuação; com pitch rebaixado, o fim

da elocução. Uma outra analogia que se pode estabelecer em relação ao Código de Produção são

as associações metafóricas de “para cima” e “para baixo” sugeridas por Lakoff e Johnson

(citados por Bolinger 1983:99), úteis na organização da experiência cotidiana de algo concluído

ou não-concluído. Assim, durante uma ação, está-se “para cima” e em movimento (da mesma

forma que a F0); no final dessa ação, senta-se ou deita-se para descansar.

Recapituladas as possibilidades de análise paralingüística da prosódia, e os mecanismos

biológicos nela envolvidos, e partindo-se para a discussão do que se deva entender como um

contorno prosódico, retoma-se Di Cristo (2004:108-110), que lembra que é possível estabelecer

uma análise a partir de uma visão holística ou de uma visão composicional. No caso de uma

concepção holística radical, de inspiração gestáltica, o contorno entonativo global,

correspondente geralmente ao que se denomina Unidade Entonativa, Grupo Entonativo ou

Sintagma Entonativo exprimiria uma significação que não poderia ser decomposta em elementos

significativos menores. O contorno, como um todo, possuiria um estatuto semelhante ao de um

morfema (o que justificaria o termo “morfema entonativo”). A especificidade dessa abordagem

holística estaria em a significação do contorno global não poder ser inferida a partir da

significação de suas partes. Di Cristo acredita que essa concepção deva ser reformulada caso se

admita que algumas partes de um contorno possam ser mais informativas que outras, como

normalmente ocorre com o ataque, a pretônica e a tônica, no caso do francês, correspondentes,

respectivamente, às sílabas inicial, penúltima e final do contorno. Assumindo o estabelecido por

Rossi et al. (1980), Di Cristo indica que, uma vez que a significação do contorno é deduzida de

uma relação entre suas partes, e não da globalidade de sua configuração, que se deva falar, nesse

caso, de um “morfema discontínuo”. Aubergé et al. (1997), ao avaliarem o ponto em que se deu

a identificação de seis atitudes ao longo de enunciações completas, verificaram, por sua vez, que

a informação prosódica sobre essas atitudes não estaria distribuída uniformemente ao longo das

enunciações, mas concentrada em pontos específicos, mesmo que o contorno fosse global (na

mesma linha dos princípios da Gestalt).

A abordagem composicional (ilustrada pela escola estadunidense “autossegmentalista”,

especialmente a partir dos trabalhos de Pierrehumbert, 1980) considera que as entidades

constitutivas dos contornos (tais como os acentos melódicos e os tons de fronteira) são

responsáveis por veicular cada uma das significações particulares responsáveis pela construção

do significado geral do contorno que as inclui. Assim, os acentos melódicos e os tons de

fronteira seriam analisados como morfemas em si mesmos, ou seja, como signos prosódicos,

inseridos em unidades significativas mais amplas. O pitch entre esses acentos melódicos e os

tons de fronteira seria preenchido pela fonética, como lembra Gussenhoven (2002b:5). Essa

abordagem parece se aproximar da de Wells (1945, citado por Fox, 2000:281), segundo a qual os

fonemas entonacionais seriam agrupados em seqüências que constituiriam morfemas, o que

significa dizer que o contorno, como um todo, não teria um estatuto fonológico.

Selkirk (1980:21) entende que o contorno entonacional de uma entonação completa deve

ser visto como constituído de contornos entonativos primitivos menores, cada um com suas

características próprias. Além disso, cada um desses contornos estaria associado a uma frase

entonacional. Couper-Kuhlen (1985) entende, com isso, que a frase entonacional apresenta,

como uma de suas características, um único contorno entonacional, que se projeta ao seu longo.

Ladd (1996:44) assume postura semelhante, considerando que um contorno entonativo

pode se projetar sobre uma enunciação monossilábica, concentrando-se de forma compacta,

como também pode se projetar sobre uma enunciação contendo várias sílabas. No entanto,

detalhando um pouco mais sua análise, o autor caracteriza a análise de um contorno projetado

sobre uma enunciação de seis sílabas como formado a partir de dois eventos distintos, em vez de

uma simples extensão sobre as sílabas:

(7) a A: I hear Sue‟s taking a course to become a driving instructor.

(Ouvi dizer que Sue está fazendo um curso para se tornar instrutora de auto-escola.)

B: Sue?

(8) b A: I hear Sue‟s taking a course to become a driving instructor.

(Ouvi dizer que Sue está fazendo um curso para se tornar instrutora de auto-escola.)

B: A driving instructor?

(Instrutora de auto-escola?)

Na primeira frase, o formato rise-fall-rise abrange toda a elocução, formada de uma única

sílaba. Ladd indica que, na segunda frase, não houve apenas a extensão desse formato sobre

todas as sílabas. Pelo contrário, estariam se processando dois eventos distintos, o primeiro

caracterizado pela elevação e queda da F0 sobre a sílaba <driv>, e o segundo, como tom de

fronteira, consistindo de uma elevação nos últimos dez segundos da elocução. O tom baixo

verificado entre esses dois extremos seria uma simples transição entre esses dois eventos. Uma

caracterização nesses termos mostra-se mais exata quanto à descrição de como esse tom pode ser

aplicado a enunciações contendo vários números de sílabas e padrões acentuais diferentes.

Um contorno prosódico, definido sob os aspectos da teoria métrico-autossegmental, é

analisado como constituído a partir de uma seqüência de tons. Essas seqüências serão

responsáveis por gerar o formato dos padrões de pitch associados às elocuções. Considerando-se

que os contornos são representativos da associação entre forma e significado – ou seja, um dado

contorno (que apresenta um formato específico) produzirá, necessariamente, um significado

específico –, não será qualquer seqüência de tons que deverá ser considerada como um contorno

prosódico. Esses contornos, essencialmente, contribuem com a constituição da Gramática de

uma língua. Marandin (2004), discutindo o princípio de Lambrecht, segundo o qual os valores

discursivos são por natureza contrastivos, observa a implicação de que o valor discursivo dos

contornos depende dos paradigmas das formas verificados em cada língua individualmente.

Assim, os contornos falling e non-falling, no inglês, estariam relacionados, respectivamente, com

o comprometimento do locutor e do ouvinte em relação à enunciação proferida, mas não no

francês (cf. discussão mais à frente).

Um contorno prosódico, para ser estabelecido como tal, necessariamente deve ser

submetido aos mesmos testes contrastivos utilizados para outras estruturas gramaticais; por

exemplo, a caracterização de uma seqüência fonética como sendo um morfema. Couper-Kuhlen

(1985:110) lembra que um contraste significativo deve ser entendido como sendo o que se

estabelece entre duas configurações entonacionais distintas quando falantes nativos associam

diferentes significados aos diferentes membros do par, esses significados podendo ser

considerados diferentes sob aspectos descritivos, expressivos ou sociais; ou, ainda, quando

contextos diferentes são apropriados aos diferentes membros do par. Caso dois elementos co-

ocorram no mesmo ambiente, não se trata de duas unidades contrastivas, a menos que possam ser

contrastadas em outros ambientes, o que indicaria tratarem-se de elementos contrastivos, mas

neutralizáveis sob certas circunstâncias.

A autora caracteriza seis tipos de contrastes significativos: no nível informacional, no

nível gramatical, no nível ilocucionário, no nível atitudinal, no nível textual-discursivo, e no

nível indexical. No nível informacional, um contraste se estabeleceria nos casos em que uma

mesma enunciação seria utilizada em contextos com estruturas informacionais diferentes.

(9) a I saw a MÀN in the garden

(Eu vi um homem no jardim)

b I SÀW a man in the garden

(Eu vi um homem no jardim)

A primeira elocução, em que o acento prosódico recai sobre “man”, seria uma resposta

possível a uma pergunta como “O que você viu?”, ou “O que aconteceu então?”, enquanto a

segunda, com o acento prosódico sobre “saw”, apenas responderia à pergunta “Você ouviu um

homem no jardim?”. A entonação é que será responsável nessas situações por atribuir uma

estrutura de foco contrastivo a “saw”, na segunda elocução.

O termo “gramatical”, para caracterizar o segundo contraste significativo, é utilizado pela

autora no sentido tradicional. Esse tipo de contraste se estabelece, portanto, a partir da função

gramatical da entonação, que possibilita, por exemplo, a diferenciação entre uma afirmação e

uma questão.

(10) a |shut the DÒOR||

(feche a porta)

b |shut the DÓOR||

(feche a porta)

As elocuções acima representam o uso do contorno descendente e ascendente para

caracterizar, respectivamente, uma ordem e um pedido.

O valor ilocucionário seria caracterizado a partir da possibilidade de a entonação conferir

uma força intencional à elocução em um dado contexto. Ou seja, segundo a entonação utilizada

para uma enunciação, o ouvinte poderia perceber, por exemplo, uma intenção subjacente do

locutor, tal como sugerir algo.

(11) a h|WHY don‟t you move to CaliFÓRnia||

(por que você não se muda para a Califórnia)

b l|why don‟t you move to CaliFÓRnia||

(por que você não se muda para a Califórnia)

Nos exemplos acima (extraídos por Couper-Kuhlen de Sag e Liberman, 1975), percebe-

se que a intenção do locutor, com a elocução (a), é apenas fazer uma pergunta, desejando obter

informações sobre as razões pelas quais seu interlocutor não estaria disposto a se mudar para a

Califórnia. Com a elocução (b), mais do que uma simples pergunta, o locutor sugere que seria

uma boa opção para seu interlocutor mudar-se para a Califórnia. Esse valor adicional conferido

ao formato, nesse caso, interrogativo do contorno prosódico é que se caracteriza como a força

ilocucionária que foi atribuída à enunciação.

Entende-se como um contraste atitudinal aquele que se estabelece com base na expressão

da emoção do locutor.

(12) a h|good MÓRning||

(bom dia)

b l|good MÒRning||

(bom dia)

O exemplo (aproveitado de Gimson, 1980) evidencia, na versão (a), um certo estado de euforia

do locutor, caracterizado pelo tom ascendente sobre a sílaba <mor>. O tom descendente sobre

essa mesma sílaba produz a sensação de um cumprimento rotineiro, sem grande entusiasmo.

O quinto contraste significativo, indicativo da função textual da entonação, seria o

responsável pelo aspecto coesivo estabelecido entre diferentes enunciações. Couper-Kuhlen

lembra que o termo “textual”, nesse caso, deve ser entendido como relacionado aos aspectos da

organização lingüística além da sentença e relacionados à mensagem em si mesma.

(13) a the h|lecture was CÀNcelled || the

h|speaker was ÌLL||

(A conferência foi cancelada. O conferencista estava doente.)

b the h\lecture was CÁNcelled || the |speaker was ÌLL||

(A conferência foi cancelada, o conferencista estava doente.)

O exemplo (b) acima (aproveitado por Couper-Kuhlen de Brazil, Coulthard e Johns, 1980:31)

deixa perceber que o contorno continuativo verificado sobre a sílaba <can> permite o

estabelecimento de uma relação discursiva direta entre as duas enunciações. Torna-se bem

evidente a noção de que o cancelamento da conferência se deu por causa da doença do

conferencista. Evidentemente, o simples fato de ambas as elocuções se posicionarem uma ao

lado da outra, e nessa seqüência em que foram apresentadas, sugere a relação causa-

conseqüência, como ocorre também na versão (a). A aplicação do contorno entonativo

continuativo, na versão (b), realça essa relação.

O último contraste significativo que Couper-Kuhlen caracteriza para os contornos

prosódicos, o indexical, seria responsável por estabelecer diferenças identitárias entre os seus

usuários. Trata-se do reconhecimento, por exemplo, de um indivíduo como pertencente a um

certo grupo sócio-regional que faria uso de um contorno específico em determinadas situações

comunicativas; assim como, entre várias outras possibilidades, de uma certa identificação

profissional, como se verifica, por exemplo, nas elocuções proferidas por pregadores religiosos

ou vendedores de rua.

Pela observação dos exemplos acima, talvez seja possível dizer que a porção mais

significativa de um contorno esteja localizada sobre a parte final da frase entonacional. Nos

casos dos contornos informacional e ilocucionário, o contraste entre as versões a e b dos

exemplos se estabeleceu, pelo contrário, a partir do realce de porções localizadas em posições

que não as finais. A marcação de foco, em princípio, pode se dar em qualquer posição da frase,

bastando que, para isso, na intenção comunicativa, o elemento destacado esteja nessa posição.

Estendendo-se essa observação para os aspectos afetivos da comunicação, os possíveis contornos

prosódicos talvez tendam a se concentrar em determinados pontos da frase entonacional segundo

a língua analisada. Para o holandês, como destaca Gussenhoven (2002a:48), a tendência parece

ser a localização sobre a porção final, numa sugestão de que, nessa língua, os finais dos

contornos seriam utilizados mais freqüentemente para sugerir os significados afetivos. Já no PB,

essa posição não seria tão recorrente. Em uma mesma frase entonacional, os pontos mais

significativos dos contornos ocupariam tanto as posições finais quanto as iniciais ou médias,

algumas vezes esses pontos significativos se distribuindo entre mais de uma posição (Moraes e

Stein, 2006).

Mesmo que a localização para um caráter distintivo de um contorno ao longo de uma

frase entonacional seja fixa, normalmente ocorrem variações na extensão do pitch. Ladd

(1996:150), ao analisar um exemplo hipotético, constituído pela seqüência tonal M..H..H..L..M,

evidencia duas possibilidades de realização para o contorno:

(14) a

Essa variação de pitch ocorre da mesma forma nas línguas entonacionais. Como o autor sugere,

tanto no inglês quanto no iorubá é possível distinguir uma extensão de pitch “normal” e uma

“expandida” daquilo que, em outros aspectos, é exatamente o mesmo tom. Assim, tanto nas

línguas entonacionais quanto nas tonais, observa-se uma identidade de relação entre a

modificação na extensão paralingüística do pitch e a especificação lingüística tonal. Ladd faz

essa observação com o intuito de mostrar que esse tipo de modificação na extensão do pitch não

seria um problema para o modelo descritivo da teoria métrico-autossegmental, assim como para

nenhuma outra teoria fonológica da estrutura entonacional. Em outras palavras, o que se

verificaria, nesses casos, seria uma projeção idiossincrática do locutor sobre o contorno

entonacional, expressando, por exemplo, um maior entusiasmo durante a elocução. Um mesmo

contorno prosódico assumiria, então, uma função fonológica e, paralelamente, expressiva, ou,

como colocou Ladd, observa-se, simultaneamente, uma caracterização lingüística e outra

paralingüística para o mesmo contorno.

Pode-se pensar a existência, então, de determinados contornos que são próprios de

situações corriqueiras, nos termos de Ladd (1978:524), situações estereotipadas ou estilizadas,

como observado, por exemplo, quando da troca de agradecimentos entre um vendedor e um

cliente. Todas as vezes em que houver necessidade de uma expressão autêntica de agradecimento

ou de desculpas, o mesmo contorno que normalmente é utilizado com esse propósito sofrerá uma

variação mais expressiva da F0. A proposta de Ladd (535) é a de que os contornos estilizados

são, na verdade, entonações planas com algo adicionado, ou seja, trata-se de uma modificação de

contornos mais básicos. A modificação pertenceria à forma: a realização de pitch uniforme dos

tons gerando o contorno. Marandin (2004) propõe a extensão dessa caracterização ao aspecto

semântico da estilização. Assim, a estilização estaria adicionando ao contorno original um efeito

de menção. O significado dos contornos estilizados poderia, então, ser decomposto em dois

elementos caracterizados, um como o contorno evidente, outro como os efeitos ligados ao fato de

esse contorno ter sido mencionado (para uma discussão mais detalhada, cf. seção 3.1 e figura

3.4, à frente).

Em princípio, a modificação na extensão do pitch poderia parecer um simples

redimensionamento na proporção entre um certo nível fixo de referência, estabelecido na parte

mais baixa da extensão do pitch, e os alvos a serem atingidos para a produção de um

determinado efeito expressivo. No entanto, Ladd (1996:269), assumindo o expresso por

Liberman et al. (1993), indica que estaria sendo envolvido, nesse processo, algum componente

aditivo além dos fatores multiplicativos que produziriam essa extensão proporcional do pitch.

Estaria presente, portanto, uma certa modificação no nível fixo de referência.

Um exemplo de fator extrínseco interferindo nesse nível de referência seria a variação na

extensão de projeção do pitch devida às características individuais dos falantes. Os valores reais

da F0 que correspondem a um tom H ou M sofrerão influência da identidade masculina ou

feminina do locutor, ou ainda de seu estado emotivo. Existe, portanto, como já dito, uma relação

direta desses níveis com a caracterização idiossincrática do locutor e o contexto paralingüístico

da elocução. No entanto, como afirma Ladd (270), nem a posição dos tons na escala, nem sua

identidade lingüística serão afetadas por esse tipo de influência (para detalhes sobre o modelo

matemático proposto, cf. Ladd (1996:265-69); para uma breve discussão da proposta de

normalização e de inicialização como alternativas para essas variações idiossincráticas, cf. mais

à frente).

De um certo modo, parece ser possível dizer que, da mesma forma que a variação na

extensão dos tons é caracterizadora de manifestações paralingüísticas, a distância na escala

temporal entre dois eventos fonológicos distintos deve ser percebida, como já discutido acima,

como a transição entre esses eventos. Segundo Ladd (1996:45), esse seria um dos pontos

principais na diferenciação entre a teoria métrico-autossegmental e as teorias anteriores: ela

distingue explicitamente “eventos” e “transições”. Assim, os eventos seriam as partes

lingüisticamente importantes dos contornos, localizadas em determinados pontos, e não

estendidas sobre todo o contorno. A manifestação da F0 entre esses eventos significativos seria

uma transição gradual entre, por exemplo, o nível alto ao final de um evento local e o baixo no

início do evento seguinte.

A consideração da existência de pontos localizados da F0 como caracterizadores dos

eventos significativos para um contorno prosódico implicaria, por extensão, dizer que o

movimento da F0, nesses eventos, atende a uma configuração específica. Parecem existir

evidências claras de que o alinhamento dos alvos da F0 seria cuidadosamente controlado (Ladd,

1996:68). Isso sustentaria uma teoria segundo a qual os alvos da F0 seriam a manifestação

fonética de tons estáticos subjacentes, o que não seria incompatível com a noção de serem os

movimentos de pitch considerados como primitivos. No entanto, uma vez que se constatam mais

evidências para o alinhamento preciso dos alvos, torna-se mais improvável a noção de que os

alvos da F0 seriam apenas pontos onde os movimentos de pitch começariam e terminariam.

Dessa forma, a proposta de uma visão baseada em configurações para os contornos prosódicos

torna-se mais plausível.

Mesmo dentro de um único evento, a F0 se estende ao longo da linha cronológica. A

previsão de um contorno se diferenciar de outro com base nos picos atingidos pela F0, ou pela

sua projeção cronológica, não se coloca de forma exatamente fácil. Como reporta Ladd

(1996:68), referindo os experimentos de Liberman e Pierrehumbert (1984), haveria indícios de

que a descrição em termos de níveis – ou seja, o nível atingido pela F0 em um determinado

ponto sendo mais elevado do que o nível atingido em outro ponto – parece expressar melhor as

regularidades nos dados experimentais analisados do que a variação na extensão. Os

experimentos utilizados evidenciaram uma correlação significativa entre a variação geral do

pitch e o tamanho das extensões da F0. No entanto, a relação entre as alturas atingidas pelos

picos mostrou-se muito mais regular do que a relação entre os tamanhos das extensões, o que

suportaria a idéia segundo a qual o posicionamento pontual dos picos da F0 é que seria mais

significativo para a caracterização dos contornos. Ladd (1996:69) apresenta ainda, como

confirmação dessa hipótese, os dados perceptivos obtidos por „t Hart (1981). Com base em um

experimento em que o autor procurou explorar especificamente a extensão da F0, em detrimento

de sua elevação, foi possível constatar que os ouvintes têm uma atenção consideravelmente

desenvolvida para o nível do alvo da F0, mostrando um desempenho muito baixo no julgamento

da extensão em si mesma.

Uma vez estabelecida a noção de que os níveis atingidos pela F0 são muito mais

significativos do que sua extensão ao longo da escala cronológica, esse referencial poderia ser

tomado como base para o estabelecimento de um modelo capaz de mensurar as variações da

freqüência fundamental. A proposta de Ladd (1996:256) tende para o que seriam considerados os

modelos normalizadores. Um modelo desse tipo focalizaria a noção de variação do pitch em

termos de alguns pontos de referência específicos do falante, tais como o valor mais alto e o mais

baixo da F0. Esse modelo possibilitaria abstrair variações entre os falantes, assim como

comportamentos paralingüísticos, expressando as características invariáveis dos tons em termos

do que seria uma variação idealizada do falante, possibilitando um processo de fatoração das

fontes de variação. Assim, seria estipulado que um tom H estaria se realizando no valor máximo

de variação do falante, ao invés de considerar que esse tom H estaria a uma determinada

distância de um tom L. Não estaria sendo feita referência ao contexto fonético da elocução, o que

permitiria considerar que, numa dada configuração, o início de um tom low-rise não seria

referenciado a partir de algum nível de pitch precedente. Uma exemplificação de uso desse

modelo seria a abordagem feita por Earle (1975, citado por Ladd, 1996:256) dos tons lexicais em

palavras monossilábicas vietnamitas. Foi estabelecido um valor de 100 para o ponto mais

elevado na escala de variação de F0 de cada falante, e 0 para o ponto mais baixo. Earle definiu as

formas de citação de cada um dos contornos dos seis tons lexicais do idioma em termos da

variação ao longo da escala percentual definida para cada falante.

Um elemento complicador na tentativa de estabelecer uma normalização, nos moldes

discutidos acima, é o fato de que a variação do pitch pode sofrer modificações, como já discutido

anteriormente, mesmo se considerado o discurso de um único falante. É o que se observa em

situações envolvendo variações paralingüísticas, como a elevação da voz para demonstrar raiva,

ou abaixamento, por um estado de tristeza, ou situações com propósitos comunicativos diversos,

como não falar alto para não perturbar os outros leitores em uma biblioteca. Embora a variação

do pitch seja intensa nessas diversas situações, alguma dessas variações seria independente da

mensagem lingüística. Como Ladd (1996:259) lembra, o que pode ser dito com a voz alta

também pode ser dito com a voz baixa. Seria o caso, então, de buscar uma normalização dessas

diferenças.

No entanto, outros fatores estariam interferindo nessa normalização. Caso sejam

comparadas as dimensões da F0 em falantes diferentes, poderão ser encontrados pontos comuns

de intersecção. Normalmente, a variação de F0 em uma mulher estará dentro de limites de pitch

diferentes da variação verificada em um homem de voz mais grave. No entanto, caso se

comparem dois homens, ou duas mulheres, será mais difícil estabelecer uma normalização. No

primeiro caso, a voz feminina será indiscutivelmente mais elevada; no segundo caso, nem

sempre será possível estabelecer a voz de um dos falantes como sendo a mais elevada. Ladd

(1996:260) propõe a caracterização de um nível geral da F0 e a caracterização das diferenças no

que ele denomina span (a extensão das freqüências utilizadas). Freqüentemente, o nível geral e o

span não são claramente distinguíveis, por covariarem: quanto mais elevado o nível geral, mais

amplo o span. Como Ladd menciona, a comparação entre uma voz masculina que apresente uma

variação de 80Hz (de 80Hz a 160 Hz, por exemplo) e uma feminina com variação de 160 Hz (de

160Hz a 320 Hz) permitirá dizer que a feminina apresenta uma variação duas vezes maior que a

masculina, mas com a mesma largura de uma oitava ou 12 semitons, se essa variação for

expressa logaritmicamente (160/80 = 320/160 = 2).

Haveria, a partir da idéia da “unidade da fonologia de pitch”, a expectativa de existirem

consistências similares no escalonamento de alvos da F0 entre falantes que produzissem uma

mesma elocução nas línguas européias. Ladd (1996:262) considera o exemplo “I‟ve been there

before” (eu já estive lá antes) entoado como uma frase declarativa neutra. São identificados

quatro alvos, um L inicial, um H* acentuado sobre “been”, seguido de um L e, finalmente, um

tom de fronteira L%. A normalização dos dados hipotéticos desses quatro alvos, pronunciados

por três falantes, sendo um deles um homem, com H* representando 100 por cento e L%

representando 0 por cento, indica que, para todos os três falantes, os quatro pontos-alvo

mostram-se os mesmos (para maiores detalhes, cf. Ladd, 1996:262).

Vários estudos têm buscado a identificação de contornos entonacionais. Embora não seja

implausível a existência de contornos mais sutis, envolvendo uma variação tonal mais fina, um

ponto que já parece ser consensual é a existência de duas configurações básicas, uma com

caracterização descendente da F0, outra com caracterização não-descendente. Marandin (2004)

identificou, para o francês, esse primeiro nível de contraste como pertencente à esfera da

controvérsia em oposição à não-controvérsia, considerando-se o conteúdo da elocução. O uso de

uma modulação descendente da F0 indicaria, da parte do locutor, uma postura não-controversa,

não ocorrendo, portanto, uma revisão do comprometimento que é expresso com a elocução. Em

outras palavras, o locutor não viria a opor qualquer argumentação ao que sua elocução sugere. Já

um contorno não-descendente anteciparia uma possível falta de concordância entre o locutor e

seu interlocutor quanto ao conteúdo proposicional da elocução. Assim, atos discursivos

prototípicos (asserções, questões e comandos, que são expressos por sentenças, respectivamente,

declarativas, interrogativas e imperativas) são verbalizados com um contorno descendente.

Gussenhoven (2002a:7), sumarizando uma sua proposta de 1984, identifica três contornos

entonativos básicos, sendo que o primeiro deles equivale ao que Marandin (2004) veio a

identificar como o contorno indicativo de uma postura não-controversa. Caracterizado como

sendo do tipo H*L, Gussenhoven sugere que esse primeiro contorno qualifica os constituintes

lingüísticos para uma adição ao modelo discursivo. Assim, o falante estaria se comprometendo

com a inclusão da informação no modelo, ou, nos termos utilizados por Marandin, não

anteciparia possíveis questionamentos em relação ao conteúdo proposicional enunciado. O

segundo contorno seria do tipo H*L H%, responsável por caracterizar os constituintes

lingüísticos para uma seleção a partir do modelo discursivo. Dessa forma, o falante se

comportaria como se o modelo discursivo já contivesse essa enunciação. Finalmente, o terceiro

contorno, do tipo L*H, caracterizaria a informação como potencialmente pertencente ao modelo

discursivo e o ouvinte, com isso, estaria sendo convidado a resolver a questão. Gussenhoven

rotulou esse modelo como sendo de Teste. Na classificação de Marandin, trata-se do contorno

que sugere uma controvérsia. Ladd (1980:150) menciona que Liberman e Sag (1974) haviam

descrito esse contorno como sendo o contorno da contradição. A idéia de contradição talvez

fosse mais bem expressa como sendo um questionamento em relação às suposições do ouvinte.

Em ambas as acepções, o contorno não poderia ser aplicado a uma oração encaixada, ou seja,

subordinada a uma outra. O exemplo apresentado é de Liberman e Sag (é mantida, aqui, a

mesma notação que foi utilizada originalmente para caracterizar o contorno):

(15) * Medical science has demonstrated that ¡elephantiasis isn‟t incurable!

(A ciência médica demonstrou que a elefantíase não é incurável!)

O problema verificado no exemplo está relacionado ao fato de a entonação sugerir que o

ponto de vista sobre a elefantíase não ser incurável é originário do locutor. No entanto, a oração

principal (que também seria pronunciada pelo locutor) indica que esse parecer foi emitido pela

ciência médica. O que se verifica, portanto, é uma incompatibilidade entre o contorno entonativo

impresso à oração subordinada e o conteúdo proposicional da oração principal. No entanto, caso

o contorno seja disseminado sobre toda a enunciação, as sentenças passam a ser aceitáveis:

(16) ¡Medical science has demonstrated that elephantiasis isn‟t incurable!

(A ciência médica demonstrou que a elefantíase não é incurável!)

Percebe-se, então, a existência de um princípio segundo o qual o ponto de vista sugerido por uma

enunciação, considerando-se o conteúdo proposicional, deve ser relativamente consistente.

Assumindo-se o ponto de vista do contorno entonacional, essa consistência deve se colocar

também no nível interno à enunciação. Como Ladd (1980:159) lembra, os pontos de vista não

precisam necessariamente ser os mesmos, mas precisam ser compatíveis.

1.3 A RELAÇÃO ORAÇÃO PRINCIPAL – ORAÇÃO SUBORDINADA

O processamento de uma enunciação, considerando-se o que foi discutido até o

momento, está relacionado à sua conformação sintática, mas não pode ficar restrito a ela. Muitas

vezes, a prosódia será tomada como única pista disponível para a atribuição de um sentido exato

a uma enunciação, como ocorre nos casos, já mencionados, em que se faz necessária a

desambigüização de uma sentença. Considerando essa função gramatical da entonação, portanto,

percebe-se que a substituição de uma entonação por outra pode acabar por produzir uma

mudança no sentido ou na função gramatical. É freqüente que uma determinada entonação

acompanhe uma estrutura gramatical no discurso real. Nas palavras de Crystal (1969) (citado por

Couper-Kuhlen, 1985:114), as considerações gramaticais também devem ser levadas em

consideração no estudo da entonação, uma vez que se percebe uma correlação regular entre uma

estrutura gramatical e um padrão entonacional. Couper-Kuhlen, comentando essa correlação

sugerida por Crystal, questiona até que ponto essa correlação deve ser tomada como um critério

adicional ou alternativo para a função entonativa. O ponto a ser considerado diz respeito ao fato

de que, muitas vezes, um padrão entonacional específico é distintivo com respeito a um certo

tipo de significado, considerando-se a noção de pares mínimos, mas, no discurso real, nem

sempre esse padrão co-ocorreria com o membro apropriado do par. Nesse caso, seria mais difícil

considerar a noção de uma função entonativa.

No entanto, a prosódia parece oferecer uma contribuição um pouco mais específica ao

processamento de uma enunciação. Grosjean (1983:503) afirma que a informação prosódica

pode ser utilizada como fonte de informação para o processamento do sinal até o ponto em que a

elocução foi produzida pelo locutor, mas também para prever o que deverá vir após esse ponto.

Para ilustrar a segunda afirmação, propósito central de seu artigo, o autor menciona que, muitas

vezes, determinados trechos de uma entrevista radiodifundida dão a impressão de que o

entrevistado não concluiu sua elocução. Isso se deve ao fato de que, no momento da edição do

sinal sonoro, as fronteiras semânticas e sintáticas teriam sido respeitadas, mas não as fronteiras

prosódicas. Essa impressão de que o entrevistado teria, originalmente, dito muito mais do que foi

apresentado ao público é sugerida pelo comportamento prosódico, que apresenta uma

informação sobre o tamanho da elocução.

Os experimentos de Grosjean confirmaram que a prosódia é capaz de informar, em um

determinado ponto da sentença, o tamanho do restante da enunciação. O interesse desse

fenômeno está, entre outros, na possibilidade de o ouvinte não apenas prever esse tamanho do

restante da enunciação, mas também contar com uma ajuda no sentido de delinear o fim da

sentença e, a partir disso, prever o início da seguinte. Isso se colocaria como um facilitador do

parsing, permitindo que, com a previsão da conclusão da sentença, o interlocutor prepare sua

resposta para uma possível intervenção na situação comunicativa.

Os resultados dos experimentos permitiram quatro conclusões. Inicialmente, confirmou-

se a capacidade extremamente precisa dos participantes na estimação do tamanho do restante da

sentença, caso ela seja interrompida antes de seu término. Essa capacidade diz respeito não

apenas ao reconhecimento de uma sentença como tendo sido interrompida, mas também à

previsão, por exemplo, de a continuação ser feita com três ou com seis palavras. Em segundo

lugar, constatou-se que os participantes não conseguiram diferenciar sentenças que terminariam

com nove palavras das que terminariam com seis palavras. Grosjean sugere que isso se deva ao

fato de os valores prosódicos dessas sentenças que seriam complementadas com nove palavras

situarem-se entre os valores das sentenças que seriam terminadas com três palavras e os valores

das que seriam terminadas com seis palavras. A terceira conclusão é a de que os participantes

não conseguiram distinguir entre os vários tipos de sentenças (final com nenhuma palavra; com

três palavras; com seis palavras; e com nove palavras) no início da potencialmente última

palavra da sentença. Isso significa dizer que as pistas prosódicas que permitem a previsão do

tamanho do restante da sentença encontraram-se ao longo dessas potenciais últimas palavras,

talvez, especificamente, sobre a sílaba tônica. Finalmente, constatou-se que existe um gradiente,

talvez prosódico, ao longo dessas últimas palavras, com o aumento da capacidade dos

participantes em prever o tamanho da continuação da sentença ao longo da progressão prosódica

dessas últimas palavras.

A importância da predição prosódica para o ouvinte pode ser caracterizada, segundo

Grosjean (1983:503), de três formas distintas. Inicialmente, com a predição, ocorreria uma

redução no leque de possibilidades interpretativas. Com isso, o ouvinte teria como direcionar o

foco de sua atenção para um ponto específico, o que tornaria o processamento cognit ivo mais

eficiente, podendo, até mesmo, ser acelerado, quer durante a percepção do discurso, quer durante

o reconhecimento das palavras, quer, ainda, durante o parsing sintático. Em segundo lugar, a

predição estaria ajudando na demarcação do domínio de processamento. O estabelecimento de

uma fronteira de palavra, de frase ou de sentença deixaria o ouvinte pronto para o processamento

seguinte, fosse ele de uma palavra, de uma frase ou de uma sentença. Finalmente, uma vez que

estaria ocorrendo uma economia no processamento cognitivo do ouvinte, haveria mais tempo

disponível para outras atividades necessárias à compreensão global do discurso, tais como a

integração das informações e a preparação, por exemplo, de uma resposta.

De uma forma um pouco menos específica, no sentido de não ter havido o interesse de

prever o tamanho do restante da sentença, Pierrehumbert e Hirschberg (1990:278), reportando

Liberman e Pierrehumbert (1984), indicam que se constatou que a variação de pitch em frases

declarativas é rebaixada e comprimida, como forma de antecipação do final da elocução.

Também Swerts et al. (1994), ao buscarem as pistas melódicas indicativas do final de uma

elocução, reportam que Cutler e Pearson (1986) identificaram o uso de contornos com downstep

como sendo boas pistas dadas pelo falante para sinalizar que deseja passar o turno da fala para

seu interlocutor, enquanto os contornos com upstep indicariam a intenção do falante de

permanecer com o turno de fala. Reportam também que Wichmann (1991) constatou, para o

inglês britânico, que se o último acento de um contorno é menor quanto à abrangência de sua

variação do que o precedente, a impressão é a de que o contorno parece mais final (“final”, aqui,

no sentido de finalização da enunciação). A hipótese que Swerts et al. assumem para os

experimentos que reportam é a de que, também no holandês, contornos entonacionais que

apresentem a convergência das linhas superior e inferior delimitadoras da declinação da F0 são

percebidos como “mais finais” do que outros contornos que apresentem as linhas de declinação

divergentes. Os resultados que obtiveram indicaram que esse valor final está mais associado a

quedas iniciais da F0 do que a quedas finais.

A combinação desses resultados se presta, de certa forma, à sustentação do procedimento

da teoria métrico-autossegmental em considerar que os contornos entonacionais são seqüências

de eventos fonológicos sucessivos. Como Ladd (1996:147) indica, não haveria necessidade de

considerar a relação entre parâmetros lexicais e entonacionais da F0 em termos de um modelo de

sobreposição, em que os parâmetros lexicais estariam superimpostos às tendências

entonacionais. Os aspectos da F0 seriam, em si mesmos, eventos localizados na seqüência de

tons, da mesma forma que os aspectos lexicais10

Uma vez que, durante o processamento cognitivo, o ouvinte faz uso das pistas prosódicas

para prever a continuação da sentença, é de esperar que essa função preditiva deva se concentrar

ao final de determinadas estruturas sintáticas. Uma vez que as orações principais, no processo de

subordinação, apresentam uma estruturação que, necessariamente, deve ser complementada por

uma outra oração, elas parecem se colocar como boas candidatas a concentrar a função preditiva.

Green (1976, citada por Ladd 1980:149) cunhou o termo “fenômeno da oração principal”

(no inglês, main clause phenomena). A partir de então, uma certa atenção passou a ser

direcionada para essas estruturas, considerando que existem certas transformações sintáticas,

itens lexicais e alguns outros fenômenos gramaticais cuja ocorrência se mostra amplamente

restrita às orações principais. Segundo Green, a concordância do falante com o que está sendo

afirmado na oração principal se relacionaria com o fenômeno da oração principal nas orações

subordinadas. Em outros termos, o falante deveria concordar com o que está sendo enunciado na

oração principal. Isso sugeriria uma teoria relativa à formulação de asserções. A conclusão a que

a autora chega é a de que esse fenômeno afeta, de alguma forma, o que está sendo afirmado,

sugerindo que o que há de comum em todos os ambientes idiossincráticos em que ele é aceitável

nas orações subordinadas é o fato de esses ambientes não contradizerem a asserção principal da

sentença, o que, de alguma forma, é assinalado pelo fenômeno da oração principal (Ladd,

1980:152). Esse fenômeno, no entanto, não caracteriza especificamente os aspectos entonativos,

sendo determinado por fatores pragmáticos, semânticos e sintáticos (Green, 1976:392). No

entender de Ladd (1980:154), a função do fenômeno da oração principal estaria mais relacionada

à forma como a asserção é feita do que a uma parte da asserção propriamente dita. Ao pronunciar

uma sentença utilizando-se desse fenômeno, o falante estaria transmitindo a informação e, ao

mesmo tempo, direcionando-a de uma maneira específica, por exemplo, de uma forma

dramática. Esse fenômeno seria semelhante à entonação no sentido de que ambos contribuem

mais intensamente para a parte não-proposicional da mensagem, ou seja, a forma como ela é

Também a escolha do acento frasal pode influenciar a interpretação das relações entre

orações contíguas. Pierrehumbert e Hirschberg (1990:304) observaram que a conjunção e, por

10 Isso se aplicaria a línguas tanto entonacionais quanto tonais. No caso do chinês, existe uma maior quantidade de

eventos na F0 pela simples razão de os tons lexicais ocorrerem em aproximadamente todas as sílabas, com as

transições na ordem de apenas alguns milissegundos. No inglês, por exemplo, os acentos de pitch ocorrem

principalmente nas palavras proeminentes, com as transições podendo ocupar várias sílabas.

exemplo, é assimétrica, podendo por vezes sugerir temporalidade ou causalidade entre as orações

que une. A proposta seria a de que a escolha do acento frasal poderia influenciar se uma dada

interpretação é sugerida ou não. A exemplificação é feita como abaixo11

, com duas

possibilidades de tom unindo as duas orações:

(17) a George ate chicken soup and got sick

H* H* H* H H* H* L L%

(George comeu a sopa de galinha e passou mal)

b George ate chicken soup and got sick

H* H* H* L H* H* L L%

No primeiro caso, o tom H favorece a interpretação de que a sopa de galinha é que teria

ocasionado o mal estar de George. Embora no segundo caso essa relação causal seja mantida,

não há um reforço entonacional. Trata-se, portanto, de uma situação em que as relações

estabelecidas entre as duas orações são percebidas, em primeiro lugar, pelo próprio conteúdo

proposicional, considerando-se, naturalmente, a seqüência cronológica em que os eventos se

sucedem (colocar a segunda oração em primeiro lugar, seguida pelo conectivo, implicaria que a

sopa de galinha seria entendida como uma possível cura para o mal estar de George). A prosódia,

nesse caso específico, serviu como um reforço para a percepção da relação existente entre as

orações.

O posicionamento do contorno de continuação (L H%), no exemplo a seguir, no entanto,

estabelecerá relações completamente diferentes entre as enunciações apresentadas (305),

evidenciando uma situação em que o papel prosódico deixa de ser secundário:

(18) a My new car manual is almost unreadable

(O manual do meu carro novo é quase ilegível)

b It‟s quite annoying

(É quase ofensivo)

c I spent two hours figuring out how to use the jack

(Gastei duas horas tentando entender como se usa o macaco)

11 No caso desses exemplos, trata-se de uma coordenação no nível sintático, mas de uma subordinação no semântico.

Por conta do contorno de continuação, a elocução (b) deve ser analisada em relação à frase

seguinte. Dessa forma, (c) se coloca como o que o locutor considera como sendo praticamente

ofensivo: no caso, o fato de ter gasto tanto tempo para entender o mecanismo de funcionamento

do macaco do carro. Uma outra relação, no entanto, deve ser estabelecida com o posicionamento

desse contorno continuativo ao final da elocução (a):

(19) a My new car manual is almost unreadable

b It‟s quite annoying

c I spent two hours figuring out how to use the jack

A elocução (b) passa a ter relação direta com a elocução (a), e o novo entendimento é o de que o

manual do carro é quase ofensivo. O estabelecimento das relações entre as elocuções, portanto,

só foi possível por conta do contorno prosódico aplicado a elas.

1.4 A PRÉ-INDICAÇÃO

A partir do momento em que se postula que os elementos da entonação apresentam

significado (Ladd, 1996), pressupõe-se que seja possível, e mesmo esperado, que o usuário da

língua faça uso desses elementos na construção do seu discurso. Pierrehumbert e Hirschberg

(1990:271) propõem que um locutor faz a escolha de uma dada entonação em sua interação com

o ouvinte. Essa entonação refletirá como a sentença se relaciona, de forma específica, com as

crenças do ouvinte, assim como oferecerá uma antecipação da contribuição das elocuções

subseqüentes na formulação do discurso. Essas relações, segundo as autoras, assumem uma

natureza composicional, composta pelos acentos melódicos, pelos acentos frasais e pelos tons de

fronteira que produzem as entonações.

Posto desta forma, a impressão é a de que, durante toda a construção do discurso, o

falante faz uso – conscientemente – de todos os contornos melódicos disponíveis para

representar, de forma precisa, seu pensamento. Grande parte da produção discursiva se dá de

forma automatizada, o que permite a ocorrência de lapsos freqüentes durante o ato comunicativo.

No entanto, o discurso também pode ser produzido a partir de um certo planejamento – o que

não implica um nível de consciência plena sobre os processos envolvidos nessa produção.

Snedeker et al. (2000:8) constataram, em seus experimentos, que o uso de pistas prosódicas

informativas dependem da consciência do falante em relação à situação discursiva, sugerindo

que essas pistas serão utilizadas se necessário.

A proposta dos autores é a de que esse uso se dá na condição de que os falantes tenham

conhecimento do contexto referencial em que estejam inseridos. Especificamente, utilizar pistas

prosódicas para evidenciar, por exemplo, uma das interpretações possíveis em uma enunciação

ambígua dependerá da existência ou não de outras pistas contextuais fornecidas pela situação

referencial. Esse contexto referencial, portanto, seria crítico na determinação dos falantes em

produzir pistas prosódicas mais fortes: a não-existência de pistas referenciais evidenciadoras de

uma das interpretações induziria os falantes ao uso das marcas prosódicas desambigüizadoras, o

que confirma, por exemplo, uma das máximas de Grice (1975), a da clareza, segundo a qual a

eficiência da interação comunicativa não permite dúvidas quanto ao conteúdo proposicional

enunciado. Por outro lado, os testes realizados evidenciaram que os ouvintes também fizeram

uso dessas pistas prosódicas (ainda que imperfeitamente), estando elas presentes.

Os padrões entonativos poderiam, também, sofrer uma segmentação, de forma que um

enunciado iniciado por um locutor viesse a ser complementado pelo ouvinte (que passa a

assumir, no seu turno, a função de locutor). Fox (1984) adota a idéia segundo a qual esses

padrões entonativos seriam vistos como grupos tonais independentes, que poderiam ser

considerados como a primeira parte de uma estrutura a ser completada pela elocução seguinte. É

o caso dos padrões entonativos utilizados nas questões totais, que apresentam, comumente, uma

modulação ascendente. Normalmente se associa a melodia ascendente a um contorno

continuativo. A finalização desse contorno, no caso de uma questão total, se daria com a resposta

do interlocutor. Essa análise indica, portanto, um padrão entonacional que se divide em dois

segmentos. Como alternativa de análise, Fox sugere que se poderia analisar o contorno

continuativo das questões totais sem recorrer a um interlocutor. Bastaria interpretar essas

questões como sendo a primeira parte de uma questão alternativa truncada, que seria

hipoteticamente completada por “ou não”. Assim, o contorno ascendente se projetaria sobre a

primeira parte da questão, e a segunda se responsabilizaria pelo contorno final. Essa abordagem

explicaria, por exemplo, por que as questões parciais não apresentam contorno continuativo: elas

não poderiam ser complementadas por “ou não”.

A análise do contorno entonacional das questões totais como sendo a parte inicial de um

contorno maior deixa perceber, de certa forma, a expectativa de que esse contorno será

complementado. Essa complementação, nesse caso específico, poderia se dar de apenas duas

formas, com uma resposta afirmativa ou uma resposta negativa. Parece bastante razoável,

portanto, sugerir que esse contorno continuativo das questões totais seja pré-indicativo de uma

resposta “sim/não”. Naturalmente, isso não se deve colocar de forma absoluta, principalmente

por conta da existência de inúmeras variações, considerando-se, inclusive, variações

idiossincráticas da modulação.

Ladd (1996:252) enfatiza a idéia de a modulação ser um parâmetro fonético anômalo.

Muitos pontos de referência, quando se lida com sons do discurso segmental, são válidos para

todos os falantes, já tendo sido devidamente estabelecidos enquadramentos taxonômicos tanto

para os aspectos articulatórios quanto para os aspectos acústicos dos sons segmentais. A variação

entre falantes, nesses casos, não anularia a validade das descrições fonéticas. Muito

provavelmente, também não anula a capacidade de predição prosódica. No entanto, não se

estabeleceu ainda uma referência exata, nesses mesmos termos, para uma descrição melódica. A

melodia varia intensamente de falante para falante, considerando-se ainda a situação discursiva

de uso das entonações, e mesmo entre uma parte da elocução e outra. Como já discutido na seção

1.2, Ladd sugere que seria necessário, ao invés de postular uma caracterização absoluta, procurar

estabelecer caracterizações que se coloquem de forma explicitamente relativa, por via da

normalização ou da inicialização.

Considerando as propostas de Ladd, e antes de pensar a possibilidade de extensão desse

conceito de predição por via prosódica a outros campos sintáticos, não se deve perder de vista,

todavia, a noção de que toda predição é raramente perfeita. Como lembra Grosjean (1983:503), a

predição, por definição, é probabilística, e o ouvinte deve levar isso em consideração caso venha

a estabelecer uma predição. Grosjean considera ainda dois outros pontos. Um deles diz respeito

ao fato de a predição não precisar ocorrer durante o processamento on-line: não seria difícil

imaginar um sistema de processamento que utilizasse apenas informações passadas e presentes,

sem tomá-las em consideração para observar o que viria a seguir. O outro ponto se relaciona ao

fato de que ainda não haveria evidência suficiente para o uso da predição no processamento.

Portanto, o fenômeno da predição prosódica deve ser sempre visto (pelo menos até que se

constate o contrário) de forma não-absoluta.

Couper-Kuhlen (1985:115), nessa mesma linha de pensamento, observa que o termo

“função entonacional” sugere que todas as categorias e parâmetros do sistema entonacional se

mostrariam distintos uns dos outros no que concerne um certo tipo de significado, mas que

raramente isso acontece. Da mesma forma, é preciso relativizar o significado de frases como

“função gramatical da entonação” ou “função atitudinal da entonação”, uma vez que elas

sugerem, em princípio, que as distinções entonativas seriam responsáveis por absolutamente

todos os constrastes de significado em um dado domínio, o que, mais uma vez, raramente ocorre.

Observando-se a realização das atitudes, o que se percebe é que algumas vezes uma atitude se

manifesta por via entonativa, enquanto outra se manifesta pela escolha lexical, assim como uma

dada construção gramatical pode estar relacionada a um correlato entonacional, enquanto outra,

Embora se deva pensar o fenômeno prosódico em termos relativos, Ladd (1996:13),

citando Lieberman e Michaels (1962:248), critica o fato de que a maior parte das tentativas de

estabelecimento de sistemas de análise lingüística analisa a modulação da freqüência

fundamental apenas em suas variações mais amplas, desprivilegiando, portanto, a sua estrutura

fina, além de desprezar, igualmente, o papel da amplitude e das variações fonéticas. Como

sugere Jacqueline Vaissière (comunicação pessoal), uma tentativa de caracterização de um

sistema prosódico deve considerar a modulação da freqüência fundamental em todas as suas

nuances, a duração e a intensidade, mas também as pausas, a qualidade da voz, e a articulação

(timbre)12

, para que se consiga, de fato, cobrir uma ampla gama de fatores relacionados ao

fenômeno prosódico.

A prosódia, tomada como elemento caracterizador das emoções e/ou atitudes, parece se

localizar na esfera do paralingüístico. Como discutido anteriormente, os possíveis padrões

entonacionais que se estabeleçam para uma língua apresentarão os tons dispostos em

determinadas posições e seqüências fixas, que serão entendidas como a marca identitária desses

contornos. As variações na escala do pitch são entendidas como expressões idiossincráticas,

revelando, por exemplo, os estados emotivos do falante no momento da elocução.

Quando se pensa o fenômeno da pré-indicação prosódica, também entendido como a

predição, parece ser necessário diferenciar o que ocorre na esfera das emoções/atitudes daquilo

que ocorre nas situações em que um determinado comportamento prosódico de um trecho de

uma enunciação sugere um outro trecho subseqüente. Uma vez que a modulação prosódica

utilizada em uma sentença se responsabiliza por sugerir que o falante está, por exemplo, triste ou

raivoso, talvez não seja apropriado dizer que a prosódia, neste caso um componente

paralingüístico, pré-indique algo que virá a seguir: a enunciação, entoada daquela forma, já

12 Di Cristo (2004:82) prefere qualificar o timbre como paraprosódico.

apresenta, em si mesma, a caracterização psicológica momentânea de seu enunciador. O

elemento prosódico, nesse caso, não seria preditivo de uma emoção/atitude, pois a

emoção/atitude já estaria totalmente manifestada na enunciação. O fenômeno da pré-indicação

ocorreria nos casos específicos em que, considerada uma enunciação (sintática ou

semanticamente) incompleta, o contorno entonativo que lhe fosse aplicado permitisse ao ouvinte

estabelecer previsões sobre como o falante daria prosseguimento à enunciação. A hipótese, nesse

caso, é a de que a entonação, a partir do estabelecimento de contornos prosódicos específicos

para cada modalidade pré-indicativa, poderia ser analisada dentro da esfera do lingüístico (em

oposição ao paralingüístico), assumindo uma configuração fonológica. Pierrehumbert e

Hirschberg (1990:271), por exemplo, ao mencionarem o uso de um contorno entonacional para

caracterizar uma interpretação discursiva, propõem que um falante escolhe uma entonação

específica para sugerir uma relação particular entre uma elocução, as crenças correntemente

percebidas de um ouvinte ou ouvintes, e as contribuições antecipadas das elocuções

subseqüentes.

Nessa linha de pensamento, a entonação não seria estudada em si mesma, mas como

elemento revelador de todo um processo procursivo, segundo os termos de Barbizet (1979:239).

Um dos grandes problemas estaria em sempre se entender a entonação como um simples

acompanhante do enunciado. A partir do momento em que se passe a observar a entonação de

forma mais incisiva, a constatação será a de que existe uma relação de entrelaçamento intenso

entre ela e outros componentes do discurso, algumas vezes de forma dependente, outras de forma

autônoma. A entonação estaria na posição de caracterizar a intencionalidade discursiva. Como

Barbizet (1979:240) e Vaissière (2004) sugerem, a relação entre as possíveis funções entonativas

e a sintaxe, de um lado, e o sentido, de outro, sofrerá modificações consideráveis quando esses

fenômenos forem observados na língua real.

Se no francês, por exemplo, se considerar a construção “ce n‟est pas comme cela” (não é

assim), a conjunção “que” (que) será o único elemento que poderá ocorrer logo a seguir, no eixo

sintagmático. A única variação que pode se verificar nessa conjunção será decorrência de fatores

fonológicos, por conta do elemento seguinte. No processo de produção discursiva, o enunciador

utiliza a conjunção antes mesmo de se preocupar em conhecer os elementos que serão utilizados

para preencher o quadro sintático que teria acabado de esboçar. Esse procedimento só se mostra

possível, segundo Barbizet (1979:243), porque existe uma curva melódica concebida como

autônoma que é aplicada sobre “ce n‟est pas comme cela”.

Fónagy (1974) é um dos principais precursores nos estudos da pré-indicação prosódica. O

termo “pré-indicação” foi, ao que parece, cunhado por ele, em seu artigo intitulado “La fonction

préindicative en français et en hongrois”. Suas observações se baseiam no fato de que a

entonação apresenta um papel bastante significativo na segmentação discursiva. Segundo ele

(44), os macro-movimentos da F0 se refletiriam na consciência humana como um movimento

espacial. Por outro lado, a entonação progressiva conteria ainda outras mensagens, indicando,

por exemplo, o comprimento do restante da frase, ou sua qualidade, isto é, se se poderia esperar

uma oração coordenada, uma subordinada, uma frase intercalada, uma enumeração, entre outras.

Para que se possam caracterizar esses comportamentos da curva melódica, seria preciso, em

primeiro lugar, estabelecer uma distinção entre as diferentes projeções perceptivas para seus

movimentos. Assim, a curva da freqüência fundamental apresentaria uma micro-estrutura,

responsável por determinar a musicalidade da voz; e uma macro-estrutura, que determinaria a

percepção das mudanças de altura, ou seja, as mudanças de freqüência dentro de uma sílaba e de

uma sílaba a outra. Embora essas diferenças sejam bastante sutis, o ouvido humano apresenta

uma grande capacidade de detectar informações, por exemplo, sobre as fronteiras entre sílabas de

um contínuo a partir de diferenças finas da F0 ou da duração (Vaissière, 1997).

Os resultados dos testes efetuados por Fónagy, na tentativa de caracterizar o fenômeno

pré-indicativo, mostraram-se negativos para a predição da frase longa. No entanto, quando se

tratava da predição de frases intercaladas, os resultados mostraram-se positivos. A melodia seria

a responsável por esse tipo de pré-indicação. Como já discutido, Grosjean (1983), embora

assumindo um paradigma distinto do adotado por Fónagy, confirmou a existência de um certo

limite quanto ao tamanho da continuação predita para uma certa frase a partir da entonação que

lhe fosse imposta. Como já comentado, não haveria diferença, quanto à capacidade preditiva,

entre uma frase com seis palavras e outra com nove, o que sugere que o limite de uma predição

distintiva estaria localizado nessa quantidade máxima de seis palavras, possivelmente em

sintonia com a capacidade de armazenagem da memória de curto-termo.

Ao analisar os resultados referentes à pré-indicação do fim de uma enumeração ou do fim

próximo de uma frase, Fónagy (1974:55) constatou uma variação bastante acentuada da

distribuição das respostas fornecidas pelos participantes segundo as diferentes realizações

prosódicas das estruturas sintáticas. Esses resultados deixariam bastante evidente a grande

variação, por vezes inconstância, dos esquemas prosódicos responsáveis por esses dois tipos de

pré-indicação. Seria possível que essa variabilidade tão intensa fosse decorrência, em primeiro

lugar, da não-identificação de um contorno prosódico específico para esses casos ou, ainda, da

própria variação idiossincrática que pode ser impressa aos múltiplos contornos, o que produziria

julgamentos diferentes dos participantes dos testes. Para Fónagy, essa variabilidade observada

em seus experimentos sugeriria a necessidade de distinguir quais seriam as realizações que

poderiam ser caracterizadas como pré-indicativas das que não seriam consideradas dessa forma.

Para o caso da entonação pré-terminal, uma mudança no esquema melódico da enumeração,

como a subida ou a ligeira depressão do patamar melódico, é que seria responsável por indicar

que o último termo enumerado teria sido atingido.

A distinção entre o valor pré-indicativo da mudança melódica e da mudança de débito

verbal sofreu, no caso, uma limitação por conta do tamanho do corpus analisado. A constatação

foi a de que o débito verbal apresentou uma aceleração considerável durante o penúltimo

membro da enumeração. A pré-indicação de uma enumeração parece ser favorecida pela

configuração que o primeiro membro da enumeração apresenta. Assim, para que uma

enumeração seja predita como longa, esse primeiro membro deveria apresentar uma acentuação

vigorosa, com o patamar da F0 bem elevado e linearizado, o que o colocaria em especial relevo.

Associado a isso, o início da frase do predicado que antecede a enumeração deveria se colocar

em anacruse, ou seja, suas sílabas iniciais deveriam se mostrar prosodicamente menos realçadas

que as últimas. Com isso, a sentença completa contendo uma enumeração longa se iniciaria em

um tom mais baixo; o ponto anterior ao início da enumeração apresentaria um tom alto; o início

da enumeração manteria esse tom alto, com a configuração prosódica, como mencionado,

contribuindo para o seu realce; gradativamente, haveria um rebaixamento de tom até o final da

enumeração, seguindo a própria curva natural da declinação. Ainda não se deveria desconsiderar

a possibilidade de uma pausa ultra-breve ou de uma quasi-pausa precedendo a enumeração.

Ao buscar a caracterização para um possível contorno prosódico pré-indicativo de uma

continuidade adversativa para um enunciado, Fónagy percebeu uma certa constância na subida

da F0 ao final da frase antecedendo a adversidade. No entanto, os resultados dos experimentos

evidenciaram que a ausência dessa subida não bastava, em si mesma, para prever uma

proposição não-adversativa. Os experimentos, portanto, não apresentaram resultados

conclusivos. Foi possível perceber apenas indicações para a caracterização do fenômeno da pré-

indicação. Isso levou Fónagy (1974:58) a assumir que a pré-indicação não constituiria – ainda –

um procedimento sintático.

Ao se pensar a possibilidade de um modelo de produção do discurso, a capacidade do

sistema de prever a extensão da linha de declinação deve ser levada em conta. Nos experimentos

de Fónagy, a possível pré-indicação do tamanho de uma enumeração se relaciona diretamente à

previsão do índice de declinação aplicado à curva da freqüência fundamental13

. É possível

perceber uma certa relação entre o fenômeno da predição prosódica, nos termos estabelecidos

por Fónagy, como discutido acima, e o que Ladd (1996:29) caracterizou como o planejamento

antecipado ou lookahead (“olhar à frente”). Uma das dificuldades em estabelecer descrições

quantitativas das tendências da F0 estaria no fato de essas tendências serem geralmente

dependentes do tamanho do domínio ao qual se aplicam. Inúmeros estudos já evidenciaram que

quanto maior é o domínio sobre o qual a declinação pode ser observada, menos íngrime é a

declinação da F0. Isso é decorrência natural do fenômeno da declinação, responsável por fazer a

F0 cair de forma constante ao longo de um domínio, independentemente de qual seja o seu

tamanho. A implicação direta desse fato é a necessidade de conhecimento antecipado, da parte

do modelo de produção do discurso, da extensão desse domínio, a fim de estabelecer o grau

exato de declinação em que a F0 deve ser iniciada. Ladd acredita que esse grau de planejamento

antecipado deva ser psicolingüisticamente inviável.

Uma possibilidade bastante interessante de análise do fenômeno antecipatório diz

respeito, em algumas línguas tonais, à elevação dos tons altos, no início de uma determinada

seqüência tonal, com o intuito de permitir uma seqüenciação progressiva de downsteps14

Rialland (2001:301) reporta que o downstep não seria apenas progressivo em seu efeito

(provavelmente por conta do efeito do próprio fenômeno da declinação), como também

envolveria a elevação dos tons precedentes. O artigo de Rialland será tomado, aqui, como

referência principal para esta discussão.

A proposta da autora é a de que existiriam três estratégias na implementação do

downstep: uma estratégia de “cancelamento”; uma estratégia de “aumento na extensão do pitch”;

e uma estratégia de “resetting” (realocação), responsável por diminuir o número de downsteps

dentro de uma dada unidade.

Laniran (1992, reportado por Rialland, 2001:302) observou que, no discurso do

informante do iorubá, uma língua da família Niger-Congo falada na Nigéria, as elocuções

formadas em sua totalidade por tons H não apresentaram declinação. Percebeu-se também que a

13 Para uma discussão mais detalhada sobre a linha de declinação, ver, mais à frente, a sessão referente aos padrões entonativos. 14 Pierrehumbert e Hirschberg (1990:280) indicam que o upstep eleva o tom de fronteira após um tom H indicativo

de um acento frasal. Assim, a seqüência H H% se manifestaria como um platô elevado, seguido de uma elevação

adicional no final. A seqüência H L% se manifestaria também como um platô elevado, mas sem nenhuma queda no

fim. Já o downstep, ou catátese, abaixa e comprime a latitude do pitch após algum dos dois acentos tonais. Como a

regra se aplica interativamente, ocorre uma sucessão de acentos, criando uma escada descendente na curva

melódica. As autoras lembram ainda que o downstep ocorre numa posição nuclear, resultando num tipo de tom

“médio”, mais baixo que o tom H precedente, mas bem acima do nível mais baixo da latitude do falante.

Gussenhoven (2002b:13) lembra que o downstep é uma forma gramaticalizada da declinação.

realização dos tons H, nessa condição, mantinham a mesma configuração, independentemente da

extensão da elocução. Um exemplo de contorno da F0 produzido em elocução contendo apenas

tons H pode ser visto na figura 1.2, abaixo:

Figuras 1.2 e 1.3 – Contorno da F0 de elocuções contendo apenas tons H e tons H e L no iorubá

(conseqüentemente, com downstep) (Laniran, 1992, citado por Rialland, 2001:302).

A observação da figura 1.3 evidencia que, numa seqüência em que se verifica o

downstep, o primeiro tom H é realizado mais alto do que os tons altos na elocução contendo

apenas tons H. A explicação para essa elevação estaria no fato de que os falantes, com o intuito

de promover uma maior extensão para a realização dos downsteps necessários, aumentam a

abrangência do pitch. No entanto, a declinação progressiva dos downsteps se processa até o

ponto hipotético em que o “valor básico” tanto dos tons H (no exemplo da figura 1.3, em torno

de 90Hz para o falante em questão) quanto dos tons L é atingido. A partir desse ponto, o

downstep é cancelado, o que caracteriza, portanto, a estratégia de “cancelamento”. Parece haver

um limite para a realização do downstep, situado a não mais do que três degraus de

proeminência. A partir desse ponto, o downstep seria negligenciado. Essa limitação, como

indicam Laniran e Clements (1995, citados por Rialland, 2001:302), talvez se explique pela

natureza amplamente não-distintiva do downstep no iorubá.

A segunda estratégia – a de “aumento na extensão do pitch” – foi percebida no dagará,

uma língua da família Niger-Congo do ramo Gur falada em Burkina. Trata-se de uma língua de

dois tons, em que os downsteps distintivos são acionados por tons baixos flutuantes.

Uma estratégia como as exibidas pelos falantes do iorubá, aplicada a uma língua com

downsteps distintos, conduziria à supressão de várias distinções. Rialland (2001:303) levanta

alguns questionamentos sobre como essa língua preservaria seus distintos downsteps. Seriam

concebíveis, para solucionar esse problema, algumas estratégias, como (a) rebaixar o limite

inferior da extensão do pitch a cada novo downstep, independentemente de quantos eles seriam;

(b) a realocação depois de um certo número de downsteps, evitando, assim, excessivos

downsteps em seqüência; (c) aumentar o limite superior da extensão do pitch no início da

elocução; ou, ainda, (d) o aumento da extensão de pitch com downsteps através do aumento dos

limites superior e inferior da extensão de pitch simultaneamente.

Os dados observados para o dagará apresentaram, assim como para o iorubá, as elocuções

constituídas apenas de tons H realizadas quase sem declinação alguma, quase totalmente planas.

A única exceção se observou no rebaixamento final. O que se observou foi que, embora todos os

locutores tenham mostrado comportamento semelhante na realização das elocuções contendo

apenas tons H, as estratégias utilizadas foram diferentes quando se buscou implementar o

downstep. À exceção da primeira estratégia listada acima, todas as outras três foram utilizadas.

Rialland enfatiza que dois dos falantes chegaram a produzir sete downsteps sem realocação

(“resetting”).

A observação da figura 1.4, em que é ilustrada a quarta estratégia mencionada acima,

possibilita uma noção bem clara de como se processa esse fenômeno de antecipação do

downstep:

Figura 1.4 – Contornos da F0 de elocuções com dois a cinco downsteps sobrepostos à linha de regressão das

elocuções contendo apenas tons H, para um dos falantes dagará (Rialland, 2001:305)

A questão posta a seguir diz respeito à possibilidade de a produção do downstep envolver

uma elevação antecipatória ou não. Os trabalhos de Poser (1984) e Kubozono (1993) (citados por

Rialland, 2001:309) evidenciaram que, no japonês, sempre que um tom H é relacionado a uma

mora acentuada, ele se realiza num pitch mais elevado do que o pico de uma palavra acentuada,

considerando-se o mesmo contexto. Esse tom H, associado a um acento, é imediatamente

seguido por um tom L15

. Assim, essa elevação dos tons H em posição acentuada pode ser

considerada como uma elevação antecipatória, o que indica, portanto, que existe antecipação

local, em que o tom H que precede um tom L é elevado.

A partir do momento em que o fenômeno antecipatório foi constatado em algumas

línguas tonais, como indica o artigo de Rialland, parece bastante razoável assumir que ele possa

se verificar nas outras línguas não-tonais, considerando, naturalmente, nuances específicas. Caso

se considerem os dados apresentados como reflexo de uma realidade lingüística concreta, a

sugestão de Ladd, comentada acima, de que o grau de planejamento antecipado seria

psicolingüisticamente inviável, não teria como ser sustentada.

15 O japonês suspende o downstep em constituintes em foco (Gussenhoven, 2002a).

2. AS RELAÇÕES DE COORDENAÇÃO E DE SUBORDINAÇÃO

A análise da estruturação sintática de uma enunciação, num nível mais profundo, prevê

que os constituintes sejam observados a partir dos processos de parataxe e de hipotaxe. A

parataxe diz respeito às relações estabelecidas entre os constituintes de forma a não haver

dependência sintática entre uns e outros, enquanto a hipotaxe prevê esse tipo de dependência.

Considerando-se a estruturação arbórea de uma frase, dois nódulos com a mesma função podem

se relacionar um ao outro sem o estabelecimento de uma dependência, como ocorre, por

exemplo, entre dois nódulos nominais que desempenhem a função de sujeito, ou dois nódulos

verbais (constituindo um período composto). Trata-se, portanto, de uma relação paratática. Numa

relação hipotática, a dependência entre os constituintes se dá, por exemplo, entre um nódulo

nominal com a função de objeto e o verbo que o comanda.

Ao se estender a análise desses processos às orações16

formadoras de um período, várias

abordagens, com terminologias distintas, são verificadas ao longo do tempo. De um ponto de

vista voltado para a tradição gramatical anterior ao gerativismo, as orações são classificadas em

dois grandes grupos. No caso da tradição estabelecida para a língua portuguesa (Cunha e Cintra,

1985; Bechara, 1982), o período é assumido como a enunciação completa que contém ao menos

um verbo e é delimitada, ao final, pelas marcas de pontuação final, interrogativa, exclamativa ou

de reticências, estas duas últimas constituindo ou final de um parágrafo ou seguidas por outro

período (que se inicia por uma letra maiúscula). Cada verbo presente no período (entendendo-se

por verbo as formas verbais plenas e/ou as locuções verbais) constitui o núcleo oracional. Caso o

período seja formado por apenas uma oração, será chamado de simples; por mais de uma oração,

composto. De acordo com a relação sintática estabelecida entre as orações do período,

consideram-se os processos de coordenação (parataxe) e de subordinação (hipotaxe).

Quanto ao processo de coordenação, as orações do período podem estar unidas umas às

outras por meio de conjunções. As que apresentam a conjunção, ou síndeto, são denominadas

sindéticas (do grego syndeton, indicando a presença de conjunção aditiva entre os termos de uma

construção coordenada e, por extensão, de todas as orações que apresentam uma conjunção

coordenativa); as que não apresentam o síndeto são chamadas de assindéticas. As orações

coordenadas sindéticas se subdividem em aditivas, adversativas, alternativas, explicativas e

conclusivas.

16 Uma oração é definida como uma unidade que pode ser analisada nos elementos Sujeito, Verbo, Complemento,

Objeto e Advérbio, sendo os dois primeiros obrigatórios (Chen, 2003, citando Cruttenden, 1997).

As orações subordinadas, por sua vez, dividem-se em três categorias, que, nas descrições

tradicionais, refletem a caracterização morfológica que lhes é subjacente: substantivas (por

desempenharem o papel de um substantivo), adjetivas (por desempenharem o papel de um

adjetivo) e adverbiais (por desempenharem o papel de um advérbio). No período composto por

subordinação, a oração dependente sintaticamente denomina-se oração subordinada e a que

comanda a subordinação denomina-se principal. Caso a oração subordinada seja introduzida por

uma conjunção subordinativa e contenha uma forma verbal finita, será considerada desenvolvida;

caso não apresente essa conjunção e a forma verbal seja infinita, será considerada reduzida (de

infinitivo, de gerúndio ou de particípio, segundo a forma verbo-nominal empregada).

Tradicionalmente, as orações subordinadas substantivas subdividem-se em cinco

categorias, nomeadas a partir do valor sintático que desempenham como termos da oração:

subjetivas, predicativas, objetivas diretas, objetivas indiretas e completivas nominais. São

introduzidas, quando em sua forma desenvolvida, por conjunções integrantes.

As orações subordinadas adjetivas, segundo a restrição ou não-restrição que estabelecem

em relação ao termo a que se relacionam, podem ser classificadas como restritivas ou

explicativas, respectivamente. Quando desenvolvidas, são introduzidas por um pronome relativo.

As orações subordinadas adverbiais, finalmente, subdividem-se em nove categorias:

causais, comparativas, concessivas, condicionais, conformativas, consecutivas, finais,

proporcionais e temporais, segundo as relações estabelecidas com a oração principal. Para

Mateus et al. (2003), essas nove subcategorias são divididas em dois grupos. O primeiro, que

caracteriza especificamente a subordinação adverbial, inclui as orações causais, as concessivas,

as condicionais, as finais e as temporais. O segundo é relacionado às construções de graduação e

comparação, envolvendo as orações comparativas, as conformativas, as consecutivas e as

proporcionais.

Com o advento da gramática gerativa, o enfoque das relações entre as orações passou a

ser observado a partir de sua estruturação profunda. Algumas vezes, a terminologia utilizada

sofreu alterações, com o intuito de caracterizar mais adequadamente a forma como as relações

estariam sendo estabelecidas. Chen (2003:108), por exemplo, caracteriza uma sentença composta

como sendo a que contém duas ou mais orações unidas ou coordenadas por conectivos como “e”,

“mas” e “ou”, enquanto uma sentença complexa seria a que contém duas orações, uma delas

sendo a oração subordinada e a outra a oração superordenada. Sob um ponto de vista discursivo,

Dargnat e Jayez (2007:5), citando Polanyi (1985), sugerem que a diferença entre a subordinação

e a coordenação está na continuação ou interrupção de uma atividade discursiva em curso.

Assim, sendo A e B dois constituintes discursivos, B é subordinado a A se B interrompe a

atividade discursiva manifestada por A. Do contrário, B é coordenado a A. Como exemplos,

citam as elaborações, as interrupções e os parênteses como evidenciando a subordinação. Já a

narração e o encadeamento temático evidenciam a coordenação. É interessante ainda observar

que, sob esse ponto de vista discursivo, toda justaposição física de constituintes (à qual os

autores não atribuem nenhum valor sintático ou semântico) correspondendo a um ato de

linguagem pode dar lugar a uma interpretação coesiva. Assim, não será a presença ou a ausência

de uma conjunção a responsável pelo estabelecimento dessas relações. A conjunção apenas

evidenciará a relação estabelecida entre esses constituintes.

Dentro do grupo das orações subordinadas, Diessel (2001:435), reportando Noonan

(1985:42), indica que as orações adverbiais se distinguem das completivas (“substantivas”, na

nomenclatura da gramática tradicional do português), quanto à função que desempenham dentro

do período. As orações completivas, por agirem como argumentos centrais do predicado, não

podem normalmente ser suprimidas, uma vez que se colocam como constituintes obrigatórios da

oração principal. As orações adverbiais, por sua vez, como desempenham o papel de adjuntos,

podem ser sempre omitidas no nível sintático, e são, normalmente, introduzidas por

subordinadores adverbiais, base para a relação semântica estabelecida com a oração principal.

A distinção entre a subordinação adverbial e a coordenação de orações não se apresenta

de forma essencialmente clara. Pode-se dizer que há uma certa equivalência no campo semântico

entre algumas orações subordinadas adverbiais e algumas orações coordenadas. Assim, às

subordinadas causais equivalem as coordenadas explicativas; às subordinadas concessivas, as

coordenadas adversativas; às subordinadas consecutivas, as coordenadas conclusivas; e às

subordinadas proporcionais, as coordenadas alternativas. O que diferencia umas das outras é,

precisamente, o processo de dependência (hipotaxe) ou de independência sintática (parataxe)

estabelecido no período que contribuem para constituir. De uma ou de outra forma, é freqüente a

dificuldade de distinção, por exemplo, entre as subordinadas causais e as coordenadas

explicativas. Embora o interesse maior desta pesquisa não seja direcionado para o

comportamento prosódico das orações coordenadas, o confronto entre a conformação da

freqüência fundamental que se propõe para as subordinadas causais e o que Moraes (1998; cf.

seção 3.2, frases (37a,b)) propõe para as coordenadas explicativas, por exemplo, coloca-se como

um bom índice diferenciador entre umas e outras.

Seguindo uma tendência verificada em vários trabalhos sobre a combinação de orações,

Diessel (2001:437) prefere analisar essa distinção entre orações coordenadas e orações

subordinadas adverbiais como formadora de um contínuo, ao invés de estipular dois tipos

distintos de conexões entre orações, e compila um conjunto de testes sintáticos úteis para a

diferenciação entre orações subordinadas adverbiais e orações coordenadas, apresentados a

seguir17

1) As orações adverbiais, quando antepostas à oração principal, admitem a inclusão de um

pronome catafórico controlado por um nome co-referencial presente na oração principal. As

orações coordenadas não admitem esse procedimento (Reinhart, 1983; Haspelmath, 1995):

(a) Quando elei veio a Paris, Pedroi encontrou João. (subordinação)

*Elei veio a Paris, e Pedroi encontrou João. (coordenação)

2) É possível omitir um elemento em uma oração que seja modificada por uma oração principal,

mas nada pode ser omitido em uma oração que esteja acompanhando uma oração coordenada

(Ross, 1967; van Oirsouw, 1987).

(a) O que você disse a ela __ quando você saiu? (subordinação)

(omissão, por exemplo, de “de manhã”)

(b) *O que você disse a ela __ e você saiu? (coordenação)

3) Em muitas línguas, as orações adverbiais podem ocorrer em posições variadas em relação à

associação oração principal/predicado. Por outro lado, as orações coordenadas apresentam

uma posição normalmente fixa (Haspelmath, 1995).

(a) Pedro admitiu que Maria estava certa [antes que ele saísse]. (subordinação)

(b) [Antes que ele saísse] Pedro admitiu que Maria estava certa. (subordinação)

(c) Pedro admitiu, [antes que ele saísse], que Maria estava certa. (subordinação)

(d) Pedro admitiu que Maria estava certa [e (ele) saiu]. (coordenação)

(e) *[E ele saiu] Pedro admitiu que Maria estava certa. (coordenação)

(f) *Pedro admitiu, [e ele saiu], que Maria estava certa. (coordenação)

4) Orações adverbiais não podem ocorrer com questões-tag, mas orações coordenadas podem

(Cristofaro, 1998a,b).

(a) *Ela vai ajudá-lo se ela estiver lá, ela não estará? (subordinação)

(b) Ela vai ajudá-lo, mas ela não estará lá, estará? (coordenação)

17 As referências apresentadas foram citadas por Croft (1995).

5) Num par de orações coordenadas, é possível a omissão do verbo em uma das orações, o que

não é permitido no caso das adverbiais (Ross, 1970; Hudson, 1976).

(a) *Bill tocou violão quando João, o piano. (subordinação)

(b) Bill tocou violão e João, o piano. (coordenação)

Uma forma de confirmar o status adverbial de uma oração em contraste com as orações

coordenadas, seria, como sugere Diessel (2001:438), a verificação do fenômeno denominado

como “deranking” (Stassen, 1985), que consiste na redução ou eliminação da morfologia verbal,

como o tempo, o aspecto e o modo. Como esse fenômeno, em muitas línguas, se restringe às

orações adverbiais, ele pode se mostrar bastante útil quando utilizado na base de algumas línguas

específicas. Diessel, na formulação de seu corpus, utilizou os cinco critérios apresentados a

seguir para a classificação das orações adverbiais:

1) a ocorrência de formas verbais específicas como as do subjuntivo, que, em algumas línguas,

como no groenlandês ocidental, é restrita a orações subordinadas;

2) o uso de sufixos de caso que marcam as orações adverbiais em línguas nas quais as orações

subordinadas são formadas pela nominalização, como é o caso do turco;

3) a ocorrência de marcadores de tópico e definidos, utilizados em línguas como o Ayutla

Mixtec, para indicar o status informacional das orações adverbiais;

4) uma ordem de palavras específica, como no alemão, que distingue orações subordinadas de

sentenças independentes;

5) restrições na ocorrência de marcadores de negação, de foco e de atos discursivos nas orações

subordinadas, como no Urubu-Kaapor.

É preciso levar em consideração que nenhum desses critérios é universalmente aplicável.

No entanto, sua combinação com os testes sintáticos descritos anteriormente, como afirma

Diessel (2001:439), parece ser suficiente para promover a distinção da maior parte das orações

adverbiais em relação às sentenças coordenadas.

Um dado interessante verificado pelo autor (2001:442) é que parece haver uma forte

correlação entre a ordenação das orações principais e adverbiais e a posição do subordinador

adverbial. A maioria das línguas OV (objeto-verbo), em que as orações adverbiais são marcadas

por subordinadores em sua posição final, tendem a posicionar essas orações adverbiais

anteriormente à oração principal. No entanto, em línguas em que as orações adverbiais são

introduzidas por um subordinador, como ocorre nas línguas VO (verbo-objeto) e numa

significativa minoria das línguas OV e OV/VO, as orações adverbiais ocorrem normalmente

tanto antes quanto depois da oração principal.

Outra possibilidade de distinção entre orações subordinadas e sentenças coordenadas,

como reporta Diessel (2001:437), é o estabelecimento de dois critérios pragmáticos, já bastante

utilizados na literatura. O primeiro diz respeito ao fato de as orações independentes, entre elas as

sentenças coordenadas, fornecerem informação de primeiro plano, enquanto as orações

subordinadas se prestariam às informações de segundo plano (“background”). O outro critério

sugere que orações coordenadas seriam atos de discurso independentes, enquanto as orações

subordinadas não apresentariam força ilocucionária. Os componentes pragmáticos seriam, em

princípio, os componentes universais das orações subordinadas, mas sua mensuração seria

extremamente difícil caso se desejasse utilizá-los para estabelecer uma divisão entre as orações

adverbiais e as coordenadas.

Se comparadas às orações principais, as orações coordenadas estariam, considerando-se

uma estrutura sentencial de coordenação, em condições de igualdade em dois aspectos: ambas

são o mesmo tipo de constituinte, e desempenham o mesmo papel na estrutura coordenada. Cada

oração seria considerada a partir de uma unidade entonacional, caso se faça a extensão de análise

aos aspectos prosódicos do discurso (cf. Vaissière, 1997, 2004). Croft (1995:851), ao discutir as

relações entre as estruturas gramaticais e as unidades entonacionais, considera, então, que a

razão para haver um limite máximo de uma oração principal finita em uma unidade entonacional

é o fato de que as orações principais, no caso de se verificarem várias, precisam ser coordenadas

entre si e, com isso, são separadas, cada uma sendo representada por um grupo entonacional

distinto. Elas nunca estariam subordinadas a uma unidade gramatical mais alta, inclusive

entonacionalmente, pelo simples fato de não haver uma unidade gramatical mais alta.

As relações de coordenação e de subordinação, assim, podem ser observadas sob o ponto

de vista entonacional. Fox (1984:125) indica que os grupos tonais, quando em seqüência,

poderiam ser analisados como promovedores de duas relações básicas: a de subordinação, em

que se estabeleceria a dependência entre um grupo tonal e outro; e a de coordenação, em que não

se verificaria dependência alguma entre eles, embora estivessem relacionados, da mesma forma

que verificado na análise da estruturação sintática. Fox realça que a subordinação ou a

coordenação se aplicam aos grupos tonais, e não aos padrões entonacionais, pela razão de ainda

não ter sido verificada uma consistência entre os padrões e o status dos grupos tonais nos quais

eles ocorrem. Uma possível projeção dessas estruturas no discurso deveria considerá-las como

um todo, não como grupos tonais individuais.

Na tentativa de identificação de possíveis estruturas entonacionais, Fox (1984:121) indica

a existência de quatro abordagens principais. Uma primeira seria aquela em que os padrões

entonacionais seriam imbuídos de significados como “continuativo”, a que se associaria uma

conformação ascendente da F0 (não-final), e “não-continuativo”, com uma conformação

descendente. Esses significados seriam do tipo “interno” ou “estrutural”, e não “atitudinal”. Essa

abordagem não se apresenta como satisfatória, uma vez que se pode encontrar, sem muita

dificuldade, um padrão final ascendente e um não-final, descendente.

Outro enfoque seria o que privilegia seqüências recorrentes de grupos tonais. Inúmeras

obras apresentam listas de seqüências possíveis, mas o problema principal está no fato de as

classificações serem bastante arbitrárias, normalmente sem uma discussão sobre como se

estabelecem as relações entre os grupos tonais ou mesmo a natureza das estruturas criadas.

A terceira abordagem consistiria na classificação dos tipos de seqüências encontradas.

Fox (1984:121) menciona o trabalho de Palmer (1922), em que se estabelece a distinção entre

seqüências coordenadas e subordinadas com base na identidade dos tons envolvidos. De acordo

com essa proposta, a coordenação seria caracterizada pela presença de um mesmo tom em cada

grupo tonal e, por conseguinte, tons diferentes para a caracterização da subordinação. Crystal

(1969) faria uma distinção similar, mas sugerindo que a subordinação ocorre com tons idênticos

quanto à extensão do pitch.

A última abordagem elencada por Fox, caracterizadora de um enfoque mais elaborado,

reconheceria uma entidade entonacional maior com vários tipos de estrutura interna. Schubiger

(1958, citado por Fox, 1984) propõe uma unidade apresentando uma estrutura semelhante à do

grupo tonal, em que haveria uma seqüência de grupos tonais com um desempenhando a função

nuclear. O próprio autor já apresentara (Fox, 1973) a proposta de um “grupo paratonal”, em que

várias relações estruturais estariam presentes.

Fox (1984:126) introduz uma fórmula que seria capaz de representar os vários tipos

estruturais de seqüências, qualquer que fosse o padrão utilizado. No caso, “a” representa os

grupos tonais independentes e “b”, os dependentes. Os índices subscritos indicam o número

mínimo de casos:

b0a1b0

Parece ser possível, no entanto, que exista uma maior complexidade interna aos grupos.

Grupos tonais poderiam ser dependentes de grupos tonais independentes individualmente, o que

produziria uma interrupção na seqüência dos grupos tonais estruturalmente equivalentes. Assim

estruturas independentes como baba, por exemplo, sofreriam a inserção de grupos tonais

dependentes, produzindo (ab)a ou a(ba). Como fórmula generalizadora, Fox propõe

(b0ab0)1

o que permitiria expansões do tipo a, ba, ab, bab, aa, baa, aab, aba, baba, entre outras. A

complexidade desse tipo de estruturas, na verdade, não é tão grande como possa parecer, pois, na

realidade, não há uma equivalência entre a complexidade das estruturas entonacionais e a da

sintaxe. Alguns tipos de estruturas parecem ser simplesmente excluídos. Por exemplo, não é

possível encaixar um grupo tonal em outro (a menos que se trate do encaixamento de uma

sentença em outra), da mesma forma que não se verifica descontinuidade dentro de um grupo

tonal, diferentemente do que freqüentemente ocorre quando se trata de estruturas sintáticas.

De acordo com a proposta de Fox (1984:127), uma estrutura subordinada seria

representada como ba, e uma coordenada, como aa, o que refletiria o status “textual” das partes.

Por essa representação, a estrutura coordenada é aberta, podendo ser continuada

indefinidamente, numa sugestão de concatenação; e a subordinada apresentaria duas partes

complementares, uma “final” e outra “não-final”, sugerindo integração entre as partes.

A relação de subordinação diz respeito diretamente à noção de dependência, ou seja, um

grupo tonal se subordina a outro se sua ocorrência necessariamente depender da ocorrência desse

outro (1984:123). Assim, nesse tipo de relação estão presentes um grupo tonal dependente e um

independente. Da mesma forma que na análise da estruturação sintática, a coordenação se faria

entre grupos tonais independentes.

Diferentes seqüências tonais, em princípio, parecem apresentar diferentes tipos de

relações internas. Ao analisar a combinação H + L (em que H representa qualquer padrão que

não termine em um pitch baixo, e L representa qualquer padrão com terminação baixa), Fox

considera o padrão H como dependente, ou seja, subordinado ao tom L. Como exemplo,

apresenta a seguinte elocução (é mantida, aqui, a representação tonal por meio dos diacríticos

originalmente utilizados):

(20) when I get back / I‟ll give you a `ring

(quando eu voltar / eu lhe darei um telefonema)

O primeiro grupo tonal seria subordinado ao segundo. Embora, nesse exemplo, exista também

uma subordinação no nível gramatical, o que se dá é o paralelismo com a subordinação dos

grupos tonais. Caso se inverta a posição das orações, a seqüência dos grupos tonais permanecerá

a mesma:

(21) I‟ll give you a ring / when I get `back

(eu lhe darei um telefonema / quando eu voltar)

Uma vez que a inversão das orações não promoveu a inversão da seqüência aplicada aos grupos

tonais, a evidência se faz no sentido de que o primeiro grupo tonal é, de fato, subordinado ao

segundo. Isso sugere, possivelmente, uma seqüência no alinhamento dos grupos tonais, nesse

caso específico, para que se caracterize a subordinação entonacional. No caso da subordinação

no nível gramatical, essa seqüência não é necessária, como evidenciou o exemplo acima.

As relações estabelecidas internamente à seqüência L + L, por outro lado, parecem se

colocar de forma diferente. O que se verificaria seria uma relação de independência – portanto,

de coordenação – entre esses grupos tonais. Como exemplo, Fox sugere a seguinte seqüência:

(22) I‟ll give you a `ring / when I get `back

(eu lhe darei um anel / quando eu voltar)

Deve-se observar, neste caso, que a subordinação se mantém no nível gramatical, mas não no

entonacional, o que implicaria dizer que a subordinação entre grupos tonais se mostra de forma

autônoma – pelo menos nesses casos analisados – em relação à subordinação gramatical,

havendo situações em que ambas coincidem. Haveria, assim, a possibilidade de, por meio da

utilização das estruturas entonativas, o locutor caracterizar determinadas partes de seu discurso

como sendo mais importantes do que outras. No exemplo abaixo (1984:130), o uso de uma

estrutura de coordenação em (a) implica a existência de duas informações em paralelo, enquanto

que em (b) ou (c), o uso de estruturas subordinativas sugere uma informação central e uma

dependente, organizadas, portanto, de forma diversa:

(23) (a) there‟s a `fly / in my `soup (aa)

(há uma mosca / na minha sopa)

(b) there‟s a fly / in my `soup (ba)

(c) there‟s a `fly / in my soup (ab)

Como Fox (1984:125) lembra, a sugestão é a de que ocorre subordinação ou coordenação entre

grupos tonais, não entre padrões entonacionais e, ainda, que essas relações devem ser percebidas

mais como internas à estrutura entonacional do que como um reflexo explícito de alguma função

discursiva direta. Essas estruturas poderiam ser projetadas no discurso, mas considerando-se

estruturas completas ao invés de grupos tonais.

Fox percebe essas relações não como evidenciadoras de uma função sintática da

entonação, mas como uma função geral na articulação do discurso, que seria susceptível de uma

interpretação mais específica quando relacionada a um certo tipo de sentença. Embora alguns

tipos de sentenças possam explorar certas funções gerais da entonação de formas bastante

específicas, ocorrendo uma certa tendência a que determinados tipos de sentenças sejam

regularmente associados a estruturas entonacionais específicas, isso não significaria dizer que

essas estruturas entonacionais ocorram obrigatoriamente com eles. O que seria mais prudente

afirmar é que normalmente há uma convergência entre estruturas sentenciais e entonacionais,

especialmente se se considerar que elas apresentam significância no discurso. Embora a extensão

dessas observações seja limitada, parece ser possível estabelecer algumas correspondências entre

características sintáticas das elocuções e tipos de estruturas entonacionais. Fox (1984:129)

indica, por exemplo, que alguns tipos de elocuções preferem uma estrutura entonativa de

coordenação, incluindo elocuções com elementos dos seguintes tipos (é mantida a notação

originalmente utilizada):

(24) (a) orações relativas (geralmente do tipo não-restritivo se possuem um grupo tonal

separado)

there‟s `Smith / who wrote that book on `speech acts

(há Smith / que escreveu aquele livro sobre atos discursivos)

(b) frases apositivas (também geralmente não-definidoras)

I‟ll introduce you to `John / my `brother

(vou apresentá-lo ao John / meu irmão)

(c) orações relativas sentenciais

I missed the `lecture / which was a `pity

(perdi a conferência / o que foi uma pena)

(d) orações adverbiais com caráter de comentário

he‟s `failed / as we ex`pected

(ele fracassou / como esperávamos)

(e) perguntas tag (em sua maioria), com o mesmo ou diferentes padrões em cada grupo

he‟s from `Birmingham / ´isn‟t he?

(ele é de Birmingham / não é?)

Retomando a noção de unidades entonacionais, como já discutido em 1.2, algumas

tentativas já foram feitas no sentido de tentar determinar um limite para o tamanho gramatical de

uma unidade entonacional. Croft (1995:850) lembra que Halliday (1967:32) já havia sugerido

que os falantes verbalizam seus pensamentos de forma que seja enunciada uma oração de cada

vez. O tamanho da unidade entonacional seria, portanto, o de uma oração simples. Os dados de

Croft, no entanto, apresentam muitas exceções para essa proposta. O máximo que seria possível

identificar, considerando esses dados, seria um limite máximo de duas orações, ao invés de uma.

No entanto, como o autor indica, caso se faça uma restrição às orações principais, um constraint

parecido com “uma oração (principal finita) por vez” parece poder ser considerado. Esse

constraint se aplicaria nos casos em que haveria mais de uma oração constituindo uma estrutura

sintática em paralelo numa única unidade entonacional. Steedman (1991:14) sugere a existência

de uma identidade entre as estruturas exigidas pela teoria da entonação e sua relação com a

informação contextual, de um lado, e as estruturas sintáticas de superfície permitidas pela

gramática combinatória, de outro. Poderia ser estipulado, então, que tudo o que pode ser

coordenado pode ser entendido como um constituinte entonacional, e vice-versa.

Outro fator normalmente sugerido para considerar os limites impostos pela capacidade e

pelo processamento cognitivos é o peso ou tamanho do constituinte, assumido em função do

número ou do nível dos constituintes envolvidos. Croft (1995:856) considera inapropriado

denominar esse fator como “peso” do constituinte, preferindo denominá-lo como o fator

“complexidade”. Da mesma forma que o paralelismo, a complexidade também estaria operando

em diferentes níveis sintáticos, especialmente nos mais baixos. A denominação como

“complexidade” evidenciaria a relação de proximidade com o paralelismo, que seria

aparentemente um tipo de complexidade. Um indício interessante da projeção do sistema

cognitivo no nível acústico está no fato de que a fronteira entre os constituintes seria marcada

pelo alongamento da última sílaba. Vaissière (1997) indica que esse alongamento é proporcional

à profundidade da fronteira; ou seja, quanto maior a separação entre os níveis sintáticos dos

constituintes, mais longa a duração da sílaba final anterior à fronteira.

3. OS MODELOS ENTONATIVOS

A noção mais ampla de contornos melódicos assume que uma determinada configuração

prosódica, em uma língua, é responsável por sugerir um determinado significado, seja na esfera

lingüística, seja no âmbito do paralingüístico. A tradição descritiva francesa, por exemplo,

assumiu a noção de clichê melódico (“cliché mélodique”), que, em princípio, pode ser definido

da mesma forma que as expressões idiomáticas léxico-sintáticas. Como Ladd (1996:140) indica,

esse significado adicional aos componentes sintáticos e semânticos, numa enunciação, é muito

difícil de descrever em palavras, sendo o equivalente vocal, por exemplo, de levantar os ombros

em sinal de dúvida. Assim, vários clichês melódicos poderiam ser identificados em uma língua.

Fónagy et al. (1983, citado por Marandin, 2004) caracterizou, para o francês, três esquemas de

clichês, um dos quais, a que denominaram “cliché enjambant”, poderia ser identificado como o

contorno continuativo estilizado.

Paralelamente ao conceito de “morfema”, Delattre (1966, 1969) e Rossi (1981) (citados

por Portes, 2005:141) assssumem a noção de “entonema”, que seria o equivalente de um

morfema entonativo (cf. Dellatre, 1966 e a discussão na seção 3.1). Segundo a definição que

adotam, um entonema corresponderia a um contorno entonativo, em que a F0 apresentaria um

movimento contrastivo relacionado a uma função específica. Um exemplo seria o contorno de

finalidade, correspondendo ao movimento descendente da F0 e responsável por indicar o fim do

enunciado.

O estabelecimento de uma determinada configuração melódica como sendo um contorno

prosódico levanta uma série de questionamentos. Por exemplo, se existiria um todo da melodia

projetada sobre uma enunciação que deveria ser considerado como o contorno em si mesmo, ou

se apenas um trecho da melodia (cf. a discussão sobre as visões holística e composicional na

análise dos contornos, na seção 1.2). Também, se a delimitação de um contorno estaria restrita a

um grupo rítmico ou a uma frase entonacional, o que leva, por sua vez, à necessidade de

distinção entre essas duas noções, diretamente relacionadas ao que Vaissière (1997) caracteriza

como a função demarcativa da prosódia.

De uma forma geral, como essa autora indica, é possível distinguir, numa tentativa de

definição das unidades delimitadas pelos parâmetros prosódicos (especificamente, a F0, a

duração e a intensidade), os níveis sub-lexicais, em que estariam classificados a mora, a sílaba e

o pé; o nível lexical, com os tons e os acentos de palavra, melódico etc.; e os níveis pós-lexicais,

em que se situariam a palavra prosódica ou unidade acentual, o grupo clítico, o grupo de sentido

ou sintagma prosódico, o sintagma, o grupo entonativo ou grupo de respiração, o enunciado, o

parágrafo, o discurso etc. Em princípio, é possível perceber que a estruturação prosódica

apresenta pontos comuns em relação à estruturação sintática, o que auxilia o ouvinte na

decodificação da enunciação, embora essa relação não seja perfeita, uma vez que normalmente

são possíveis várias realizações prosódicas para uma mesma enunciação.

A noção de grupo rítmico, também conhecido como “grupo acentual”, “grupo

entonativo”, “grupo de respiração (souffle)”, “grupo de sentido” (Dargnat e Jayez, 2007:4) está

na essência do fenômeno que Vaissière (1997) detectou em seus experimentos, na década de

1970, ao perceber que as seqüências de 7 a 8 sílabas tendem a não serem decompostas,

mantendo-se como uma unidade (cf., mais à frente, essa mesma noção discutida por Martin,

2002). Como indicam Delais-Roussarie et al. (2002), um grupo rítmico é demarcado, em sua

fronteira direita, por uma sílaba contendo um acento primário. Normalmente, o grupo rítmico

contém uma palavra lexical e a possibilidade de todas as palavras gramaticais no seu lado não-

recursivo. Já a frase entonacional seria caracterizada pela realização de um tom de fronteira em

sua última sílaba. Assim, qualquer grupo rítmico apresentaria a possibilidade de ser realizado

como uma frase entonacional, especialmente num discurso mais lento. A segmentação nas frases

entonacionais depende, por exemplo, do ritmo do discurso, sendo delimitada por fatores

relacionados aos princípios rítmicos, à dimensão informacional e à própria estrutura sintática.

Além disso, a caracterização de um contorno estaria relacionada ao que se considera como

acento de pitch.

Esses autores distinguem duas categorias de acentos de pitch. A primeira – a dos acentos

de modalidade – seria responsável por expressar a atitude do falante. Esses acentos de

modalidade poderiam estar ancorados em qualquer sílaba proeminente, sendo utilizados ao lado

dos tons de fronteira para a elaboração de tons melódicos específicos. A outra categoria seria a

dos acentos pragmáticos, realizados em uma sílaba acentuada e responsáveis pela caracterização

de diferentes funções pragmáticas, como a ênfase ou a intensificação.

Embora a análise dos conceitos discutidos acima pareça não apresentar grandes

complicações, as segmentações prosódicas feitas pelos usuários da língua normalmente

apresentam uma grande gama de possibilidades. Delais-Roussarie (2000) demonstra esse fato

comparando a segmentação prosódica estabelecida por vários locutores para um mesmo

enunciado com dois postulados que poderiam ser estabelecidos. Em princípio, os constituintes

prosódicos seriam primitivos fonológicos definidos anteriormente à análise dos fenômenos

segmentais e suprassegmentais. Assim, os constituintes prosódicos seriam as únicas unidades a

que o componente fonológico da gramática teria acesso. Como segundo postulado, a idéia de que

o componente fonológico é alimentado pelo componente morfossintático da gramática. Com

isso, os constituintes prosódicos se formariam na interface entre esses dois componentes a partir

de informações morfossintáticas.

Um primeiro problema em relação a esses postulados é sugerido pela segmentação

prosódica e pela acentuação no francês. A autora indica que a mesma estrutura sintática presente

nas três enunciações a seguir foi segmentada de três formas diferentes por vários locutores que

deveriam lê-las em voz alta.

(25) a (Jean François) (a aperçu) (les enfants) (de mon voisin)18

b (Jean François) (a vu le fils) (de mon voisin)

c (Jean François) (a aperçu) (le fils de Pierre)

Isso indica, portanto, que a sintaxe, em si mesma, não é suficiente para determinar as

segmentações prosódicas e, por conseguinte, a distribuição dos acentos. Critérios rítmicos, como

o tamanho dos constituintes em número de sílabas e a distância entre os acentos, estariam

interferindo explicitamente na segmentação. Um outro exemplo em que a sintaxe não suplanta a

prosódia é observado nas línguas Bantu. Harford e Demuth (1999:48) indicam que algumas

dessas línguas, como a Chishona, apresentam um caso em que um impedimento sintático contra

o movimento (STAY) é violado, para favorecer um impedimento prosódico de nível mais alto

contra palavras monossilábicas. Segundo as autoras indicam, o impedimento prosódico não

seleciona entre duas construções sintáticas igualmente adequadas, nem contribui apenas quando

a sintaxe não é determinante. A exemplificação é feita a partir de duas estratégias diferentes de

relativização do objeto, uma em que a elevação do verbo a C0 é obrigatória em orações relativas

de objeto, originando uma aparente “inversão de sujeito”, e outra em que a elevação do verbo

não ocorre, produzindo a ordem básica de palavras SV na oração relativa intercalada. Em ambos

os casos, é a condição prosódica do complemetizador relativo que determina a sintaxe da ordem

de palavras.

Um segundo problema relacionado aos postulados apresentados se relaciona à ordem das

palavras, à acentuação e ao ritmo. Delais-Roussarie indicou que alguns enunciados podem ser

18 a. (Jean François) (percebeu) (os filhos) (de meu vizinho)

b. (Jean François) (viu o filho) (de meu vizinho)

c. (Jean François) (percebeu) (o filho de Pierre)

linearizados (em sua forma sintática de superfície) de formas diferentes, enquanto outros não

admitem essa possibilidade, como demonstram os exemplos a seguir.

(26) a. J‟ai parlé hier soir à Marie19

J‟ai parlé à Marie hier soir.

b. J‟ai parlé à Marie en fin d‟après-midi.

? J‟ai parlé en fin d‟après-midi à Marie.

A diferença de linearização entre [hier soir] e [à Marie], que se mostra possível em (a), é

discutível em (b), ao que parece, por razões prosódicas. A segmentação prosódica de (b) implica

certos princípios rítmicos, como o equilíbrio silábico e a distância entre os acentos, que estariam

sendo transgredidos em “J‟ai parlé en fin d‟après-midi à Marie”. Esses princípios rítmicos

seriam, assim, um constraint na linearização dos enunciados.

Com base na observação desses problemas, Delais-Roussarie propõe uma nova

abordagem da estrutura prosódica, sustentada por dois outros postulados. O primeiro caracteriza

os constituintes prosódicos não como primitivos fonológicos, mas como determinados em

superfície por diferentes tipos de informações (lingüísticas e extralingüísticas). O segundo

postulado considera que a interface entre os componentes sintático, semântico e fonológico da

gramática não é biunívoca. Em paralelo, estariam intervindo na linearização dos enunciados,

portanto, constraints sintáticos, semânticos e fonológicos. A autora propõe, para suas análises do

francês, um modelo baseado na idéia de que a acentuação é primeira, o que faz que a estrutura

prosódica de superfície se deduza a partir da localização dos acentos. Com isso, os constituintes

prosódicos não seriam mais concebidos como primitivos fonológicos definidos anteriormente à

análise dos fenômenos acentuais.

Como se pode perceber, o estabelecimento dos possíveis contornos prosódicos não deve

levar em consideração apenas a estruturação sintática das enunciações, como constatado para o

francês (e, ao que tudo indica, também para as outras línguas). Uma vez que, na realização

discursiva, os locutores normalmente estabelecem a segmentação prosódica de forma a

evidenciar, sim, a estrutura morfossintática, mas também respeitando princípios rítmicos

fundamentais, esses princípios rítmicos possivelmente representam um ponto importante para a

determinação de um contorno prosódico. Como indicado anteriormente, a questão relativa ao que

19 a. Falei ontem à noite com Marie. / Falei com Marie ontem à noite.

b. Falei com Marie no final da tarde. / Falei no final da tarde com Marie.

se deva considerar “contorno prosódico” não está ainda solucionada, nem quanto à extensão de

seus limites, nem quanto à sua localização exata dentro do enunciado. A aplicação de princípios

rítmicos na segmentação de uma enunciação, no caso do francês, talvez possa contribuir, se não

para a definição do que seja um contorno prosódico em si mesmo, pelo menos para a delimitação

de sua área de abrangência.

De acordo com as teorias adotadas para o francês, os eventos fonológicos significativos

ocorreriam essencialmente nas sílabas acentuadas, tanto no nível das palavras quanto no nível

enfático ou contrastivo (Martin, 1978, citado em Delais-Roussarie et al., 2002). As sílabas

acentuadas refletiriam, dessa forma, a organização hierárquica da sentença, a divisão dessa

sentença em tema/rema, e a ênfase. Martin (2002) indica que as realizações efetivas dos

parâmetros dos contornos prosódicos dependerá, portanto, da configuração da estrutura

prosódica considerada.

Segundo esse autor, há uma regra de dependência acentual que estabelece acentos para as

palavras, estando elas numa relação de independência ou de dependência com uma outra

unidade. Deve-se considerar que unidades em relação de solidariedade constituem um grupo

acentual, podendo possuir um único acento. Uma regra contra o conflito de acentos impede que

uma sílaba acentuada se siga a outra sílaba imediatamente acentuada, sem que haja espaço

fonético suficiente entre elas. Associado a isso, Martin caracteriza uma regra rítmica, que

permite a deacentuação de sílabas acentuadas, de acordo com sua posição na estrutura prosódica

correspondente e sua distância em número de sílabas entre a sílaba acentuada inicial e a final, a

fim de manter o tamanho das palavras prosódicas (ou seja, dos grupos acentuais) variando de 6 a

8 sílabas, o que corresponde ao que Vaissière (1997) caracterizou como o grupo rítmico, como

discutido anteriormente.

Na delimitação dos contornos prosódicos, em princípio podem ser identificados dois

movimentos principais da F0, um com tendência ascendente, outro com tendência descendente.

Em muitas línguas, observa-se que o pitch elevado ou ascendente é usado na fronteira de uma

oração para assinalar, como já discutido, a continuidade dessa oração (Chen, 2003:108). Delattre

(1965, citado por Chen, 2003:110) observou que, no inglês, a continuação seria sugerida por um

contorno predominantemente descendente, seguido de um trecho com ligeira subida; no entanto,

no alemão, no francês e no espanhol, o formato dessa subida já se mostraria bem delineado. A

inversão de pente na curva prosódica, ou seja, um contorno ascendente (ou descendente) em uma

primeira unidade prosódica, seguido de um contorno descendente (ou ascendente) na unidade

prosódica seguinte, também se constitui como um recurso amplamente utilizado para marcar

oposição, mas, como indica Vaissière (1997), esse procedimento seria inimaginável numa língua

tonal como o chinês.

Essa relação do significado sonoro entre o pitch elevado ou ascendente na posição final

de uma oração e a continuação, normalmente conhecida como a “elevação de continuidade”

(continuation rise), estaria em conexão direta com o que Gussenhoven (2002a) denominou de

Código de Produção (Production Code). Como já discutido, o Código de Produção constituiria

uma parte da teoria do significado paralingüístico entonacional, relacionado à pressão subglotal.

Por conta das condições fisiológicas inerentes ao mecanismo de produção da voz, a pressão

subglotal se mostra mais elevada no início das enunciações, sofrendo uma diminuição com o

volume menor de ar expelido pelos pulmões. Assim, como uma maior pressão subglotal produz a

F0 com freqüências mais elevadas, e essa posição elevada da F0 é normalmente associada ao

início das elocuções, o contorno final de uma oração que apresente o pitch elevado ou

ascendente sugerirá que algo mais será utilizado a partir daquele ponto, caracterizando, então, a

sensação de continuidade. O contorno com pitch baixo ou descendente sugerirá o final da

elocução. Trata-se da mesma associação que Vaissière (1997) estabelece em relação aos grupos

de respiração (groupes de souffle): a sensação de continuidade é sugerida por um grupo de

respiração não-final, ou seja, fisiologicamente ainda haveria ar suficiente nos pulmões para dar

prosseguimento à enunciação, o inverso ocorrendo com um grupo de respiração final.

Comparativamente ao Código de Produção, o Código de Esforço (Effort Code) seria responsável

pelos usos enfáticos da prosódia. Quanto maior a latitude dos movimentos de pitch, maior o grau

de ênfase. Gramaticalmente, esse fenômeno é normalmente observado quando se procura

estabelecer a focalização de um determinado item na enunciação. Vaissière (1997) indica, como

explicação para essa acentuação da F0, a pressão contínua produzida pela tensão gerada sobre as

pregas vocais.

Com a intenção de verificar como o efeito de continuação seria produzido por

estrangeiros aprendendo o inglês, o francês e o alemão, Grover et al. (1987, citados por Chen,

2003:108) mediram a inclinação da F0 sobre a sílaba acentuada anterior à conjunção iniciadora

da oração seguinte em elocuções produzidas por falantes nativos. Esse cálculo foi feito

dividindo-se a variação de F0 entre os pontos máximo e mínimo atingidos pela curva e a

variação de tempo nesse intervalo. Essa inclinação apresentou valores positivos no alemão e no

francês, mas negativos no inglês. Como comentado acima, as elocuções do inglês apresentaram,

ao final, uma ligeira elevação da F0, que teria sido, ao que parece, suficiente para caracterizar a

sensação de continuidade. Na abordagem da teoria métrico-autossegmental, os resultados obtidos

por Delattre e Grover et al. parecem sugerir que o inglês, o alemão, o francês e o espanhol

utilizam um tom de fronteira alto (H%) para assinalar a continuação. A particularidade estaria no

inglês, em que o acento de pitch nuclear favoreceria um contorno descendente-ascendente,

enquanto que, nas outras três línguas, esse contorno seria apenas ascendente.

Na marcação de fronteiras no inglês britânico, percebeu-se que os falantes nativos

consideraram como soando mais naturalmente os contornos com uma elevação final na fronteira

entre duas orações coordenadas e/ou na fronteira entre uma oração principal e uma subordinada.

O contorno com queda final foi sentido como menos natural (Sanders, 1996, citado por Chen,

2003:111). Da mesma forma, Féry (1993, citado por Chen, 2003:111) verificou que, para o

alemão, o acento de pitch ascendente L*H foi utilizado para indicar a intenção do falante de

continuar a enunciação.

Para o holandês, Chen reporta o estudo de „t Hart e Cohen (1973), em que se evidenciou

que a fronteira de orações seria marcada predominantemente por meio de um de três contornos,

H*L H%, H* % ou !H*L. Desses três, os dois primeiros teriam apresentado maior índice de

preferência. Ou seja, a fronteira de uma oração a ser continuada é preferentemente marcada, no

holandês, com um contorno ascendente, embora não se possa estabelecer uma preferência clara

entre os contornos descendente-ascendente e os ascendentes.

Em sentido inverso, um contorno descendente pode refletir o grau de finalidade de uma

elocução de forma gradiente. Chen (2003:113), reportando os estudos de Wichmann (1991) e de

Pierrehumbert e Hirschberg (1990), indica que quanto mais baixo estiver o ponto inicial da

queda final (considerando-se a palavra acentuada antes da fronteira oracional), mais a elocução

será percebida como sendo final. A indicação se daria, então, no sentido de que os falantes

explorariam também o espaço fonético das elevações finais para assinalar o grau de continuidade

da elocução, em sintonia com o Código de Produção de Gussenhoven (2002a).

Um exemplo desse uso gradiente seria a percepção do sentido de “surpresa” pelos

ouvintes holandeses e britânicos. Os holandeses estariam acostumados a uma extensão de pitch

padrão mais estreita, ou seja, a extensão de pitch utilizada habitualmente pelos falantes

normalmente não apresenta uma grande latitude. Por outro lado, os britânicos já utilizariam uma

extensão de pitch muito maior. Por conta disso, para um mesmo intervalo de picos de alturas

tonais, os holandeses conseguem perceber uma diferença maior de significado do que os

britânicos. A expectativa, no caso da percepção de elevações finais, seria a de que os ouvintes

britânicos, acostumados a uma variação menor das alturas finais de pitch, perceberiam uma

diferença maior na probablidade de continuação de um dado intervalo das elevações finais do

que os holandeses (Chen, 2003:113).

Os resultados obtidos por Chen (2003:133) em seus experimentos evidenciaram uma

clara diferença em relação ao que havia sido preconizado anteriormente, no tocante à percepção

dos contornos finais entre o inglês britânico, o alemão e o holandês. Para os britânicos, o

contorno continuativo preferido parece ser H*L H%; para os alemães, a preferência se daria por

H*L H%, diferente do que preconizaram Delattre (1965) e Grover et al. (1987); para os

holandeses, o contorno preferido seria H* H%. Ficou constatado, também, que quanto mais

elevado se mostrava o pitch final, maior era o grau de probabilidade de a elocução ser proferida

como sendo a primeira de uma seqüência de duas. Além disso, os britânicos e os holandeses

teriam uma maior inclinação a explorar o espaço fonético do pitch final com o objetivo de

assinalar diferentes graus de continuação do que os alemães.

Essa noção de que o significado de um contorno prosódico é uma função dos significados

dos tons constitutivos é sustentada pela maior parte dos adeptos da teoria métrico-

autossegmental. Bartels (1999, segundo Marandin, 2004) também propõe que os acentos de pitch

seriam fonte de informação sobre o status de ativação do conteúdo, sobre a atitude do falante; e

os acentos de fronteira, sobre a interpretação da elocução com relação ao discurso sendo

enunciado. Em relação ao francês, no entanto, Marandin et al. (2004) teriam chegado à

conclusão provisória de que o significado de um contorno não pode ser analisado pela

combinação dos significados dos tons que o constituem. Em primeiro lugar, porque os

significados possivelmente associados a H*, HL* ou H+L* deveriam ser restritos a cada

contorno final a que pertencem, uma vez que, em outros lugares, eles podem aparecer como

elevações continuativas com uma função métrica ou demarcativa e nenhum significado

específico. Além disso, como ocorrem em um único contorno, não haveria como estabelecer se

esses significados são associados ao tom ou ao contorno em si mesmo. Em segundo lugar,

porque mesmo que fossem considerados apenas os contornos finais, não poderiam ser associados

significados específicos nem ao contraste “L vs. H” para os tons frasais realizados na porção

esquerda do domínio focal nem aos tons de fronteira na margem direita. A expectativa de

Marandin é a de que os contornos sejam unidades semânticas globais.

3.1 ALGUMAS CARACTERÍSTICAS DO SISTEMA ENTONACIONAL DO FRANCÊS

Com a percepção crescente de que o componente melódico seria responsável por uma

parcela significativa do significado do discurso, algumas tentativas já se estabeleceram no

sentido de definir um inventário de contornos prosódicos para algumas línguas. No inglês, por

exemplo, Pierrehumbert (1980) enumerou 22 contornos. No entanto, Delattre (1966) é quem se

mostra como pioneiro nesse tipo de sistematização. Seu estudo identificou dez contornos básicos

para o francês. A descrição desses contornos considera a variação da F0 em quatro níveis (sendo

o nível 4 o mais elevado), com a utilização da noção explícita dos entonemas. A cada contorno

caberia uma função significativa, que poderia ser representada por um entonema, a que seria

associado um traço distintivo. A tabela 3.1 sintetiza os dez contornos definidos por Delattre.

Observe-se que dois deles são continuativos (continuation mineure, continuation majeure), dois

são contornos pós-focais (echo, parenthèse), e seis são potenciais contornos finais.

função significativa entonema traço distintivo

1. Continuação menor A 2-3

2. Continuação maior B 2-4

3. Questão (sim? não?) C 2-4+

4. Implicação D 2-4-

5. Finalidade E 2-1

6. Interrogação F 4-1 curvas não-distintivas entre si

7. Comando

8. Exclamação

9. Parêntese G 1-1 em distribuição complementar

10. Eco 4-4

Tabela 3.1 – Os dez contornos para o francês definidos por Delattre (1966).

Post (2000:150, citada por Marandin, 2004) sugere, por sua vez, uma outra lista de dez

contornos, mas distintos dos propostos por Delattre. Em seu inventário, três contornos são

internos à frase entonacional (ascendente, ascendente-descendente, descendente), incorporando

os contornos continuativos e os que se realizam sobre domínios focais estreitos. Os sete outros

são contornos relacionados ao final da frase entonacional. A descrição destes últimos envolveria

dois fatores, um tipo de tom e uma direção. A autora sugere três tons (alto (H), baixo (L) e médio

(M)) e quatro direções (ascendente, ascendente-descendente, descendente e descendente a partir

do penúltimo pico). Marandin (2004) e Marandin et al. (2004) admitem um outro inventário,

embora em sintonia com a proposta de Post, que será tomado como base para a discussão que se

estabelecerá mais à frente.

Beyssade e Marandin (2007) indicam (como já discutido anteriormente) que, para o

francês, não foi possível identificar um significado para cada tom nos contornos, como foi

possível fazer para o inglês (Pierrehumbert, 1980). No inglês, os constituintes dos contornos

assumem um status morfêmico, o que significa dizer que os diversos acentos de pitch e tons de

fronteira apresentam o mesmo significado nos diferentes contornos em que ocorrem como

constituintes. Assim, é possível, nessa língua, uma abordagem composicional do significado de

um contorno. Beyssade e Maradin reportam que, no francês, não foi possível, por exemplo,

identificar o mesmo significado para os acentos de pitch H* ou HL* em contornos finais ou não-

finais. O que parece é que esses acentos apresentam apenas uma função demarcativa nos

contornos não-finais. O esforço dos autores foi canalizado na consideração dos contornos como

sendo unidades de significado básico da entonação.

Para a caracterização prosódica da língua francesa, é preciso considerar, inicialmente, que

a acentuação apresenta duas características essenciais. Em primeiro lugar, ela não surge do nível

lexical, mas do sintagmático, o que significa dizer que, em um enunciado, nem sempre a última

sílaba das palavras lexicais será acentuada. Em segundo lugar, o acento não apresenta uma

função distintiva, como ocorre no inglês, mas demarcativa: em uma palavra lexical, ele ocorrerá

na última sílaba (Delais-Roussarie, 2000). Com isso, a acentuação no francês é analisada a partir

do sintagma fonológico, cuja formação é definida por Selkirk (1986, como citado por Delais-

Roussarie, 2000) nos seguintes termos:

“Dans une représentation syntaxique de type X-barre, une frontière de syntagme

phonologique est insérée à la droite de toute tête lexicale de projection maximale qui

n’est pas en position de spécifieur. La paramètre utilisé est: ]Xtête.”20

Assim, a segmentação do enunciado “Les jeunes enfants regardent un film grec”21

se apresenta

da seguinte forma:

(27) Les jeunes enfants]Xtête regardent]Xtête un film]Xtête grec]Xtête

20 Numa representação sintática do tipo X-barra, uma fronteira de sintagma fonológico é inserida à direita de toda

cabeça lexical de projeção máxima que não esteja em posição de especificador. O parâmetro utilizado é ]Xcabeça. 21 As crianças estão vendo um filme grego.

Beyssade e Marandin (2007) assumem três níveis de fraseamento para o francês. O

primeiro nível seria o das frases acentuais, determinador da localização do acento (stress); o

segundo seria o nível das frases maiores, que consistiria em uma ou várias frases acentuais; e o

terceiro nível seria o da frase entonacional, consistindo em uma ou várias frases maiores.

Embora não seja determinada lexicalmente no francês, a proeminência pode ser determinada

pelo fraseamento prosódico, como já indicado anteriormente (cf. Martin, 2002).

A natureza fonológica do acento, no francês, se reflete na percepção que os usuários da

língua têm do posicionamento do acento lexical nas palavras. Nesse tocante, Vaissière (1997)

identifica a dificuldade que os francófonos apresentam em perceber as proeminências no francês

e nas outras línguas, por conta da ausência, no francês, do acento de palavra fonológica. A noção

de acento de palavra não se mostra como uma realidade na consciência do falante francês

monolíngüe, o que normalmente faz que ele não consiga perceber esse acento também nos outros

idiomas. O estudo de Mora et al. (1997-1998:111), em que se comparou a forma como

hispanófonos e francófonos percebem o acento lexical espanhol, evidenciou que os acentos

lexicais foram bem detectados tanto pelos participantes espanhóis (89,59%) quanto pelos

participantes franceses (87,40%). De uma forma geral, portanto, os acentos seriam percebidos no

lugar ocupado pelo acento lexical. O estudo evidenciou que ocorre o deslocamento do acento à

esquerda ou à direita tanto para um grupo quanto para o outro, assim como a adição de acentos à

esquerda ou à direita de um acento lexical percebido de forma correta. No entanto, foi verificada

uma tendência dos francófonos em deslocar à direita o acento percebido (79,13% dos casos), e

dos hispanófonos em produzir esse deslocamento à esquerda (70,37% dos casos), a diferença

entre os dois grupos mostrando-se significativa (Chi2

, df1 = 48,02; p = .0001). A mesma

tendência foi verificada em relação aos acentos adicionados. Entre os acentos adicionados pelos

francófonos, 86,96% foram à direita do acento lexical; pelos hispanófonos, 72,53% foram à

esquerda, sendo também essa diferença significativa (Chi2

, df1 = 27,19; p = 0,0001).

Uma análise possível para esses resultados pode ser feita a partir do efeito da duração

silábica sobre a F0. Prieto et al. (1995, citados por Mora et al., 1997-1998:111) indicam que

quanto mais longa for a sílaba acentuada, mais o pico da F0 será tardio. A tendência dos sujeitos

francófonos envolvidos nos testes em deslocar o acento à direita, associada às características

acentuais do francês (que, como comentado acima, não apresenta o acento de palavra

fonológica), receberia um reforço das manifestações acústicas do acento lexical em espanhol,

colocado em relevo, também, por um pico da F0 sobre a sílaba pós-acentual. A combinação

desses dois fatores teria sido a responsável pela tendência ao deslocamento dos acentos à direita.

Quanto à disposição dos hispanófonos em deslocar o acento à esquerda, parece haver

uma tendência a que o acento espanhol induza um alongamento da sílaba sobre a qual ele recai,

assim como uma variação da F0 que, para atingir seu valor máximo de elevação na sílaba

acentuada, deve iniciar sua ascensão na sílaba anterior (Mora, 1996, segundo Mora et al., 1997-

1998:112). Pela observação de Beaugendre e Hermes (1996:184, segundo Mora et al., 1997-

1998:112), haveria uma ligação entre a noção de acentuação e a percepção de uma variação

melódica bem no início do movimento. O correlato acústico da sensação de acentuação estaria

nessa variação melódica, ainda que singela, no início do movimento da F0.

Uma vez que a percepção das flutuações da freqüência fundamental parece variar em

função do comportamento prosódico da língua em questão, não é despropositado, portanto,

imaginar que a percepção dos contornos entonativos também sofra influência desses fatores.

Talvez seja essa uma explicação para Beyssade e Marandin (2007) não terem conseguido

identificar um significado para cada tom nos contornos do francês, como comentado

anteriormente.

Marandin (2004; Beyssade et Marandin, 2007) admite, para o francês, quatro contornos

finais básicos, caracterizados pela direção gerada pelo acento de pitch. No seu entender, esses

contornos são decomponíveis em tons, segundo o esquema a seguir.

(28) a Contorno descendente: H- ... L* (T%)

b Contorno ascendente: L- ... H* (T%)

c Contorno ascendente-descendente (sic): L- ... LH* (T%)

d Contorno descendente a partir de um penúltimo pico: L- ... H+L* (T%)

A idéia mais ampla seria a de que o contorno descendente (ou, no caso, o tom L

relevante) não estaria associado à asserção, mas a asserções consideradas “prototípicas”, a

interrogações ou a ordens. Por outro lado, o contorno não-descendente, como caracterizado pelas

formulações (b), (c) e (d), no esquema acima, não estaria associado à interrogação, mas a

elocuções com um valor discursivo marcado. Assim, uma elocução em forma declarativa poderia

apresentar um valor interrogativo com qualquer um desses quatro contornos finais, inclusive o

contorno descendente. O que se constata, então, é que nenhum dos contornos finais seria

associado especificamente à natureza interrogativa, da mesma forma que nenhum deles também

seria associado à natureza assertiva.

Para Marandin (2004), os contornos finais são aqueles associados à porção da extrema

direita dos domínios focais. Neles, o acento de pitch se situa na sílaba mais à direita da unidade

lexical mais à direita no domínio. Nessa localização, existe a possibilidade de uma configuração

em que a fronteira direita dos domínios focais coincide com a fronteira direita da sentença – nas

elocuções com foco amplo; e uma outra configuração em que a fronteira direita dos domínios

focais coincide com a fronteira direita do constituinte que contribui para o foco – nas elocuções

com foco estreito. Os contornos não-finais, por sua vez, estariam ancorados nas frases maiores

(cf. a caracterização dos três níveis de fraseamento no francês, acima), correspondendo a frases

prosódicas terminando com uma elevação continuativa.

Observações a partir de resultados empíricos evidenciam que, no francês, o contorno de

uma asserção prototípica, ou seja, uma sentença declarativa em que o locutor realmente acredita

no que está dizendo e em que o ouvinte é induzido a acreditar no conteúdo enunciado, é

produzido regularmente como um contorno descendente. Uma questão de confirmação

prototípica, ou seja, uma sentença declarativa que solicita uma resposta da parte do ouvinte de

uma forma que pareça ser idêntica ao que as interrogativas fazem, apresenta um contorno

ascendente ou ascendente-descendente. Evidentemente, o inverso dessa descrição também se

observa, ou seja, é possível que uma asserção seja produzida com um contorno ascendente e que

questões de confirmação sejam produzidas com um contorno descendente, embora com menor

freqüência, pelo fato de que os contextos em que esses contornos seriam apropriados se mostram

também menos freqüentes (Marandin, 2004). Marandin (2004) considera os contornos

descendentes como sendo aqueles em que não se observa elevação alguma da F0 no núcleo do

contorno, e a queda da curva melódica se dá ou sobre os últimos grupos rítmicos da elocução, ou

apenas sobre o último grupo rítmico. Os contornos não-descendentes, portanto, são os que

apresentam uma elevação da F0 em seu núcleo.

Um exemplo de contorno descendente, no francês, é o “contorno nananère”,

caracterizado por uma queda estilizada da F0 a partir de seu penúltimo pico. A sugestão desse

contorno é a de que o locutor estaria pronto para revisar seu comprometimento na interação com

o interlocutor. Além desse significado principal, o “contorno nananère” produziria um efeito

secundário de humor ou ironia. A idéia é a de que a elocução emitida é considerada contenciosa,

mas ao mesmo tempo o locutor se mostra pronto para rever seu comprometimento em relação ao

conteúdo da elocução ao interagir com o ouvinte. O efeito humorístico seria decorrente do fato

de que o locutor estaria pronto para concordar com o ouvinte: uma vez que o contorno indica a

disponibilidade do locutor em revisar sua crença em relação ao que está sendo enunciado, um

possível comentário feito pelo interlocutor seria aceito sem dificuldade. O efeito irônico, por

outro lado, seria originado no fato de que o locutor não estaria nem um pouco disposto a

concordar com o ouvinte: uma vez que, com o contorno utilizado, o locutor estaria

hipoteticamente disposto a revisar sua crença no que acaba de ser enunciado, o efeito irônico

decorre do fato de o locutor, na verdade, não apresentar essa disponibilidade. Marandin (2004)

indica que, quando usado por crianças, esse contorno é irônico e brincalhão. A configuração

prosódica para a frase (3.1) Bien sûr que j'te crois, Marie va arriver (Claro que eu acredito em

você, Maria vai chegar), a que foi aplicado o “contorno nananère” em laboratório, seria ilustrada

pela figura 3.1.

Figura 3.1 – O “contorno nananère” aplicado à frase Bien sûr que j'te crois, Marie va arriver (Claro que eu acredito

em você, Maria vai chegar) (Marandin, 2004).

Na sua caracterização de dez contornos para o francês, Delattre (1966) observa que três

dos contornos com configuração descendente, associados à asserção, à ordem e à exclamação,

não apresentam diferenciações claras uns dos outros. O debate ainda se desenvolve quanto a

saber se esses contornos seriam realmente distinguíveis. O que parece inquestionável é não

serem eles distinguíveis quanto aos níveis ou configurações da F0 (Marandin et al., 2004). O

contorno descendente que Delattre chama de “finalidade” corresponde ao contorno descendente

de uma elocução longa que possibilita a divisão da porção esquerda da elocução em contornos

continuativos. Esse contorno é verificado tanto em elocuções assertivas como em qualquer um

dos três tipos de elocuções elencados por Delattre (ordem, interrogação e exclamação). Como

Marandin (2004) indica, seria uma família de quatro contornos descendentes, não distinguíveis

entre si em termos de força ilocucionária.

Quanto aos contornos ascendentes, parece haver vários tipos. A constatação de Marandin

(2004) no corpus utilizado é a de que dois são mais freqüentes: um seria caracterizado por um

platô baixo e uma elevação acentuada na última sílaba; o outro apresentaria a elevação da F0 de

forma linear até a última sílaba. Em princípio, eles estariam em variação, uma vez que não

apresentam contraste semântico. Já foi sugerido que talvez o contraste no formato da elevação

possa ser distintivo, por exemplo, entre asserções e interrogações, mas o que parece mais certo é

não haver uma correlação estrita entre um formato ascendente e um tipo de significado.

Grundstrom (1973:50, em citação de Beyssade e Marandin, 2007) indica não ter sido possível

identificar um contorno essencialmente distintivo no sentido de que cada ocorrência sua

estivesse necessariamente associada a uma questão22

. A ascensão da F0 seria a marca mais

evidente de uma questão, mas esse movimento nem sempre corresponderia a uma questão.

Vaissière (1997) também apresenta as interrogativas como podendo ser retratadas tanto por

contornos ascendentes quanto por contornos descendentes. No entender de Zwanenburg (1965,

também citado por Beyssade et Marandin, 2007), um contorno assume um determinado valor

apenas quando em combinação com outros elementos da elocução num determinado contexto e

numa determinada situação.

Ainda no âmbito dos contornos ascendentes, é possível a caracterização dos chamados

contornos continuativos. Delattre (1966) e Rossi (1981) (citados por Portes, 2005:142) fazem a

distinção de dois tipos diferentes, um contorno continuativo menor e um contorno continuativo

maior. Essencialmente, ambos apresentam os mesmos movimentos ascendentes, sendo

distinguidos pelo valor máximo atingido pela F0, mais baixo no continuativo menor e mais alto

no continuativo maior. A continuação maior teria o papel, sob um ponto de vista funcional, de

agrupar várias continuações menores em uma unidade maior, na condição de que essa unidade

maior não corresponda ao fim da frase.

22 De forma semelhante, quando comentam a escolha de um contorno para expressar uma determinada atitude,

Pierrehumbert e Hirschberg (1990:284) sugerem que a atitude é melhor entendida como sendo derivada de um

significado entonativo interpretado em um certo contexto, ao invés de ser considerada como representante daquele

significado em si mesmo. Em outras palavras, um mesmo contorno entonacional pode sugerir atitudes diferentes,

segundo o contexto em que se insira.

Figura 3.2 – A continuação maior agrupando várias continuações menores em uma unidade maior (Portes, 2005).

Globalement il réalise pas trop, l’état dans l(e)quel il est (Globalmente, ele não realiza muito, no estado em

que se encontra).

Para o contorno final no francês, Beyssade e Marandin (2007) propõem uma análise que

privilegia a interação discursiva entre os interlocutores. A escolha de um contorno possibilitaria

ao locutor indicar como ele antecipa a recepção da elocução por parte do ouvinte. Essa

abordagem, portanto, se basearia na imagem que o locutor constrói em relação às crenças do

ouvinte quanto ao assunto em questão, nos termos apresentados acima em relação ao “contorno

nananère” e discutidos como a seguir.

O uso de um contorno descendente sugeriria que o locutor estaria apresentando sua

elocução como não-controversa, além de indicar que não estaria esperando nenhuma revisão ou

questionamento em relação ao conteúdo de sua enunciação. Por outro lado, se o locutor fizesse

uso de um contorno não-descendente, estaria sendo antecipado um possível conflito entre sua

crença (como sugerido pelo conteúdo de sua enunciação) e a crença do ouvinte em relação ao

que estaria sendo dito. O uso de um contorno ascendente, embora antecipando que a crença do

locutor quanto ao conteúdo da enunciação talvez não seja compatível com o que assume ser a

crença do ouvinte, também indicaria que o locutor não estaria pronto para rever sua posição em

relação ao assunto. Ainda, o uso de um contorno descendente a partir de um penúltimo pico da

F0 indicaria, nesse caso, que o locutor antecipa uma possível necessidade de revisão de seu

posicionamento em relação ao conteúdo enunciado.

Beyssade e Marandin (2007) citam três trabalhos que assumem a noção do

comprometimento como sendo indicada pelos contornos também no inglês. Bartels (1999),

considerando a questão do comprometimento do locutor ou do ouvinte em relação ao enunciado

da elocução numa abordagem composicional dos contornos, indica que o tom de frase L-

assinala o comprometimento do locutor. Gunlogson (2001), numa abordagem holística e restrita

à análise das declarativas, sugere que os contornos descendentes indicam o comprometimento do

locutor, e os contornos ascendentes, o comprometimento do ouvinte. Steedman (2003) reformula

esta última hipótese e analisa a entonação em termos do comprometimento do locutor e a

atribuição, por parte do locutor, de comprometimento ao ouvinte. Esse tipo de generalização, no

entanto, não se aplicaria ao francês, uma vez que uma elocução na forma declarativa pode

sugerir o comprometimento do locutor tanto com um contorno descendente quanto com um

contorno ascendente. O exemplo que Beyssade e Marandin apresentam, transcrito abaixo, indica

que a asserção ascendente compromete o locutor, mas não seu alocutário.

(29) [Contexto: um homem num centro social entrevistado no rádio]

Nous, on est dans des centres d’hébergement. Bon, moi personnellement, j’ai trois

enfants, mais je ne peux pas recevoir mes enfants.23

Figura 3.3 – Asserção ascendente comprometendo o locutor, mas não seu alocutário (Beyssade e Marandin, 2007).

Como a definição de “comprometimento” (commitment) em termos de responsabilidade

não estaria ainda muito bem definida, Beyssade e Marandin (2007) sugerem que ela seja

caracterizada como sendo a atribuição pública de uma crença pelo falante a si mesmo. Assim, o

falante estaria comprometido com p quando ele se atribui publicamente a crença que p. Com essa

caracterização, a definição do comprometimento entrecruza os contrastes presentes na hierarquia

dos contornos franceses. Um locutor, então, se apresenta como comprometido com p ao usar

tanto um contorno ascendente quanto um contorno descendente.

O esquema geral da proposta de contornos para o francês sugerido por Beyssade e

Marandin (2007) se apresenta como na figura 3.4.

23 Moramos num centro social. Bom, pessoalmente, eu tenho três filhos, mas eu não posso receber meus filhos.

Figura 3.4 – Esquema geral dos contornos finais para o francês, segundo Beyssade e Marandin (2007).

3.2. ALGUMAS CARACTERÍSTICAS DO SISTEMA ENTONACIONAL DO PORTUGUÊS

Embora os estudos prosódicos do PB ainda possam ser considerados bastante recentes,

portanto sem uma tradição estabelecida como em relação ao inglês ou ao francês, alguns

aspectos da entonação modal (cf. Aubert e Hochgreb, 1981; Hochgreb, 1983; Moraes, 1984,

1991; Gebara, 1976) e do acento lexical (Fernandes, 1976; Moraes, 1987, 1995a, 1995b; Leite,

1974; Costa, 1978), como citado por Moraes (1998:179), já apresentam uma boa sustentação (cf.

também, para a relação prosódia-sintaxe no PB, Freitas, 1995; Gonçalves, 1997; Orsini, 2003).

Ainda é necessário que a pesquisa se dedique intensamente à relação da prosódia com a sintaxe,

mas também com a organização informacional e com a análise conversacional.

No PB, o acento lexical está estreitamente ligado à posição que a palavra ocupa ao longo

da elocução. É possível, também, que ele varie de acordo com o padrão acentual da palavra,

embora de forma menos significativa. Como Moraes (1998:180) indica, caso a palavra se

localize dentro de um grupo prosódico, o que caracteriza uma posição fraca, a marcação do

acento se colocará como uma combinação da intensidade e da duração.

Normalmente, quando é necessário destacar uma sílaba com fins expressivos em uma

enunciação, a F0 dessa sílaba sofre uma elevação significativa em relação à média verificada ao

longo da frase. Segundo Vaissière (comunicação pessoal), é bastante comum no francês que, ao

invés de elevar o pico da F0 em uma sílaba, o locutor rebaixe o nível global da F0 ao longo da

enunciação, e mantenha o pico da F0, na sílaba a ser destacada, no nível em que normalmente

entoaria essa enunciação. Assim, não se altera o padrão médio de variação da curva melódica,

preservando-se o valor máximo normalmente atingido, e conseguindo-se o efeito de destaque

sobre a sílaba. Pode-se fazer uma analogia entre esse comportamento verificado no francês para

a F0 em conjunto com o comportamento da intensidade, e a duração, no PB, para a

caracterização da proeminência acentual. Moraes (1998:180) indica que a intensidade,

diferentemente da duração, diminui na sílaba pós-tônica, ao invés de aumentar na sílaba tônica.

Ainda, se uma palavra oxítona se encontrar em uma posição fraca ao longo da enunciação, não

será detectada, via de regra, nenhuma pista acústica explícita para esse acento. O efeito

psicoacústico gerado por essa característica é bastante interessante: numa seqüência de sílabas

dentro de um grupo prosódico, o acento (stress) será percebido como descendente na sílaba final

caso as sílabas do grupo sejam entoadas com um peso prosódico constante. Já no final de um

grupo prosódico, ou seja, em uma posição forte, a freqüência fundamental se associaria à

duração e à intensidade como uma pista acentual. Isso parece decorrer do fato de que, numa

posição forte, o acento (stress) no nível frasal ou sentencial se superimpõe ao acento lexical.

No PB, tanto a freqüência fundamental quanto a duração e a intensidade são utilizadas na

demarcação da sílaba acentuada em uma palavra. Em níveis mais elevados, como o frasal ou o

sentencial, a freqüência fundamental se mostra como o principal correlato do acento, além de se

colocar como uma pista adicional para o acento lexical numa posição forte. No sistema

entonativo do PB, uma sílaba acentuada sempre contará com um movimento de pitch, com o seu

formato variando de acordo com o padrão entonativo imposto à elocução. O estudo de Moraes e

Espesser (1988) indicou a existência de uma hierarquia para a importância dos correlatos

acústicos relacionados à marcação da sílaba acentuada: quando em posição final na elocução, a

F0 é a marca mais característica do acento, seguida pela duração e, somente depois, pela

intensidade.

Quando se pensa a caracterização do acento secundário, ele ocorrerá, no PB, sempre

sobre uma sílaba pré-tônica. Verifica-se uma regra de alternância rítmica entre sílabas fortes e

fracas, contadas da direita para a esquerda a partir da sílaba tônica final (doravante, STF). Essa

alternância rítmica será a responsável direta pela localização do acento secundário. Como

exemplo, Moraes (1998:181) apresenta a forma verbal infinita “aproximar” e seu substantivo

derivado “aproximação”. Ambos os vocábulos são oxítonos. Na forma verbal, o acento

secundário recai sobre a sílaba <pro>; no substantivo, verificam-se dois acentos secundários,

sobre as sílabas <a> e <xi> (esta última, em ambos os casos, realizada como [si]). Na

representação abaixo, “F” indica um acento forte, e “f”, um acento fraco.

(30) (a) a `pro xi mar (forma verbal)

f F f F

(b) `a pro `xi ma ção (substantivo)

F f F f F

Um papel consideravelmente importante que pode ser atribuído aos acentos nos níveis

frasal e sentencial e no nível da palavra diz respeito à caracterização da coesão sintática

estabelecida entre os termos de uma enunciação. Verifica-se que os constituintes que se

mostrarem dominados por um mesmo acento estarão numa relação de maior coesão sintática do

que os que apresentarem acentos diferentes (Moraes, 1998:182). Caso se considere, por exemplo,

uma relação de coordenação entre dois verbos numa elocução, por um lado, e uma relação de

subordinação entre um verbo e seu complemento, por outro, o comportamento prosódico tanto

das formas verbais quanto do complemento refletirá a relação de independência ou de

dependência sintática estabelecida entre uns e outros. A expectativa é a de que, tanto no nível da

palavra quanto no nível frasal, as características prosódicas com que os verbos se realizem numa

elocução sejam semelhantes caso esses verbos estejam em relação de coordenação. Assim, as

curvas melódicas, por exemplo, apresentariam a mesma configuração, atingindo o mesmo nível

de pico em ambas as formas verbais. Já a configuração prosódica do complemento verbal se

mostraria diferente da configuração do verbo, refletindo a subordinação: muito provavelmente, a

média da F0 até o verbo seria maior do que a média no complemento, para citar apenas um

aspecto prosódico dessa diferenciação. Moraes (1998:191) demonstra esses comportamentos

com um exemplo em que o tamanho dos constituintes acaba por determinar a existência e a

localização de alguns acentos:

As variações (a) e (b) acima apresentam padrões acentuais idênticos, embora os padrões

melódicos sejam diferentes. O primeiro ponto a observar é a amplitude da variação de pitch na

sílaba <ti>, em “ser combaTIdo”: ela é maior em (a) do que em (b). Na variação (a), essa

amplitude tem o mesmo peso que sobre a sílaba <ci> em “esqueCIdo”, o que implica dizer que

os dois constituintes (“ser combatido” e “ser esquecido”) estão num mesmo nível sintático, ou

seja, estão coordenados entre si. Na variação (b), a amplitude da variação de pitch sobre a sílaba

<ten>, em “incompeTÊNcia”, apresenta um peso maior que sobre a sílaba <ti>, em

“combaTIdo”. Essa diferença de amplitude indica que os constituintes “ser combatido” e “por

sua incompetência” mantêm uma relação de subordinação, isto é, de dependência, entre si.

Com isso, percebe-se que a segmentação de uma elocução em grupos prosódicos é um

elemento extremamente significativo para a organização sintática. A localização dos acentos de

frase ou de sentença tornará possível, como em várias línguas, a desambigüização de enunciados

como os seguintes, sugeridos por Moraes (1998:191):

(32) A profeSSOra de prosódia brasiLEIra.

(33) A professora de proSÓdia brasiLEIra.

Na frase (32), a interpretação é a de que a professora ensina a prosódia brasileira; na frase (33),

trata-se de uma professora de prosódia que é brasileira.

No PB, os acentos de frase e de sentença se sobrepõem ao acento lexical caso a sílaba

acentuada coincida com uma sílaba acentuada (stressed) de uma palavra. Por outro lado, não é

possível que uma sílaba não-acentuada venha a receber acento ao longo de uma elocução, a não

ser que se procure enfatizar um morfema, caracterizando-se, assim, um uso metalingüístico

(Moraes, 1998:182). É o que ocorre no exemplo a seguir:

(34) Ele falou em IMportar, não em EXportar.

Esse mesmo procedimento pode ser verificado em relação ao uso das palavras

gramaticais. No PB, a diferença de tonicidade pode caracterizar um par mínimo, como por

(preposição) e pôr (verbo). A preposição por é uma palavra gramatical e, devido ao seu papel

como conector entre palavras de uma elocução, não é acentuada. Essa mesma função impede que

as palavras gramaticais sejam utilizadas em fim de unidade sintática. A única possibilidade de

essas partículas serem acentuadas ocorre quando são usadas de forma metalingüística, no mesmo

procedimento indicado para a ênfase dos morfemas, no exemplo acima. Observe-se o exemplo

abaixo, em que as preposições passam a ser acentuadas (Moraes, 1998:182):

(35) Você disse DE ou PAra?

Da mesma forma que em várias outras línguas, também o PB apresenta um padrão

entonativo com a média de pitch mais elevada para as sentenças interrogativas do que para as

declarativas. Embora, algumas vezes, o ordenamento das palavras ou partículas gramaticais

possa ser um fator identificador da modalidade interrogativa, é a entonação que desempenha esse

papel de forma predominante (Hochgreb, 1983; Moraes, 1984, citados em Moraes, 1998:184).

Uma questão total é evidenciada pela elevação de pitch na última sílaba acentuada. Na

diferenciação entre essa modalidade interrogativa e a modalidade declarativa, Moraes indica

ainda dois outros contrastes como potencialmente pertinentes. Numa questão total, o pitch inicial

se mostra ligeiramente mais elevado do que nas declarativas, assim como, na sílaba pré-tônica

final24

(doravante SPreTF) da questão total, ele se mostra mais baixo do que na SPreTF das

declarativas. Isso significa dizer que o contraste criado na STF será muito maior. E ainda, o que

se perceberá é que uma sílaba pós-tônica (caso exista) numa declarativa apresentará o pitch ainda

mais baixo do que na interrogativa.

Essas marcas melódicas verificadas nas sílabas inicial e pré-tônica de uma sentença

interrogativa total podem ser percebidas como indícios antecipatórios da modalidade em que a

elocução será produzida, como indica Fónagy (Fónagy e Galvagny, 1974; Fónagy 1981, segundo

Moraes, 1998:185). Os experimentos realizados por Moraes (1984) a partir de ressínteses, no

entanto, evidenciaram que é sobre a STF que a diferenciação entre as modalidades interrogativa

e declarativa efetivamente ocorre. Os resultados evidenciaram que as oposições promovidas pela

entonação modal não se localizam de forma dispersa sobre a elocução, mas sobre pontos

específicos; e que a interpretação da modalidade da sentença sofre variação em pontos

perfeitamente definíveis ao longo do contínuo dos níveis de altura.

Para que uma elocução seja percebida como interrogativa, é preciso que a média da

elevação de pitch na STF esteja acima do nível melódico médio da sentença. Caso isso não

ocorra, mesmo com a elevação na STF, a elocução será percebida como declarativa. De forma

inversa, se houver uma queda no pitch da STF, mas a média de pitch da sentença permanecer

24 Ao se considerar a sílaba pré-tônica final como um referencial na composição de um contorno prosódico, está-se

em sintonia com a abordagem composicional hierárquica, quer do tipo proposto pela Escola Britânica, formado por

uma pré-cabeça (prehead), uma cabeça (head), um núcleo (nucleus) e uma coda (tail); quer do tipo proposto por Di

Cristo (ambos citados por Di Cristo, 2004:117), em que a Unidade Entonativa é dividida em elementos denominados

ataque, pretônica e tônica. Como será observado ao longo do capítulo 4 e subseqüentes, essa sílaba é também

tomada como referencial nesta pesquisa.

elevada, a elocução será interpretada como uma questão total. Em relação à importância da

SPreTF, os experimentos de Moraes (1998:186) a partir da ressíntese de uma enunciação

assertiva com uma sílaba pré-tônica rebaixada (típica, portanto, da questão total) e de uma

questão total com uma elevação de pitch na sílaba pré-tônica (típica de uma frase declarativa)

evidenciaram dois pontos distintos. Em primeiro lugar, a frase interrogativa com a sílaba pré-

tônica modulada como em uma declarativa foi interpretada como questão total por 94% dos

ouvintes, o que caracteriza o papel secundário da STF na produção do efeito interrogativo. Em

segundo lugar, a frase declarativa com a conformação de interrogativa total na sílaba pré-tônica

(ou seja, com rebaixamento de pitch) foi interpretada pela metade exata dos ouvintes como sendo

declarativa e pela outra metade, como questão total.

Como mencionado mais acima, as pistas prosódicas presentes no início de uma elocução

podem sugerir tratar-se ela de uma interrogação ou não. Um outro exemplo no PB, em que o

comportamento prosódico pode ser percebido como índice de predição de uma modalidade

interrogativa, é a elevação de pitch a um nível mais alto na sílaba acentuada que preceda a

partícula alternativa “ou”, sugerindo tratar-se de uma questão alternativa. No exemplo a seguir,

Moraes (1998:187) assume que a elevação verificada sobre a sílaba <do> já antecipa o sentido da

questão alternativa.

Embora não haja indicação em Moraes, parece que a elevação de pitch nessa sílaba deve ser

consideravelmente maior que a elevação necessária para produzir uma questão total. Esse nível

mais elevado que o pico da F0 atinge nessa sílaba <do> é que talvez seja responsável pelo valor

preditivo da questão alternativa em comparação com a questão total.

A noção de tema (relacionada ao já-dado, ou seja, o assunto em questão) e o rema

(relacionada ao novo, ou seja, a nova informação prestada sobre o assunto em questão) é

caracterizada melodicamente também no PB. O rema apresenta o movimento melódico na sílaba

acentuada final, podendo ser uma descida, no caso de uma sentença declarativa, ou uma subida,

no caso de uma questão total. Já o comportamento melódico do tema dependerá de seu

posicionamento na elocução. Como Moraes (1998:188) indica, caso o tema preceda o rema,

haverá um contraste entre os dois padrões melódicos, com uma elevação de pitch na sílaba

acentuada final, caso se trate de uma assertiva, ou com uma queda final, caso se trate de uma

questão total. Por outro lado, se o tema ocorrer após o rema, o padrão melódico utilizado sobre o

tema reproduzirá o que foi precedentemente utilizado sobre o rema, com uma queda, se se tratar

de uma assertiva, e uma subida, se se tratar de uma questão total.

Esse comportamento prosódico identificador das noções de tema e rema, no PB, parece

estar também na base de certas distinções de funções gramaticais organizadas de formas

diferentes segundo a hierarquia das informações apresentadas. Como já foi discutido

anteriormente (cf. as relações de coordenação e subordinação), é freqüente que se confundam as

noções de causalidade (no binômio causa-conseqüência25

) e de explicação. Essas relações se

estabelecem, respectivamente, no campo da subordinação e da coordenação. As duas variações

apresentadas a seguir ilustram essa problemática (Moraes, 1998:189) .

(37) a.

Em (37a), observa-se uma ordem neutra para a informação, em que “ele saiu logo” é a

informação dada (tema) e “porque tinha muito o que fazer” é a informação nova (rema). Trata-

se, nesse caso, do processo de subordinação, em que a oração principal (que contém o tema)

apresenta a conseqüência para a causa informada na oração subordinada (que contém o rema).

Observe-se que existe uma elevação de pitch sobre a STF da oração principal/tema, sugerindo

uma continuidade, nos mesmos modelos do padrão continuativo anteriormente discutido para o

francês.

25 Di Cristo (2004:115) indica que, nos parâmetros da análise do discurso, a interpretação das funções da prosódia

sugere que as significações conferidas às enunciações pelas unidades entonativas derivam das relações sintagmáticas

que elas contraem. Como exemplo, apresenta o enunciado

Marie est infidèle, Pierre boit (Marie é infiel, Pierre bebe),

que pode sugerir a noção de causa a uma das orações (por conseguinte, cabendo à outra a noção de conseqüência).

Caso se verifique a seqüência prosódica [Implicação + Parêntese baixo], a inferência será a de que Marie é infiel

porque Pierre bebe, enquanto que a seqüência [Parêntese baixo + Implicação] sugerirá que Pierre bebe porque Marie

é infiel.

Em (37b), a informação mais importante (rema) está contida na primeira oração.

Observe-se que o movimento de pitch na STF dessa oração é descendente, o que poderia ser

analisado como o término da informação relevante no contexto comunicativo. A segunda oração

apresentaria, assim, uma informação suplementar, que não se enquadraria na relação

(necessariamente subordinativa) entre conseqüência e causa. Trata-se, nesse caso, da

evidenciação do processo de coordenação.

Outra situação em que o padrão entonacional será responsável por distinguir entre duas

interpretações, ainda nesse âmbito da coordenação/subordinação, diz respeito à presença de uma

negação na oração principal seguida de uma oração adverbial que exprima razão. Como indica

Moraes (1998:189), o mesmo ocorre também no francês e no inglês. Observem-se as variações a

seguir.

(38) a.

Existe um comportamento diferente do locutor, considerando-se a segunda enunciação de

cada variação acima, em relação ao que fora enunciado anteriormente. Em (38a), a ordem da

informação é neutra, da mesma forma que em (37a), como discutido acima: o tema se posiciona

antes do rema. O que se percebe com essa enunciação é que o locutor não foi à casa do outro. Já

em (38b), o que se percebe é a contestação da afirmação anterior. Observe-se que o elemento

negativo “não” se destaca do restante da elocução por meio do movimento de pitch. O

comportamento prosódico indica, assim, que a nova informação, ou seja, o rema, está

posicionada sobre esse elemento negativo. Na interação entre os dois locutores, o segundo deseja

informar que ele não foi à casa do outro, sem dúvida, mas não em decorrência da chuva (um

outro motivo o teria impedido).

Esse último exemplo reflete também um efeito contrastivo entre as informações. Moraes

(1998:190) caracteriza o perfil das elocuções apresentando ênfase contrastiva, no PB, da seguinte

forma:

a) verifica-se um pitch baixo sobre a sílaba acentuada da palavra enfatizada;

b) o pitch da sílaba imediatamente anterior à sílaba acentuada será alto, produzindo-se um

contraste entre essas duas sílabas;

c) a parte da elocução que preceder a palavra acentuada apresentará o mesmo padrão

entonacional que o de uma sentença declarativa neutra, e o que se seguir ao ponto de ênfase

será pronunciado com um tom baixo parentético;

d) a sílaba acentuada (stressed) da palavra acentuada apresentará maior intensidade e maior

duração.

Comparem-se os exemplos (39a) e (39b) (Moraes, 1998:190 e 191). Em (39a), observa-se

o efeito contrastivo sobre uma única palavra. Em (39b), o contraste se estabelece entre uma

expressão maior do que uma palavra e uma única palavra que foi utilizada na sentença anterior à

do contraste.

(39) a.

No caso de (39b), não foi a “senhora” a pessoa cumprimentada, mas a “garota de preto”.

Embora o acento contrastivo principal esteja sobre a última sílaba tônica do enunciado (<pre>), a

posição elevada do pitch se iniciou na primeira palavra da expressão contrastiva, estendendo-se

até o início da queda final.

4. METODOLOGIA

Adotou-se, para a formação dos corpora utilizados neste trabalho, tanto para o PB quanto

para o FR, a forma canônica do período composto por subordinação, caracterizada por uma

oração principal (doravante OP) seguida de uma oração subordinada adverbial (doravante,

OSAdv). Esta pesquisa assume que os resultados finais obtidos aplicam-se apenas a essa

disposição canônica das orações. Caso se faça a inversão dessas posições, perde-se o efeito da

pré-indicação, uma vez que o período passa a ser iniciado pela própria conjunção. No entanto,

deve-se levar em consideração que algumas categorias apresentam uma disposição a se

posicionarem antes da OP, como é o caso das subordinadas adverbiais condicionais e temporais.

Diessel (2001) propõe, para o grupo de línguas analisadas em seu estudo, a existência de uma

hierarquia no posicionamento da oração adverbial em relação à principal, com a maior

disposição a essa antecipação sendo verificada nas condicionais, seguidas, seqüencialmente,

pelas temporais, pelas causais e pelas finais (as outras cinco categorias presentes no português

não foram contempladas: como é possível perceber, não há uma uniformidade para essa tipologia

entre as diversas línguas). As orações subordinadas adverbiais finais seriam, nessas línguas, as

que apresentariam a maior disposição à posposição. O mesmo se aplica para o inglês e,

possivelmente, também para o PB e o FR, embora não tenha sido encontrada confirmação para

Ao que parece, as orações subordinadas adverbiais são pré-indicadas, no caso do PB, por

conformações prosódicas próprias de cada uma de suas nove subcategorias (cf. as figuras 4.1 e

4.2, mais à frente). Essas conformações prosódicas, projetadas sobre as OPs, aplicam-se, em

princípio, apenas quando observada a ordem canônica discutida acima. Assim, caso a OSAdv se

posicione após a OP, a tendência deverá ser a de que sua F0 apresente uma conformação

semelhante para todas as subcategorias, com possível elevação acentuada sobre o conectivo

(refletindo a ênfase atribuída ao valor semântico) seguida de uma declinação constante (devida a

fatores propriamente fisiológicos; cf. Gussenhoven, 2002a). A OP, posposta à OSAdv, tenderá a

apresentar uma mesma conformação em sua modulação, também refletindo o processo de

declinação natural de uma frase assertiva. Assim, na ordem canônica “oração principal –

(conectivo) oração subordinada adverbial”, caberá à conformação prosódica da OP o papel de

pré-indicar a relação sintático-semântica que se processará com a OSAdv. Caso a OSAdv inicie

o período, a conjunção se responsabilizará por explicitar todo o campo semântico envolvido, e o

componente prosódico perderá essa função.

4.1 A FORMAÇÃO DO CORPUS PARA O PB

Duas orações principais distintas – Ficava infeliz [] e Mostrava-se cansado

[] –, a partir de agora denominadas, respectivamente, OP 1 e OP 2,

constituíram a base do corpus para o PB. A primeira contém seis sílabas fonológicas, que se

reduzem a cinco sílabas fonéticas (Moraes e Leite, 1992), pela elisão de [a] ao se combinarem as

sílabas <va> e <in>; e a segunda, sete sílabas fonológicas, que podem reduzir-se a seis sílabas

fonéticas, pela queda da vogal [] em <se>. A STF ocupa a última posição na OP 1, e a

penúltima, na OP 2.

O objetivo de a OP 2 conter uma sílaba pós-tônica é verificar de que forma a posição da

STF pode interferir no estabelecimento da função pré-indicativa. Como a percepção de variações

na F0 é mais eficaz antes de pausa (Mertens, 2004, citando House, 1990), e normalmente a STF

concentra a expressividade do contorno melódico, uma das hipóteses é a de que o índice de

reconhecimento dos valores pré-indicativos seja mais elevado nas OPs 1 que nas OPs 2. Para a

formulação do Teste 1, conforme será discutido em 4.3.1, as OPs foram isoladas das OSAdvs,

constituindo arquivos sonoros independentes. Como os participantes do teste ouviram apenas as

OPs, estabeleceu-se necessariamente uma pausa após suas últimas sílabas. No caso das OPs 1,

essa pausa seguiu-se imediatamente à STF.

Cada uma das OPs se fez seguir das mesmas nove OSAdvs, como descrito na tabela 4.1.

O objetivo de as duas OPs serem sempre repetidas foi o de poderem constituir pares-mínimos,

quando da formação do Teste 1, como será discutido mais à frente (cf. Chen, 2003).

Em relação aos cinco critérios que Diessel (2001:438, citando Stassen, 1985) utilizou

para classificar as orações adverbiais (cf. capítulo 2), nenhum deles pôde ser aplicado às orações

formadoras desse corpus, porque, no PB: 1) não se verifica uma forma verbal específica, como o

subjuntivo, para as orações subordinadas; 2) não há sufixos marcadores de caso; 3) não há

marcadores de tópico e definidos; 4) a ordem de palavras é bastante flexível; 5) não há restrições

na ocorrência de marcadores de negação, de foco ou de atos discursivos nas orações

subordinadas. No entanto, a confirmação do valor subordinado dessas OSAdvs foi feita pelos

dois critérios pragmáticos e por três dos cinco critérios sintáticos reportados pelo mesmo autor

(437) (dois dos cinco critérios não se mostram pertinentes ao tipo de estruturação utilizada nos

períodos formadores do corpus para o PB), como comentado a seguir.

Oração Principal Relação

Semântica

Oração Subordinada Adverbial

Ficava infeliz

causal porque o trabalho não produzia frutos.

comparativa como uma pessoa que não via resultados.

concessiva embora o trabalho o motivasse.

condicional se os exercícios não fossem adequados.

conformativa conforme convinha a um pessimista.

consecutiva que dava pena ver seu rosto.

final para que todos sentissem pena dele.

proporcional à medida que via seus planos desabarem.

temporal quando não lhe permitiam falar.

Mostrava-se cansado

causal porque o trabalho não produzia frutos.

condicional se os exercícios não fossem adequados.

final para que todos sentissem pena dele.

proporcional à medida que via seus planos desabarem.

Tabela 4.1 – Orações principais e subordinadas adverbiais utilizadas como base para a formação do corpus para o

Quanto aos critérios pragmáticos, em primeiro lugar, as OSAdvs fornecem informações

de segundo plano – a informação central está contida na OP, estabelecendo-se a informação

prestada pela OSAdv como um comentário à contida na OP. Em segundo lugar, percebe-se que

não se pode utilizar, por exemplo, “(para que) todos sentissem pena dele” como ato discursivo, o

que neutraliza o valor ilocucionário da enunciação.

Quanto aos critérios sintáticos, observa-se que:

1) as OSAdvs permitem a inclusão de um pronome catafórico controlado por um nome

correferencial na OP seguinte (Porque o seu1 trabalho não produzia frutos, Paulo1 ficava

infeliz.);

2) as OSAdvs podem ocorrer em posições variadas, relativamente à ordem canônica (Ficava,

porque o trabalho não produzia frutos, infeliz.);

3) as OSAdvs não podem ocorrer com uma pergunta tag (*? Ficava infeliz porque o trabalho não

produzia frutos, produzia?).

Tradicionalmente, a OSAdv consecutiva apresenta a forma combinada tão... que,

responsável por imprimir à OP, que conterá o advérbio de intensidade tão (ou tanto), o valor de

uma causa, que gerará, na OSAdv, sua conseqüência, introduzida pela conjunção que. No

entanto, caso esse advérbio seja utilizado na OP, torna-se ele o responsável – semântico – pela

pré-indicação consecutiva.

Há, no PB, construções populares que eliminam esse advérbio, transferindo a elevação de

F0 que se processaria sobre ele para o termo que ele estaria modificando. Frases como era feio

que dava dó apresentam, via de regra, o ataque da F0 no início de feio, atingindo o seu ápice na

vogal tônica dessa mesma palavra lexical. Optou-se, assim, por eliminar esse advérbio, o que

permitiu a homogeneidade das orações principais do corpus.

A proposta desta pesquisa se restringe ao português falado no Rio de Janeiro. Por tal

razão, todos os dezoito períodos foram gravados por uma locutora carioca, foneticista e

experiente na locução expressiva, em estúdio acusticamente isolado, em mídia digital, utilizando

o programa computacional Sound Forge v. 6.0. Os arquivos sonoros foram registrados em mídia

digital (CD-rom), formato WAV-PCM, mono, 16 bits e 22.050Hz. Para não permitir dúvidas

quanto aos valores semânticos sugeridos por cada uma das orações subordinadas adverbiais,

todos os períodos foram inseridos em contextos que explicitam esses valores semânticos,

conforme indicado no Anexo 1.

A locutora foi gravada três vezes, com direcionamento específico para a expressividade

que se desejava obter em cada um dos períodos. Foram gravados não apenas os períodos para a

formação do corpus, mas também o contexto em que eles se inseriam. A seguir, procedeu-se à

eliminação dos contextos dos arquivos sonoros, de forma a isolar apenas os períodos a serem

testados. As três versões produzidas foram submetidas à apreciação de quatro ouvintes

brasileiros, já iniciados nos estudos prosódicos, para que indicassem, numa escala de 0 a 4, qual

a nota que atribuiriam a cada uma das elocuções, considerando a adequação prosódica ao campo

semântico sugerido pelas conjunções subordinativas. A nota “0” sugeriria que a melodia

utilizada não seria apropriada para aquela frase, e a nota “4”, que ela seria perfeita. Foram

escolhidas, a partir desse julgamento, as elocuções que obtiveram as melhores notas.

Cada uma dessas orações principais selecionadas como referência, detentoras de um valor

pré-indicativo, será denominada, a partir de agora, OP de referência, Caso seja necessário

estabelecer a subcategoria em que se insere, por exemplo, “causal”, será denominada OP causal

de referência. As figuras 4.1 e 4.2 ilustram a F0 das orações principais tomadas como referência

para o PB.

OP 1 causal OP 1 comparativa OP 1 concessiva

OP 1 condicional OP 1 conformativa OP 1 consecutiva

OP 1 final OP 1 proporcional OP 1 temporal

Figura 4.1 – Freqüência fundamental das OPs 1 – Ficava infeliz – para o PB.

Time (s)

0 1.392270

300f i k a v i f e l i

Time (s)0 1.37667

Time (s)

0 1.363610

Time (s)0 1.44771

Time (s)

0 1.446870

Time (s)

0 1.471810

Time (s)

0 1.406050

Time (s)0 1.39587

Time (s)

0 1.34980

300f i ak v i f e l i

Figura 4.2 – Freqüência fundamental das OPs 2 – Mostrava-se cansado – para o PB.

4.2 A FORMAÇÃO DO CORPUS PARA O FR

Da mesma forma que para o PB, foram formadas para o FR duas orações principais

distintas – Il est ennuyé [] (ele está preocupado) e Il se montre irritable

[] (ele se mostra irritado) –, igualmente denominadas, respectivamente, OP 1 e

OP 2. A primeira contém cinco sílabas fonológicas, correspondendo a cinco sílabas fonéticas; e

a segunda, oito sílabas fonológicas, que se reduzem a cinco ou a seis sílabas fonéticas, caso se

verifique a queda da vogal [schwa] em <se> e em <ble>, ou em apenas uma delas. A STF ocupa

a última posição na OP 1, e virtualmente a penúltima, na OP 2. O objetivo dessa escolha é

verificar de que forma a posição da STF pode interferir no estabelecimento da função pré-

indicativa. Da mesma forma que para o PB, como discutido em 4.1, uma das hipóteses é a de que

o índice de reconhecimento dos valores pré-indicativos seja mais elevado nas OPs 1.

Time (s)

0 1.690290

300m o t r a v a s i k a s a d u

Time (s)0 1.66964

300m o t a v s i k a s a d u

Time (s)

0 1.554470

300mo t r a v a s k a s a d u

Time (s)0 1.48351

300m o t a v s k a s a du

Time (s)

0 1.556080

300m o t r a v a s k a s a d u

Time (s)

0 1.557190

Time (s)

0 1.658930

300m o t r a v a s i k a s a d u

Time (s)0 1.53957

300m o t a v s k a s a du

Time (s)

0 1.565710

Cada uma dessas OPs se fez seguir das mesmas nove OSAdvs, como descrito na tabela

Oração Principal Relação

Semântica

Oração Subordinada Adverbial

Il est ennuyé

[Ele está preocupado]

causal car le marché du travail est très exigeant. [porque o mercado de trabalho é muito exigente.]

comparativa comme s‟il allait échouer à tous ses examens.

[como se ele fosse fracassar em todos os

exames.]

concessiva alors que tous les résultats sont positifs.

[embora todos os resultados sejam positivos.]

condicional si les exercices ne lui sont pas adaptés.

[se os exercícios não lhe são adaptados.]

conformativa d’après ce qu‟a dit la petite fille de sa voisine.

[conforme disse a filha da vizinha.]

consecutiva du coup il est désagréable avec ses amis.

[a ponto de ser desagradável com seus amigos.]

final pour obtenir une autorisation de sortie.

[para obter uma autorização de saída.]

proporcional à mesure qu‟il voit ses plans professionnels

échouer.

[à medida que vê seus planos profissionais

fracassarem.]

temporal après avoir travaillé des heures sans comprendre.

[depois de ter trabalhado horas sem

compreender.]

Il se montre irritable

[Ele se mostra irritado]

causal car le marché du travail est très exigeant.

comparativa comme s‟il allait échouer à tous ses examens.

concessiva alors que tous les résultats sont positifs.

condicional si les exercices ne lui sont pas adaptés.

conformativa d’après ce qu‟a dit la petite fille de sa voisine.

consecutiva du coup il est désagréable avec ses amis.

final pour obtenir une autorisation de sortie.

proporcional à mesure qu‟il voit ses plans professionnels

échouer.

temporal après avoir travaillé des heures sans comprendre.

Tabela 4.2 – Orações principais e subordinadas adverbiais utilizadas como base para a formação do corpus para o

Da mesma forma que para o estabelecimento do corpus para o PB (cf. seção 4.1, acima),

as OSAdvs utilizadas no corpus do FR atendem aos critérios estabelecidos por Diessel (2001),

utilizados como referência nesta pesquisa.

Como a proposta desta pesquisa, no que diz respeito ao francês, restringe-se ao francês

falado em Paris, todos os dezoito períodos foram gravados por uma locutora parisiense, com

formação em fonética, em estúdio acusticamente isolado, em mídia digital, utilizando o

programa computacional Sound Forge v. 6.0. Os arquivos sonoros foram registrados em mídia

digital (MD), formato WAV-PCM, mono, 16 bits e 22.050Hz. Para não permitir dúvidas quanto

aos valores semânticos sugeridos por cada uma das OSAdvs, todos os períodos foram inseridos

em contextos que explicitam esses valores semânticos, conforme indicado no Anexo 2.

Do mesmo modo que para a formação do corpus para o PB, a locutora foi gravada três

vezes, com direcionamento específico para a expressividade que se desejava obter em cada um

dos períodos. Foram registrados não apenas os períodos para a formação do corpus, mas também

o contexto em que eles se inseriam. A seguir, procedeu-se à eliminação dos contextos dos

arquivos sonoros, de forma a ficarem isolados apenas os períodos a serem testados. As três

versões produzidas foram submetidas à apreciação de quatro ouvintes franceses, já iniciados nos

estudos prosódicos, para que indicassem, numa escala de 0 a 4, qual a nota que atribuiriam a

cada uma das elocuções, segundo o campo semântico sugerido pelas conjunções subordinativas,

nos mesmos moldes utilizados para o PB. Foram escolhidas, a partir desse julgamento, as

elocuções que obtiveram as melhores notas.

Cada uma dessas orações principais selecionadas como referência será denominada, a

partir de agora, OP de referência. Caso seja necessário estabelecer a subcategoria em que se

insere, por exemplo, “causal”, será denominada OP causal de referência. As figuras 4.3 e 4.4

ilustram a F0 das orações principais tomadas como referência para o FR.

Figura 4.3 – Freqüência fundamental das OPs 1 – Il est ennuyé – para o FR.

Time (s)

0 1.045490

500i l t ã n i j e

Time (s)

0 1.059950

500i l t a n i j e

Time (s)

0 1.085220

500i l t a n i j e

Time (s)

0 1.016550

500i l t a n i j e

Time (s)

0 1.052740

500i l t a n i j e

Time (s)

0 1.05020

500i l t a n i j e

Time (s)

0 1.034060

500i l t a n i j e

Time (s)

0 1.16050

600i l t a n i j e

Time (s)

0 1.127070

500i l t a n i j e

Figura 4.4 – Freqüência fundamental das OPs 2 – Il se montre irritable – para o FR.

4.3 TESTE 1

O primeiro teste realizado teve por objetivo identificar a existência ou não da pré-

indicação prosódica para as OSAdvs. Para isso, os períodos escolhidos como referência foram

segmentados, de forma que as OPs constituíssem arquivos sonoros independentes das OSAdvs.

4.3.1 O Teste 1 para o PB

Como no português se manifesta a regra fonológica segundo a qual a fricativa alveolar

surda se sonoriza quando seguida por uma vogal, foi necessário fazer uma adaptação desse

segmento final nas realizações das OPs 1 que antecediam as OSAdvs concessivas (introduzidas

por embora) e proporcionais (introduzidas por à medida que). Com o programa computacional

Time (s)

0 1.415920

500i l s m o n t i i t a b l

Time (s)

0 1.357870

Time (s)

0 1.424220

Time (s)

0 1.415330

500i l s m o t i i t a b l

Time (s)

0 1.397960

Time (s)

0 1.375280

Time (s)

0 1.386890

Time (s)

0 1.317820

Time (s)

0 1.386390

Sound Forge v. 6.0, substituiu-se a realização dessa fricativa sonora por uma realização surda

extraída de uma outra OP 1, de forma que essa oração apresentasse, nas suas nove variações

melódicas, a mesma constituição fonética . Caso isso não fosse feito, a

sonorização da fricativa atuaria como pré-indicação de uma vogal, o que direcionaria a escolha

dos ouvintes durante a realização do Teste 1.

Para identificar se os ouvintes nativos do PB conseguem perceber a função pré-indicativa

das OSAdvs nas OPs, procedeu-se ao cruzamento, por análise combinatória, das nove

modalidades das duas OPs, de forma que todas elas pudessem ser contrastadas entre si, duas a

duas (9 subcategorias pré-indicativas X 8 combinações = 72 associações para a OP 1. Como

foram estabelecidos cruzamentos para as subcategorias pré-indicativas duas a duas, tem-se 72 : 2

= 36 cruzamentos para a OP 1, e 36 cruzamentos para a OP 2, num total de 72 cruzamentos).

Os cruzamentos foram apresentados em folhas de tamanho A4, com as informações e os

dados dispostos em seis colunas. Na primeira, o número de ordem do cruzamento; na segunda, as

letras “A” e “B”, dispostas verticalmente, rotulando as OPs, presentes na terceira coluna; na

quarta coluna, as mesmas letras “A” e “B”, dispostas horizontalmente e com espaçamento entre

si; na quinta coluna, os algarismos “1” e “2”, rotulando as OSAdvs, presentes na sexta coluna.

As OSAdvs apresentadas em cada par eram, necessariamente, complementos da modulação

prosódica apresentada para as OPs do par, ou seja, não havia a possibilidade de estar presente

uma modulação indicativa de uma OSAdv diferente das apresentadas naquele cruzamento,

tratando-se, portanto, de um teste com escolha forçada. Isso significa dizer que, a partir do

momento em que o participante identificasse uma associação, a outra estaria automaticamente

determinada. Uma forma de minimizar um possível efeito negativo dessa escolha forçada foi

estabelecer os cruzamentos por análise combinatória, de forma que todas as OPs fossem

cruzadas com todas as OSAdvs. Assim, caso a escolha forçada em um dos cruzamentos

beneficiasse uma determinada associação entre uma OP e uma OSAdv do par, a outra OP

possivelmente prejudicada pelo automatismo da associação seria necessariamente testada em

outros pares26

. A opção por esse tipo de cruzamento se deu por conta da extrema sutileza

envolvida nos dados em análise. Embora a conformação do Teste 1 sugira uma grande

dificuldade para os participantes, a expectativa foi a de que, caso se obtivesse um resultado

significativo, esse resultado seria ainda mais expressivo do ponto de vista perceptivo. Ou seja,

quanto maior a dificuldade do teste, maior a expressividade de seus resultados. Cada sessão de

aplicação foi precedida de uma prática, com o objetivo de familiarizar os participantes com os

26 A apresentação das OPs em pares aos ouvintes segue o sugerido por Chen (2003), assumindo o paradigma das

comparações em par proposto por Scheffé (1952).

procedimentos envolvidos. Uma amostra do Teste 1, precedida do comando dado aos

participantes, é apresentada na figura 4.5.

Você ouvirá, para cada item, o mesmo trecho inicial entoado de duas formas diferentes. O

objetivo é você escolher qual dessas entonações é sonoramente adequada à intenção semântica

sugerida por cada uma das frases no segundo trecho. Assinale sua escolha na coluna central (por

exemplo, A1 B2).

1 A Ficava infeliz

A B 1 porque o trabalho não produzia frutos.

B Ficava infeliz 2 como uma pessoa que não via resultados.

2 A Mostrava-se cansado

A B 1 embora o trabalho o motivasse.

B Mostrava-se cansado 2 se os exercícios não fossem adequados.

Figura 4.5 – Modelo gráfico para aplicação do Teste 1 no PB. Na terceira coluna, aos pares de orações princiais são

associadas duas modulações prosódicas diferentes, necessariamente complementadas por uma das orações

subordinadas adverbiais presentes na última coluna. O conectivo que introduz cada uma das OSAdvs evidencia

o valor semântico em questão, a que corresponde uma das modulações prosódicas atribuídas às OPs.

Foram apresentados aos ouvintes apenas os arquivos sonoros referentes às OPs, presentes

na terceira coluna, de forma que, a partir da entonação com que essas orações fossem realizadas,

se procedesse à escolha das OSAdvs, presentes na sexta coluna. A partir dessa audição, deveriam

assinalar, na quarta coluna, o cruzamento de sua preferência, como, por exemplo, A2 B1,

indicando que para a OP “A” a escolha foi a da OSAdv “2” e, para a OP “B”, foi escolhida a

OSAdv “1”.

Cada par de OPs foi repetido três vezes, com um intervalo de 400ms entre cada oração do

par, e de 700ms entre cada par. Caso algum ouvinte solicitasse, o arquivo sonoro poderia ser

ouvido novamente.

O Teste 1 foi aplicado a 40 alunos do curso de graduação em Letras da Universidade

Federal do Rio de Janeiro, todos voluntários, durante duas aulas, numa mesma semana, e

dividido em quatro partes, no início e no fim de cada aula, de forma que a percepção dos

ouvintes não fosse prejudicada com a repetição exaustiva das OPs. Os participantes

permaneceram em suas salas de aula. Os arquivos sonoros foram executados utilizando-se um

reprodutor de CD convencional (Aiwa, modelo CSD-SR510), com os alto-falantes embutidos no

aparelho. Como as salas de aula não contavam com tratamento acústico, haveria a possibilidade

de, durante o teste, os participantes ouvirem ruídos externos.

4.3.2 O Teste 1 para o FR

Devido às diferenças entre as estruturas de ensino brasileira e francesa, a aplicação do

Teste 1 em Paris precisou sofrer uma adaptação em relação à metodologia utilizada no Rio de

Janeiro. Como não foi possível reunir todos os participantes durante duas aulas, o teste foi

realizado individualmente, nos computadores pessoais dos próprios participantes. Para isso, a

diagramação utilizada não foi apresentada em folhas de papel, mas sob o formato de um arquivo

Excel, acompanhado dos arquivos sonoros a serem utilizados. Os participantes receberam um

envelope contendo uma folha explicativa dos passos a seguir para a realização do teste, e um

CD-rom contendo o arquivo Excel e os arquivos sonoros. Solicitou-se que o teste fosse feito com

fones de ouvido, em duas sessões distintas. Os resultados foram enviados ao pesquisador por

correio eletrônico.

As OPs foram separadas das OSAdvs seguindo-se o mesmo procedimento adotado para o

PB, cruzando-se, por análise combinatória, as nove modalidades das duas OPs, de forma que

todas elas pudessem ser contrastadas entre si, duas a duas.

Os cruzamentos foram apresentados em uma formatação contínua, com as informações e

os dados dispostos em seis colunas. Na primeira, o número de ordem do cruzamento; na

segunda, as letras “A” e “B”, dispostas verticalmente, rotulando as OPs, presentes na terceira

coluna; na quarta coluna, as mesmas letras “A” e “B”, dispostas horizontalmente e com

espaçamento entre si; na quinta coluna, os algarismos “1” e “2”, rotulando as OSAdvs, presentes

na sexta coluna. As OSAdvs apresentadas em cada par eram, necessariamente, complementos da

modulação prosódica apresentada para as OPs do par, ou seja, não havia a possibilidade de

ocorrer uma modulação indicativa de uma OSAdv diferente das apresentadas naquele

cruzamento. Uma amostra do Teste 1, precedida do comando dado aos participantes, é

apresentada na figura 4.6.

Choisissez quelle des intonations est adéquate à l‟intention sémantique suggérée par chacune des

propositions dans le dernier segment.27

Figura 4.6 – Modelo gráfico para aplicação do Teste 1 no FR. Na coluna D, aos pares de orações principais são

associadas duas modulações prosódicas diferentes, necessariamente complementadas por uma das orações

subordinadas presentes na coluna J. O conectivo que introduz cada uma das OSAdvs evidencia o valor

semântico em questão, a que corresponde uma das modulações prosódicas atribuídas às OPs. Para ouvir os

arquivos sonoros, o participante deveria acionar os alto-falantes presentes na coluna B.

Da mesma forma que para o PB, foram apresentados aos ouvintes apenas os arquivos

sonoros referentes às OPs, presentes na quarta coluna, de forma que, a partir da entonação com

que essas orações fossem realizadas, se procedesse à escolha das OSAdvs, presentes na última

coluna. Para ouvir esses arquivos sonoros, os participantes deveriam acionar os alto-falantes

presentes na segunda coluna. A partir dessa audição, deveriam, então, assinalar, nas sexta e

oitava colunas, o cruzamento de sua preferência, como, por exemplo, A2 B1, indicando que para

a OP “A” a escolha foi a da OSAdv “2” e, para a OP “B”, foi escolhida a OSAdv “1”.

Cada par de OPs foi repetido três vezes, com um intervalo de tempo de 400ms entre cada

oração do par, e de 700ms entre cada par. Caso houvesse necessidade, o arquivo sonoro poderia

ser ouvido novamente. Havia, da mesma forma que para a aplicação do Teste 1 ao PB, uma

sessão de prática.

O Teste 1 foi aplicado a 11 alunos dos segundo, terceiro e quarto ciclos das

Universidades de Paris 3 e 7, todos voluntários.

4.4 O PROCESSO DE RESSÍNTESE

Uma vez identificados os contornos melódicos que mais facilmente são reconhecidos

como pré-indicativos de algumas das OSAdvs, tornou-se necessário caracterizar o

comportamento dos componentes prosódicos nessas manifestações pré-indicativas. Como será

27 Escolha qual das entonações é adequada à intenção semântica sugerida por cada uma das orações no último

segmento.

discutido à frente, os resultados obtidos com o Teste 1 para o FR indicaram menos possibilidades

de contornos pré-indicativos (se consideradas as OPs 1 e 2 individualmente) segundo os critérios

adotados para a constituição do Teste 2 (cf. seção 5.3). Assim, o processo de ressíntese para

elaboração do Teste 2 foi aplicado apenas ao PB.

Solicitou-se a um locutor masculino carioca, experiente em fonética e no uso estilizado

da voz, que registrasse uma versão neutra das duas OPs. Foram feitas três gravações, submetidas,

da mesma forma que para a identificação das melhores gravações para o Teste 1, ao julgamento

de quatro brasileiros, também iniciados nos estudos prosódicos, que deveriam indicar, numa

escala de 0 a 4, qual a nota que atribuiriam a cada uma das elocuções, considerando o valor de

“neutralidade”. As gravações foram apresentadas aos juízes, de forma aleatória, em conjunto

com gravações das OPs (moduladas de forma a pré-indicar OSAdvs) realizadas também por esse

mesmo locutor. Tomaram-se, então, as versões das OPs 1 e 2 que obtiveram o melhor

julgamento como neutras como referência para todo o processo de ressíntese que será descrito a

seguir. Essas orações serão denominadas, a partir de agora, OP 1 neutra e OP 2 neutra.

Há duas considerações, no entanto, que devem ser feitas antes dessa descrição. A

primeira diz respeito à escolha de um locutor masculino para o registro da OP neutra, uma vez

que, no Teste 1, foram utilizadas as gravações realizadas por um locutor feminino. A preferência

por essa alternância se deu como forma de, caso os novos resultados obtidos a partir do processo

de ressíntese viessem a se mostrar satisfatórios, fortalecer a importância desse comportamento

prosódico pré-indicativo, independentemente da qualidade vocal utilizada. Em outras palavras, a

conformação prosódica reconhecida para cada um dos contornos pré-indicativos detectados

poderia ser aplicada tanto a vozes masculinas quanto a vozes femininas.

Em segundo lugar, a opção por uma gravação neutra das OPs, quando poderia ser obtida

uma frase monotônica, utilizando-se o processo de ressíntese, a partir de uma das gravações

realizadas para o Teste 1. A discussão maior se dá quanto ao que se possa considerar uma versão

entonacional “neutra” de uma frase (cf. Aubergé et al., 2004; Bänziger et al., 2003, para a

aplicação de uma versão prosodicamente neutra ao estudo das emoções). Assume-se, aqui, que a

neutralidade da elocução indica que as OPs não tenham favorecido uma pré-indicação específica

de quaisquer das subcategorias adverbiais em análise. Uma vez que, com base na análise

prosódica efetuada para as OPs de referência utilizadas no Teste 1, a configuração prosódica de

cada pré-indicação parecia se caracterizar a partir de pontos específicos – como a STF –, mas

também contando com movimentos prosódicos expressivos em outros segmentos, a utilização de

uma frase monotônica poderia prejudicar a naturalidade final da ressíntese, causando uma

interferência negativa no julgamento que deveria ser feito durante o Teste 2. Em prol dessa

naturalidade, a opção foi feita, então, pela gravação com uma entonação neutra, ainda porquê,

sendo ela a mesma base para todas as ressínteses, o controle das variações efetuadas se manteria

de forma rigorosa. Uma vez que, no entanto, não seria prudente deixar de verificar o resultado

obtido a partir de uma modulação completamente monotônica, decidiu-se aplicar o mesmo

processo de ressíntese utilizado para a versão neutra a uma versão monotônica das OPs, com a

F0 nivelada em 132Hz para a OP 1 e em 127Hz para a OP 2 (cf. a descrição da “linha de

referência”, no início do capítulo 6). Essas versões monotônicas serão denominadas, a partir de

agora, OP 1 monotônica e OP 2 monotônica.

A figura 4.7 ilustra a F0 das OPs, em suas versões neutras.

OP 1 neutra OP 2 neutra

Figura 4.7– Freqüência fundamental e alinhamento das orações principais neutras.

Todo o processo de ressíntese consistiu em procurar adaptar a conformação prosódica das

OPs de referência às suas versões neutra e monotônica. Assumiu-se a conformação prosódica das

OPs 1 de referência para as ressínteses das variedades neutra e monotônica tanto da OP 1 quanto

da OP 2, uma vez que os resultados obtidos a partir do Teste 1 (cf. seção 4.1) confirmaram a

hipótese segundo a qual os contornos prosódicos pré-indicativos apresentariam um índice de

reconhecimento inferior nas OPs 2, por contarem elas com uma sílaba pós-tônica. Utilizou-se o

programa de processamento sonoro Praat, versão 4.5.15 (Boersna e Weenink, 1996),

empregando a técnica PSOLA. Como procedimento inicial, após a transformação dos arquivos

sonoros originais (versões neutras) para a manipulação por ressíntese, determinou-se a

estilização de pitch em dois semitons. Para atingir o resultado de cada subcategoria, essas

versões foram ressintetizadas, levando-se em consideração, de um lado, as variações da

freqüência fundamental e, de outro, a duração. Procurou-se seguir uma seqüência na modificação

desses parâmetros, elevando-se a F0 em um determinado segmento, por exemplo, em um

percentual mais baixo que o verificado nas OPs de referência e, sucessivamente, aumentando-se

Time (s)

0 1.576210

Time (s)

0 1.746370

250mo t r a v a s i k a s a d u

esse percentual, inclusive ultrapassando o ponto em que se obteve um resultado auditivo

satisfatório. Assim, a F0 foi sendo gradativamente elevada em 0,5 valor de referência (VR), até

atingir 6 VRs28

(para a discussão sobre o valor de referência, cf. o capítulo 6). Ressintetizaram-se

a F0 e a duração isoladamente e, em determinadas ressínteses, houve a combinação dos dois

parâmetros, simultaneamente. Houve situações em que a variação da duração de segmentos não

pareceu necessária para obter o resultado sonoro desejado, não sendo esse parâmetro, portanto,

explorado. O julgamento quanto à aproximação das ressínteses às OPs de referência foi feito

pelo próprio pesquisador.

A partir da análise visual da curva representativa da freqüência fundamental das OPs de

referência, é possível estabelecer dois grupos distintos, segundo seja ela ascendente ou

descendente na STF. Para o processo de ressíntese, foram consideradas apenas as subcategorias

que, de acordo com os critérios estabelecidos (cf. a seção 5.3, mais à frente), apresentaram maior

expressividade contrastiva. Assim, para o contorno ascendente da F0, consideraram-se as OPs de

referência causal, consecutiva e final; para o contorno descendente da F0, as OPs de referência

concessiva, conformativa e temporal.

Todos os valores numéricos expressos no capítulo 6, referente à descrição das ressínteses,

refletem as mensurações obtidas para a freqüência fundamental e a duração das OPs de

referência (cf. anexo 3). O ponto de segmentação fonética foi estabelecido, no caso das vogais,

tomando-se como referência o segundo formante (Jacqueline Vaissière, comunicação pessoal) e,

tanto para as vogais quanto para as consoantes, ampliou-se a imagem representativa dos ciclos

do sinal acústico, de forma que fosse identificado o ponto mais provável em que se processou o

início ou o fim da regularidade dos ciclos formadores do segmento (Bernard Gautheron,

comunicação pessoal). Caso não houvesse a necessidade dessa ampliação da imagem, como, por

exemplo, na determinação do ponto mínimo da F0 ao longo da consoante de ataque da sílaba

tônica, nas subcategorias com F0 ascendente nessa sílaba, utilizou-se a ferramenta do programa

Praat que permite a detecção automática do ponto mínimo de pitch.

Deve-se levar em consideração, ainda, que as medidas indicadas podem sofrer variação

de um programa para outro. A mensuração do pitch na fronteira inicial da vogal /e/, na SPreTF

da OP neutra para o PB, apresentou o valor de 132Hz, segundo o programa Praat; 118Hz,

segundo o programa WinPitchPro; e 135Hz, segundo o programa WinSnoori, todos os três

28 No entanto, algumas vezes houve uma diferença entre os valores de pitch esperados com as elevações da F0

aplicadas durante o processo de ressíntese e os valores reais obtidos. De uma forma geral, os valores reais estiveram

alguns Hertz abaixo do esperado. É importante observar que houve casos em que os valores esperados e os atingidos

coincidiram.

utilizando o método de autocorrelação, seguindo-se, no uso dos três programas, o mesmo

processo de detecção de fronteira de segmento descrito acima. Os valores apresentados no

capítulo 6 foram obtidos a partir do programa Praat, utilizado ao longo de todo o processo de

ressíntese. O silêncio referente à oclusão da consoante /k/, para efeitos de segmentação, foi

incorporado ao todo da consoante, inclusive uma possível pausa anterior a essa oclusão.

Utilizou-se o recurso de obtenção semi-automática dos dados, por meio da ferramenta “Log 1”,

no menu “Query”. Foram excluídos os valores decimais, sem se proceder à aproximação dos

valores inteiros. A título de lembrança, houve manifestação da F0 na consoante da STF por se

tratar, no corpus utilizado, de uma sonante.

Quanto aos resultados obtidos a partir da elevação da F0 na STF, como será descrito no

capítulo 6, deve-se levar em consideração que a qualidade auditiva final nem sempre se mostra

satisfatória. Uma vez que a F0 é definida como

F0 = 1 ,

período

sendo que período refere-se à duração, em milissegundos, de um ciclo do sinal sonoro, para

elevá-la é necessário aumentar o número de ciclos formadores do segmento sonoro. Isso implica

a diminuição de tempo (período) para cada ciclo. Por exemplo, se um período apresentar a

duração de 20ms (0,020seg), a F0 será de 50Hz (ou seja, 1/0,020). Se a duração do período for

de 10ms (0,010seg), a F0 será de 100Hz.

Para promover essa elevação por meio da ressíntese sonora, os algoritmos dos programas

computacionais selecionam amostras dos ciclos do sinal e inserem, progressivamente, cópias

desses ciclos no mesmo período. Normalmente, obtém-se um resultado auditivo satisfatório com

até duas vezes o valor original da F0 (Philippe Martin, comunicação pessoal). Assim, as

ressínteses produzidas a partir das OPs 1 e 2, tanto neutras quanto monotônicas, produziram um

efeito de voz não-natural quando a F0 foi elevada acima de determinados limites.

No sexto capítulo, após a apresentação e discussão dos resultados do Teste 1, serão

apresentadas as ressínteses promovidas para as OPs 1 e 2 neutras e monotônicas para o PB.

4.5 TESTE 2

O objetivo do Teste 2 foi verificar, dentre as ressínteses feitas para cada uma das OPs

neutras e monotônicas, quais apresentariam um índice de reconhecimento significativo por parte

dos ouvintes como pré-indicativas de cada uma das seis subcategorias adverbiais

significativamente identificadas no Teste 1. Seria inviável testar todas as ressínteses, optando-se,

então, por duas de cada subcategoria. O processo de seleção dessas ressínteses atendeu,

inicialmente, às situações de conflito entre os parâmetros prosódicos modificados. Por exemplo,

o comportamento apenas da F0, dissociada da variação de duração, apresentaria um resultado

final tão satisfatório quanto em combinação com alterações na duração. Selecionou-se, então,

uma versão ressintetizada apenas com variações na F0 e outra, com variações na F0 e na

duração. No entanto, nem todos os pares de ressínteses utilizadas no Teste 2 exploraram

necessariamente esses dois fatores em conjunto. Houve casos em que foi necessário testar

modificações na curva da F0 em pontos distintos, sem a interferência da duração (para maiores

detalhes, cf. o capítulo 6). Como o objetivo dessas ressínteses foi aproximar, ao máximo

possível, as versões neutras e monotônicas às versões originais das OPs de referência, a seleção

de quais ressínteses seriam utilizadas no Teste 2 levou em consideração esse nível de

semelhança.

O modelo utilizado no Teste 2 inspirou-se no utilizado no Teste 1, mas de uma forma

mais simples. No Teste 1, foram testadas, duas a duas, todas as OPs. Como o Teste 2 avaliou

frases não-naturais, optou-se pelo julgamento de cada uma das ressínteses isoladamente. Todas

as ressínteses produzidas a partir da OP neutra e da OP monotônica e selecionadas para o teste

foram também contrastadas com as OSAdvs, por análise combinatória. Como o resultado do

Teste 1 evidenciou o reconhecimento significativo de seis dos nove possíveis contornos pré-

indicativos adverbiais, o Teste 2 explorou apenas essas seis subcategorias (pré-indicações causal,

concessiva, conformativa, consecutiva, final e temporal) (6 subcategorias pré-indicativas X 2

ressínteses = 12 ressínteses; 12 ressínteses X 5 cruzamentos = 60 cruzamentos para a OP 1 e 60

cruzamentos para a OP 2; total de 120 cruzamentos para as ressínteses a partir da OP neutra e

120 cruzamentos para as ressínteses a partir da OP monotônica).

Os cruzamentos foram apresentados em folhas de tamanho A4, com as informações e os

dados dispostos em quatro colunas. Na primeira, o número de ordem do cruzamento; na segunda,

a OP; na terceira, as letras “A” e “B”, dispostas verticalmente e seguidas por parênteses; na

quarta coluna, as OSAdvs. Apenas uma das OSAdvs apresentadas em cada par era o potencial

complemento da modulação prosódica apresentada para a OP contida na segunda coluna (versão

ressintetizada). Cada sessão de aplicação do teste foi precedida de uma prática, com o objetivo

de familiarizar os participantes. Uma amostra do Teste 2, precedida do comando dado aos

participantes, é apresentada na figura 4.8.

Você ouvirá, para cada item, o trecho inicial entoado de uma forma específica. O objetivo é você

escolher qual das duas complementações é adequada para a forma como o trecho inicial foi

pronunciado. Indique sua escolha marcando um X na opção A ou na opção B.

1 Ficava infeliz A ( ) porque o trabalho não produzia frutos.

B ( ) que dava pena ver seu rosto.

2 Mostrava-se cansado A ( ) para que todos sentissem pena dele.

B ( ) conforme convinha a um pessimista.

Figura 4.8 – Modelo gráfico para aplicação do Teste 2. Os participantes ouviram uma versão ressintetizada das

orações principais presentes na segunda coluna, à qual deveria ser associada uma das orações subordinadas

presentes na quarta coluna. O valor semântico de cada OSAdv é indicado pelo conectivo que a introduz.

Os arquivos sonoros foram registrados em mídia digital (CD-rom). Cada OP foi repetida

quatro vezes, com um intervalo de tempo de 2300ms entre cada repetição. Apenas após todos os

participantes terem feito sua escolha, procedia-se à audição do grupo seguinte. Caso algum

ouvinte solicitasse, o arquivo sonoro poderia ser ouvido novamente.

O Teste 2 foi aplicado a 40 alunos do curso de graduação em Letras das Universidades

Federais do Rio de Janeiro e do Espírito Santo (20 em cada universidade), distribuídos em dois

grupos: 10 alunos de cada universidade participaram da versão do Teste 2 direcionada às

ressínteses das OPs neutras, e os 10 outros, da versão direcionada às ressínteses das OPs

monotônicas. O teste foi aplicado durante duas aulas, numa mesma semana, e dividido em quatro

partes, no início e no fim de cada aula, de forma que a percepção dos ouvintes não fosse

prejudicada com a repetição exaustiva das OPs. Os participantes permaneceram em suas salas de

aula. Da mesma forma que para a aplicação do Teste 1, os arquivos sonoros foram executados

utilizando-se um reprodutor de CD convencional e os alto-falantes embutidos no aparelho. Como

as salas de aula não contavam com tratamento acústico, haveria a possibilidade de, durante o

teste, os participantes ouvirem ruídos externos.

4.6 PROSOGRAMAS

No capítulo 7, destinado à análise dos resultados do Teste 2, será feito uso dos

prosogramas (cf. figuras 7.1 e 7.2), um sistema de transcrição prosódica desenvolvido por Piet

Mertens (2004) como aplicativo do programa Praat, visando a uma representação objetiva e

confiável do comportamento melódico de uma elocução. O resultado final obtido a partir do

emprego dessa ferramenta prevê a estilização das variações de altura e de percepção tonal.

A estilização se processa exclusivamente sobre os segmentos vocálicos. O núcleo desses

segmentos é definido como a parte vozeada em torno do pico de intensidade, com delimitações à

esquerda e à direita, respectivamente, feita pelos pontos situados a -3dB e -9dB desse pico. A

expectativa é a de que os traçados de F0 obtidos representem os movimentos melódicos

efetivamente perceptíveis ao ouvido humano.

Cada prosograma gerado apresenta, no eixo das ordenadas, a variação em semitons. O

espaço entre cada linha pontilhada, paralela ao eixo das abscissas, corresponde a uma variação

de dois semitons. Os semitons são estabelecidos a partir de 1Hz. Verifica-se uma seta no eixo

das ordenadas, com a indicação de 150Hz. Esse ponto é assumido como um valor freqüencial

normalmente presente no escopo de variação tanto da voz masculina quanto da voz feminina.

Para maiores detalhes, conferir Mertens (2004).

A geração e observação dos prosogramas para as OPs de referência utilizadas nesta

pesquisa coloca-se como um recurso adicional para a identificação e confirmação ou não das

hipóteses para os parâmetros prosódicos responsáveis por cada subcategoria pré-indicativa. No

entanto, como será discutido, verificaram-se alguns conflitos entre os resultados obtidos a partir

do Teste 2 e as estilizações dos movimentos melódicos perceptíveis ao ouvido humano sugeridas

pelos prosogramas.

5. DESCRIÇÃO E ANÁLISE DOS RESULTADOS DO TESTE 1

5.1. OS RESULTADOS PARA O PB

Como caracterizado na descrição metodológica, o objetivo do Teste 1 foi identificar quais

subcategorias das OSAdvs teriam um bom índice de reconhecimento pré-indicativo. A partir do

cruzamento aleatório de todas as subcategorias, por análise combinatória binária (cf. 4.3.1), o

julgamento dos 40 participantes evidenciou os resultados apresentados nas tabelas 5.1 e 5.2 e

comentados a seguir.

A análise estatística dos resultados foi feita utilizando o Teste Chi-quadrado, uma vez que

o Teste 1 procurou analisar se um determinado cruzamento foi feito dentro da expectativa de

distinção entre as nove subcategorias ou não. Em outras palavras, se as OSAdvs de cada par do

cruzamento foram associadas às modulações prosódicas pré-indicativas correspondentes,

aplicadas às OPs. Isso permitiu estabelecer como pretensamente “correto” o julgamento em que

o cruzamento se realizou dentro dessa expectativa, e como “errado” o cruzamento que não a

preencheu.

Nessa situação específica, o grau de liberdade estabelecido é 1, e para que o valor p seja

igual ou inferior a 0,05, o resultado do Teste Chi-quadrado deve ser igual ou superior a 3,84. Foi

assumido o índice de significância para p de 0,05.

comp 6,4

0,011 comp

conces 14,4

0,0001

0,114 conces

condic 0,9

0,343 condic

confor 4,9

0,527 confor

consec 4,9

0,0001 consec

final 0,9

0,0001 final

propor 0

0,114 propor

temp 6,4

Tabela 5.1 – Resultados de um Teste Chi2 (df=1), para o cruzamento, no Teste 1, entre as 9 subcategorias de OPs 1

para o PB. Em cada célula, a linha superior indica o resultado do Teste Chi2; a inferior, o valor p. As células

destacadas sinalizam os cruzamentos que obtiveram nível de significância p 0,05.

comp 2,5

0,114 comp

conces 8,1

0,752 conces

condic 0,4

0,343 condic

confor 0,4

0,343 confor

consec 4,9

0,0000002

0,00001

0,027 consec

final 0,1

0,0001

0,114 final

propor 0,4

0,752 propor

temp 0,9

Tabela 5.2 – Resultados de um Teste Chi2 (df=1), para o cruzamento, no Teste 1, entre as 9 subcategorias de OPs 2

para o PB. Em cada célula, a linha superior indica o resultado do Teste Chi2; a inferior, o valor p. As células

destacadas sinalizam os cruzamentos que obtiveram nível de significância p 0,05.

5.1.1 Cruzamentos a partir da subcategoria causal

Os resultados obtidos sugerem que, no universo dos participantes do Teste 1, o contorno

pré-indicativo causal, na OP 1, é significativamente distinguível dos contornos pré-indicativos de

comparação, de concessão, de conformidade, de conseqüência e de temporalidade. Ou seja, nas

oito possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo causal foi

significativamente identificado em cinco.

Em relação à OP 2, a distinção é significativa em relação aos contornos pré-indicativos de

concessão e de conseqüência. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o

contorno pré-indicativo causal foi significativamente identificado em duas.

5.1.1.1 Análise dos resultados para a pré-indicação causal

Comparando-se a configuração melódica da OP 1 causal de referência com a da OP 1

comparativa de referência (distinção com índice p=0,011), observa-se que o traçado da F0 é

bastante semelhante nos dois casos, ambos com elevação da F0 na STF. O que parece ser o fator

diferenciador é o valor máximo de elevação nesse segmento29

. Enquanto na OP 1 causal de

referência a F0 varia de 131Hz a 236Hz (80%), na OP 1 comparativa de referência a variação

está entre 113Hz e 193Hz (70%), com variação, entre os pontos máximos atingidos, de 22%30

Levando-se ainda em consideração o formato ascendente da F0 na STF, o outro contraste

significativo (Chi2=4,9, df=1, p=0,027) se deu em relação à OP 1 consecutiva de referência. A

variação da F0 na STF esteve entre os 126Hz e os 223Hz (76%), bastante próxima, portanto, do

verificado no mesmo segmento da OP 1 comparativa de referência31

(como indicado acima,

esses dois contornos não foram significativamente distinguidos entre si). A hipótese para a

diferenciação dos contornos recai, então, sobre o formato que a F0 assume, na STF da OP 1

consecutiva de referência, que se mostra com uma concavidade mais acentuada,

consideravelmente mais arredondada que nesse mesmo segmento da OP 1 causal de referência e

com o ataque em posição mais aguda na sílaba pré-tônica32

(cf. figura 5.1); e sobre a duração da

consoante inicial da STF, que, na OP 1, é 20% maior na pré-indicação consecutiva que na causal

(140ms contra 116ms) (na OP 2, a diferença é de apenas 3%, com 178ms contra 185ms).

OP 1 causal OP 1 consecutiva

Figura 5.1 - Freqüência fundamental e alinhamento das OPs 1 causal e consecutiva de referência – Ficava infeliz –

para o PB.

Considerando-se o outro grande grupo de configurações melódicas verificado – F0 com

configuração descendente na STF –, a distinção mais significativa se deu em relação à OP 1

concessiva de referência (Chi2=14,4, df=1, p=0,0001). Como esperado, o contraste entre os

29 Embora a elevação da F0, nos casos em análise da OP 1, tenha seu início de sua elevação situado no ataque da

STF, não se devem perder de vista os casos em que essa consoante é surda, como, por exemplo, na OP 2. Como será

apresentado em relação aos processos de ressíntese utilizados para a configuração do Teste 2, caso a consoante seja

surda, será assumida a variação da F0 apenas na VTF. 30 Essa diferença é significativa ao ouvido humano. Segundo Rossi (1971, 1978), o limite de percepção do glissando

está entre 18Hz e 19Hz para uma duração de 200ms, tanto para o movimento ascendente quanto para o movimento

descendente da F0. 31 A variação em relação ao valor máximo atingido pela F0 na STF da OP 1 comparativa de referência é de 5%.

32 Essa diferenciação, no processo de ressíntese (cf. conclusão), se concretiza pela formação do vale da F0.

Time (s)

0 1.392270

Time (s)

0 1.471810

formatos de F0 com configuração ascendente seria mais claramente evidenciado em relação ao

formato com configuração descendente na STF. Isso se verificou também no contraste da OP 1

causal de referência com a conformativa (Chi2=4,9, df=1, p=0,027) e com a temporal

(Chi2=6,4, df=1, p=0,011).

A não-significância de contraste, portanto, da OP 1 causal de referência com a

condicional e com a de finalidade (Chi2=0,9, df=1, p=0,343, para ambos os casos) não seria de

todo imprevista. No entanto, o contraste com a proporcional – que apresenta um possível

contorno pré-indicativo com a F0 descendente na STF – mostrou-se totalmente nulo (Chi2=0,

df=1, p=1), contrariando a expectativa inicial.

Comparativamente aos contrastes estabelecidos para a OP 1, a OP 2 causal de referência

evidenciou apenas dois resultados significativos: com as OPs 2 pré-indicativas concessiva

(Chi2=8,1, df=1, p=0,004) e consecutiva (Chi2=4,9, df=1, p=0,027) de referência. O mais

previsível desses dois, segundo a expectativa inicial, seria o contraste com o contorno pré-

indicativo de concessão, que apresenta configuração da F0 descendente na STF.

Observe-se que não se verificou significância contrastiva, nos outros casos, nem mesmo

em relação às outras OPs 2 com essa mesma configuração da F0.

5.1.2 Cruzamentos a partir da subcategoria comparativa

Os índices obtidos sugerem que, no universo dos participantes do Teste 1, o contorno pré-

indicativo comparativo, na OP 1, é significativamente distinguível dos contornos pré-indicativos

de causa e de finalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno

pré-indicativo comparativo é significativamente identificado em duas.

Em relação à OP 2, há distinção significativa em relação aos contornos pré-indicativos de

finalidade e de temporalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o

contorno pré-indicativo comparativo é significativamente identificado em duas.

5.1.2.1 Análise dos resultados para a pré-indicação comparativa

Como já discutido na sessão anterior, a diferenciação entre o contorno pré-indicativo

comparativo e o causal parece residir no valor máximo de elevação da F0 na STF, 22% mais

elevado no causal.

Em relação ao contorno pré-indicativo final (Chi2=4,9, df=1, p=0,027, para a OP 1;

Chi2=8,1, df=1, p=0,004, para a OP 2), esse valor máximo de elevação da F0 se colocou

praticamente no mesmo nível: enquanto, no contorno pré-indicativo final, atingiram-se os

202Hz, no comparativo o valor máximo esteve nos 193Hz, ou seja, uma variação de 4%. Como

essa variação se mostra abaixo do limiar de percepção do ouvido humano para os sons da fala

(cf. Rossi, 1971, 1978), a hipótese de diferenciação entre os dois contornos recai, assim, sobre o

formato da F0 que, da mesma forma que no contorno pré-indicativo de conseqüência, apresenta a

forma mais arredondada e com o ataque em posição mais aguda na sílaba pré-tônica.

A diferenciação em relação ao contorno pré-indicativo temporal (Chi2=4,9, df=1,

p=0,027, para a OP 1 e para a OP 2) preencheu a expectativa inicial, uma vez que se trata de dois

formatos da F0 com direcionamento oposto na STF, ascendente para a pré-indicação causal e

descendente para a temporal.

Considerando-se os contrastes significativos obtidos para a OP 2, os mesmos comentários

acima aplicam-se de forma respectiva aos dois casos verificados. Deve-se observar que a F0, na

sílaba tônica da OP 2 final de referência, apresenta uma conformação ascendente, da mesma

forma que a OP 2 comparativa de referência, embora a queda que segue seja mais acentuada. A

caracterização descendente da F0 na STF da OP 2 temporal de referência mostra-se oposta à

conformação ascendente da comparativa.

Contrariando as expectativas iniciais, não se verificou contraste significativo entre a pré-

indicação comparativa e as pré-indicações concessiva, conformativa e proporcional, estas três

últimas com a conformação da F0 na STF em formato descendente.

Provavelmente por conta da similaridade entre os formatos ascendentes da F0 nas sílabas

tônicas finais, não se verificou a diferenciação em relação aos contornos pré-indicativos de

condição e de conseqüência.

5.1.3 Cruzamentos a partir da subcategoria concessiva

pré-indicativo concessivo, na OP 1, é significativamente distinguível dos contornos pré-

indicativos de causa, de conformidade, de conseqüência, de proporção e de temporalidade. Ou

seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo concessivo é

significativamente identificado em cinco.

Em relação à OP 2, a pré-indicação concessiva é significativamente distinguível dos

contornos pré-indicativos de causa, de conformidade, de conseqüência, de finalidade, de

proporção e de temporalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o

contorno pré-indicativo concessivo é significativamente identificado em seis.

5.1.3.1 Análise dos resultados para a pré-indicação concessiva

A diferenciação significativa da pré-indicação concessiva em relação aos contornos pré-

indicativos causal (Chi2=14,4, df=1, p=0,0001, para a OP 1; Chi2=8,1, df=1, p=0,004, para a

OP 2) e consecutivo (Chi2=8,1, df=1, p=0,004, para a OP 1; Chi2=22,5, df=1, p=0,0000002,

para a OP 2) confirmou as expectativas iniciais, por apresentarem os dois últimos a F0 na STF

com o formato ascendente.

Comparando-se o traçado melódico da OP 1 concessiva de referência, significativamente

diferenciado do da conformativa (Chi2=10, df=1, p=0,002, para a OP 1; Chi2=8,1, df=1,

p=0,004, para a OP 2), verifica-se uma semelhança visual bastante acentuada. A hipótese de

diferenciação entre os dois contornos recai sobre dois pontos.

A F0, na vogal tônica final (doravante, VTF) da pré-indicação concessiva, apresenta um

formato ligeiramente côncavo. Na pré-indicação conformativa, esse formato é ligeiramente

convexo. Menos sutil que essa particularidade, no entanto, percebe-se uma diferença na duração

dessa VTF: 177ms, na pré-indicação concessiva, e 131ms, na pré-indicação conformativa

(variação de 35%), considerando-se as OPs 1. Ao se observarem esses mesmos pontos nas OPs

2, no entanto, verifica-se que o formato da F0 mostra-se ligeiramente côncavo em ambas as

vogais tônicas finais, e que a diferença de duração é praticamente inexistente: 186ms, na pré-

indicação concessiva, e 182ms, na pré-indicação conformativa (2%).

O traçado melódico da pré-indicação de proporção mostrou-se também

significativamente diferenciado do de concessão (Chi2=4,9, df=1, p=0,027, tanto para a OP 1

quanto para a OP 2), embora apresentem-se ambos com a configuração descendente da F0 na

STF. A hipótese diferenciadora entre os dois contornos pré-indicativos recai sobre o formato da

F0 na VTF: na pré-indicação concessiva, esse formato mostra-se ligeiramente côncavo, e

acentuadamente convexo na pré-indicação proporcional (embora, em relação à OP 2, não se

possa dizer que essa convexidade seja acentuada). Ainda que essa hipótese seja levantada com

base em um nível de percepção bastante sutil, é interessante lembrar que Delattre (1966), ao

caracterizar as três curvas descendentes identificadas entre os que considerou como os dez

contornos de base do francês, considerou-as como convexa, linear e côncova. Atendendo

também à sugestão de Ladd (1996) quanto à necessidade de observação de detalhes menores

quando da análise prosódica, parece razoável que essa hipótese seja assumida.

Considerando-se a similaridade de contornos descendentes, a pré-indicação concessiva

mostrou-se também significativamente diferente da pré-indicação temporal (Chi2=10, df=1,

p=0,002, para a OP 1; Chi2=4,9, df=1, p=0,027, para a OP 2). Comparando-se as duas pré-

indicações na OP 1, percebe-se também a mesma diferença de concavidade-convexidade

discutida no parágrafo anterior, mas com uma tendência, na pré-indicação temporal, a um certo

nivelamento. Enquanto na pré-indicação concessiva a F0 na VTF varia entre 181Hz e 120Hz

(51%), na temporal essa variação ocorre entre 154Hz e 146Hz (5%). Há ainda uma expressiva

diferença de duração da VTF: 177ms, na pré-indicação concessiva, e 114ms, na pré-indicação

temporal, com uma diferença, portanto, de 55%. Essas diferenças não se verificam em relação às

OPs 2, que apresentam variações semelhantes tanto na F0 (157Hz e 113Hz, perfazendo 39%, na

OP 2 concessiva de referência; 170Hz e 125Hz, perfazendo 36%, na OP 2 temporal de

referência) quanto na duração (186ms, na OP 2 concessiva de referência; 178ms, na OP 2

temporal de referência, perfazendo uma variação de 4%).

Contrariando as expectativas iniciais, o contorno pré-indicativo concessivo não se

diferenciou dos contornos pré-indicativos comparativo e condicional, que apresentam, ambos,

forma ascendente da F0 na STF. Essa expectativa inicial de identificação devida à diferença de

direcionamento ascendente ou descendente da F0, em relação à pré-indicação de finalidade, só se

verificou no universo da OP 2 (Chi2=10, df=1, p=0,002).

5.1.4 Cruzamentos a partir da subcategoria condicional

indicativo condicional, na OP 1, é significativamente distinguível do contorno pré-indicativo de

conseqüência. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-

indicativo concessivo é significativamente identificado apenas em uma.

Em relação à OP 2, da mesma forma que ocorre para a OP 1, há distinção significativa

apenas em relação ao contorno pré-indicativo de conseqüência.

5.1.4.1 Análise dos resultados para a pré-indicação condicional

O contorno pré-indicativo de condição apresentou um comportamento semelhante quanto

aos resultados obtidos no Teste 1 tanto para a OP 1 quanto para a OP 2. Em ambos os casos, o

único contraste significativo se deu em relação à pré-indicação de conseqüência (Chi2=6,4,

df=1, p=0,011, para a OP 1; Chi2=19,6, df=1, p=0,00001, para a OP 2). A hipótese para essa

diferenciação recai sobre a combinação do ponto máximo de elevação atingido pela F0 na VTF

com a duração maior da consoante na STF da pré-indicação consecutiva, sem desprezar, no

entanto, o movimento descendente-ascendente da F0 a partir da VPreTF. É de se observar que

este movimento não se verifica na pré-indicação causal, talvez por isso não ter sido ela

distinguida da pré-indicação condicional.

Considerando-se a hipótese inicial da diferença contrastiva entre os formatos ascendente

e descendente da F0 na STF, a expectativa estaria centralizada sobre uma diferenciação

significativa entre o contorno pré-indicativo condicional (ascendente) e os contornos pré-

indicativos concessivo, conformativo, proporcional e temporal (descendentes). No entanto, isso

não aconteceu em nenhum dos casos.

A não-diferenciação em relação aos contornos pré-indicativos de causa, de comparação e

de finalidade, por sua similaridade no formato ascendente, foi verificada.

Observando-se o índice p=1 obtido a partir do cruzamento entre o contorno pré-

indicativo condicional e o temporal (o que significa dizer que o julgamento feito pelos

participantes do Teste 1 foi totalmente devido ao acaso), percebe-se a existência de uma grande

similaridade entre os dois contornos, muito embora o condicional apresente conformação

ascendente para a F0 na STF, e o temporal, conformação descendente.

Há uma discussão considerável em relação à ambigüidade existente entre determinadas

categorias semânticas. Como apresentado na seção 1.3, a desambigüização da oração introduzida

pela conjunção “e”, cujo valor semântico oscila entre a temporalidade e a causalidade, pode ser

feita por via prosódica (cf. Pierrehumbert e Hirschberg, 1990:304). Verifica-se também uma

certa dificuldade de distinção entre a noção de tempo e a de condição (cf. Gouveia et al., 2001;

Dias, Vanderlei, 1999). Efetivamente, ao se afirmar, por exemplo, que alguém ficava infeliz

quando não lhe permitiam falar, há a implicação direta de que esse estado de infelicidade só se

processaria na condição de não lhe permitirem falar; ou seja, caso lhe permitissem falar, não

ficaria infeliz.

Durante a gravação das frases para a formulação do corpus para o PB, a locutora

produziu, num primeiro momento, a OP 1 pré-indicativa temporal com a modulação ascendente

para a F0, de forma semelhante à pré-indicação condicional, conforme se verifica na figura 5.1.

A escolha, no entanto, da conformação descendente para a pré-indicação temporal pelos quatro

avaliadores brasileiros (cf. 4.1) sugere a possibilidade de caracterizar o critério prosódico como

responsável pela desambigüização entre essas duas categorias semânticas. A sugestão, então, é

considerar como essencialmente temporal a OSAdv que apresente modulação descendente da F0

na STF, e como condicional a OSAdv com modulação ascendente33

nesse segmento, mesmo que

a oração seja introduzida por um conectivo tradicionalmente assumido como temporal, como é o

caso de “quando”34

. Philippe Martin (1982) assume posição semelhante para o FR.

33 Pierrehumbert e Hirschberg (1990:304) indicam que a leitura “condicional implícita” da conjunção “e” é

favorecida pelos acentos frasais H, como em:

Eat another cookie and I‟ll kill you (coma outro biscoito e eu te matarei)

H* H H* L L% 34 Durante a formulação do corpus para o francês (cf. 4.2), as pessoas (nativas) envolvidas afirmaram

categoricamente que il est ennuyé quand on ne lui permet pas de s’exprimer evidencia uma relação de condição, e

que para que se tratasse de uma relação de tempo, necessariamente deveria haver um marcador específico numa

escala temporal, como “après” em il est ennuyé après avoir travaillé des heures sans comprendre.

OP 1 temporal com valor

condicional

OP 1 temporal sem valor

condicional

OP 1 condicional

Figure 5.1 – Freqüência fundamental e alinhamento das OPs 1 – Ficava infeliz – pré-indicativas de tempo com e

sem valor condicional, e da OP 1 condicional de referência.

Essa ambigüidade entre os valores semânticos condicional e temporal talvez não se

apresente como explicação para a não-significância de contraste entre as OPs condicionais de

referência e as demais pré-indicações. Observe-se, no entanto, que os cruzamentos feitos a partir

da pré-indicação temporal mostraram-se significativos em seis das oito possibilidades, como será

discutido mais à frente (cf. 5.1.9).

5.1.5 Cruzamentos a partir da subcategoria conformativa

Os resultados do Teste 1 sugerem que o contorno pré-indicativo conformativo, na OP 1, é

significativamente distinguível dos contornos pré-indicativos de causa, de concessão, de

conseqüência e de temporalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o

contorno pré-indicativo conformativo é significativamente identificado em quatro.

Em relação à OP 2, a pré-indicação conformativa é significativamente distinguível dos

contornos pré-indicativos de concessão, de conseqüência e de finalidade. Ou seja, nas oito

possibilidades de cruzamentos para a OP 2, o contorno pré-indicativo condicional é

significativamente identificado em três.

5.1.5.1 Análise dos resultados para a pré-indicação conformativa

Se considerado amplamente o formato descendente da F0 na STF, o contorno pré-

indicativo conformativo se assemelha aos contornos concessivo e temporal. Como já discutido

em 5.1.3.1, a hipótese de diferenciação entre a pré-indicação concessiva e a conformativa recai

Time (s)

0 1.268030

Time (s)

0 1.34980

300f i ak v i f e l i

Time (s)0 1.44771

sobre o formato da F0 (ligeiramente côncavo, no caso da concessão; ligeiramente convexo, no

caso da conformidade) e da duração na VTF (35% maior na pré-indicação concessiva).

Em relação ao contorno pré-indicativo temporal, como já sugerido em 5.1.3.1, o fator

identificador desse contorno parece ser o formato com menor variação de amplitude da F0 na

VTF (5%), mostrando-se, portanto, mais nivelada. É importante lembrar que essa variação se

processou de forma diferente na OP 2 temporal de referência.

A significância de contraste com a pré-indicação consecutiva (Chi2=14,4, df=1,

p=0,0001, para a OP 1; Chi2=4,9, df=1, p=0,027, para a OP 2) e final (Chi2=14,4, df=1,

p=0,0001, para a OP 2) atendeu à expectativa geral devida ao contraste de formato ascendente

ou descendente da F0. No entanto, não houve distinção significativa em relação aos contornos

pré-indicativos (também ascendentes) de comparação, de condição e, considerando-se apenas a

OP 1, de finalidade.

A não-distinção em relação ao contorno pré-indicativo de proporção talvez se tenha dado

por conta da semelhança entre as conformações descendentes da F0 nos dois casos.

5.1.6 Cruzamentos a partir da subcategoria consecutiva

Os índices obtidos com o Teste 1 indicam que o contorno pré-indicativo consecutivo, na

OP 1, é significativamente distinguível dos contornos pré-indicativos de causa, de concessão, de

condição, de conformidade, de finalidade, de proporção e de temporalidade. Ou seja, nas oito

possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo conformativo foi

significativamente identificado em sete.

Esses índices também sugerem que o contorno pré-indicativo consecutivo, na OP 2, é

significativamente distinguível dos contornos pré-indicativos de causa, de concessão, de

condição e de conformidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o

contorno pré-indicativo consecutivo foi significativamente identificado em quatro.

5.1.6.1 Análise dos resultados para a pré-indicação consecutiva

Considerando-se a diferenciação mais ampla esperada por conta da oposição ascendente-

descendente no formato da F0 na STF, a pré-indicação consecutiva (modulação ascendente)

diferenciou-se significativamente dos contornos pré-indicativos concessivo (Chi2=8,1, df=1,

p=0,004, para a OP 1; Chi2=22,5, df=1, p=0,0000002, para a OP 2), conformativo (Chi2=14,4,

df=1, p=0,0001, para a OP 1; Chi2=4,9, df=1, p=0,027, para a OP 2), proporcional (Chi2=10,

df=1, p=0,002, apenas para a OP 1) e temporal (Chi2=10, df=1, p=0,002, apenas para a OP 1).

Diferenciou-se também de forma significativa dos contornos pré-indicativos

(ascendentes) causal (Chi2=4,9, df=1, p=0,027, para a OP 1 e a OP 2), condicional (Chi2=6,4,

df=1, p=0,011, para a OP 1; Chi2=19,6, df=1, p=0,00001, para a OP 2) e final (Chi2=12,1,

df=1, p=0,001, apenas para a OP 1). No entanto, não houve diferenciação em relação à pré-

indicação comparativa, em nenhuma das OPs.

Neste caso de semelhança mais ampla do formato ascendente da F0 na STF entre a pré-

indicação consecutiva e as pré-indicações causal, condicional e final, a hipótese de diferenciação

mais ampla recai sobre a duração da consoante inicial da STF (cf. 5.1.1, acima, para as hipóteses

a partir da pré-indicação causal). Considerando-se o contraste com a pré-indicação causal, a

duração desse segmento mostrou-se 20% maior na pré-indicação consecutiva (116ms contra

140ms), se observada apenas a OP 1 (como mencionado, a diferença, se observadas as OPs 2, foi

de 3%). Para a diferenciação obtida para esse cruzamento, levantou-se também a hipótese do

formato mais arredondado da F0 na STF da pré-indicação causal.

Em relação ao contraste com a pré-indicação condicional, a duração da consoante que

introduz a STF mostrou-se também 20% maior na pré-indicação consecutiva (116ms contra

140ms), se observada a OP 1, e 17% maior, se observada a OP 2 (152ms contra 178ms).

Considerando-se a hipótese do valor máximo atingido pela F0 na VTF, a F0, na pré-indicação

consecutiva, atingiu 223Hz na OP 1 e 192Hz na OP 2, contra, na pré-indicação condicional,

194Hz na OP 1 e 171Hz na OP 2, evidenciando uma diferença, respectivamente, de 14% e de

Considerando-se o terceiro contraste em relação ao formato ascendente da F0 na STF – a

pré-indicação de finalidade –, a duração da consoante inicial da STF mostrou-se 27% maior na

pré-indicação consecutiva (110ms contra 140ms), se observada a OP 1, e 10% maior (161ms

contra 178ms), se observada a OP 2. Também a elevação da F0 na VTF foi superior na pré-

indicação consecutiva em relação à final: 10% (223Hz e 202Hz, respectivamente), se observada

a OP 1, e 29% (192Hz e 149Hz, respectivamente), se observada a OP 2.

5.1.7 Cruzamentos a partir da subcategoria final

pré-indicativo final, na OP 1, é significativamente distinguível dos contornos pré-indicativos de

comparação, de conseqüência e de temporalidade. Ou seja, nas oito possibilidades de

cruzamentos para a OP 1, o contorno pré-indicativo final é significativamente identificado em

três.

Em relação à OP 2, há distinção significativa em relação aos contornos pré-indicativos de

comparação, de concessão e de conformidade. Ou seja, nas oito possibilidades de cruzamentos

para a OP 2, o contorno pré-indicativo final é significativamente identificado em três.

5.1.7.1 Análise dos resultados para a pré-indicação final

Segundo os resultados obtidos para o Teste 1, a configuração melódica candidata a

contorno pré-indicativo de finalidade apresenta contraste significativo em relação a quatro outros

contornos: comparativo (Chi2=4,9, df=1, p=0,027, para a OP 1; Chi2=8,1, df=1, p=0,004, para

a OP 2), concessivo (Chi2=10, df=1, p=0,002, apenas para a OP 2), conformativo (Chi2=14,4,

df=1, p=0,0001, apenas para a OP 2), consecutivo (Chi2=12,1, df=1, p=0,001, apenas para a OP

1) e temporal (Chi2=4,9, df=1, p=0,027, apenas para a OP 1).

Considerando-se a hipótese de contraste mais amplo, a pré-indicação de finalidade (F0

com formato ascendente na F0 da STF) diferenciou-se dos contornos concessivo (apenas a OP

2), conformativo (apenas a OP 2) e temporal (apenas a OP 1).

A diferenciação em relação ao contorno comparativo, como apresentado em 5.1.2, recai

sobre a forma mais arredondada da F0 na STF da pré-indicação de finalidade, assim como sobre

o ataque em posição mais aguda em sua sílaba pré-tônica.

Como discutido em 5.1.6, a hipótese de diferenciação em relação à pré-indicação

consecutiva recai sobre a maior duração da consoante inicial e da maior elevação da F0 na STF

da pré-indicação consecutiva.

Não houve diferenciação significativa entre as OPs final de referência e as causal e

condicional (estas duas com forma ascendente da F0 na STF), nem em relação às OPs pré-

indicativas de proporção (que apresentam forma descendente da F0).

5.1.8 Cruzamentos a partir da subcategoria proporcional

Os resultados sugerem que, no universo dos participantes do Teste 1, o contorno pré-

indicativo proporcional, na OP 1, é significativamente distinguível dos contornos pré-indicativos

de concessão e de conseqüência. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o

contorno pré-indicativo proporcional é significativamente identificado em dois.

No universo da OP 2, ocorre distinção significativa em relação ao contorno pré-indicativo

de concessão. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o contorno pré-

indicativo proporcional é significativamente identificado em apenas um.

5.1.8.1 Análise dos resultados para a pré-indicação proporcional

Das oito possibilidades de cruzamento, o candidato a contorno da pré-indicação

proporcional distinguiu-se significativamente das pré-indicações concessiva (Chi2=4,9, df=1,

p=0,027, para as OPs 1 e 2) e consecutiva (Chi2=10, df=1, p=0,002, apenas para a OP 1).

Como apresentado em 5.1.3.1, a diferenciação em relação à pré-indicação concessiva

talvez se baseie no formato côncavo ou convexo da F0 na VTF, respectivamente para a pré-

indicação de concessão e a de proporção.

A diferenciação em relação à pré-indicação consecutiva atende às expectativas gerais de

contraste entre os formatos ascendente e descendente da F0 na STF.

Não houve diferenciação significativa em relação aos contornos pré-indicativos de

conformidade e de temporalidade, ambos com formatos descendentes da F0 na STF.

No entanto, o contorno pré-indicativo de proporção (formato descendente da F0) não se

diferenciou significativamente de nenhum dos outros contornos com formato ascendente da F0,

se considerada a OP 2, e apenas do contorno consecutivo, se considerada a OP 1. Como

destaque, observe-se que, no universo da OP 1, o contraste com o contorno pré-indicativo de

causa apresentou o valor p=1, o que significa dizer que o julgamento dos participantes do Teste

1 foi totalmente devido ao acaso. Talvez isso se explique pela aparente proximidade semântica

entre os campos da causa e da proporção. Considerando-se a enunciação Ficava infeliz à medida

que via seus planos desabarem, não soa estranho imaginar que a causa da infelicidade seja o

desabamento dos planos. É latente a impressão de ser a proporção uma causa progressiva, da

mesma forma que a noção de tempo também parece entremear-se com a de causa (cf. 5.1.4.1) e a

de condição (cf. 5.1.4). Uma quarta combinação promovedora de ambigüidade se estabelece

entre as relações de causa e de finalidade. Dizer que um rapaz ficava infeliz para que todos

sentissem pena dele deixa entrever uma certa noção de causalidade para a sua infelicidade.

Embora esses conflitos nos campos semânticos não sejam objetivo desta pesquisa, parece

apropriada a sugestão de o valor causal se estabelecer como uma “arquicategoria” adverbial, sob

cuja abrangência se localizariam a condição, a finalidade, a proporção e, possivelmente, a

temporalidade. Observando-se os resultados obtidos a partir do Teste 1 (cf. tabelas 5.1 e 5.2),

também se percebe que a pré-indicação causal distinguiu-se significativamente apenas da pré-

indicação temporal na OP 1. Talvez seja o caso de postular que o componente prosódico não

tenha força suficiente para distinguir os valores condicional, final e proporcional do valor causal.

Caso essa hipótese seja verdadeira, percebe-se um caso em que a força semântica anula a força

prosódica.

5.1.9 Cruzamentos a partir da subcategoria temporal

indicativo temporal, na OP 1, é significativamente distinguível dos contornos pré-indicativos de

causa, de comparação, de concessão, de conformidade, de conseqüência e de finalidade. Ou seja,

nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo temporal é

significativamente identificado em seis.

Em relação à OP 2, a distinção é significativa em relação aos contornos pré-indicativos de

comparação e de concessão. Ou seja, nas oito possibilidades de cruzamentos para a OP 2, o

contorno pré-indicativo temporal é significativamente identificado em dois.

5.1.9.3 Análise dos resultados para a pré-indicação temporal

Considerando-se a hipótese mais ampla da diferenciação devida ao contraste ascendente-

descendente do formato da F0 na STF das OPs, o contorno temporal (descendente) diferenciou-

se dos contornos causal (Chi2=6,4, df=1, p=0,011, apenas para a OP 1), comparativo (Chi2=4,9,

df=1, p=0,027, para as OPs 1 e 2), consecutivo (Chi2=10, df=1, p=0,002, apenas para a OP 1) e

final (Chi2=4,9, df=1, p=0,027, apenas para a OP 1).

Também se diferenciou do contorno pré-indicativo de concessão (Chi2=10, df=1,

p=0,002, para a OP 1; Chi2=4,9, df=1, p=0,027, para a OP 2), que apresenta formato

descendente da F0. Como sugerido em 5.1.3.1, a diferenciação entre esses dois contornos talvez

resida no nivelamento da F0 na VTF da pré-indicação temporal, com uma variação expressiva

nesse mesmo segmento da pré-indicação concessiva; e na maior duração dessa vogal, na pré-

indicação concessiva (tomando-se em consideração apenas as OPs 1).

Retomando a discussão iniciada em 5.1.4.1 quanto à semelhança semântica entre as

noções de tempo e de condição, é interessante observar que a conformação das OPs temporais de

referência utilizadas no Teste 1 apresentou a F0 descendente na STF, contrastivamente à

conformação das OPs pré-indicativas de condição. Enquanto quase não se percebeu contraste

significativo entre a pré-indicação de condição e as demais subcategorias adverbiais (salvo para a

conseqüência) (cf. 5.1.4.1), a pré-indicação temporal foi significativamente contrastada em

relação a seis dessas subcategorias (mas não em relação à condicional), numa possibilidade

máxima de oito. Esse resultado sugere a confirmação da hipótese de que o valor de pré-indicação

temporal seja construído com a conformação prosódica da F0, na OP, com o formato

descendente na STF, mas não confirma a diferenciação em relação ao valor condicional.

5.2. OS RESULTADOS PARA O FR

A análise dos resultados do Teste 1 para o FR seguirá os mesmos procedimentos que para

o PB. Os resultados, discriminados nas tabelas 5.3 e 5.4, foram obtidos a partir do cruzamento

aleatório de todas as subcategorias, por análise combinatória, a partir do julgamento de 11

participantes (cf. 4.3.2).

comp 7,4

0,007 comp

conces 0,8

0,132 conces

condic 0,8

0,366 condic

confor 7,4

0,132 confor

consec 0,1

0,007 consec

final 0,8

0,035 final

propor 0,8

0,035 propor

temp 0,1

Tabela 5.3 – Resultados de um Teste Chi2 (df=1), para o cruzamento entre as 9 subcategorias de OPs 1 para o FR.

Em cada célula, a linha superior indica o resultado do Teste Chi2; a inferior, o valor p. As células destacadas

sinalizam os cruzamentos que obtiveram nível de significância p 0,05.

comp 2,3

0,132 comp

conces 0,8

0,763 conces

condic 0,8

0,763 condic

confor 0,8

0,035 0

0,132 confor

consec 0,8

0,132 0 consec

final 0,1

0,132 final

propor 0,1

0,763 propor

temp 0,8

Tabela 5.4 – Resultados de um Teste Chi2 (df=1), para o cruzamento entre as 9 subcategorias de OPs 2 para o FR.

Em cada célula, a linha superior indica o resultado do Teste Chi2; a inferior, o valor p. As células destacadas

sinalizam os cruzamentos que obtiveram nível de significância p 0,05.

5.2.1 Cruzamentos a partir da subcategoria causal

indicativo causal, na OP 1, é significativamente distinguível dos contornos pré-indicativos de

comparação e de conformidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o

contorno pré-indicativo causal foi significativamente identificado em dois.

Já em relação à OP 2, não há distinção significativa em relação a nenhum outro contorno

pré-indicativo.

5.2.1.1 Análise dos resultados para a pré-indicação causal

Comparando-se a configuração melódica da OP 1 causal de referência com a da OP 1

comparativa de referência (distinção com índice Chi2=7,4, df=1, p=0,007), observa-se um

traçado da F0 bastante semelhante nos dois casos, ambos com elevação da F0 na STF. O que

parece se apresentar como o fator diferenciador é o acento secundário que se mostra proeminente

sobre a sílaba /t ã/, apenas na OP 1 causal.

Considerando-se o outro grupo de formatos verificado – F0 com configuração

descendente na STF –, a única distinção significativa se deu em relação à OP 1 conformativa de

referência (Chi2=7,4, df=1, p=0,007). Como seria mais provavelmente esperado, o contraste

entre os formatos de F0 com configuração ascendente seria mais claramente evidenciado em

relação ao formato com configuração descendente na STF.

Comparativamente ao verificado para as OPs 1, as OPs 2 não evidenciaram contraste

significativo algum, nem mesmo entre os contornos com F0 ascendente na STF e os com F0

descendente.

5.2.2 Cruzamentos a partir da subcategoria comparativa

pré-indicativo comparativo, na OP 1, é significativamente distinguível dos contornos pré-

indicativos de causa, de conseqüência e de proporcionalidade. Ou seja, nas oito possibilidades de

cruzamentos para a OP 1, o contorno pré-indicativo comparativo é significativamente

identificado em três.

No universo da OP 2, houve distinção significativa em relação aos contornos pré-

indicativos de conformidade, de conseqüência e de finalidade. Ou seja, nas oito possibilidades de

cruzamentos para a OP 2, o contorno pré-indicativo comparativo é significativamente

5.2.2.1 Análise dos resultados para a pré-indicação comparativa

Os resultados obtidos a partir do Teste 1 evidenciaram, para os contrastes das OPs pré-

indicativas de comparação, cinco cruzamentos significativos. Como já discutido na sessão

imediatamente anterior, a diferenciação entre o contorno pré-indicativo comparativo e o causal

parece residir, no caso da OP 1, na projeção do acento secundário sobre a sílaba /t ã/, na OP 1

comparativa de referência.

Em relação ao contorno pré-indicativo consecutivo, observa-se tanto na OP 1 quanto na

OP 2 a projeção do acento secundário, realçado pelo formato ascendente da F0, ainda mais

evidente sobre a sílaba // da OP 2. Neste caso, o pico atingido pela F0 mostrou-se 16% mais

elevado no acento secundário (316Hz) que no acento primário (271Hz).

A diferenciação em relação ao contorno pré-indicativo proporcional, na OP 1, mostrou

índice de diferenciação total, ou seja, todos os participantes do Teste 1 reconheceram o contorno

comparativo como distinto do contorno proporcional. O fator diferenciador entre essas duas

modalidades parece ser a duração do segmento //, que foi realizado com 202ms na OP 1

comparativa de referência, e com 296ms na OP 1 proporcional de referência, uma diferença,

portanto, de 46%.

Considerando-se os outros dois contrastes significativos, obtidos apenas para a OP 2,

verificou-se a distinção em relação às modalidades conformativa e final. A primeira hipótese

para a diferenciação em relação à OP 2 conformativa de referência recai sobre a conformação da

F0 na vogal /a/ final, ascendente na modalidade comparativa e descendente na modalidade

conformativa. Associado a esse fator, percebe-se uma projeção mais intensa da F0 sobre a sílaba

// (337Hz) que sobre a sílaba // (271Hz), com uma diferença de 66Hz (24%).

Quanto à diferenciação em relação à OP 2 final de referência, talvez o fator significativo

para esta modalidade seja o valor máximo atingido pela F0 no segmento // (279Hz),

semelhante ao atingido no segmento // (289Hz). Na OP 2 comparativa de referência, não se

verificou essa equivalência.

5.2.3 Cruzamentos a partir da subcategoria concessiva

Os índices obtidos no Teste 1 sugerem que o contorno pré-indicativo concessivo, na OP

1, é significativamente distinguível do contorno pré-indicativo de finalidade. Ou seja, nas oito

possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo concessivo é

significativamente identificado em um.

Em relação à OP 2, a distinção significativa se deu em relação aos contornos pré-

indicativos de conformidade e de finalidade. Ou seja, nas oito possibilidades de cruzamentos

para a OP 2, o contorno pré-indicativo concessivo é significativamente identificado em dois.

5.2.3.1 Análise dos resultados para a pré-indicação concessiva

A diferenciação significativa do valor concessivo em relação ao contorno pré-indicativo

conformativo (p=0, para a OP 2) confirmou as expectativas iniciais, por conta do contraste entre

os formatos da F0 sobre a última vogal tônica (/a/) da oração. Observe-se que, na OP 2

conformativa de referência, forma-se uma linha de declinação completa a partir da sílaba /mõn/,

o que não ocorre na OP 2 concessiva de referência. Destaque-se, ainda, que houve um índice de

diferenciação total entre as duas OPs.

Comparando-se o traçado melódico da OP 1 concessiva de referência, significativamente

diferenciado do de finalidade (Chi2=4,5, df=1, p=0,035, tanto para a OP 1 quanto para a OP 2),

verifica-se uma semelhança visual bastante acentuada no caso da OP 1. A hipótese de

diferenciação entre os dois contornos recai sobre a duração da vogal /ã/. Na OP 1 concessiva de

referência, esse segmento foi realizado em 72ms; na OP 1 final de referência, em 113ms, uma

diferença, portanto, de 57% na duração. Constituiu-se, assim, na OP 1 final de referência, um

acento secundário em comparação com a OP 1 concessiva de referência. No universo da OP 2

final de referência, o formato ascendente da F0 na sílaba /mõn/ contrasta com o formato

descendente na OP 2 concessiva de referência, parecendo, assim, corresponder à marcação de

um acento secundário, de forma semelhante ao que foi verificado para a OP 1 final de referência.

5.2.4 Cruzamentos a partir da subcategoria condicional

Os resultados obtidos indicam que, no universo dos participantes do Teste 1, o contorno

pré-indicativo condicional não foi significativamente contrastado com nenhum outro contorno

pré-indicativo.

5.1.4.1 Análise dos resultados para a pré-indicação condicional

Mesmo a expectativa inicial de que haveria uma distinção em relação ao contorno

conformativo, por conta da F0 ascendente nas OPs 1 e 2 condicionais e descendente nas OPs 1 e

2 conformativas de referência, não se verificou.

5.2.5 Cruzamentos a partir da subcategoria conformativa

No universo dos participantes do Teste 1, o contorno pré-indicativo conformativo, na OP

1, foi significativamente distinguível dos contornos pré-indicativos de causa, de concessão e de

proporcionalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-

indicativo conformativo é significativamente identificado em três.

Em relação à OP 2, houve distinção significativa em relação aos contornos pré-

indicativos de comparação, de concessão, de conseqüência e de finalidade. Ou seja, nas oito

possibilidades de cruzamentos para a OP 2, o contorno pré-indicativo condicional é

significativamente identificado em quatro.

5.2.5.1 Análise dos resultados para a pré-indicação conformativa

Se considerado o formato descendente da F0 na sílaba final, tanto da OP 1 quanto da OP

2, o possível contorno pré-indicativo conformativo se diferencia de todos os outros possíveis

contornos, que apresentam a F0 ascendente nesse segmento. Assim, a significância verificada na

distinção entre a modalidade conformativa e as outras seis modalidades indicadas acima se

justificaria por essa inversão de formato.

5.2.6 Cruzamentos a partir da subcategoria consecutiva

Os resultados indicam que, no universo dos participantes do Teste 1, o contorno pré-

indicativo consecutivo, na OP 1, é significativamente distinguível dos contornos pré-indicativos

de comparação, de conformidade e de finalidade. Ou seja, nas oito possibilidades de

cruzamentos para a OP 1, o contorno pré-indicativo conformativo foi significativamente

Quanto à OP 2, a distinção se mostrou significativa em relação aos contornos pré-

indicativos de comparação e de conformidade. Ou seja, nas oito possibilidades de cruzamentos

para a OP 2, o contorno pré-indicativo consecutivo foi significativamente identificado em dois.

5.2.6.1 Análise dos resultados para a pré-indicação consecutiva

Considerando-se a diferenciação mais ampla esperada por conta da oposição ascendente-

descendente no formato da F0 na sílaba final, a pré-indicação consecutiva (modulação

ascendente) diferenciou-se significativamente do contorno pré-indicativo conformativo

(Chi2=7,4, df=1, p=0,007, para a OP 1; p=0, para a OP 2).

Em relação ao contorno pré-indicativo comparativo, como já discutido em 5.2.2.1, a

hipótese de diferenciação recai sobre o acento secundário, realçado pela configuração ascendente

da F0 nas OPs consecutivas de referência. Essa mesma hipótese é assumida para a diferenciação

da modalidade consecutiva em relação à modalidade final na OP 1. É interessante observar que,

na OP 2, os dois contornos se assemelham nesse segmento.

5.2.7 Cruzamentos a partir da subcategoria final

Segundo os resultados obtidos para o Teste 1, a configuração melódica candidata a

contorno pré-indicativo de finalidade apresenta contraste significativo, na OP 1, em relação aos

contornos concessivo, consecutivo e proporcional. Nas oito possibilidades de cruzamentos para a

OP 1, o contorno pré-indicativo de finalidade foi, portanto, significativamente identificado em

três.

Considerando-se a OP 2, a distinção se apresentou significativa em relação aos contornos

pré-indicativos comparativo, concessivo e conformativo. Portanto, a pré-indicação de finalidade

foi significativamente identificada em três cruzamentos.

5.2.7.1 Análise dos resultados para a pré-indicação final

Considerando-se a hipótese de contraste mais amplo, a pré-indicação de finalidade (F0

com formato ascendente na sílaba final) diferenciou-se do contorno conformativo (Chi2=7,4,

df=1, p=0,007) apenas na OP 2.

A diferenciação em relação ao contorno comparativo, como apresentado em 5.2.2.1, recai

sobre a semelhança para o valor máximo atingido pela F0 nos segmentos // e //,

para a pré-indicação final. Essa semelhança não ocorre na pré-indicação comparativa.

Como discutido em 5.2.3.1, a hipótese de diferenciação em relação à pré-indicação

concessiva recai sobre a duração da vogal /ã/, para a OP 1; e sobre o contraste entre o formato

ascendente da F0 na sílaba /mõn/ da modalidade final e descendente nesse mesmo segmento da

modalidade concessiva, considerando-se a OP 2.

A diferenciação entre a modalidade final e a consecutiva para a OP 1, como já sugerido

em 5.2.6.1, talvez se deva ao acento secundário, realçado pela configuração ascendente da F0 nas

OPs consecutivas.

Tanto a OP 1 final quanto a OP 1 proporcional de referência apresentam um

comportamento melódico bastante semelhante. A hipótese de diferenciação entre as duas

(Chi2=4,5, df=1, p=0,035) se estabelece em dois pontos, ambos referentes à duração de

segmentos. A vogal /ã/, onde recai o acento secundário, se realizou em 113ms na OP 1 final de

referência, e em 90ms na OP 1 proporcional de referência. Portanto, a duração desse segmento se

mostra 25% mais longa na OP 1 final. O outro ponto parece ser o segmento /ije/, realizado em

167ms na OP 1 final, e em 297ms na OP 1 proporcional de referência (78% de diferença).

5.2.8 Cruzamentos a partir da subcategoria proporcional

indicativo proporcional, na OP 1, é significativamente distinguível dos contornos pré-indicativos

de comparação, de conformidade, de finalidade e de temporalidade. Ou seja, nas oito

possibilidades de cruzamentos para a OP 1, o contorno pré-indicativo proporcional é

significativamente identificado em quatro.

Já no universo da OP 2, o contorno pré-indicativo proporcional não se diferencia de

nenhum dos outros.

5.2.8.1 Análise dos resultados para a pré-indicação proporcional

Como apresentado em 5.2.2.1, a diferenciação em relação à pré-indicação comparativa

talvez se localize na duração do segmento //, maior na OP 1 proporcional que na OP 1

comparativa de referência.

A diferenciação em relação à pré-indicação conformativa, como já discutido em 5.2.5.1,

parece se dar pela oposição ascendente/descendente entre os formatos da F0 na sílaba final.

Quanto à diferenciação em relação à pré-indicação final, como já discutido em 5.2.7.1,

parece haver interferência da duração da vogal /ã/ (onde recai o acento secundário), mais longa

na OP 1 final de referência. A outra interferência talvez seja a duração do segmento //, mais

longo na OP 1 proporcional de referência.

Para a diferenciação entre a pré-indicação proporcional e a temporal, no universo da OP

1, o ponto crítico parece ser a elevação máxima atingida pela F0 ao final da oração. Esses índices

corresponderam a 336Hz e 424Hz, respectivamente; uma diferença, portanto, de 88Hz (26%).

5.2.9 Cruzamentos a partir da subcategoria temporal

indicativo temporal, na OP 1, é significativamente distinguível do contorno pré-indicativo de

proporcionalidade. Ou seja, nas oito possibilidades de cruzamentos para a OP 1, o contorno pré-

indicativo temporal é significativamente identificado em apenas um.

Quanto à OP 2, não houve distinção significativa em relação a nenhum outro contorno.

5.2.9.1 Análise dos resultados para a pré-indicação temporal

Como sugerido em 5.2.8.1, a diferenciação entre os contornos pré-indicativos temporal e

proporcional parece ser a elevação máxima atingida pela F0 na sílaba final, 26% superior na OP

1 temporal de referência.

5.2.10 Considerações sobre o resultado para o FR

Quanto ao resultado obtido para o FR, pelo menos duas análises são feitas. Mejvaldová

(2001), analisando a percepção de atitudes/emoções por franceses e tchecos, verificou que a

latitude da F0 precisa ser consideravelmente maior para que os franceses percebam uma dada

variação expressiva, comparativamente à latitude necessária para a percepção dos tchecos. Em

outros termos, a neutralidade atitudinal/emotiva dos franceses conta com uma variação na

amplitude da F0 muito maior que a neutralidade dos tchecos. O estudo de Chen (2003), já

referido no capítulo 3, apresenta uma relativização semelhante também para os holandeses e os

britânicos. Segundo a autora, a extensão de pitch padrão a que os holandeses estariam

acostumados seria mais estreita do que a dos britânicos, o que permitiria aos primeiros perceber

variações mais sutis no movimento da F0 do que os britânicos. Considerando a capacidade de

percepção das variações extremamente sutis da F0, como demonstrado com os resultados dos

Testes 1 e 2, é possível que os brasileiros se assemelhem aos tchecos e aos holandeses quanto a

essa amplitude da F0 para a manutenção da neutralidade.

A segunda possibilidade de análise, sugerida por Jacqueline Vaissière (comunicação

pessoal), é a de que o FR se coloca como uma língua em que o contorno melódico continuativo

se caracteriza, essencialmente, pelo formato ascendente da F0. Isso explicaria, em princípio, o

fato de praticamente todos os contornos verificados para as F0s das OPs 1 e 2, no FR, terem se

mostrado ascendentes na sílaba tônica final. A única exceção verificada foi para as OPs

conformativas de referência. Como o PB apresentaria a possibilidade de uma entonação

continuativa sem, necessária e freqüentemente, a F0 mostrar-se ascendente, foi possível a

constituição de pelo menos dois contornos melódicos principais, um ascendente e outro

descendente. Talvez seja mais razoável, como possível explicação para a diferença tão

expressiva entre os resultados do Teste 1 para o PB e para o FR, considerar a combinação dessas

duas hipóteses. Em pesquisas futuras, não seria desproposital explorar a variação na amplitude

da F0, por meio do processo de ressíntese, para o FR. Não se descarta a hipótese, portanto, de se

revelarem, de forma mais realçada, os possíveis contornos pré-indicativos de OSAdvs no FR.

5.3. CRITÉRIOS DE SELEÇÃO DOS CANDIDATOS A CONTORNOS PRÉ-INDICATIVOS

Identificados os cruzamentos em que houve distinção significativa entre as pré-

indicações, tornou-se necessário estabelecer um critério para a seleção de quais dessas

subcategorias seriam submetidas ao processo de ressíntese e posteriormente utilizadas na

formulação do Teste 2, tanto no PB quanto no FR.

Em princípio, qualquer uma das nove subcategorias que fosse significativamente

contrastada com pelo menos uma das outras oito poderia ser utilizada no processo de ressíntese.

No entanto, alguns fatores relacionados à natureza do fenômeno pesquisado devem ser

considerados:

a) a pré-indicação apresenta-se de forma bastante sutil, não sendo um comportamento

prosódico facilmente identificável como, por exemplo, a linha de declinação natural das

elocuções assertivas;

b) embora não pareça ser um fenômeno idiossincrático, é possível que locutores nativos

produzam curvas melódicas distintas para cada uma das orações principais das nove

subcategorias pesquisadas e, ainda assim, algumas dessas variantes sejam aceitas como

bem produzidas entonacionalmente para sugerir a pré-indicação das orações subordinadas

adverbiais subseqüentes;

c) um contorno melódico pré-indicativo que venha a ser identificado deve apresentar o

mínimo possível de ambigüidade em relação aos demais contornos, de forma que venha a

assumir um valor fonológico efetivo.

Estabeleceu-se, então, um critério quantitativo para selecionar as subcategorias adverbiais

a serem ressintetizadas e utilizadas no Teste 2. No universo do Teste 1, cada uma das nove

subcategorias foi cruzada com as outras oito por análise combinatória (cf. 4.3.1), o que significa

a realização de oito cruzamentos. Decidiu-se utilizar para o processo de ressíntese as

subcategorias que foram significativamente contrastadas em pelo menos cinco cruzamentos, o

que equivale à metade dos cruzamentos mais um. Esse critério objetiva minimizar o impacto dos

três fatores listados acima.

Assim, considerando-se esse critério, em relação à OP 1 no PB houve quatro

subcategorias que foram significativamente reconhecidas como pré-indicadas pelas modulações

da OP: a causal, a concessiva, a consecutiva e a temporal. Em relação à OP 2, apenas uma: a

concessiva. No FR, não houve nenhum reconhecimento significativo, tanto em relação à OP 1

quanto em relação à OP 2.

Os resultados obtidos no Teste 1 indicam comportamentos diferentes para a OP 1 e a OP

2, tanto no PB quanto no FR. Nem todos os cruzamentos obtidos para a OP 1 foram equivalentes

aos obtidos para a OP 2. No entanto, como foi assumida a hipótese de que os contornos pré-

indicativos podem ser aplicados a enunciações distintas, contando ou não com uma sílaba pós-

tônica final, caso se faça a sobreposição dos resultados obtidos para a OP 1 com os obtidos para

a OP 2, duas novas subcategorias se apresentam em conformidade com o critério acima

estabelecido, para o PB: a conformativa e a final. No caso do FR, três subcategorias passariam a

ser consideradas: a comparativa, a conformativa e a final. Essas indicações podem ser

visualizadas nas tabelas 5.5 e 5.6.

caus comp conces condic confor consec final propor temp

caus X X X X X

comp X X X

conces X X X X X X

condic X

confor X X X X X X

consec X X X X X X X

final X X X X X

propor X X

temp X X X X X X

/ 8 5 4 6 1 5 7 5 2 6

Tabela 5.5 – Sobreposição dos resultados significativos dos cruzamentos, no Teste 1, da OP2 aos da OP1 para o PB.

As células marcadas com “X” indicam índice de significância p 0,05, a partir de um teste Chi-quadrado. Foi feita a representação dos cruzamentos duas vezes (abaixo e acima da diagonal descendente dividindo as

subcategorias), de forma a facilitar a visualização. As três células hachuradas indicam os resultados para a OP

2 que contribuem para a inclusão de dois novos contornos no critério de metade dos cruzamentos mais um. Na

última linha, as células em cinza indicam as subcategorias que se inserem nesse critério.

caus comp conces condic confor consec final propor temp

caus X X

comp X X X X X

conces X X

condic

confor X X X X X X

consec X X X

final X X X X X

propor X X X X

temp X

/ 8 2 5 2 0 6 3 5 4 1

Tabela 5.6 – Sobreposição dos resultados significativos dos cruzamentos, no Teste 1, da OP2 aos da OP1 para o FR.

As células marcadas com “X” indicam índice de significância p 0,05, a partir de um teste Chi-quadrado. Foi feita a representação dos cruzamentos duas vezes (abaixo e acima da diagonal descendente dividindo as

subcategorias), de forma a facilitar a visualização. As sete células hachuradas indicam os resultados para a OP

2 que contribuem para a inclusão de três contornos no critério de metade dos cruzamentos mais um. Na última

linha, as células em cinza indicam as subcategorias que se inserem nesse critério.

Para o processo de ressíntese e a subseqüente elaboração do Teste 2, decidiu-se explorar

apenas o PB, uma vez que o FR, se consideradas as OPs 1 ou 2 isoladamente, não apresentou

resultado satisfatório segundo o critério estabelecido de metade dos cruzamentos mais um.

Paralelamente à ressíntese das OPs de referência das quatro subcategorias identificadas

para a OP 1 no PB – causal, concessiva, consecutiva e temporal –, optou-se por explorar também

as duas outras subcategorias obtidas a partir da sobreposição dos resultados obtidos para a OP 2

à OP 1: a conformativa e a final. De uma forma mais prudente, pode-se dizer que o Teste 1

identificou quatro contornos pré-indicativos de forma mais consistente, com a possibilidade de

dois outros contornos aumentarem o conjunto.

6. O PROCESSO DE RESSÍNTESE

Como discutido no capítulo 4, para que se pudessem detectar as configurações dos

componentes prosódicos possivelmente responsáveis pelo valor pré-indicativo de cada

subcategoria adverbial, foi necessário utilizar o processo de ressíntese para reproduzir as OPs 1 e

2 de referência do PB. Essas ressínteses foram realizadas a partir de uma versão neutra e de uma

versão monotônica de cada OP, buscando adaptá-las às configurações da OP1 (cf. seção 4.4)

originalmente verificadas nas gravações utilizadas para o Teste 1 (cf. figuras 4.1 e 4.2).

Foram levados em consideração para a ressíntese, como discutido no final do capítulo

anterior, apenas seis contornos melódicos pré-indicativos das nove subcategorias adverbiais.

Neste capítulo são detalhadas as etapas do processo de ressíntese para as OPs 1 e 2 neutras e

monotônicas.

O formato ascendente da F0

Nas OPs de referência com F0 ascendente na STF, observa-se, recorrentemente, um

formato descendente-ascendente a partir da vogal da sílaba pré-tônica (cf. figuras 4.1 e 4.2). O

movimento descendente se dá até aproximadamente o meio da consoante de ataque dessa sílaba,

passando a ascendente, com valor máximo de elevação próximo ao final da vogal tônica,

formando uma concavidade. Esses trechos da F0 se opõem diametralmente.

Se se considerar a diferença, em Hertz, entre o início e o final do movimento descendente

dessa curva, a subcategoria pré-indicativa causal apresenta 17% de variação; a final, 28%; e a

consecutiva, 40%. A queda da F0 se processa com uma média de 0,30Hz/ms, ou 36Hz em

117ms. Os valores específicos, para a pré-indicação:

. causal: 22Hz em 129ms, ou 0,17Hz/ms, ou 17%;

. consecutiva: 50Hz em 141ms, ou 0,35Hz/ms, ou 40%;

. final: 37Hz em 81ms, ou 0,45Hz/ms, ou 28%.

Estipulou-se, com base nesse movimento descendente da F0 acima descrito, um valor de

referência, a partir de agora denominado simplesmente VR, a ser adotado na manipulação da F0

desses segmentos críticos, nas OPs neutra e monotônica. O VR é baseado, portanto, na variação

descendente da F0, constituída entre o ataque na vogal da SPreTF e o valor mínimo de pitch

verificado ao fim do movimento descendente. Uma vez que uma diferença de 2% ou de 3% nos

valores de pitch indicados nos casos das pré-indicações acima mencionados não representa

variação significativa ao ouvido humano35,

, as variações para as subcategorias pré-indicativas

causal e final foram aproximadas para 20% e 30%, respectivamente. O VR assume esse

percentual de 20%, o que significa dizer que, para o segundo índice, de 30%, contabiliza-se 1,5

VR e, para o terceiro, de 40%, 2 VRs.

Já entre o início e o final do movimento ascendente total dessa curva, verifica-se que a

variação da F0 na OP consecutiva (82%) mostrou-se próxima da variação na OP causal (91%),

ambas superiores à da OP final de referência (63%). A elevação da F0 se processa com uma

média de 0,43Hz/ms, ou 97Hz em 222ms. Os valores exatos, para a pré-indicação:

. causal: 113Hz em 232ms, ou 0,48Hz/ms, ou 91%;

. consecutiva: 106Hz em 217ms, ou 0,48Hz/ms, ou 86%;

. final: 73Hz em 219ms, ou 0,33Hz/ms, ou 56%.

Esse movimento da F0, iniciado na SPreTF e concluído na STF, com caracterização

descendente-ascendente, forma uma curva côncava que, a partir de agora, será denominada vale

da F0. O vale da F0 é limitado, em seu lado superior, pela linha de referência37

, caracterizada a

seguir.

Considere-se uma linha paralela ao eixo temporal (abscissa), que tangencia a F0 no

primeiro momento de sua manifestação visual38

na vogal pré-tônica final (doravante, VPreTF).

Essa linha será, a partir de agora, simplesmente denominada LR. Na OP neutra, utilizada para a

35 Rossi (1978:14) caracterizou uma lei, segundo a qual um glissando não é jamais percebido em sua totalidade,

sendo que sua altura é determinada pela freqüência situada entre o segundo e o terceiro terços da duração vocálica.

O questionamento que ele estabelece diz respeito a saber se, na língua, o limite de referência para percepção do

glissando é um limite de identificação ou de discriminação. Sua proposta (26) é a de que esse limite de percepção

seja calculado com base em uma taxa de identificação. Assim, a partir dos experimentos realizados, a constatação

foi a de que o limite de percepção dos glissandos, tanto ascendentes quanto descendentes, se estabelece entre 18Hz e

19Hz para uma duração de 200ms, com uma freqüência inicial de 139Hz (para maiores detalhes, cf. Rossi, 1971 e

1978). 36Não se deve perder de vista que nem todo movimento de pitch percebido pelo ouvido humano é fonologicamente

significativo: como indica Fox (2000:285), citando „t Hart, Collier e Cohen (1990), esse movimento deve estar acima de determinados limites físico-psíquicos, mas também ser reconhecido como resultado de uma ação

intencional da parte do falante. 37 Optou-se por linha de “referência”, e não linha de “base”, para não estabelecer um conflito com a linha de base

(linha de declinação baixa, baseline) oposta à linha de declinação alta (topline) tradicionalmente utilizada para

delimitar a linha de declinação da F0 (cf. Di Cristo, 2004). 38 Preferiu-se estabelecer a descrição desta forma por conta da possibilidade de, devido ao fenômeno de co-

articulação, haver manifestação do traçado da F0 ainda durante a consoante que antecede a vogal, mesmo que essa

consoante seja surda. Nos casos em que ocorra uma consoante sonora e, portanto, o traçado representativo da F0

possa ser visualizado ao longo de todo esse segmento, a referência a ser estabelecida é o ponto inicial da vogal.

primeira etapa do processo de ressíntese, considere-se também uma LR que atende aos mesmos

princípios anteriores e que, no caso, está a 132Hz, na OP 1, e a 127Hz, na OP 2. Nas OPs

monotônicas, a LR é a própria F0 ao longo de toda a frase prosódica, aproveitando-se esses

mesmos valores; ou seja, a OP 1 monotônica tem sua F0 nivelada a 132Hz e a OP 2 monotônica,

a 127Hz.

Figura 6.1 – Diagramação visual do valor de referência (VR), da linha de referência (LR) e da elevação da F0 acima

da LR, a partir da OP 1 consecutiva de referência. Trata-se, neste caso, de 2 VRs. Os detalhes encontram-se no

texto.

A elevação da F0 acima dessa LR aproxima, diferentemente do verificado acima, quando

se assumiu a elevação da F0 a partir de seu ataque, a OP consecutiva de referência (29% de

variação) da OP final de referência (27% de variação), ambas com aproximadamente a metade

da variação verificada na OP causal de referência (62%). Os valores exatos, para a pré-indicação:

. causal: 91Hz em 167ms, ou 54Hz/ms, ou 62%;

. consecutiva: 51Hz em 101ms, ou 50Hz/ms, ou 29%;

. final: 45Hz em 98ms, ou 45Hz/ms, ou 27%.

A aproximação da OP consecutiva de referência em relação à OP final de referência,

diferentemente do que se verificou quando da análise da F0 a partir de seu ataque, desenvolvida

valor de referência

linha de

referência (LR)

elevação acima da

linha de referência

mais acima, deve-se ao fato de o vale da FO, na OP consecutiva de referência, apresentar maior

variação (2VRs) do que o verificado na subcategoria final (1,5VR).

Uma vez que a F0 na SPreTF, na OP 1 neutra que serviu de base ao processo de

ressíntese para produzir as modulações pré-indicativas da OP1, apresenta um movimento de

modulação descendente, repetindo, de certa forma, esse mesmo movimento verificado nas OPs

de referência, optou-se por manter essa conformação da F0 na sílaba pré-tônica das OPs 1 e 2

neutras, reajustando-se a variação do vale da F0 de forma a igualá-la à variação verificada nas

OPs de referência. A variação nesse segmento descendente da F0, na OP 1 neutra, é de 32%,

aproximada, para efeitos de simplificação, para 30% (ou seja, 1,5VR). Assim, o VR, expresso

percentualmente, foi aplicado levando-se em consideração a variação da F0, em Hz, na OP 1

neutra. Para os processos de ressíntese a partir da F0 das OPs monotônicas, a conformação do

vale da F0 foi criada, também segundo a quantidade de VRs em questão (cf. mais à frente).

O formato descendente da F0

O segundo grupo pré-indicativo é caracterizado pelo formato descendente da freqüência

fundamental (cf. figuras 4.1 e 4.2). Esse movimento da F0 se inicia na SPreTF, evidenciando

queda progressiva até o final da OP. O ataque da F0, no início da VPreTF, se dá em um nível

bastante elevado, e a queda se processa com uma variação média de 0,32Hz/ms, ou 107Hz em

319ms. Os valores exatos, para a pré-indicação:

. concessiva: 127Hz em 343ms, ou 0,37Hz/ms, ou 105%;

. conformativa: 107Hz em 285ms, ou 0,37Hz/ms, ou 81%;

. temporal: 84Hz em 359ms, ou 0,23Hz/ms, ou 57%.

Visualmente, as três subcategorias se assemelham bastante. A diferença extremamente

sutil entre os contornos pré-indicativos concessivo e conformativo parece se localizar na F0 da

VTF: no primeiro, forma-se uma ligeira curva côncava, enquanto que, no segundo, essa curva é

convexa. O processo de ressíntese utilizado na adaptação da F0 das OPs neutras a esses

contornos, como descrito a seguir, assumiu a hipótese de ser esse formato côncavo ou convexo

da F0 nesses segmentos o responsável pela diferenciação entre as duas subcategorias, ainda que

essa variação, conforme indicação dos prosogramas produzidos (cf. figuras 7.1 e 7.2, no capítulo

7), não seja perceptível ao ouvido humano39

Embora seja questionável a obtenção de uma frase que possa ser considerada, de fato,

neutra, a modulação que se verifica ao longo dessa frase faz que os resultados finais obtidos com

o processo de ressíntese soem mais naturais. Se, por um lado, isso permite que as possíveis

sensações de estranheza sonora sejam devidas exclusivamente às modificações produzidas

durante o processo de ressíntese, por outro torna questionável o fato de outros segmentos que

não tenham sido manipulados não serem (também) responsáveis pela caracterização do contorno

melódico pesquisado.

Com vistas a essa nova possibilidade, decidiu-se, como já mencionado anteriormente,

aplicar o mesmo processo de ressíntese às variantes monotônicas das OPs. Para obtê-las, bastou,

com o auxílio do programa Praat, eliminar todos os pontos existentes entre o primeiro e o último

pontos de pitch das OPs neutras. O resultado final apresenta a F0 com forma totalmente linear.

Para a OP 1 monotônica, essa linha de F0 foi estabelecida a 132Hz, seguindo o mesmo contorno

utilizado para o estabelecimento da LR para a OP 1 neutra; para a OP 2, o nivelamento se deu a

127Hz.

O processo de ressíntese das OPs 1 e 2 monotônicas seguiu, basicamente, as mesmas

etapas utilizadas para a OP 1 neutra, com algumas pequenas modificações, que serão

devidamente apresentadas. A escolha das ressínteses a serem utilizadas no Teste 2, em alguns

casos, não coincidiu com as realizadas em relação às OPs 1 e 2 neutras.

Buscou-se, ao máximo possível, que as etapas ao longo do processo de ressíntese fossem

semelhantes inter e intracategorialmente. Assim, as ressínteses da OP 2, produzidas para cada

subcategoria pré-indicativa, seguiram na maior parte das vezes as mesmas etapas utilizadas para

as ressíntes da OP 1. Os casos em que isso não se verificou são decorrentes da natureza

prosódica específica a uma ou a outra das OPs.

39 No entanto, como será discutido quando da análise dos resultados para o Teste 2 (cf. 7.2.3), alguns resultados

parecem contradizer essa previsão dos prosogramas.

RESSÍNTESE DAS ORAÇÕES PRINCIPAIS 1

6.1. RESSÍNTESE DAS OPS 1 NEUTRAS COM F0 ASCENDENTE

6.1.1 Pré-indicação consecutiva

A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 consecutiva de referência,

seguiu os seguintes passos:

6.1.1.1 adição de 0,5VR ao vale da F0;

6.1.1.2 cumulativamente, centralização do vértice do vale da F0 na consoante de ataque da STF;

6.1.1.3 cumulativamente, acima da LR, na OP neutra, elevação da F0 da VTF segundo as

quantidades de VR indicadas abaixo, na primeira coluna, com o objetivo de atingir o

valor máximo, em Hertz, indicado na segunda coluna. A terceira coluna indica os valores

obtidos40

após a ressíntese:

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 158 153

b) 1,5 171 168

c) 2 184 184

d) 2,5 198 192

e) 3 211 200

f) 3,5 224 212

g) 4 237 225

h) 4,5 250 240

i) 5 264 248

j) 5,5 277 260

k) 6 290 277

6.1.1.4 cumulativamente, aumento da duração da consoante na STF em 97%, assemelhando-a à

duração verificada na OP de referência;

6.1.1.5 cumulativamente, realocação de toda a F0 anterior à SPreTF 4% abaixo da LR.

A tabela apresentada na descrição da ressíntese (6.1.1.3) indica que os valores atingidos a

partir da aplicação do VR se mostraram diferentes dos valores esperados.

40 Conferir nota 28.

Como o vale da F0, na OP consecutiva de referência, apresenta variação de 2VRs, o vale

da F0 na OP neutra (que apresenta variação de 32%) foi aumentado de 0,5VR.

A implementação da ressíntese (6.1.1.5) se deu porque, comparando-se o traçado

melódico da OP neutra com o da OP consecutiva de referência, percebe-se que a F0 no segmento

anterior ao ponto crítico (ou seja, do início da oração até a VPreTF) nivela-se, aproximadamente,

com o traçado verificado na VPreTF. Enquanto na OP neutra a média da F0 nesse segmento está

11% abaixo da LR, na OP consecutiva de referência a média está 4% abaixo dessa linha. Isso

significa dizer que, para assemelhar esse segmento da OP neutra ao seu equivalente na OP

consecutiva de referência, é preciso que esta última tenha a média de seu segmento da F0 em

questão 4% abaixo da LR.

A audição, pelo Autor, das ressínteses produzidas indicou que a transformação (6.1.1.2)

não interfere no resultado final, assim como a (6.1.1.5), e que, para as transformações realizadas

em (6.1.1.3), o ponto crítico é o item (i): abaixo desse percentual, não se obtém a pré-indicação

consecutiva; acima desse percentual, ocorre a ênfase da pré-indicação. A transformação (6.1.1.4)

torna o todo da ressíntese mais próximo do original e, aplicada aos itens de (a) a (e) de (6.1.1.3),

não é capaz de lhes conferir o valor consecutivo. A centralização do vértice da F0, indicada em

(6.1.1.2), mostrou-se dispensável.

Para a realização do Teste 2, utilizaram-se, portanto, as ressínteses (6.1.1.3.i) e (6.1.1.4),

ilustradas pelas figuras 6.2 e 6.3, abaixo:

Figura 6.2 – Processo de ressíntese (6.1.1.3.i) da OP 1 neutra para a pré-indicação consecutiva

Figura 6.3 – Processo de ressíntese (6.1.1.4) da OP 1 neutra para a pré-indicação consecutiva

6.1.2. Pré-indicação causal

A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 causal de referência, seguiu

os seguintes passos:

6.1.2.1 redução do vale da F0 em 0,5VR;

6.1.2.3 cumulativamente, acima da LR, na OP neutra, elevação da F0 da VTF em:

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 158 155

b) 1,5 171 165

c) 2 184 177

d) 2,5 198 191

e) 3 211 201

f) 3,5 224 213

g) 4 237 225

h) 4,5 250 238

i) 5 264 251

j) 5,5 277 262

k) 6 290 273

6.1.2.4 cumulativamente, realocação de toda a F0 anterior à SPreTF 3% acima da LR.

A tabela apresentada na descrição da ressíntese 6.1.2.3 indica que os valores atingidos a

partir da aplicação do VR se mostraram diferentes dos valores esperados.

Como o vale da F0, na OP causal de referência, apresenta variação de 1VR, o vale da F0

na OP neutra (que apresenta variação de 32%), foi reduzido de 0,5VR.

Comparando-se o traçado melódico da OP neutra com o da OP causal de referência,

percebe-se que a F0 no segmento anterior ao ponto crítico (ou seja, do início da oração até a

VPreTF) nivela-se, aproximadamente, com o traçado verificado na VPreTF. Enquanto na OP

neutra a média da F0 nesse segmento está 11% abaixo da LR, na OP causal de referência a média

está 3% acima dessa linha (ou seja, a variação é negativa, considerando-se que a LR está abaixo

da média da F0 no segmento em questão). Isso significa dizer que, para assemelhar esse

segmento da OP neutra ao seu equivalente na OP causal de referência, é preciso que ela tenha a

média da F0 desse seu segmento elevado 3% acima da LR. Esse procedimento se efetuou com a

ressíntese 6.1.2.4.

A audição, pelo Autor, das ressínteses produzidas indicou que a transformação (6.1.2.3.i)

já parece ser suficiente para conferir à OP monotônica o valor pré-indicativo causal, e que a

transformação (6.1.2.4), cumulativa a (6.1.2.3.i), torna o resultado melhor. A centralização do

vértice da F0, indicada em (6.1.2.2) mostrou-se dispensável.

Para a realização do Teste 2, utilizaram-se, portanto, as ressínteses (6.1.2.3.i) e (6.1.2.4),

Figura 6.4 – Processo de ressíntese (6.1.2.3.i) da OP 1 neutra para a pré-indicação causal

Figura 6.5 – Processo de ressíntese (6.1.2.4) da OP 1 neutra para a pré-indicação causal

6.1.3. Pré-indicação final

Visualmente, o que parece diferenciar o contorno pré-indicativo final do causal, na OP 1,

é o valor máximo de elevação da F0 na vogal da STF. Nas OPs de referência, a F0 ascendente da

STF na pré-indicação causal apresenta uma variação de 113Hz, ou 91%, enquanto que, na pré-

indicação final, essa variação é de 82Hz, ou 63%. Tomando-se como referência a LR, na pré-

indicação causal a F0 da VTF sofre uma elevação de 91Hz, ou 62% (3,1VR) e, na pré-indicação

final, de 45Hz, ou 27% (1,35VR). Uma vez que o vale da F0, na OP final de referência, sofre

variação de 28%, optou-se por não modificar esse mesmo segmento na manipulação da OP

neutra, em que a variação é de 32%.

A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 final de referência, seguiu os

seguintes passos:

6.1.3.1 centralização do vértice do vale da F0 na consoante de ataque da STF;

6.1.3.2 cumulativamente, acima da LR, na OP neutra, elevação da F0 da VTF em:

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 158 157

b) 1,5 171 168

c) 2 184 176

d) 2,5 198 191

e) 3 211 203

f) 3,5 224 213

g) 4 237 226

h) 4,5 250 238

i) 5 264 249

j) 5,5 277 263

k) 6 290 274

6.1.3.3 a duração da consoante de ataque da STF (/l/), na OP de referência, é 54% maior que na

OP neutra. Cumulativamente, aplicação dessa transformação;

6.1.3.4 a duração da vogal (/i/) e da consoante de coda (/s/) na STF é, respectivamente, 23% e

117% maior na OP neutra que na OP final de referência. Cumulativamente, redução da

duração desses segmentos, na OP neutra, portanto, em 18% e 53%41

, respectivamente;

6.1.3.5 a duração da sílaba /ka/, na OP final de referência, é 39% maior do que na OP neutra.

Cumulativamente, redução da duração da sílaba /ka/, na OP neutra, portanto, em 27%;

6.1.3.6 cumulativamente, realocação de toda a F0 anterior à SPreTF 8% abaixo da LR;

6.1.3.7 ressíntese (6.1.3.6) excluindo (6.1.3.5).

A audição, pelo Autor, das ressínteses produzidas indicou que parece ser necessário que a

transformação (6.1.3.2.g) seja acompanhada por (6.1.3.3). As transformações (6.1.3.4) e

(6.1.3.5), cumulativamente a (6.1.3.1) e (6.1.3.2), tornam as ressínteses mais próximas do

original, embora não pareçam ser indispensáveis. A centralização do vértice da F0, indicada em

(6.1.3.1), mostrou-se desnecessária.

Utilizaram-se, portanto, para o Teste 2, as ressínteses (6.1.3.2.g) e (6.1.3.3), ilustradas

pelas figuras 6.6 e 6.7, abaixo:

41 Para obter o percentual de redução da duração, tornam-se os valores de 23% e 117% os novos valores referenciais

e, por meio de uma regra de 3, calcula-se em que percentual os segmentos devem ser reduzidos na OP neutra. Por

exemplo, para o cálculo relativo à vogal /i/:

/i/ OP final 0,149ms – 100% /i/ OP neutra 0,184ms – x x = 23%

Assumindo esse novo valor como referencial:

0,184ms – 23%

0,149ms – x x = 18%

Para comprovar esses cálculos, basta subtrair 18% da duração do segmento na OP neutra e o resultado será a

duração do segmento na OP de referência:

0,184ms – 18% = 0,151ms (a diferença se deve à variação no número de casas decimais no cálculo do percentual,

desprezadas)

Figura 6.6 – Processo de ressíntese (6.1.3.2.i) da OP 1 neutra para a pré-indicação final

Figura 6.7 – Processo de ressíntese (6.1.3.3) da OP 1 neutra para a pré-indicação final

6.2. RESSÍNTESE DAS OPS 1 NEUTRAS COM F0 DESCENDENTE

6.2.1. Pré-indicação concessiva

Para iniciar o processo de ressíntese da OP 1 neutra, o primeiro ponto a determinar seria o

referencial a partir do qual se localizaria o valor máximo de elevação da F0 na VPreTF.

Estipulou-se que esse referencial seria o valor máximo de pitch da vogal nasal (no caso da OP 1),

núcleo da sílaba anterior à SPreTF. Na OP 1 concessiva de referência, a variação entre esse valor

máximo da vogal da sílaba anterior à SPreTF e o valor máximo da F0 na vogal da SPreTF foi de

27Hz, ou 12%.

Acompanhando a queda da F0 (segundo ponto a determinar), observa-se que, nessa

mesma oração tomada como base, entre o início e o fim da VPreTF, há uma variação de –10Hz,

ou –4%; entre o início e o fim da consoante de ataque da STF, a variação é de –56Hz, ou –30%;

e entre o início e o fim da VTF, de –61Hz, ou –50%.

O terceiro ponto a determinar seria o grau de concavidade aplicado quando da formação

da curva ligeiramente côncava. Na OP 1 concessiva de referência, estabeleceu-se o ponto médio

da VTF, no eixo temporal imaginário (abscissa), registrando-se o valor da F0. A seguir, projetou-

se uma reta que unisse o ponto inicial e o ponto final da F0 dessa VTF. A partir do ponto médio

temporal, projetou-se uma reta paralela ao eixo vertical (ordenada) e, na intersecção dessa reta

vertical com a reta de união dos pontos extremos da F0, calculou-se o potencial valor da F0. A

variação entre esses valores, medidos em Hz, foi de 10%. Ou seja, a F0, na VTF, apresenta uma

modulação de formato côncavo em 10%.

Figura 6.8 – Diagramação visual para cálculo da variação da F0 na concavidade formada na VTF da OP 1

concessiva de referência. A variação é obtida pela diferença entre o valor potencial da F0 e o valor de pitch

mensurado no ponto médio da VTF.

A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 concessiva de referência,

seguiu, então, os seguintes passos:

ponto médio da

valor potencial

6.2.1.1 modulação da F0 englobando, simultaneamente, as seguintes características:

a. ponto inicial da curva descendente elevado 12% acima do valor máximo de pitch da

vogal na sílaba anterior à SPreTF;

b. variação descendente da F0, na VPreTF, em 4%;

c. variação descendente da F0, na consoante da STF, em 30%;

d. variação descendente da F0, na VTF, em 50%;

e. elevação de toda a frase em 30%;

f. formação de ponto de pitch no ponto médio da VTF;

6.2.1.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato côncavo. Para

isso, criou-se um ponto de pitch na F0, tomando como referência seu ponto médio

temporal,

a. com concavidade em 10%;

b. com concavidade em 15%;

c. com concavidade em 20%;

6.2.1.3 cumulativamente, redução da duração da sílaba /ka/ em 54%.

Como o tom da voz masculina utilizada na gravação da OP neutra era bastante grave, os

rebaixamentos da F0 produzidos em (6.2.1.1) tornaram o resultado auditivo da ressíntese

inadequados. Como solução, elevou-se a F0 de toda a frase em 30% (6.2.1.1.e), o que produziu

um resultado sonoro satisfatório.

Comparando-se o resultado sonoro obtido com a OP 1 concessiva de referência, a

duração da sílaba /ka/ pareceu interferir no valor pré-indicativo concessivo. Na OP 1 concessiva

de referência, a duração dessa sílaba mostrou-se 54% menor que na OP 1 neutra. Por conta disso,

a transformação (6.2.1.3).

já parece ser suficiente para conferir à OP 1 neutra o valor pré-indicativo concessivo, e que a

transformação (6.2.1.3), cumulativa a (6.2.1.1), torna a similaridade com a OP concessiva de

referência maior, embora não pareça um acréscimo essencial.

A aplicação de (6.2.1.2.c) acentua a modulação da voz na VTF, embora (6.2.1.2.b) soe

mais natural.

Utilizaram-se, para o Teste 2, as ressínteses (6.2.1.1) e (6.2.1.2.b), ilustradas pelas figuras

6.9 e 6.10, abaixo:

Figura 6.9 – Processo de ressíntese (6.2.1.1) da OP 1 neutra para a pré-indicação concessiva

Figura 6.10 – Processo de ressíntese (6.2.1.2.b) da OP 1 neutra para a pré-indicação concessiva

6.2.2. Pré-indicação conformativa

Como discutido anteriormente, o elemento diferenciador entre o contorno pré-indicativo

conformativo e o concessivo parece ser a curva, convexa ou côncava, formada ao longo do

traçado da freqüência fundamental ao longo da VTF. Partindo desse pressuposto, o processo de

ressíntese da OP 1 neutra, para produzir o valor pré-indicativo conformativo, assumiu os mesmos

passos iniciais utilizados para a ressíntese da pré-indicação concessiva, descritos em 6.2.1 acima,

respeitando-se a diferença de variação da F0 existente em cada segmento. Assim, para o

referencial a partir do qual o valor máximo de elevação da F0 na VPreTF seria estipulado,

adotou-se, da mesma forma, o valor máximo de pitch da vogal nasal, núcleo da sílaba anterior à

SPreTF. Na OP 1 conformativa de referência, a variação entre esse valor máximo da vogal da

sílaba anterior à SPreTF e o valor máximo da F0 na vogal da SPreTF foi de 35Hz, ou 17%.

A queda da F0, a partir do início da VPreTF até a fronteira com a consoante seguinte,

sofreu uma variação de –22Hz, ou –10%; entre o início e o fim da consoante da STF, a variação

foi de –59Hz, ou –37%; e entre o início e o fim da VTF, de –26Hz, ou –19%.

Quanto ao grau de convexidade da curva formada pela F0 na VTF, estabeleceu-se, da

mesma forma que para a pré-indicação concessiva, o seu ponto médio, no eixo temporal,

registrando-se o valor da F0. A seguir, foi feita a projeção de uma reta que tangenciasse o ponto

inicial e o ponto final da F0 dessa VTF. A partir do ponto médio temporal, projetou-se uma reta

paralela ao eixo vertical e, na intersecção dessa reta vertical com a reta de união dos pontos

extremos da F0, calculou-se o potencial valor da F0. A variação, neste caso, foi de 3%.

Observando-se atentamente esse trecho da F0 na OP conformativa de referência, verifica-se uma

irregularidade do traçado. Caso a medição seja feita com base no ponto mais pronunciado da

curva, essa diferença se eleva a 5%. Embora esse percentual de variação possa parecer irrisório,

deve-se considerar que, em paralelo com a variação verificada para a pré-indicação concessiva, a

diferença entre os extremos da curva côncava e da curva convexa somará 15%.

A ressíntese da OP 1 neutra, de forma a assemelhá-la à OP 1 conformativa de referência,

seguiu, então, os seguintes passos:

6.2.2.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato convexo. Para

temporal,

a. com convexidade em 5%;

b. com convexidade em 10%;

c. com convexidade em 15%;

d. com convexidade em 20%;

Da mesma forma que para a ressíntese para o valor pré-indicativo concessivo, foi

necessário elevar toda a F0, e 30% de elevação se mostraram igualmente satisfatórios.

Comparando-se o resultado obtido com a OP 1 conformativa de referência, a duração da

sílaba /ka/ talvez pudesse interferir no valor pré-indicativo concessivo. Na OP 1 conformativa de

referência, a duração dessa sílaba mostrou-se 26% menor que na OP 1 neutra, o que gerou a

ressíntese (6.2.2.3).

não produziu efeito importante. Houve apenas uma maior aproximação com o verificado na OP 1

conformativa de referência. Quanto ao aspecto da formação da convexidade na curva de F0 da

VTF, o melhor efeito foi obtido com a ressíntese 6.2.2.2.c.

Para a realização do Teste 2, utilizaram-se, assim, as ressínteses (6.2.2.1) e (6.2.2.2.d),

Figura 6.11 – Processo de ressíntese (6.2.2.1) da OP 1 neutra para a pré-indicação conformativa

Figura 6.12 – Processo de ressíntese (6.2.2.2.d) da OP 1 neutra para a pré-indicação conformativa

6.2.3. Pré-indicação temporal

Entre as três subcategorias que compõem o grupo pré-indicativo com modulação

descendente da freqüência fundamental, a temporal apresenta o contorno da F0 na VTF com

menor variação. Enquanto as subcategorias concessiva e conformativa apresentam esse segmento

com uma variação de –50% e de –19%, respectivamente, a VTF da pré-indicação temporal sofre

uma variação, em Hz, de apenas –5%. O seu contorno, portanto, mostra-se mais plano. O

processo de ressíntese, descrito a seguir, assume essa particularidade como sendo o elemento

diferenciador em relação às outras duas subcategorias.

Uma vez que, anteriormente à VTF, a F0 apresenta um comportamento semelhante ao

verificado tanto para a pré-indicação concessiva quanto para a conformativa, o processo de

ressíntese da OP 1 neutra, para produzir o valor pré-indicativo temporal, retoma os mesmos

passos iniciais utilizados para aquelas duas. Da mesma forma, o referencial a partir do qual o

valor máximo de elevação da F0 na VPreTF seria calculado foi estipulado no valor máximo de

pitch da vogal nasal, núcleo da sílaba anterior à SPreTF. Na OP 1 temporal de referência, a

variação entre esse valor máximo da vogal da sílaba anterior à SPreTF e o valor máximo da F0

na vogal da SPreTF foi de 26Hz, ou 12%.

A variação que a F0 sofreu, entre o início da VPreTF e a fronteira com a consoante

seguinte, foi de –23Hz, ou –11%; entre o início e o fim da consoante da STF, de –53Hz, ou –

34%; e entre o início e o fim da VTF, de –8Hz, ou –5%, como já mencionado acima.

O processo de ressíntese da OP 1 neutra para obtenção da pré-indicação temporal seguiu,

então, os seguintes passos:

6.2.3.2 cumulativamente, manipulação da F0 na VPreTF, tornando-a mais linear;

6.2.3.3 cumulativamente, redução da duração da VTF em 61%;

6.2.3.4 cumulativamente, redução da duração da sílaba /ka/ em 45%;

6.2.3.5 ressíntese (6.2.3.4) excluindo a ressíntese (6.2.3.3).

Da mesma forma que para a ressíntese para os valores pré-indicativos concessivo e

conformativo, toda a F0 foi elevada em 30%, como indicado em (6.2.3.1.e), com resultado

sonoro igualmente satisfatório.

As ressínteses (6.2.3.4) e (6.2.3.5) não mostraram um resultado sonoro apropriado. A

transformação promovida em (6.2.3.2) tornou o resultado auditivo perceptualmente mais

próximo do verificado na OP 1 temporal de referência, e a ressíntese (6.2.3.3) tornou esse

resultado ainda mais próximo do original.

Utilizaram-se, então, para o Teste 2, as ressínteses (6.2.3.2) e (6.2.3.3), ilustradas pelas

figuras 6.13 e 6.14, abaixo:

Figura 6.13 – Processo de ressíntese (6.2.3.2) da OP 1 neutra para a pré-indicação temporal

A partir dessas observações, talvez se possa afirmar que a duração maior das vogais pré-

tônica e tônica final, na OP 1 neutra, não prejudica o estabelecimento do contorno pré-indicativo

temporal, embora sua redução melhore o efeito global, tornando o resultado obtido com a

ressíntese muito mais próximo do verificado na oração de referência. Parecem ser marcas do

contorno pré-indicativo temporal, então, a VTF com um formato de F0 mais nivelado,

cumulativamente com a duração reduzida, e a VPreTF mais enfatizada, especialmente por meio

de uma queda mais linear de sua F0.

6.3. RESSÍNTESE DAS OPS 1 MONOTÔNICAS COM F0 ASCENDENTE

6.3.1. Pré-indicação consecutiva

A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 consecutiva de

referência, seguiu os seguintes passos:

6.3.1.1 formação do vale da F0, com 2VRs;

6.3.1.3 cumulativamente, acima da LR, na OP 1 monotônica, elevação da F0 da VTF segundo as

obtidos após a ressíntese:

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 158 158

b) 1,5 171 170

c) 2 184 182

d) 2,5 198 195

e) 3 211 211

f) 3,5 224 218

g) 4 237 235

h) 4,5 250 248

i) 5 264 263

j) 5,5 277 265

k) 6 290 279

duração verificada na OP consecutiva de referência.

Como se pode perceber, foi necessária a formação do vale da F0, uma vez que a F0 da

OP 1 monotônica se mostra totalmente nivelada. Essa formação adotou a mesma variação de

modulação verificada na OP 1 neutra.

Para o Teste 2, escolheram-se as ressínteses (6.3.1.3.i) e (6.3.1.4), ilustradas pelas figuras

6.15 e 6.16, abaixo:

Figura 6.15 – Processo de ressíntese (6.3.1.3.i) da OP 1 monotônica para a pré-indicação consecutiva

Figura 6.16 – Processo de ressíntese (6.3.1.4) da OP 1 monotônica para a pré-indicação consecutiva

A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 causal de referência,

6.3.2.1 formação do vale de F0, com 1VR;

6.3.2.3 cumulativamente, acima da LR, na OP 1 monotônica, elevação da F0 da VTF em:

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 158 158

b) 1,5 171 169

c) 2 184 182

d) 2,5 198 194

e) 3 211 210

f) 3,5 224 218

g) 4 237 237

h) 4,5 250 249

i) 5 264 262

j) 5,5 277 267

k) 6 290 279

A diferença básica em relação à manipulação da OP 1 neutra se situa na formação do vale

da F0, neste caso, com 1VR.

Para a realização do Teste 2, utilizaram-se as ressínteses (6.3.2.3.i) e (6.3.2.4), ilustradas

Figura 6.17 – Processo de ressíntese (6.3.2.3.i) da OP 1 monotônica para a pré-indicação causal

Figura 6.18 – Processo de ressíntese (6.3.2.4) da OP 1 monotônica para a pré-indicação causal

A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 final de referência,

6.3.3.1 formação do vale da F0 com 1,5VR;

6.3.3.3 cumulativamente, acima da LR, na OP 1 monotônica, elevação da F0 da VTF em:

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 158 158

b) 1,5 171 170

c) 2 184 182

d) 2,5 198 196

e) 3 211 206

f) 3,5 224 214

g) 4 237 237

h) 4,5 250 249

i) 5 264 263

j) 5,5 277 266

k) 6 290 280

6.3.3.4 a duração da consoante de ataque da STF (/l/), na OP 1 final de referência, é 54% maior

que na OP 1 monotônica. Cumulativamente, aplicação dessa adaptação;

6.3.3.5 a duração da vogal (/i/) e da consoante (/s/) na STF é, respectivamente, 23% e 117%

maior na OP 1 monotônica que na OP 1 final de referência. Cumulativamente, redução da

duração desses segmentos, na OP 1 monotônica, portanto, em 18% e 53%42

respectivamente;

6.3.3.6 a duração da sílaba /ka/, na OP 1 final de referência, é 39% maior do que na OP 1

monotônica. Cumulativamente, redução da duração da sílaba /ka/, na OP 1 monotônica,

portanto, em 27%42

6.3.3.7 cumulativamente, realocação de toda a F0 anterior à SPreTF 8% abaixo da LR;

6.3.3.8 ressíntese (6.3.3.6) excluindo (6.3.3.5).

Na manipulação da OP 1 neutra para produzir as ressínteses para o contorno pré-

indicativo final, não foi necessário modificar o vale da F0, que já se mostrava com 1,5VR. Para a

OP 1 monotônica, necessariamente, houve a formação do vale, o que, comparativamente ao

processo para a OP 1 neutra, produziu uma ressíntese a mais.

Utilizaram-se, para o Teste 2, as ressínteses (6.3.3.3.g) e (6.3.3.4), ilustradas pelas figuras

6.19 e 6.20, abaixo:

Figura 6.19 – Processo de ressíntese (6.3.3.3.g) da OP 1 monotônica para a pré-indicação final

42 cf. nota 41.

Figura 6.20 – Processo de ressíntese (6.3.3.4) da OP 1 monotônica para a pré-indicação final

6.4. RESSÍNTESE DAS OPS 1 MONOTÔNICAS COM F0 DESCENDENTE

A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 concessiva de

a. ponto inicial da curva descendente elevado 12% acima da LR no início da vogal da

sílaba anterior à SPreTF;

6.4.1.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato côncavo. Para

temporal,

Como observado, não houve necessidade de modificação alguma nas etapas do processo

de ressíntese, comparativamente à OP 1 neutra.

6.21 e 6.22, abaixo:

Figura 6.21 – Processo de ressíntese (6.4.1.1) da OP 1 monotônica para a pré-indicação concessiva

Figura 6.22 – Processo de ressíntese (6.4.1.2.b) da OP 1 monotônica para a pré-indicação concessiva

A ressíntese da OP 1 monotônica, de forma a assemelhá-la à OP 1 conformativa de

6.4.2.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato convexo. Para

temporal,

Também para este grupo não houve necessidade de modificação alguma nas etapas do

processo de ressíntese, comparativamente à OP 1 neutra.

Para a realização do Teste 2, utilizaram-se as ressínteses (6.4.2.1) e (6.4.2.2.d), ilustradas

Figura 6.23 – Processo de ressíntese (6.4.2.1) da OP 1 monotônica para a pré-indicação conformativa

Figura 6.24 – Processo de ressíntese (6.4.2.2.d) da OP 1 monotônica para a pré-indicação conformativa

O processo de ressíntese da OP 1 monotônica para obtenção da pré-indicação temporal

6.4.3.4 cumulativamente, redução da duração da sílaba /ka/ em 45%;

6.4.3.5 ressíntese (6.4.3.4) excluindo a ressíntese (6.4.3.3).

Mais uma vez, o processo de ressíntese mostrou-se idêntico ao utilizado para a OP 1

neutra.

Utilizaram-se, para o Teste 2, as ressínteses (6.4.3.2) e (6.4.3.3), ilustradas pelas figuras

6.25 e 6.26, abaixo:

Figura 6.25 – Processo de ressíntese (6.4.3.2) da OP 1 monotônica para a pré-indicação temporal

De uma forma geral, as ressínteses obtidas a partir da OP 1 monotônica não apresentaram

um resultado sonoro final muito diferente do obtido para a manipulação da OP 1 neutra. A

ausência da modulação da F0 verificada na OP 1 monotônica (excluindo-se, evidentemente, os

segmentos manipulados durante a ressíntese), parece se diluir por força do número reduzido de

sílabas constituindo a frase. Isso, como se verá mais à frente, não ocorre em relação à OP 2

monotônica, que apresenta um maior número de sílabas.

RESSÍNTESE DAS ORAÇÕES PRINCIPAIS 2

A OP 2 – Mostrava-se cansado – foi constituída de forma a existir uma sílaba pós-tônica

final, com o objetivo de verificar se esse fator causaria alguma interferência potencial na

caracterização da função pré-indicativa. Enquanto a OP 1 – Ficava infeliz – apresenta quatro

sílabas fonéticas anteriores à STF (recorrentemente, houve elisão de [a] ao se combinarem as

sílabas <va> e <in>, produzindo-se, então, [] [] [] []), a OP 2 apresenta cinco sílabas

([] [] [] [] []). Paralelamente à existência de uma sílaba a mais, deve-se ainda

considerar que, entre os fonemas constituintes da frase, há um número maior de fricativas, classe

fonêmica que apresenta uma duração intrínseca mais longa (Di Cristo, 1985).

A OP 2 neutra apresentou a manifestação do fonema [], da sílaba <si>, em sua gravação.

Nas OPs 2 de referência, esse fonema não se realizou quatro vezes: nas concessivas, nas

conformativas, nas consecutivas e nas temporais. Essa não-realização implica a diminuição de

uma sílaba antes da STF. No entanto, como as ressínteses foram produzidas a partir da OP 2

neutra (em que não houve a elisão do fonema []), houve a manutenção das cinco sílabas

originais.

Em relação à duração, a OP 2 neutra apresentou o segmento anterior à STF com 831ms,

enquanto a OP 1 neutra, com 660ms, uma diferença, portanto, de 26%. Somando-se a isso a

presença de uma sílaba pós-tônica, a manipulação da OP 2 implica duas hipóteses:

1. o grau de naturalidade obtido com a manipulação da OP 2 monotônica não será o

mesmo verificado em relação à manipulação da OP 1 monotônica;

2. a presença de uma sílaba pós-tônica exige uma configuração melódica, para cada

contorno pré-indicativo, diferente da configuração estabelecida para os casos em que

não há uma sílaba pós-tônica.

Um outro ponto que deve ser levado em consideração, quando da manipulação da OP 2, é

o fato de a STF ser constituída, em seu ataque, por uma consoante fricativa surda, o que elimina,

nesse segmento, a manifestação visual da freqüência fundamental. Comparativamente à OP 1,

que apresenta, nessa posição, uma consoante lateral, a F0 da OP 2, nessa STF, mostra um ataque

bastante elevado, sem, portanto, uma transição harmônica do contorno entre as vogais da SPreTF

e da STF, como se pode perceber na figura 4.7, reproduzida abaixo como 6.27 para conveniência

do leitor.

OP 1 neutra OP 2 neutra

Figura 6.27 – Processo de ressíntese (6.4.3.3) da OP 1 monotônica para a pré-indicação temporal.

O processo de ressíntese da OP 2 procurou seguir, ao máximo possível, as modificações

produzidas para as ressínteses da OP 1. Uma vez que se procura estabelecer um contorno pré-

indicativo, é razoável que a manipulação de todas as possíveis OPs siga os mesmos parâmetros.

Basicamente, as diferenças se verificaram em relação à duração dos segmentos, com

características próprias diferentes na OP 1 e na OP 2. Como sugerido no parágrafo anterior, o

ponto de partida da manipulação da F0 na STF também foi diferente na OP 2.

A LR para a OP 2, como citado anteriormente, foi estabelecida a 127Hz, atendendo aos

mesmos princípios utilizados para a OP 1, ou seja, o valor máximo de elevação da F0 na vogal

da SpreTF na OP neutra.

6.5. RESSÍNTESE DAS OPS 2 NEUTRAS COM F0 ASCENDENTE

A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 consecutiva de referência,

6.5.1.1 formação do vale da F0 a 2VRs abaixo da LR;

6.5.1.3 cumulativamente, acima da LR, na OP 2 neutra, elevação da F0 da VTF segundo as

Time (s)

0 1.576210

Time (s)

0 1.746370

250mo t r a v a s i k a s a d u

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 152 153

b) 1,5 165 165

c) 2 177 178

d) 2,5 190 191

e) 3 203 203

f) 3,5 215 216

g) 4 228 229

h) 4,5 241 242

i) 5 254 254

j) 5,5 266 266

k) 6 279 280

Para o Teste 2, escolheram-se as ressínteses (6.5.1.3.i) e (6.5.1.4), ilustradas pelas figuras

6.28 e 6.29, abaixo. Comparativamente aos resultados sonoros obtidos para as ressínteses da OP

1 neutra, as ressínteses escolhidas para o Teste 2 foram equivalentes. Observe-se que o

percentual de duração na consoante da STF mostrou-se diferente em uma e em outra OP (na OP

1, aumento de 97%; na OP 2, aumento de 18%), por conta das durações verificadas nas OPs de

referência.

Figura 6.28 – Processo de ressíntese (6.5.1.3.i) da OP 2 neutra para a pré-indicação consecutiva

Figura 6.29 – Processo de ressíntese (6.5.1.4) da OP 2 neutra para a pré-indicação consecutiva

A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 causal de referência, seguiu

6.5.2.1 formação do vale da F0 a 1VR abaixo da LR;

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 152 153

b) 1,5 165 165

c) 2 177 178

d) 2,5 190 191

e) 3 203 203

f) 3,5 215 216

g) 4 228 229

h) 4,5 241 242

i) 5 254 254

j) 5,5 266 266

k) 6 279 280

Para a realização do Teste 2, utilizaram-se as ressínteses (6.5.2.3.f) e (6.5.2.4), ilustradas

pelas figuras 6.30 e 6.31, abaixo. As ressínteses da OP 2 neutra selecionadas para o Teste 2 não

se mostraram equivalentes às selecionadas para a OP 1 neutra, considerando-se os percentuais de

variação empregados. Observe-se que, para as ressínteses da OP 1 neutra, na modalidade pré-

indicativa causal, a ressíntese com manipulação da F0 na vogal da STF (6.5.2.3.i) apresentou

variação de 5VRs, enquanto que, para a OP 2 neutra, 3,5VRs.

Figura 6.30 – Processo de ressíntese (6.5.2.3.f) da OP 2 neutra para a pré-indicação causal

Figura 6.31 – Processo de ressíntese (6.5.2.4) da OP 2 neutra para a pré-indicação causal

A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 final de referência, seguiu os

seguintes passos:

6.5.3.1 formação do vale da F0 a 1,5VR abaixo da LR;

6.5.3.3 cumulativamente, elevação da F0 no início da VTF 28% acima da LR; no ápice da VTF,

31%; no final da vogal pós-tônica final, 13% abaixo da LR;

6.5.3.4 cumulativamente, localização do ápice da F0 na VTF a 56% do seu início, e localização

da F0 no fim da VTF 27% abaixo de seu ápice;

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 152 152

b) 1,5 165 164

c) 2 177 177

d) 2,5 190 190

e) 3 203 202

f) 3,5 215 215

g) 4 228 228

h) 4,5 241 241

i) 5 254 253

j) 5,5 266 266

k) 6 279 280

6.5.3.7 cumulativamente, F0 anterior à SPreTF 14% acima da LR.

Utilizaram-se, para o Teste 2, as ressínteses (6.5.3.5.c) e (6.5.3.6), ilustradas pelas figuras

6.32 e 6.33, abaixo. A seleção das ressínteses da OP 2 neutra para o Teste 2 não se mostrou

equivalente, também neste caso, à seleção feita para a OP 1 neutra, considerando-se os

percentuais de variação empregados. Observe-se que, para as ressínteses da OP 1 neutra, na

modalidade pré-indicativa final, a ressíntese com manipulação da F0 na vogal da STF (6.1.3.2.g)

apresentou variação de 4VRs, enquanto que, para a OP 2 neutra, 2VRs.

Figura 6.32 – Processo de ressíntese (6.5.3.5.c) da OP 2 neutra para a pré-indicação final

Figura 6.33 – Processo de ressíntese (6.5.3.6) da OP 2 neutra para a pré-indicação final

6.6. RESSÍNTESE DAS OPS 2 NEUTRAS COM F0 DESCENDENTE

A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 concessiva de referência,

6.6.1.2 cumulativamente, modulação da F0, na VTF, conferindo-lhe um formato côncavo, a

partir do ponto de pitch criado na F0,

6.6.1.3 cumulativamente, adaptação da duração de todos os fones da frase, assimilando-a à OP

de referência.

A única modificação nas etapas do processo de ressíntese, comparativamente à OP 1

neutra, se deu em relação ao parâmetro da duração. Uma vez que não foi possível estabelecer, da

mesma forma que para a OP 1 neutra, uma única sílaba anterior à STF a ter sua duração

modificada, optou-se por fazer a adaptação completa da duração em toda a frase. De toda forma,

essa modificação não pareceu importante na obtenção do valor pré-indicativo concessivo.

6.34 e 6.35, abaixo:

Figura 6.34 – Processo de ressíntese (6.6.1.1) da OP 2 neutra para a pré-indicação concessiva

Figura 6.35 – Processo de ressíntese (6.6.1.2.b) da OP 2 neutra para a pré-indicação concessiva

A ressíntese da OP 2 neutra, de forma a assemelhá-la à OP 2 conformativa de referência,

6.6.2.3 cumulativamente, adaptação da duração de todos os fones da frase, assimilando-a ao

verificado na OP de referência.

Da mesma forma que para o grupo precedente, a única modificação no processo de

ressíntese, comparativamente ao desenvolvido para a OP 1 neutra, se deu em relação à duração

da frase. Também aqui, o resultado final decorrente dessa modificação não pareceu interferir na

obtenção do contorno pré-indicativo desejado.

Figura 6.36 – Processo de ressíntese (6.6.2.1) da OP 2 neutra para a pré-indicação conformativa

Figura 6.37 – Processo de ressíntese (6.6.2.2.d) da OP 2 neutra para a pré-indicação conformativa

O processo de ressíntese da OP 2 neutra para obtenção da pré-indicação temporal seguiu

6.6.3.2 cumulativamente, linearização da F0 na VPreTF;

6.6.3.4 cumulativamente, aumento da duração da consoante da STF em 19%;

6.6.3.5 cumulativamente, redução da duração do segmento /travasi/, assemelhando-a ao

verificado na OP 2 temporal de referência;

6.6.3.6 ressíntese (6.6.3.5) excluindo a ressíntese (6.6.3.4);

6.6.3.8 ressíntese (6.6.3.5), excluindo as ressínteses (6.6.3.3) e (6.6.3.4).

Comparativamente ao processo de ressíntese para a OP 1 neutra, houve, aqui, algumas

alterações significativas. Além da variação na duração da VTF, devido às características próprias

das OPs de referência, o aumento da duração da consoante na STF mostrou-se como uma

adaptação indispensável para a obtenção de um resultado sonoro próximo ao verificado na OP 2

temporal de referência.

A escolha do segmento /travasi/ (ressíntese 6.6.3.5) para ter a duração modificada se deu

porque, como já comentado em relação ao processo de ressíntese para a pré-indicação concessiva

(cf. 6.6.1.3 e parágrafo subseqüente), não foi possível selecionar uma única sílaba a ter a duração

modificada. Observe-se que, no caso das ressínteses para a pré-indicação concessiva, não houve

necessidade de alterar a duração de segmentos específicos a partir da SPreTF. Neste caso da pré-

indicação temporal, no entanto, houve alterações de duração indispensáveis, como mencionado

no parágrafo anterior. Por outro lado, não pareceu necessário modificar a duração da primeira

sílaba da frase, optando-se, então, apenas pela modificação nesse segmento <trava se>.

6.38 e 6.39, abaixo:

RESSÍNTESE DA OP 2 MONOTÔNICA

O processo de ressíntese da OP 2, como dito, procurou seguir, ao máximo possível, as

modificações produzidas para a ressíntese da OP 1. Essas mesmas transformações, respeitadas as

peculiaridades da OP 2 em relação à OP 1, foram aplicadas também à OP 2 monotônica,

conforme as descrições a seguir.

6.7. RESSÍNTESE DAS OPS 2 MONOTÔNICAS COM F0 ASCENDENTE

A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 consecutiva de

6.7.1.1 formação do vale da F0 a 2VRs abaixo da LR;

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 152 152

b) 1,5 165 165

c) 2 177 178

d) 2,5 190 191

e) 3 203 203

f) 3,5 215 216

g) 4 228 229

h) 4,5 241 241

i) 5 254 254

j) 5,5 266 267

k) 6 279 279

Para o Teste 2, escolheram-se as ressínteses (6.7.1.3.g) e (6.7.1.4), ilustradas pelas figuras

6.40 e 6.41, abaixo. Comparativamente aos resultados sonoros obtidos para a OP 2 neutra, houve

redução de dois níveis de variação do VR na elevação da F0 na STF para essa escolha.

Figura 6.40 – Processo de ressíntese (6.7.1.3.g) da OP 2 monotônica para a pré-indicação consecutiva

Figura 6.41 – Processo de ressíntese (6.7.1.4) da OP 2 monotônica para a pré-indicação consecutiva

A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 causal de referência,

6.7.2.1 formação do vale da F0 a 1VR abaixo da LR;

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 152 152

b) 1,5 165 165

c) 2 177 178

d) 2,5 190 191

e) 3 203 203

f) 3,5 215 216

g) 4 228 229

h) 4,5 241 241

i) 5 254 254

j) 5,5 266 267

k) 6 279 279

Para a realização do Teste 2, da mesma forma verificada para as ressínteses da OP 2

neutra, utilizaram-se as ressínteses (6.7.2.3.f) e (6.7.2.4), ilustradas pelas figuras 6.42 e 6.43,

abaixo:

Figura 6.42 – Processo de ressíntese (6.7.2.3.f) da OP 2 monotônica para a pré-indicação causal

Figura 6.43 – Processo de ressíntese (6.7.2.4) da OP 2 monotônica para a pré-indicação causal

A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 final de referência,

6.7.3.1 formação do vale da F0 a 1,5VR abaixo da LR;

6.7.3.3 cumulativamente, elevação da F0 no início da VTF 28% acima da LR; no ápice da VTF,

31%; no final da vogal pós-tônica final, 13% abaixo da LR;

6.7.3.4 cumulativamente, localização do ápice da F0 na VTF a 56% do seu início e da F0 no fim

da VTF, 27% abaixo de seu ápice;

VR aplicado à

elevação da F0

Valores esperados

Valores atingidos

a) 1 152 152

b) 1,5 165 165

c) 2 177 178

d) 2,5 190 191

e) 3 203 203

f) 3,5 215 216

g) 4 228 229

h) 4,5 241 241

i) 5 254 254

j) 5,5 266 267

k) 6 279 279

6.7.3.7 cumulativamente, F0 anterior à SPreTF 14% acima da LR.

Utilizaram-se, para o Teste 2, da mesma forma que para a OP 2 neutra, as ressínteses

(6.7.3.5.c) e (6.7.3.6), ilustradas pelas figuras 6.44 e 6.45, abaixo:

Figura 6.44 – Processo de ressíntese (6.7.3.5.c) da OP 2 monotônica para a pré-indicação final

Figura 6.45 – Processo de ressíntese (6.7.3.6) da OP 2 monotônica para a pré-indicação final

6.8. RESSÍNTESE DAS OPS 2 MONOTÔNICAS COM F0 DESCENDENTE

A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 concessiva de

6.8.1.3 cumulativamente, adaptação da duração de todos os fones da frase, assimilando-a ao

verificado na OP de referência.

Também para o processo de ressíntese da OP 2 monotônica, optou-se pela adaptação da

duração de toda a frase à duração verificada na OP 2 concessiva de referência.

6.46 e 6.47, abaixo, da mesma forma que para a OP 2 neutra:

Figura 6.46 – Processo de ressíntese (6.8.1.1) da OP 2 monotônica para a pré-indicação concessiva

Figura 6.47 – Processo de ressíntese (6.8.1.2.b) da OP 2 monotônica para a pré-indicação concessiva

A ressíntese da OP 2 monotônica, de forma a assemelhá-la à OP 2 conformativa de

6.8.2.2 modulação da F0, na VTF, conferindo-lhe um formato côncavo, a partir do ponto de pitch

criado na F0,

6.8.2.3 cumulativamente, adaptação da duração de todos os fones da frase, assimilando-a à OP

de referência.

Figura 6.48 – Processo de ressíntese (6.8.2.1) da OP 2 monotônica para a pré-indicação conformativa

Figura 6.49 – Processo de ressíntese (6.8.2.2.d) da OP 2 monotônica para a pré-indicação conformativa

O processo de ressíntese da OP 2 monotônica para obtenção da pré-indicação temporal

6.8.3.4 cumulativamente, aumento da duração da consoante da STF em 19%;

6.8.3.5 cumulativamente, redução da duração do segmento /travasi/, assemelhando-a ao

verificado na OP 2 temporal de referência;

6.8.3.8 ressíntese (6.8.3.5) excluindo as ressínteses (6.8.3.3) e (6.8.3.4).

Esse processo de ressíntese manteve as mesmas modificações utilizadas para a OP 2

neutra, aplicando-se a mesma justificativa para a escolha por modificar a duração do segmento

/travasi/.

6.50 e 6.51, abaixo:

7. DESCRIÇÃO E ANÁLISE DOS RESULTADOS DO TESTE 2

O objetivo do Teste 2 foi identificar, a partir do julgamento de vinte falantes nativos do

PB, quais parâmetros prosódicos modificados nas ressínteses produzidas para as versões neutra e

monotônica das OPs 1 e 2 seriam responsáveis pelo caráter identitário de cada uma das seis

subcategorias pré-indicativas selecionadas no Teste 1. O Teste 2 consistiu no cruzamento por

análise combinatória de cada uma das duas versões ressintetizadas escolhidas das OPs 1 e 2,

isoladamente, com todas as possibilidades (remanescentes do Teste 1) de OSAdvs. Como

discutido em 5.3, o Teste 2 foi construído a partir apenas dos seis contornos pré-indicativos que

apresentaram pelo menos cinco contrastes significativos (num universo de oito) no Teste 1,

quando em contraste com as outras subcategorias, ou seja, os contornos causal, consecutivo,

final, concessivo, conformativo e temporal.

Para a análise estatística dos resultados obtidos, utilizou-se o Teste Chi-quadrado, uma

vez que o Teste 2 buscou analisar se uma determinada OSAdv foi associada à OP ressintetizada

dentro das expectativas semânticas iniciais (o objetivo, como já discutido, foi adaptar, por meio

da modificação dos componentes prosódicos, as versões neutra e monotônica das OPs 1 e 2 aos

contornos pré-indicativos de referência utilizados para o Teste 1), distinguindo, assim, as seis

subcategorias pré-indicativas detectadas a partir do resultado obtido com o Teste 1. Estabeleceu-

se, então, como pretensamente “correta” a associação da OP ressintetizada com a OSAdv que

estaria sendo pré-indicada. Assim, as expectativas iniciais foram as de que uma OP ressintetizada

de forma a produzir a pré-indicação de causa fosse associada à OSAdv causal.

Nessa situação específica, o grau de liberdade estabelecido é 1, e para que o valor p seja

igual ou inferior a 0,05, o resultado do Teste Chi-quadrado deve ser igual ou superior a 3,84. O

índice de significância considerado foi p ≤ 0,05. Como será observado, alguns índices

mostraram-se significativos em sentido inverso ao da expectativa do cruzamento, sugerindo que

a ressíntese que pretensamente deveria pré-indicar um valor causal, por exemplo, estaria, na

verdade, indicando um valor de finalidade.

A análise estatística a partir de um Teste T pareado sugeriu não haver diferença

significativa entre o total dos resultados obtidos para as ressínteses considerando-se apenas as

OPs neutras ou apenas as OPs monotônicas. De uma forma geral, portanto, parece razoável

considerar que um parâmetro prosódico específico que tenha sido modificado na ressíntese a ou

na ressíntese b seja considerado como responsável pela pré-indicação em questão, mesmo que o

contraste dessa pré-indicação com outra subcategoria tenha sido significativo apenas na

ressíntese, por exemplo, da OP 1 neutra, mas não da OP 1 monotônica.

Test T séries emparelhadas

Desvio teórico = 0

Desvio médio df t p

OP1 neutra, OP2 neutra

OP1 neutra, OP1 monoton

OP1 monoton, OP2 monoton

Tabela 7.1 – Resultados obtidos a partir de um Teste T pareado, indicando que os números totais de reconhecimento

das ressínteses a e b não são significativamente distintos.

Os resultados ideais para o Teste 2 seriam aqueles em que, de cada grupo de duas

ressínteses produzidas para cada OP (neutra ou monotônica) em uma subcategoria pré-indicativa,

apenas uma fosse significativamente escolhida – e não as duas, ou nenhuma delas. Esse ponto

ideal, no entanto, não foi atingido, como se observará a seguir, com a descrição dos resultados.

7.1 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CAUSAL

As OPs 1 e 2, em suas versões neutra e monotônica, foram ressintetizadas de 24 formas

diferentes, explorando a formação do vale da F0, com a centralização da concavidade formadora

dessa vale; a elevação da F0 acima da LR; o posicionamento da F0 anteriormente à SPreTF (cf.

6.1.2, 6.3.2, 6.5.2 e 6.7.2).

Constituíram o Teste 2, na modalidade neutra das OPs, as ressínteses 6.1.2.3.i (OP 1) e

6.5.2.3.f (OP 2) (versão a), 6.1.2.4 (OP 1) e 6.5.2.4.f (OP 2) (versão b); e na modalidade

monotônica, as ressínteses 6.3.2.3.i (OP 1) e 6.7.2.3.f (OP 2) (versão a), 6.3.2.4 (OP 1) e 6.7.2.4

(OP 2) (versão b).

Considerando-se as OPs 1 neutra e monotônica, e a OP 2 neutra, a versão a foi

caracterizada pela redução de 0,5 VR no vale da F0, com sua concavidade centralizada, e a F0 na

VTF elevada a 5 VRs acima da LR – segundo a indicação original do programa Praat, a 264Hz

tanto para a OP 1 neutra quanto para a monotônica e, na realidade, a 251Hz para a OP 1 neutra, e

-,667 5 -,542 ,6109

-,333 5 -,415 ,6952

,667 5 ,474 ,6554

,333 5 ,271 ,7971

1,333 5 1,865 ,1212

1,000 5 ,745 ,4896

a 262Hz para a OP 1 monotônica. Considerando-se as OPs 2 neutra e monotônica, essa elevação

da F0 se faz a 216Hz.

No caso das OPs 1, a versão b consistiu dos parâmetros utilizados para a versão a,

acrescidos da elevação da F0 anterior à SPreTF 3% acima da LR, produzindo uma média, nesse

segmento, de 136Hz. Já para as OPs 2, a versão b foi caracterizada pelas modificações nos

parâmetros prosódicos utilizadas na versão a e, cumulativamente, o aumento da duração da

consoante na STF em 23%, assemelhando-a à duração desse mesmo segmento na OP 2 causal de

referência (cf. figuras 6.3 e 6.4 (OP 1 neutra); 6.28 e 6.29 (OP 2 neutra); 6.15 e 6.16 (OP 1

monotônica); 6.40 e 6.41 (OP 2 monotônica)).

Os resultados referentes ao cruzamento das ressínteses a e b para a subcategoria causal,

obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.2, e discutidos a seguir.

CAUSAL

OP 1 neutra

causal a x

conces

causal b x

conces

causal a x

confor

causal b x

confor

causal a x

consec

causal b x

consec

causal a x

causal b x

causal a x

tempor

causal b x

tempor

Chi2(a) 0 5 1,8 5 0,8 0,2 0,2 5 0,8 0,8

p 1 0,025 0,180 0,025 0,371 0,655 0,655 0,025 0,371 0,371

CAUSAL

OP 1 monoton

causal a x

conces

causal b x

conces

causal a x

confor

causal b x

confor

causal a x

consec

causal b x

consec

causal a x

causal b x

causal a x

tempor

causal b x

tempor

Chi2(a) 0,2 0,8 5 9,8 5 0,8 5 0 5 7,2

p 0,655 0,371 0,025 0,002 0,025 0,371 0,025 1 0,025 0,007

CAUSAL

OP 2 neutra

causal a x

conces

causal b x

conces

causal a x

confor

causal b x

confor

causal a x

consec

causal b x

consec

causal a x

causal b x

causal a x

tempor

causal b x

tempor

Chi2(a) 5 1,8 1,8 5 5 3,2 9,8 3,2 5 1,8

p 0,025 0,180 0,180 0,025 0,025 0,074 0,002 0,074 0,025 0,180

CAUSAL

OP 2 monoton

causal a x

conces

causal b x

conces

causal a x

confor

causal b x

confor

causal a x

consec

causal b x

consec

causal a x

causal b x

causal a x

tempor

causal b x

tempor

Chi2(a) 1,8 0,2 0,2 1,8 0,2 0 0 1,8 1,8 5

p 0,180 0,655 0,655 0,180 0,655 1 1 0,180 0,180 0,025

(a) 0 células (,0%) com freqüências esperadas menor do que 5. A freqüência de célula esperada é

Tabela 7.2 – Resultados de um Teste Chi2 (df=1) para a subcategoria causal, a partir do cruzamento das ressínteses

a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza ou hachuradas apresentam índice de

significância p 0,05. As células hachuradas indicam que o resultado se obteve em sentido inverso: a ressíntese foi reconhecida como pré-indicativa das outras subcategorias que não a causal.

7.1.1 OP 1 ressintetizada para a pré-indicação de causa

Os resultados obtidos indicam que, no universo dos participantes do Teste 2, a versão a

da ressíntese da OP 1 neutra para produzir a pré-indicação causal não se apresentou de forma

significativa em nenhum dos cruzamentos. Já a versão b distinguiu-se significativamente das

modalidades concessiva e conformativa.

Observe-se que o cruzamento entre a versão b e a modalidade final produziu um índice de

significância em sentido inverso, ou seja, o percentual de votos negativos para a OSAdv causal

(no caso, 75%) acabou por sugerir que a versão b é, na verdade, pré-indicativa de finalidade.

Considerando-se a OP 1 monotônica, os resultados indicam que a versão a da ressíntese

da OP 1 monotônica para produzir a pré-indicação causal apresentou-se de forma significativa

nos cruzamentos com as modalidades conformativa, consecutiva e final. Já a versão b distinguiu-

se significativamente da modalidade conformativa. Portanto, tanto a versão a quanto a versão b,

quando em contraste com a modalidade conformativa, mostraram-se significativas (embora o

índice de significância da versão a tenha sido consideravelmente inferior ao da versão b).

O cruzamento entre as versões a e b e a modalidade temporal produziu um índice de

significância em sentido inverso, ou seja, o percentual de votos negativos para a OSAdv causal

(75%, no caso da versão a; 80%, no caso da versão b) acabou por sugerir que a versão b é, na

verdade, pré-indicativa de temporalidade.

7.1.2 OP 2 ressintetizada para a pré-indicação de causa

No universo dos participantes do Teste 2, a versão a da ressíntese da OP 2 neutra para

produzir a pré-indicação causal apresentou-se de forma significativa nos cruzamentos com as

modalidades concessiva e temporal. Já a versão b distinguiu-se significativamente da modalidade

conformativa.

Observe-se que o cruzamento entre a versão a e as modalidades consecutiva e final

produziu um índice de significância em sentido inverso, ou seja, o percentual de votos negativos

para a OSAdv causal (75%, em contraste com a consecutiva; 85%, em contraste com a final)

acabou por sugerir que a versão b é, na verdade, pré-indicativa de conseqüência e de finalidade.

No tocante à OP 2 monotônica, a versão a da ressíntese para produzir a pré-indicação

causal não se apresentou de forma significativa em nenhum dos cruzamentos. Já a versão b

distinguiu-se significativamente da modalidade temporal.

7.1.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação causal

A título de recapitulação, no Teste 1, a OP 1 causal foi significativamente reconhecida

quando em contraste com as OPs 1 comparativa, concessiva, conformativa, consecutiva e

temporal. A OP 2, no entanto, contrastou-se apenas em relação às OPs concessiva e consecutiva.

De acordo com o critério utilizado para a seleção das pré-indicações mais bem contrastadas –

contraste significativo em relação a cinco outros contornos pré-indicativos, no total de oito

possíveis cruzamentos –, as ressínteses das OPs 1 e 2 causais foram analisadas em cruzamento

com os contornos concessivo, conformativo, consecutivo, final e temporal, lembrando que, no

Teste 1, a pré-indicação causal não foi significativamente reconhecida quando em contraste com

a pré-indicação final.

Como observado, as ressínteses para a pré-indicação causal produziram contraste

significativo em relação à OSAdv concessiva tanto para a OP 1 quanto para a OP 2, mas apenas

na modalidade neutra das OPs. Para a OP 1, o resultado sugere a pré-indicação a partir da

ressíntese b; para a OP 2, a partir da ressíntese a. A diferença entre essas duas ressínteses, no

caso das OPs 1, está na elevação da F0 anterior à SPreTF, realizada apenas na ressíntese b; no

caso das OPs 2, essa elevação não foi utilizada, sendo, por outro lado, aumentada a duração da

consoante da STF. Os índices de significância mostraram-se idênticos em ambos os casos

(Chi2=5, df=1, p=0,025), sugerindo, no caso da OP 1, que essa elevação da F0 poderia ser

considerada facultativa para a caracterização do contorno pré-indicativo causal e, no caso da OP

2, que o aumento da duração não é necessário. No entanto, não parece razoável desconsiderar

que, no caso da OP 1 neutra, a ressíntese a foi igualmente atribuída às OSAdvs causal e

concessiva (Chi2=0, df=1, p=1). Uma vez que a pré-indicação causal apresenta formato

ascendente de F0 na STF, e a concessiva, formato descendente, o fato de tanto a ressíntese a

quanto a ressíntese b terem obtido os mesmos índices de reconhecimento talvez seja reflexo de o

contraste entre as duas pré-indicações fazer-se de forma suficiente apenas pela oposição dos

formatos da F0.

O segundo contraste significativo para as ressínteses para a pré-indicação causal se deu

em relação à OSAdv conformativa, tanto para a OP 1 (neutra e monotônica) quanto para a OP 2

(apenas neutra). Exceto na OP 1 monotônica, em que ambas as ressínteses a e b foram

significativamente reconhecidas como pré-indicativas de causa, foi a ressíntese b que prevaleceu

no cômputo geral, considerando-se inclusive que, no caso da OP 1 monotônica, o índice de

significância da ressíntese b (Chi2=9,8, df=1, p=0,002) foi melhor que o da ressíntese a

(Chi2=5, df=1, p=0,025). O resultado desse cruzamento sugere, então, que a elevação da F0

anterior à SPreTF, diferenciador das duas ressínteses, é indispensável, no caso da OP 1, da

mesma forma que o aumento da duração, no caso da OP 2. No entanto, não se deve perder de

vista o fato de que, como no cruzamento anterior, a pré-indicação conformativa apresenta

formato descendente da F0, em contraste com o formato ascendente da pré-indicação causal.

O terceiro contraste significativo se deu em relação à OSAdv consecutiva, embora de

forma um tanto quanto problemática. Apenas a ressíntese a na OP 1 monotônica para produzir a

pré-indicação de causa apresentou índice significativo de diferenciação, o que sugere que, no

contraste causa/conseqüência, a elevação da F0 anterior à SPreTF da OP 1 não é necessário. No

entanto, observe-se que, considerando-se a OP 2 neutra, o contraste se deu de forma inversa, ou

seja, a ressíntese a para a OP 2 causal de referência (que não contém o aumento da duração da

consoante na STF, reservado à ressíntese b) foi reconhecida como pré-indicativa de

conseqüência43

. Uma vez que essas duas pré-indicações apresentam a F0 com contorno

ascendente, duas hipóteses precisam ser levantadas: ou os índices prosódicos para a pré-

indicação de causa não são, estritamente, os manipulados nas ressínteses a e b; ou há uma

interferência da estrutura da OP 2 (que apresenta uma sílaba pós-tônica final) sobre esse

contraste44

Em situação semelhante se encontra o quarto contraste, estabelecido em relação à OSAdv

final. Apenas a ressíntese a foi reconhecida como pré-indicativa de causa, e apenas na OP 1

monotônica. No caso da OP 1 neutra, a ressíntese b e, no caso da OP 2 neutra, a ressíntese a

foram reconhecidas de forma inversa, ou seja, como pré-indicativas de finalidade (contorno

ascendente da F0). Como já discutido em relação ao formato ascendente da F0, no início do

capítulo 6, a hipótese de diferenciação entre os contornos pré-indicativos causal e final reside no

valor máximo de elevação da F0 na VTF (mais elevado no causal que no final). O que se

percebe, portanto, é um conflito entre os resultados, sugerindo que algum outro fator prosódico

estaria interferindo nessa diferenciação. No entanto, como será analisado em 7.5, mais à frente, a

pré-indicação final foi bem diferenciada da OSAdv causal, considerando-se apenas esse

componente prosódico.

43 Como será analisado em 7.4, o aumento na duração da consoante na STF parece se colocar como índice prosódico

significativo para a construção do contorno pré-indicativo de conseqüência. 44 Deve-se levar em consideração que, embora estejam sendo manipulados dois parâmetros distintos (elevação da F0

anteriormente à SPreTF, na OP 1, e aumento da duração da consoante na STF, na OP 2), essas manipulações

ocorreram com o intuito de assemelhar o resultado auditivo final das ressínteses ao verificado nas OPs de referência,

a partir do Teste 1. Embora, em princípio, essa diferença de parâmetros possa parecer metodologicamente

incoerente, ela se fez necessária por conta da própria estrutura inerente a cada uma das OPs. Foram escolhidas para

constituir o Teste 2 as ressínteses que, consideradas as OPs 1 e 2 isoladamente, realmente pareciam mostrar conflito

entre os parâmetros prosódicos manipulados.

No último contraste significativo, as ressínteses para a pré-indicação causal talvez

possam ser diferenciadas da OSAdv temporal. A ressíntese a, como já descrito, foi reconhecida

de forma significativa no caso da OP 2 neutra, e a b, no caso da OP 2 monotônica. Isso sugeriria

que o aumento da duração na consoante da STF não se colocaria como condição indispensável

para a pré-indicação causal, considerando-se a OP 2. Reconhecimento inverso, no entanto, se

processou para ambas as ressínteses, quando considerada a OP 1 monotônica, ou seja, as

ressínteses estariam caracterizando a pré-indicação temporal.

O reconhecimento em sentido inverso, verificado nos cruzamentos das ressínteses das

OPs 1 e 2 pré-indicativas de causa com as OSAdvs consecutiva e final está, de certa forma,

dentro de uma certa previsibilidade, uma vez que as três modalidades apresentam a F0 com

contorno ascendente. No entanto, caso se desprezem esses reconhecimentos em sentido inverso,

os resultados obtidos para a ressíntese a, que tem como ponto central o valor máximo atingido

pela F0 na VTF, confirmariam a hipótese de ser esse ponto de elevação da F0 o fator prosódico

responsável pela diferenciação entre as três pré-indicações.

A comparação entre os prosogramas gerados para essas três subcategorias (cf. figura 7.1)

indica que a variação de F0 na VTF da OP 1 é sensível ao ouvido humano. A variação da F0

nesse segmento é de 10 semitons, para a OP 1 causal, contra 8 semitons para a OP 1 consecutiva

e 6 semitons para a OP 1 final de referência (valores aproximados). Considerando-se a OP 2, a

subcategoria causal foi a única que apresentou, segundo os prosogramas, variação interna de

pitch, com aproximadamente 6 semitons. As subcategorias consecutiva e final não apresentaram

variação sensível nesse segmento, embora, se considerada em relação à vogal da sílaba pré-

tônica, em ambos os casos a variação ascendente foi também de aproximadamente seis semitons.

A análise a partir dos prosogramas, em ambas as OPs, confirma a indicação de ser a variação de

pitch na VTF o diferencial entre a pré-indicação causal e a final (como será discutido mais à

frente, a duração da consoante de ataque nessa sílaba parece ter papel indispensável na pré-

indicação consecutiva). Se realmente for possível diferenciar essas três subcategorias

prosodicamente, não se deve descartar, no entanto, a hipótese de haver algum outro componente

que não tenha sido explorado nos processos de ressíntese utilizados nesta pesquisa.

O resultado obtido em sentido inverso não seria previsível no cruzamento com a OSAdv

temporal. Esse resultado talvez se deva a fatores não-prosódicos, uma vez que o contorno aqui

assumido como pré-indicativo de temporalidade apresenta a F0 com modulação descendente na

STF. Embora não seja objeto desta pesquisa, não parece inapropriado sugerir que a interferência

do fator semântico pode ter se colocado de forma significativa. Não se descarta uma certa

ambigüidade entre a noção de causa e a de tempo (cf. seção 5.1.4.1). Assim, alguém ficar infeliz

porque o trabalho não produz frutos implica, subjacentemente, que, quando o trabalho não

produz frutos, essa pessoa se torna infeliz. Da mesma forma, alguém ficar infeliz quando não lhe

permitem falar, implica que o fato de não lhe permitirem falar é causador de sua infelicidade.

OP 1 causal OP 1 comparativa

OP 1 concessiva OP 1 condicional

OP 1 conformativa OP 1 consecutiva

OP 1 final OP 1 proporcional

OP 1 temporal

Figura 7.1 – Prosogramas para as OPs 1 de referência. No eixo vertical, os algarismos representam a quantidade de

semitons, referenciados a partir de 1Hz. A seta indica a equivalência a 150Hz. O espaço entre as linhas

horizontais pontilhadas indica uma variação de 2 semitons.

OP 2 causal OP 2 comparativa

OP 2 concessiva OP 2 condicional

OP 2 conformativa OP 2 consecutiva

OP 2 final OP 2 proporcional

OP 2 temporal

Figura 7.2 – Prosogramas para as OPs 2 de referência. No eixo vertical, os algarismos representam a quantidade de semitons, referenciados a partir de 1Hz. A seta indica a equivalência a 150Hz. O espaço entre as linhas

horizontais pontilhadas indica uma variação de 2 semitons.

7.2. CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONCESSIVA

diferentes, adaptando a F0 a partir da VPreTF a um formato descendente, com elevação da F0 de

toda a frase em 30%; formação de concavidade na F0 da VTF; redução da duração da sílaba /ka/,

na OP 1, e de todos os segmentos, na OP 2, de forma a assemelhar a duração da OP a ser

ressintetizada à duração da versão original da OP 2 concessiva de referência (cf. 6.2.1, 6.4.1,

6.6.1 e 6.8.1).

Constituíram o Teste 2, na modalidade neutra das OPs, as ressínteses 6.2.1.1 (OP 1) e

6.6.1.1 (OP 2) (versão a), 6.2.1.2.b (OP 1) e 6.6.1.2.b (OP 2) (versão b); e na modalidade

monotônica, as ressínteses 6.4.1.1 (OP 1) e 6.8.1.1 (OP 2) (versão a), 6.4.1.2.b (OP 1) e 6.8.1.2.b

(OP 2) (versão b).

Em ambos os casos, a versão a foi caracterizada pela conformação descendente da F0 a

partir da VPreTF (cf. detalhes em 6.2.1.1). A versão b consistiu dos parâmetros utilizados para a

versão a, acrescidos da formação de uma concavidade de 15% na F0 da VTF (cf. figuras 6.7 e

6.8 (OP 1 neutra); 6.32 e 6.33 (OP 2 neutra); 6.19 e 6.20 (OP 1 monotônica); 6.44 e 6.45 (OP 2

monotônica)).

Os resultados referentes ao cruzamento das ressínteses a e b para a subcategoria

concessiva, obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.3, e

discutidos a seguir.

CONCESSIVA

OP 1 neutra

conces a x

causal

conces b x

causal

conces a x

confor

conces b x

confor

conces a x

consec

conces b x

consec

conces a x

conces b x

conces a x

tempor

conces b x

tempor

Chi2(a) 0,8 0,2 5 5 0,8 12,8 5 0,8 3,2 1,8

p 0,371 0,655 0,025 0,025 0,371 0,0003 0,025 0,371 0,074 0,180

CONCESSIVA

OP 1 monoton

conces a x

causal

conces b x

causal

conces a x

confor

conces b x

confor

conces a x

consec

conces b x

consec

conces a x

conces b x

conces a x

tempor

conces b x

tempor

Chi2(a) 5 0 7,2 9,8 5 7,2 5 9,8 0,8 0

p 0,025 1 0,007 0,002 0,025 0,007 0,025 0,002 0,371 1

CONCESSIVA

OP 2 neutra

conces a x

causal

conces b x

causal

conces a x

confor

conces b x

confor

conces a x

consec

conces b x

consec

conces a x

conces b x

conces a x

tempor

conces b x

tempor

Chi2(a) 5 1,8 0,8 0 9,8 7,2 9,8 7,2 0,8 5

p 0,025 0,180 0,371 1 0,002 0,007 0,002 0,007 0,371 0,025

CONCESSIVA

OP 2 monoton

conces a x

causal

conces b x

causal

conces a x

confor

conces b x

confor

conces a x

consec

conces b x

consec

conces a x

conces b x

conces a x

tempor

conces b x

tempor

Chi2(a) 5 5 0,2 5 5 16,2 7,2 7,2 0,8 5

p 0,025 0,025 0,655 0,025 0,025 0,0001 0,007 0,007 0,371 0,025

Tabela 7.3 – Resultados de um Teste Chi2 (df=1) para a subcategoria concessiva, a partir do cruzamento das

ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza ou hachuradas

apresentam índice de significância p 0,05. A célula hachurada indica que o resultado se obteve em sentido inverso: a ressíntese foi reconhecida como pré-indicativa de outra subcategoria que não a concessiva.

7.2.1 OP 1 ressintetizada para a pré-indicação de concessão

Os resultados indicam que, no universo dos participantes do Teste 2, a versão a da

ressíntese da OP 1 neutra para produzir a pré-indicação concessiva apresentou-se de forma

significativa nos cruzamentos com as modalidades conformativa e final. A versão b distinguiu-se

significativamente das modalidades conformativa e consecutiva.

Em relação à OP 1 monotônica, a versão a da ressíntese para produzir a pré-indicação

concessiva apresentou-se de forma significativa nos cruzamentos com as modalidades causal,

conformativa e final. Já a versão b distinguiu-se significativamente das modalidades

conformativa e consecutiva. Portanto, tanto a versão a quanto a versão b, quando em contraste

com as modalidades conformativa e final, mostraram-se significativas.

Observe-se que, no caso da versão a em contraste com a modalidade consecutiva, a

significância se deu em sentido inverso, ou seja, os votos negativos para a OSAdv concessiva

acabaram por sugerir que a versão a é, na verdade, pré-indicativa de conseqüência.

7.2.2 OP 2 ressintetizada para a pré-indicação de concessão

A indicação dos resultados obtidos é a de que, no universo dos participantes do Teste 2, a

versão a da ressíntese da OP 2 neutra para produzir a pré-indicação concessiva apresentou-se de

forma significativa nos cruzamentos com as modalidades causal, consecutiva e final. A versão b

distinguiu-se significativamente das modalidades consecutiva, final e temporal. Observa-se,

portanto, que ambas as versões a e b mostraram-se significativas quando em contraste com as

modalidades consecutiva e final.

concessiva apresentou-se de forma significativa nos cruzamentos com as modalidades causal,

consecutiva e final. Já a versão b distinguiu-se significativamente das modalidades causal,

conformativa, consecutiva, final e temporal. Portanto, ambas as versões a e b mostraram-se

significativas quando cruzadas com as OSAdvs causal, consecutiva, final e temporal. Observe-se

que a versão b, no caso do cruzamento com a OSAdv consecutiva, apresentou melhor índice de

significância que a versão a.

concessiva

No Teste 1, a pré-indicação de concessão foi significativamente distinguida das OSAdvs

causal, conformativa, consecutiva, proporcional e temporal, considerando-se a OP 1, e também

da OSAdv final, considerando-se a OP 2. Pelo critério adotado para a seleção das OPs a serem

utilizadas no Teste 2, as ressínteses das OPs 1 e 2 neutras e monotônicas, versões a e b, foram

cruzadas, então, com as OSAdvs causal, conformativa, consecutiva, final e temporal.

De acordo com os resultados do Teste 2, as ressínteses para a pré-indicação concessiva

(movimento descendente da F0) produziram contraste significativo em relação à OSAdv causal

(movimento ascendente da F0), considerando-se a OP 1 monotônica e as OPs 2 neutra e

monotônica. A ressíntese a foi reconhecida como pré-indicativa do valor concessivo nas três

situações, e também a ressíntese b na OP 2 monotônica. A diferença entre as duas ressínteses

reside apenas na formação de uma concavidade na F0 durante a VTF, conforme descrito em

6.2.1.2.b. Uma vez que o índice de significância nesses contrastes foi o mesmo (Chi2=5, df=1,

p=0,025); que a ressíntese b mostrou-se significativamente contrastada apenas na OP 2

monotônica; que a ressíntese b foi totalmente confundida com a OSAdv causal na OP 1

monotônica (Chi2=0, df=1, p=1), a indicação parece se colocar no sentido de a formação dessa

concavidade, utilizada para a ressíntese b, ser dispensável na configuração prosódica da pré-

indicação concessiva.

Considerando-se o cruzamento com a OSAdv conformativa (movimento descendente da

F0), tanto a ressíntese a quanto a b foram significativamente reconhecidas como pré-indicativas

de concessão nas OPs 1 neutra e monotônica. Na OP 2 monotônica, apenas a ressíntese b foi

significativamente reconhecida. O índice de significância tendo sido o mesmo (Chi2=5, df=1,

p=0,025) em três cruzamentos (OP 1 neutra, a e b; OP 2 monotônica, b), a tendência para a

indicação de uma das ressínteses como contendo os parâmetros prosódicos apropriados para a

pré-indicação concessiva talvez se estabeleça em direção à ressíntese b, uma vez que, na OP 1

monotônica, seu índice de significância (Chi2=9,8, df=1, p=0,002) foi o melhor de todos (muito

embora a ressíntese a, nessa mesma OP 1 monotônica, apresente Chi2=7,2, df=1, p=0,007).

Assumindo-se esse referencial, a formação da concavidade na F0 da VTF, verificada na

ressíntese b, seria, então, necessária para a pré-indicação concessiva, considerando-se que, para a

conformação prosódica da pré-indicação conformativa, foi assumida a hipótese de que o formato

convexo da F0 na VTF seria o índice prosódico indispensável a essa pré-indicação.

No cruzamento com a OSAdv consecutiva, houve reconhecimento significativo da pré-

indicação concessiva em todas as quatro OPs. No universo das OPs 1 neutra e monotônica,

apenas a ressíntese b foi reconhecida significativamente, sendo que a ressíntese a, na OP 1

monotônica, apresentou índice de significância em sentido inverso: a pré-indicação seria não a

de concessão, mas a de conseqüência (movimento ascendente da F0). De uma forma geral, a

ressíntese b apresenta os melhores índices de significância, se comparados aos da ressíntese a, o

que levaria à sugestão, mais uma vez, de que, para a pré-indicação concessiva, o formato

côncavo da F0 na VTF é indispensável.

Em relação ao cruzamento com a OSAdv final, houve reconhecimento significativo da

pré-indicação concessiva também em todas as quatro OPs. A distinção só não se mostrou

significativa em relação à ressíntese b na OP 1 neutra. Como a ressíntese b evidenciou um índice

de significância (Chi2=9,8, df=1, p=0,002) mais elevado do que a ressíntese a (Chi2=5, df=1,

p=0,025) na OP 1 monotônica, o inverso ocorrendo na OP 2 neutra (ressíntese a com Chi2=9,8,

df=1, p=0,002 e ressíntese b com Chi2=7,2, df=1, p=0,007), a propensão a identificar a

ressíntese a como a mais apropriada para a distinção em relação à pré-indicação final

(movimento ascendente da F0) seria decorrência do cruzamento a partir da OP 1 neutra, em que

apenas essa ressíntese a foi significativamente contrastada.

No universo do cruzamento com a OSAdv temporal, os reconhecimentos significativos

da pré-indicação concessiva se deram apenas nas OPs 2, tanto neutra quanto monotônica, e

apenas para a ressíntese b, sugerindo, mais uma vez, que a formação da concavidade na F0 da

VTF seria indispensável para a caracterização do contorno pré-indicativo concessivo.

Analisando-se esses resultados como um todo, a ressíntese a parece mostrar-se mais

relevante que a b nos contrastes com as OSAdvs causal e final. É interessante observar que,

nesses casos específicos, as pré-indicações de causalidade e de finalidade têm os contornos

prosódicos assumidos com a F0 ascendente na STF. Uma vez que a pré-indicação concessiva

apresenta a F0 descendente nesse segmento, a formação ou não de uma concavidade na F0 da

VTF não seria indispensável. A diferenciação seria feita, essencialmente, pelo caráter ascendente

ou descendente da F0.

Por outro lado, a ressíntese b parece mostrar-se como tendência nos cruzamentos com as

OSAdvs conformativa, consecutiva e temporal. À exceção da pré-indicação consecutiva, que

apresenta movimento ascendente da F0, as outras duas pré-indicações são assumidas a partir do

movimento descendente da F0, da mesma forma que a pré-indicação concessiva. Isso parece

sugerir que a formação da concavidade da F0 na VTF (em associação com as outras

características descritas em 6.2.1.1) seria o parâmetro prosódico diretamente responsável pela

identidade da pré-indicação concessiva.

Se consideradas as representações obtidas com os prosogramas (cf. figuras 7.1 e 7.2), a

formação da concavidade na F0 da VTF não seria perceptível ao ouvido humano, o que, de certa

forma, contradiz os resultados obtidos com o Teste 2. É preciso analisar os cruzamentos entre as

subcategorias com movimento descendente de F0 de forma isolada.

Caso se considere o contraste entre a pré-indicação concessiva e a temporal, o resultado

indica que a ressíntese b foi a única significativa. No entanto, deve-se observar que a hipótese

central assumida para a caracterização da pré-indicação temporal (cf. 7.6) é a forma plana da F0

na VTF, em oposição à forma descendente nas pré-indicações concessiva e conformativa. Se

essa hipótese for verdadeira, a formação da concavidade na forma descendente seria dispensável.

Deve-se observar, no entanto, que a ressíntese a para a pré-indicação concessiva não foi

reconhecida significativamente em nenhum dos cruzamentos com a pré-indicação temporal.

O cruzamento entre a pré-indicação concessiva e a conformativa (ambas com formato

descendente da F0 na VTF), no entanto, indicou a ressíntese b como a detentora da melhor

freqüência de reconhecimento contrastivo. Esse resultado sugere, por si só, que a formação da

concavidade na VTF seria um fator significativo na caracterização da pré-indicação concessiva.

Como dito acima, no entanto, a análise produzida pelo prosograma não apresentou essa

indicação. Não é possível afirmar categoricamente que isso se deva a uma falha nessa

representação, mas é interessante observar (cf. figura 7.1) que ambas as OPs 1 condicional e

final de referência apresentam, na VTF, um movimento ascendente-descendente da F0, que foi

identificado no prosograma apenas da OP 1 final.

7.3 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONFORMATIVA

diferentes, adaptando a F0 a partir da VPreTF a um formato descendente, com elevação da F0 de

toda a frase em 30%; formação de convexidade na F0 da VTF; redução da duração da sílaba /ka/,

na OP 1, e de todos os segmentos, na OP 2, de forma a assemelhar a duração da OP a ser

ressintetizada à duração do(s) segmento(s) das OPs 1 e 2 conformativas de referência (cf. 6.2.2,

6.4.2, 6.6.2 e 6.8.2).

6.6.2.1 (OP 2) (versão a), 6.2.2.2.d (OP 1) e 6.6.2.2.d (OP 2) (versão b); na modalidade

monotônica, as ressínteses 6.4.2.1 (OP 1) e 6.8.2.1 (OP 2) (versão a), 6.4.2.2.d (OP 1) e 6.8.2.2.d

(OP 2) (versão b).

Em ambos os casos, a versão a foi caracterizada pela conformação descendente da F0 a

partir da VPreTF (cf. detalhes em 6.2.2.1). A versão b consistiu dos parâmetros utilizados para a

versão a, acrescidos da formação de uma convexidade de 20% na F0 da VTF (cf. figuras 6.9 e

6.10 (OP 1 neutra); 6.34 e 6.35 (OP 2 neutra); 6.21 e 6.22 (OP 1 monotônica); 6.46 e 6.47 (OP 2

monotônica)).

conformativa, obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.4, e

CONFORMATIVA

OP 1 neutra

confor a

x causal

confor b

x causal

confor a

x conces

confor b

x conces

confor a

x consec

confor b

x consec

confor a

x final

confor b

x final

confor a

x tempor

confor b

x tempor

Chi2(a) 5 0,2 0 1,8 9,8 0,2 0,8 5 5 1,8

p 0,025 0,655 1 0,180 0,002 0,655 0,371 0,025 0,025 0,180

CONFORMATIVA

OP 1 monoton

confor a

x causal

confor b

x causal

confor a

x conces

confor b

x conces

confor a

x consec

confor b

x consec

confor a

x final

confor b

x final

confor a

x tempor

confor b

x tempor

Chi2(a) 5 1,8 0,8 7,2 9,8 0 1,8 0,2 0,2 0

p 0,025 0,180 0,371 0,007 0,002 1 0,180 0,655 0,655 1

CONFORMATIVA

OP 2 neutra

confor a

x causal

confor b

x causal

confor a

x conces

confor b

x conces

confor a

x consec

confor b

x consec

confor a

x final

confor b

x final

confor a

x tempor

confor b

x tempor

Chi2(a) 0,8 0,2 3,2 0,8 5 0,2 0,8 1,8 0,2 1,8

p 0,371 0,655 0,074 0,371 0,025 0,655 0,371 0,180 0,655 0,180

CONFORMATIVA

OP 2 monoton

confor a

x causal

confor b

x causal

confor a

x conces

confor b

x conces

confor a

x consec

confor b

x consec

confor a

x final

confor b

x final

confor a

x tempor

confor b

x tempor

Chi2(a) 0 1,8 5 5 0,8 0,2 1,8 1,8 1,8 0,8

p 1 0,180 0,025 0,025 0,371 0,655 0,180 0,180 0,180 0,371

Tabela 7.4 – Resultados de um Teste Chi2 (df=1) para a subcategoria conformativa, a partir do cruzamento das

ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza ou hachuradas

apresentam índice de significância p 0,05. As células hachuradas indicam que o resultado se obteve em sentido inverso: as ressínteses foram reconhecidas como pré-indicativas de outra subcategoria que não a

conformativa.

7.3.1 OP 1 ressintetizada para a pré-indicação de conformidade

ressíntese da OP 1 neutra para produzir a pré-indicação conformativa apresentou-se de forma

significativa nos cruzamentos com as modalidades causal, consecutiva e temporal. A versão b

distinguiu-se significativamente da modalidade final.

conformativa apresentou-se de forma significativa nos cruzamentos com a modalidade

consecutiva. Já a versão b distinguiu-se significativamente da modalidade concessiva, mas em

sentido inverso. Ou seja, os votos negativos para a OSAdv conformativa acabaram por sugerir

que a versão b é, na verdade, pré-indicativa de concessão.

7.3.2 OP 2 ressintetizada para a pré-indicação de conformidade

ressíntese da OP 2 neutra para produzir a pré-indicação conformativa apresentou-se de forma

significativa no cruzamento com a modalidade consecutiva. A versão b não se distinguiu

significativamente em nenhum dos cruzamentos.

Considerando-se a OP 2 monotônica, o único cruzamento que mostrou índice

significativo de diferenciação se deu em relação à OSAdv concessiva, tanto na versão a quanto

na versão b, mas em sentido inverso. Isso significa dizer que, também nesse caso, os votos

negativos para a OSAdv concessiva sugerem que ambas as ressínteses seriam pré-indicativas de

concessão.

conformativa

A pré-indicação de conformidade, no Teste 1, foi significativamente diferenciada das

OSAdvs causal, concessiva, consecutiva e temporal, considerando-se a OP 1; e das OSAdvs

concessiva, consecutiva e final, considerando-se a OP 2. Pelos critérios assumidos para a

elaboração do Teste 2, as ressínteses a e b das OPs 1 e 2 neutra e monotônica foram cruzadas

com as OSAdvs causal, concessiva, consecutiva, final e temporal.

Os resultados do Teste 2 evidenciaram que, no cruzamento com a OSAdv causal, houve

apenas um reconhecimento significativo da pré-indicação conformativa: a ressíntese a da OP 1

neutra. Esse resultado está abaixo das expectativas gerais, uma vez que a pré-indicação

conformativa apresenta a F0 com movimento descendente, e a pré-indicação causal, com

movimento ascendente. Caso se considere, então, que a ressíntese a contenha os parâmetros

prosódicos necessários à pré-indicação conformativa, o formato convexo da F0 na VTF,

característica adicional da ressíntese b, deve ser visto como dispensável.

O cruzamento com a OSAdv concessiva apresentou índices significativos de

reconhecimento, mas apenas em sentido inverso: na ressíntese b da OP 1 monotônica, e nas

ressínteses a e b da OP 2 monotônica. A indicação, então, é a de que as ressínteses utilizadas

seriam pré-indicativas de concessão, não de conformidade. Uma vez que ambas as pré-

indicações assumem um movimento descendente da F0, essa não-discriminação encontra-se

dentro do previsível. Isso significa também dizer que o formato convexo da F0 na VTF, utilizado

na ressíntese b, não foi percebido como característica prosódica diferenciadora. Observe-se, no

entanto, que, como discutido na sessão imediatamente anterior, o formato côncavo foi percebido

como identificador da pré-indicação concessiva.

Em relação ao cruzamento com a OSAdv consecutiva, apenas a ressíntese a foi

reconhecida de forma significativa como pré-indicativa de conformidade. Esse resultado se

verificou para as OPs 1 neutra e monotônica, e para a OP 2 neutra. Também neste caso, trata-se

de dois contornos da F0 opostos: descendente, para a pré-indicação conformativa; ascendente,

para a consecutiva. A escolha da ressíntese a sugere que, também neste caso, o formato convexo

da F0 na VTF é dispensável.

O cruzamento com a OSAdv final indicou significância de reconhecimento apenas para a

ressíntese b, na OP 1 neutra. Da mesma forma que no cruzamento com a OSAdv causal, a

expectativa seria a de diferenciação significativa também nas outras ressínteses, uma vez que a

pré-indicação de finalidade apresenta formato ascendente da F0 na VTF. Neste caso específico, o

formato convexo da F0 nesse segmento parece ter se mostrado importante. No entanto, para uma

afirmação categórica nesse sentido, seria necessário que a ressíntese b tivesse sido

significativamente contrastada também na OP 1 neutra e nas OPs 2 neutra e monotônica.

No último cruzamento verificado, com a OSAdv temporal, houve também apenas um

reconhecimento significativo, no caso, para a ressíntese a na OP 1 neutra. Partindo da idéia de

que o contorno pré-indicativo de temporalidade apresenta formato descendente da F0, o formato

convexo na VTF não se colocaria como índice indispensável.

Pela observação desses resultados, a única indicação consistente para a ressíntese a se

apresenta quando em contraste com a OSAdv consecutiva, embora, na verdade, isso talvez se

deva mais ao fato de o contorno pré-indicativo de conseqüência se mostrar com a F0 modulada

de forma oposta ao formato verificado na pré-indicação de conformidade. Como discutido

acima, o mesmo se dá em relação ao contraste com a OSAdv causal. O único cruzamento que,

efetivamente, parece dever ser considerado, é o estabelecido entre a pré-indicação conformativa

e a OSAdv temporal, uma vez que ambos os contornos pré-indicativos apresentariam forma

descendente da F0. Nesse cruzamento a ressíntese a foi a única identificada significativamente,

ainda que apenas na ressíntese da OP 1 neutra.

O prosograma produzido para a OP 1 neutra (cf. figura 7.1) não identificou a forma

convexa na F0 da VTF45

. Sob esse referencial, a hipótese de ser esse movimento da curva

melódica uma característica significativa do contorno pré-indicativo de conformidade é refutada,

da mesma forma sugerida pelos resultados do Teste 2.

45 A expectativa seria a de que o prosograma, caso essa variação melódica se mostrasse perceptível ao ouvido

humano, estilizasse a curva da F0, produzindo, nesse caso, duas retas em formação angular.

7.4 CRUZAMENTOS A PARTIR DA SUBCATEGORIA CONSECUTIVA

diferentes, explorando a formação do vale da F0, com a centralização da concavidade

identificadora desse vale; a elevação da F0 acima da LR; o aumento da duração da consoante na

STF; o posicionamento da F0 anteriormente à SPreTF (para detalhes, cf. 6.1.1, 6.3.1, 6.5.1 e

6.7.1).

Constituíram o Teste 2, na modalidade neutra das OPs, as ressínteses 6.1.1.3.i (OP 1) e

6.5.1.3.i (OP 2) (versão a), 6.1.1.4 (OP 1) e 6.5.1.4 (OP 2) (versão b); e na modalidade

monotônica, as ressínteses 6.3.1.3.i (OP 1) e 6.7.1.3.g (OP 2) (versão a), 6.3.1.4 (OP 1) e 6.7.1.4

(OP 2) (versão b).

A versão a foi caracterizada pela redução de 0,5 VR no vale da F0, com sua concavidade

centralizada, e a F0 na VTF elevada a 5 VRs acima da LR – teoricamente a 264Hz tanto para a

OP 1 neutra quanto para a monotônica e, na realidade, a 248Hz para a OP 1 neutra, e a 263Hz

para a OP 1 monotônica. A OP 2 neutra teve esse segmento elevado a 254Hz, e a OP 2

monotônica, a 229Hz.

A versão b consistiu dos parâmetros utilizados para a versão a, acrescidos do aumento da

duração da consoante na STF em 97%, no caso das OPs 1, e 18%, no caso das OPs 2,

assemelhando-as à duração verificada na versão original das OPs pré-indicativas de

conseqüência utilizadas no Teste 1 (cf. figuras 6.1 e 6.2 (OP 1 neutra); 6.26 e 6.27 (OP 2 neutra);

6.13 e 6.14 (OP 1 monotônica); 6.38 e 6.39 (OP 2 monotônica)).

consecutiva, obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.5, e

CONSECUTIVA

OP 1 neutra

consec a

x causal

consec b

x causal

consec a

x conces

consec b

x conces

consec a

x confor

consec b

x confor

consec a

x final

consec b

x final

consec a

x tempor

consec b

x tempor

Chi2(a) 0,2 5 5 7,2 1,8 0,2 0,8 0,8 0,2 9,8

p 0,655 0,025 0,025 0,007 0,180 0,655 0,371 0,371 0,655 0,002

CONSECUTIVA

OP 1 monoton

consec a

x causal

consec b

x causal

consec a

x conces

consec b

x conces

consec a

x confor

consec b

x confor

consec a

x final

consec b

x final

consec a

x tempor

consec b

x tempor

Chi2(a) 1,8 1,8 16,2 9,8 0 0,2 1,8 1,8 0,8 5

p 0,180 0,180 0,0001 0,002 1 0,655 0,180 0,180 0,371 0,025

CONSECUTIVA

OP 2 neutra

consec a

x causal

consec b

x causal

consec a

x conces

consec b

x conces

consec a

x confor

consec b

x confor

consec a

x final

consec b

x final

consec a

x tempor

consec b

x tempor

Chi2(a) 7,2 5 5 1,8 9,8 16,2 0,8 5 5 12,8

p 0,007 0,025 0,025 0,180 0,002 0,0001 0,371 0,025 0,025 0,0003

CONSECUTIVA

OP 2 monoton

consec a

x causal

consec b

x causal

consec a

x conces

consec b

x conces

consec a

x confor

consec b

x confor

consec a

x final

consec b

x final

consec a

x tempor

consec b

x tempor

Chi2(a) 1,8 7,2 1,8 5 0,8 12,8 0,8 5 7,2 5

p 0,180 0,007 0,180 0,025 0,371 0,0003 0,371 0,025 0,007 0,025

Tabela 7.5 – Resultados de um Teste Chi2 (df=1) para a subcategoria consecutiva, a partir do cruzamento das

ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza apresentam índice de

significância p 0,05.

7.4.1 OP 1 ressintetizada para a pré-indicação de conseqüência

ressíntese da OP 1 neutra para produzir a pré-indicação consecutiva apresentou-se de forma

significativa no cruzamento com a modalidade concessiva. A versão b distinguiu-se

significativamente das modalidades causal, concessiva e temporal. Observe-se que, no

cruzamento com a modalidade concessiva, tanto a ressíntese a quanto a ressíntese b

apresentaram índices significativos de julgamento, embora a ressíntese b tenha obtido melhor

índice de significância.

consecutiva apresentou-se de forma significativa nos cruzamentos com a modalidade concessiva.

Já a versão b distinguiu-se significativamente das modalidades concessiva e temporal. Portanto,

tanto a versão a quanto a versão b, quando em contraste com a modalidade concessiva,

mostraram-se significativas (embora o índice de significância da versão a tenha sido

consideravelmente melhor que o da versão b).

7.4.2 OP 2 ressintetizada para a pré-indicação de conseqüência

ressíntese da OP 2 neutra para produzir a pré-indicação consecutiva apresentou-se de forma

significativa nos cruzamentos com as modalidades causal, concessiva, conformativa e temporal.

A versão b distinguiu-se significativamente nos cruzamentos com as modalidades causal,

conformativa e temporal. Isso significa dizer que tanto a versão a quanto a versão b foram

significativamente contrastadas em relação às modalidades causal, conformativa e temporal,

embora a versão a tenha se mostrado consideravelmente mais significativa no contraste com a

modalidade causal, e a versão b, no contraste com as modalidades conformativa e temporal.

No universo da OP 2 monotônica, a versão a da ressíntese para produzir a pré-indicação

consecutiva apresentou-se de forma significativa no cruzamento com a modalidade temporal. Já

a versão b distinguiu-se significativamente das modalidades causal, concessiva, conformativa,

final e temporal. Ambas as versões, portanto, mostraram-se significativas quando em contraste

com a modalidade temporal, embora a versão a tenha obtido melhor índice de significância.

consecutiva

Os cruzamentos realizados no Teste 1 evidenciaram a pré-indicação consecutiva como

significativamente reconhecida quando em contraste com as pré-indicações de causa, de

concessão, de condição e de conformidade, nas OPs 1 e 2, e também com as pré-indicações de

finalidade, de proporcionalidade e de tempo, considerando a OP 1. Segundo os critérios

utilizados para a elaboração do Teste 2, as ressínteses a e b para as OPs 1 e 2, neutras e

monotônicas, foram contrastadas com as OSAdvs causal, concessiva, conformativa, final e

temporal.

O cruzamento com a OSAdv causal, segundo os resultados do Teste 2, evidenciou índice

significativo de identificação da ressíntese a como pré-indicativa de conseqüência apenas na OP

2 neutra. A ressíntese b foi significativamente identificada nas OPs 1 e 2 neutras, e na OP 2

monotônica. Embora o índice de significância do reconhecimento da ressíntese a na OP 2 neutra

(Chi2=7,2, df=1, p=0,007) tenha sido consideravelmente melhor do que o da ressíntese b

(Chi2=5, df=1, p=0,025), a comparação entre os resultados dos cruzamentos evidencia que a

ressíntese b mostrou-se mais expressiva em um maior número de cruzamentos. A diferença entre

essas duas ressínteses reside, no caso da b, no aumento da duração da consoante na STF,

associada à modulação da F0 já desenvolvida na ressíntese a (cf. 6.1.1.4). Considerando que

tanto a pré-indicação consecutiva quanto a causal assumem contornos ascendentes da F0, esse

resultado sugere que o aumento da duração verificado na ressíntese b é o responsável pela

identidade do contorno pré-indicativo consecutivo, nesse cruzamento.

O cruzamento com a OSAdv concessiva indicou significativamente a ressíntese a como

pré-indicativa de conseqüência nas OPs 1 neutra e monotônica, e na OP 2 neutra. A ressíntese b

foi reconhecida significativamente também nas OPs 1 neutra e monotônica, e na OP 2

monotônica. Os índices com melhor significância, quando ambas as ressínteses foram

significativamente reconhecidas, aplicaram-se à ressíntese b, na OP 1 neutra, e à ressíntese a, na

OP 1 monotônica. Considerando também que os índices de significância foram idênticos para a

ressíntese a, na OP 2 neutra, e para a b, na OP 2 monotônica, não é possível chegar a uma

indicação precisa de ser a ressíntese a ou a b a responsável pela identidade da pré-indicação

consecutiva nesse cruzamento. A expectativa mais ampla de se diferenciarem os contornos pré-

indicativos de conseqüência (formato ascendente da F0) e de concessão (formato descendente da

F0) por conta dos formatos diferentes da F0 se confirmou.

Em relação ao cruzamento com a OSAdv conformativa, houve reconhecimento

significativo das ressínteses a e b como pré-indicativas de conseqüência apenas nas OPs 2. A

ressíntese a foi identificada na OP 2 neutra, e a ressíntese b, nas OPs 2 neutra e monotônica.

Uma vez que o índice de reconhecimento da ressíntese b foi consideravelmente mais

significativo que o da ressíntese a na OP 2 neutra, a indicação é a de que a ressíntese b contenha

a característica prosódica identificadora da pré-indicação consecutiva. Deve-se observar que na

OP 1 monotônica a ressíntese a foi totalmente confundida com a pré-indicação de conformidade

(Chi2=0, df=1, p=1), embora os dois contornos assumam formatos opostos da F0.

O cruzamento com a OSAdv final evidenciou reconhecimento significativo apenas da

ressíntese b, e apenas nas OPs 2, como pré-indicativa de conseqüência. Uma vez que tanto o

contorno pré-indicativo consecutivo quanto o final apresentam a F0 com formato ascendente,

esse resultado sugere que a pré-indicação consecutiva deve contar com o aumento da duração da

consoante na STF.

Em relação ao cruzamento com a OSAdv temporal, a ressíntese a foi reconhecida como

pré-indicativa de conseqüência nas OPs 2 neutra e monotônica. Já a ressíntese b, nas OPs 1 e 2

neutras e monotônicas. Apenas na OP 2 monotônica o índice de reconhecimento da ressíntese a

foi melhor que o da b. Considerando, no entanto, o resultado geral para esses cruzamentos, a

indicação se dá no sentido de, mais uma vez, considerar a ressíntese b como contendo a

configuração prosódica caracterizadora da pré-indicação de conseqüência.

Excetuando-se o cruzamento com a OSAdv concessiva, em que tanto a ressíntese a

quanto a b foram reconhecidas como significativas de forma semelhante, em todos os outros

cruzamentos a ressíntese b foi a que obteve os melhores índices. A sugestão clara, a partir desses

dados, é a de que a pré-indicação de conseqüência é caracterizada pela configuração da F0, como

descrito de 6.1.1.1 a 6.1.1.3, somada ao aumento da duração da consoante na STF, nos

percentuais discutidos em 6.1.1.4.

Como indicado nos prosogramas relativos às OPs 1 e 2 consecutivas (cf. figuras 7.1 e

7.2), a elevação da F0 na VTF é perceptível ao ouvido humano. No caso da OP 1, a F0

apresentou um movimento ascendente, com variação de 8 semitons. Embora na OP 2 o ligeiro

movimento ascendente nesse segmento não tenha sido detectado pelo prosograma, a F0 da VTF

se apresenta 6 semitons acima da F0 da vogal na sílaba pré-tônica. As indicações dos

prosogramas, nesse caso, confirmam a percepção, pelo ouvido humano, da variação ascendente

da F0, transformação que deve ser associada ao aumento da duração na consoante de ataque da

STF para que se produza o valor pré-indicativo consecutivo.

7.5 CRUZAMENTOS A PARTIR DA SUBCATEGORIA FINAL

A OP 1, em suas versões neutra e monotônica, foi ressintetizada de 67 formas diferentes,

explorando a formação do vale da F0, com a centralização da concavidade formadora desse vale;

a elevação da F0 na STF acima da LR; a redução da duração da vogal e da consoante finais; a

redução da duração da sílaba /ka/; o posicionamento da F0 anteriormente à SPreTF (para

detalhes, cf. 6.1.3 e 6.3.3).

A OP 2, em suas versões neutra e monotônica, foi ressintetizada de 37 formas diferentes,

explorando também a formação do vale da F0 e a centralização de sua concavidade; a elevação

da F0 na STF acima da LR; o posicionamento do ápice da F0 na VTF; a redução da duração da

VTF; a elevação da F0 anterior à SPreTF acima da LR (para detalhes, cf. 6.5.3 e 6.7.3).

Constituíram o Teste 2, na modalidade neutra, as ressínteses 6.1.3.2.i (OP 1) e 6.5.3.5.c

(OP 2) (versão a), 6.1.3.3 (OP 1) e 6.5.3.6 (OP 2) (versão b); e na modalidade monotônica, as

ressínteses 6.3.3.3.g (OP 1) e 6.7.3.5.c (OP 2) (versão a), 6.3.3.4 (OP 1) e 6.7.3.6 (OP 2) (versão

Considerando-se a OP 1, as versões a foram caracterizadas pela (criação, centralização e)

aplicação de 1,5 VR ao vale da F0, com sua concavidade centralizada, e a F0 na VTF elevada 4

VRs acima da LR – teoricamente a 238Hz, tendo sido esse valor de fato atingido apenas na OP

1 monotônica (na OP 1 neutra, o valor atingido foi de 226Hz).

As versões b das OPs 1 consistiram nas transformações utilizadas para a versão a,

adicionando-se o aumento da duração da consoante da STF em 54%, assemelhando-a à duração

verificada na versão original da OP pré-indicativa de finalidade utilizada no Teste 1 (cf. figuras

6.5 e 6.6 (OP 1 neutra); 6.17 e 6.18 (OP 1 monotônica)).

Considerando-se a OP 2, as versões a foram caracterizadas pela (criação, centralização e)

aplicação de 1,5 VR ao vale da F0, com sua concavidade centralizada, e adaptação do formato da

STF ao verificado na OP 1 final de referência. A F0 da VTF foi elevada 2 VRs acima da LR,

atingindo-se 177Hz.

As versões b das OPs 2 utilizaram as transformações aplicadas para a versão a, reduzindo

a duração da VTF em 15%, para também assemelhá-la à duração verificada na versão original da

OP pré-indicativa de finalidade (cf. figuras 6.30 e 6.31 (OP 2 neutra); 6.42 e 6.43 (OP 2

monotônica)).

Os resultados referentes ao cruzamento das ressínteses a e b para a subcategoria final,

obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.6, e discutidos a seguir.

OP 1 neutra

final a x

causal

final b x

causal

final a x

conces

final b x

conces

final a x

confor

final b x

confor

final a x

consec

final b x

consec

final a x

tempor

final b x

tempor

Chi2(a) 9,8 7,2 0,8 1,8 7,2 9,8 1,8 1,8 1,8 1,8

p 0,002 0,007 0,371 0,180 0,007 0,002 0,180 0,180 0,180 0,180

OP 1 monoton

final a x

causal

final b x

causal

final a x

conces

final b x

conces

final a x

confor

final b x

confor

final a x

consec

final b x

consec

final a x

tempor

final b x

tempor

Chi2(a) 5 0 0,2 9,8 5 9,8 5 0 0,8 0

p 0,025 1 0,655 0,002 0,025 0,002 0,025 1 0,371 1

OP 2 neutra

final a x

causal

final b x

causal

final a x

conces

final b x

conces

final a x

confor

final b x

confor

final a x

consec

final b x

consec

final a x

tempor

final b x

tempor

Chi2(a) 0,8 5 5 5 7,2 5 0 0,2 5 9,8

p 0,371 0,025 0,025 0,025 0,007 0,025 1 0,655 0,025 0,002

OP 2 monoton

final a x

causal

final b x

causal

final a x

conces

final b x

conces

final a x

confor

final b x

confor

final a x

consec

final b x

consec

final a x

tempor

final b x

tempor

Chi2(a) 5 0,2 7,2 7,2 0,2 0,8 1,8 0 1,8 5

p 0,025 0,655 0,007 0,007 0,655 0,371 0,180 1 0,180 0,025

Tabela 7.6 – Resultados de um Teste Chi2 (df=1) para a subcategoria final, a partir do cruzamento das ressínteses a

e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza apresentam índice de significância p 0,05.

7.5.1 OP 1 ressintetizada para a pré-indicação de finalidade

ressíntese da OP 1 neutra para produzir a pré-indicação final apresentou-se de forma significativa

nos cruzamentos envolvendo as categorias causal e conformativa. Da mesma forma, a versão b.

Isso implica dizer que ambas as versões foram significativamente reconhecidas como pré-

indicativas de finalidade, embora o índice de significância tenha sido ligeiramente melhor para a

versão a, em cruzamento com a causalidade, e b, em cruzamento com a conformidade.

Quanto à OP 1 monotônica, a versão a da ressíntese para produzir a pré-indicação final

apresentou-se de forma significativa nos cruzamentos com as modalidades causal e

conformativa. Já a versão b distinguiu-se significativamente das modalidades concessiva e

conformativa. Portanto, tanto a versão a quanto a versão b, quando em contraste com a

modalidade conformativa, mostraram-se significativas (embora o índice de significância da

versão b tenha sido consideravelmente melhor que o da versão a).

7.5.2 OP 2 ressintetizada para a pré-indicação de finalidade

ressíntese da OP 2 neutra para produzir a pré-indicação final apresentou-se de forma significativa

nos cruzamentos com as modalidades concessiva, conformativa e temporal. A versão b

distinguiu-se significativamente das modalidades causal, concessiva, conformativa e temporal.

Ou seja, tanto a versão a quanto a versão b foram reconhecidas significativamente como pré-

indicativas de finalidade quando em contraste com as OSAdvs concessiva, conformativa e

temporal. A versão a apresentou melhor índice de significância quando em contraste com a

OSAdv conformativa, e a b, em contraste com a temporal.

Quanto à OP 2 monotônica, a versão a da ressíntese para produzir a pré-indicação final

apresentou-se de forma significativa nos cruzamentos com as modalidades causal e concessiva.

Já a versão b distinguiu-se significativamente das modalidades concessiva e temporal. Tanto a

versão a quanto a versão b foram reconhecidas com o mesmo índice de significância como pré-

indicativas de finalidade quando em cruzamento com a modalidade concessiva.

7.5.3 Análise dos resultados para o julgamento das ressínteses para a pré-indicação final

No Teste 1, os cruzamentos evidenciaram a pré-indicação final como significativamente

reconhecida quando em contraste com as pré-indicações comparativa, consecutiva e temporal,

considerando a OP 1, e com as pré-indicações comparativa, concessiva e conformativa,

considerando a OP 2. Os critérios utilizados para a elaboração do Teste 2 estabeleceram o

cruzamento das ressínteses a e b das OPs 1 e 2 neutras e monotônicas com as OSAdvs causal,

concessiva, conformativa, consecutiva e temporal.

O cruzamento da ressíntese a com a OSAdv causal mostrou-se com índice significativo

de reconhecimento como pré-indicativa de finalidade na OP 1 neutra e nas OPs 2 neutra e

monotônica. A ressíntese b mostrou-se significativa nas OPs 1 e 2 neutras. Embora os índices de

significância tenham sido idênticos (Chi2=5, df=1, p=0,025) para as ressínteses a, na OP 1

monotônica, e b, na OP 2 neutra, o da ressíntese a apresentou melhor índice de significância

(Chi2=9,8, df=1, p=0,002) que o da b (Chi2=7,2, df=1, p=0,007) na OP 1 neutra. Esses

resultados talvez sugiram que a ressíntese a seja a que contenha os parâmetros prosódicos

apropriados à pré-indicação de finalidade, em oposição à pré-indicação de causa. A hipótese

inicial foi a de que a diferenciação entre o contorno pré-indicativo causal e o final estaria no

nível de elevação da F0 na VTF, mais elevada no primeiro que no segundo. Como a ressíntese b,

além das modificações da F0 processadas na ressíntese a, incorporou a variação da duração na

consoante da STF (cf. 6.1.3.3 e 6.5.3.6), esses resultados parecem indicar que essa variação de

duração não se mostra necessária para a caracterização do contorno pré-indicativo final, quando

em oposição ao causal.

O cruzamento com a OSAdv concessiva evidenciou a ressíntese b como pré-indicativa de

finalidade na OP 1 monotônica, e tanto a ressíntese a quanto a b, nas OPs 2 neutra e monotônica.

Os índices obtidos para a ressíntese b mostraram-se semelhantes aos índices para a ressíntese a

nas OPs 2, o que impede sugerir uma das ressínteses como contendo os parâmetros prosódicos

responsáveis pela pré-indicação de finalidade. Como no universo da OP 1 apenas a ressíntese b

foi reconhecida como pré-indicativa de finalidade, este resultado torna-se o responsável pela

sugestão de ser ela a que contém esses parâmetros prosódicos. Isso significa dizer, embora muito

discretamente, que, nesse cruzamento, há uma tendência a que a variação de duração na

consoante da STF deva ser adicionada à modulação da F0 promovida na ressíntese a. A não-

diferenciação expressiva entre as duas ressínteses talvez decorra do fato de o contorno pré-

indicativo final apresentar forma ascendente da F0 na STF, e a pré-indicação concessiva, uma

forma descendente. Essa variação no direcionamento da F0, pura e simplesmente, já se prestaria

à distinção entre as duas pré-indicações.

O cruzamento com a OSAdv conformativa evidenciou ambas as ressínteses a e b como

pré-indicativas de finalidade nas manipulações das OPs 1 neutra e monotônica, e da OP 2 neutra.

Embora o índice de significância da ressíntese a (Chi2=7,2, df=1, p=0,007) tenha sido

consideravelmente melhor do que o da b (Chi2=5, df=1, p=0,025) na OP 2 neutra, os índices da

ressíntese b mostraram-se melhores que os da ressíntese a nas OPs 1 neutra (respectivamente,

Chi2=9,8, df=1, p=0,002 e Chi2=7,2, df=1, p=0,007) e monotônica (respectivamente,

Chi2=9,8, df=1, p=0,002 e Chi2=5, df=1, p=0,025). Da mesma forma que verificado no

cruzamento com a OSAdv concessiva, parece haver uma tendência a considerar a ressíntese b

como a que contém os parâmetros prosódicos caracterizadores da pré-indicação de finalidade.

Também neste caso vale lembrar que a forma da F0 na STF da pré-indicação conformativa é

descendente, o que bastaria, por si só, para estabelecer a diferenciação em relação à pré-

indicação final.

Em relação à OSAdv consecutiva, o cruzamento evidenciou que apenas a ressíntese a, na

OP 1 monotônica, foi reconhecida como pré-indicativa de finalidade. Considerando que a

hipótese assumida para a diferenciação entre a pré-indicação final e a consecutiva reside no valor

máximo de elevação da F0 na VTF (mais elevado na consecutiva que na final); e que, na

ressíntese b, foi aumentada a duração da consoante na STF, da mesma forma que processado na

ressíntese b para a pré-indicação consecutiva, esse resultado sugere, ainda que timidamente, que

a diferenciação entre essas duas pré-indicações reside na elevação da F0 (cf. 6.3.1.3.i

(consecutiva) e 6.3.3.3.g (final)).

O último cruzamento, com a OSAdv temporal, evidenciou significância de

reconhecimento da ressíntese a na OP 2 neutra, e da ressíntese b nas OPs 2 neutra e monotônica.

A tendência, então, é a de sugerir a ressíntese b como a que contém os parâmetros prosódicos

apropriados à pré-indicação final. No entanto, é preciso lembrar que a pré-indicação temporal

apresenta formato descendente da F0 na STF, o que, como já sugerido, por si só já bastaria para a

diferenciação entre as duas pré-indicações. Observe-se, ainda, que a ressíntese b foi totalmente

confundida com a pré-indicação temporal na OP 1 monotônica.

De uma forma geral, a ressíntese b para a pré-indicação final (movimento ascendente da

F0) tendeu a se mostrar mais significativa que a ressíntese a nos contrastes com as pré-

indicações concessiva, conformativa e temporal, as três com movimento descendente da F0,

situação em que o contraste se mostra facilitado. Para uma caracterização efetiva da pré-

indicação final em contraste com as outras duas subcategorias que apresentam movimento

ascendente da F0 – a causal e a consecutiva –, talvez seja razoável considerar apenas a variação

na elevação da F0, como efetuado na ressíntese a, como marca da pré-indicação final.

Essa diferença de pico da F0 na VTF é confirmada pela representação dos prosogramas

obtidos para as OPs 1 (cf. figura 7.1). O segmento apresenta variação de 10 semitons, na OP 1

causal; de 6 semitons, na OP 1 final; e de 8 semitons, na OP 1 consecutiva. No caso das OPs 2, a

F0 foi representada com movimento ascendente apenas na modalidade causal, com uma variação

de 6 semitons. No caso das modalidades final e consecutiva, a diferença entre a F0 (plana, na

representação dos prosogramas) da VTF e a da VPreTF foi, em ambos os casos, também de 6

semitons.

Se forem isoladas apenas as ressínteses produzidas para as OPs 2 com movimento

ascendente da F0 na STF, percebe-se que os resultados foram idênticos (Chi2=5, df=1, p=0,025)

para as ressínteses a e b, no caso da pré-indicação causal, e sem significância para a pré-

indicação consecutiva. Para analisar esses resultados, é interessante lembrar que, para o processo

de ressíntese, foram utilizados para a modulação da F0 das OPs 2 os mesmos parâmetros

utilizados para as OPs 1, e a diferença quanto ao valor máximo de elevação atingido pela F0 foi

mantida (elevação maior na pré-indicação causal que na final; cf. 6.1.2 e 6.1.3) (os prosogramas

foram obtidos a partir das OPs de referência). Como a ressíntese a mostrou-se significativa de

forma idêntica à ressíntese b, a possível conclusão a que se chega é a de que a diferença na

duração da consoante de ataque da STF não interfere no contraste entre as pré-indicações causal

e final, mas apenas a diferença entre os pontos máximos de elevação da F0 na VTF. Já no caso

do contraste com a pré-indicação consecutiva, essa variação da duração parece ter interferido,

uma vez que também essa pré-indicação se sustenta pela variação de duração nesse segmento.

7.6 CRUZAMENTOS A PARTIR DA SUBCATEGORIA TEMPORAL

As OPs 1 e 2, em suas versões neutras, foram ressintetizadas de 5 formas diferentes e, em

suas versões monotônicas, de 8 formas, adaptando a F0 a partir da VPreTF a um formato

descendente, assemelhando-o à conformação originalmente verificada para a OP 1 temporal de

referência, com elevação da F0 de toda a frase em 30%; nivelamento da F0 na vogal anterior à

STF; redução da duração da VTF; redução da duração da sílaba /ka/, no caso da OP 1, e da

consoante /s/ da STF, no caso da OP 2 (para detalhes, cf. 6.2.3, 6.4.3, 6.6.3 e 6.8.3).

6.6.3.2 (OP 2) (versão a), 6.2.3.3 (OP 1) e 6.6.3.4 (OP 2) (versão b); na modalidade monotônica,

foram utilizadas as ressínteses 6.4.3.2 (OP 1) e 6.8.3.2 (OP 2) (versão a), 6.4.3.3 (OP 1) e 6.8.3.4

(OP 2) (versão b).

Considerando as OPs 1, as versões a consistiram na adaptação da F0, como descrito

acima e remetido a 6.2.3 e 6.4.3, com o nivelamento da F0 na vogal anterior à STF; as versões b

acrescentaram às versões a a redução da duração da VTF em 61%, assemelhando-a ao verificado

na OP 1 temporal de referência.

Considerando-se as OPs 2, as versões a também consistiram na adaptação da F0, nos

moldes utilizados para as ressínteses das OPs 1, com o nivelamento da F0 na vogal anterior à

STF; as versões b acrescentaram às versões a o aumento da duração da consoante da STF em

19% (cf. figuras 6.11 e 6.12 (OP 1 neutra); 6.36 e 6.37 (OP 2 neutra); 6.23 e 6.24 (OP 1

monotônica); 6.48 e 6.49 (OP 2 monotônica)).

temporal, obtidos a partir de um Teste Chi-quadrado, são sintetizados na tabela 7.7, e discutidos

a seguir.

TEMPORAL

OP 1 neutra

tempor a

x causal

tempor b

x causal

tempor a

x conces

tempor b

x conces

tempor a

x confor

tempor b

x confor

tempor a

x consec

tempor b

x consec

tempor a

x final

tempor b

x final

Chi2(a) 5 1,8 0,2 0,8 0,8 5 0,2 5 5 5

p 0,025 0,180 0,655 0,371 0,371 0,025 0,655 0,025 0,025 0,025

TEMPORAL

OP 1 monoton

tempor a

x causal

tempor b

x causal

tempor a

x conces

tempor b

x conces

tempor a

x confor

tempor b

x confor

tempor a

x consec

tempor b

x consec

tempor a

x final

tempor b

x final

Chi2(a) 7,2 5 0 0,2 0,2 0 9,8 12,8 5 7,2

p 0,007 0,025 1 0,655 0,655 1 0,002 0,0003 0,025 0,007

TEMPORAL

OP 2 neutra

tempor a

x causal

tempor b

x causal

tempor a

x conces

tempor b

x conces

tempor a

x confor

tempor b

x confor

tempor a

x consec

tempor b

x consec

tempor a

x final

tempor b

x final

Chi2(a) 0 0 0,8 1,8 5 0,8 5 3,2 0,2 0,2

p 1 1 0,371 0,180 0,025 0,371 0,025 0,074 0,655 0,655

TEMPORAL

OP 2 monoton

tempor a

x causal

tempor b

x causal

tempor a

x conces

tempor b

x conces

tempor a

x confor

tempor b

x confor

tempor a

x consec

tempor b

x consec

tempor a

x final

tempor b

x final

Chi2(a) 0,2 0,2 1,8 0,8 1,8 0 0 0,8 1,8 0,8

p 0,655 0,655 0,180 0,371 0,180 1 1 0,371 0,180 0,371

Tabela 7.7 – Resultados de um Teste Chi2 (df=1) para a subcategoria temporal, a partir do cruzamento das

ressínteses a e b para as OPs 1 e 2, versões neutra e monotônica. As células em cinza apresentam índice de

significância p 0,05.

7.6.1 OP 1 ressintetizada para a pré-indicação de temporalidade

ressíntese da OP 1 neutra para produzir a pré-indicação temporal apresentou-se de forma

significativa nos cruzamentos com as modalidades causal e final. A versão b distinguiu-se

significativamente das modalidades conformativa, consecutiva e final. Observa-se, portanto, que

ambas as versões foram significativamente reconhecidas (com índices idênticos) como pré-

indicativas de temporalidade.

temporal apresentou-se de forma significativa nos cruzamentos com as modalidades causal,

consecutiva e final, da mesma forma que a versão b. Portanto, tanto a versão a quanto a versão b,

quando em contraste com as modalidades causal, consecutiva e final, mostraram-se

significativas. A versão a apresentou melhor índice de significância quando em contraste com a

modalidade causal; e a versão b, quando em contraste com as modalidades consecutiva e final.

7.6.2 OP 2 ressintetizada para a pré-indicação de temporalidade

ressíntese da OP 2 neutra para produzir a pré-indicação temporal apresentou-se de forma

significativa nos cruzamentos com as modalidades conformativa e consecutiva. A versão b não

se distinguiu significativamente de nenhuma das modalidades.

Em relação à OP 2 monotônica, nenhuma das versões mostrou-se significativamente

contrastada com nenhuma das outras cinco subcategorias.

temporal

Os cruzamentos realizados no Teste 1 evidenciaram que a pré-indicação temporal

distingue-se significativamente das pré-indicações causal, comparativa, concessiva,

conformativa, consecutiva e final, considerando-se a OP 1. No universo da OP 2, a distinção

mostrou-se significativa em relação às pré-indicações comparativa e concessiva. Segundo os

critérios utilizados para a elaboração do Teste 2, estabeleceu-se o cruzamento das ressínteses a e

b das OPs 1 neutras e monotônicas com as OSAdvs causal, concessiva, conformativa,

consecutiva e final.

Os resultados do cruzamento com a OSAdv causal evidenciaram que a ressíntese a foi

identificada como pré-indicativa de temporalidade nas OPs 1 neutra e monotônica. A ressíntese b

foi identificada na OP 1 monotônica, embora com índice de significância (Chi2=5, df=1,

p=0,025) inferior ao da ressíntese a (Chi2=7,2, df=1, p=0,007). Esses resultados parecem

sugerir que a ressíntese a, por si só, contém os parâmetros prosódicos responsáveis pela pré-

indicação temporal. Essa ressíntese a consistiu da modulação da F0 a partir da SPreTF, como

descrito em 6.2.3.2, com atenção ao nivelamento da F0 na VPreTF e ao nivelamento da F0 na

VTF. A ressíntese b incorporou a essas modificações a variação na duração da VTF (cf. 6.2.3.3).

A sugestão, portanto, é a de que essa variação da duração não se coloca como índice

significativo para a pré-indicação temporal, muito embora a pré-indicação causal seja assumida

com forma ascendente da F0 na STF e a pré-indicação temporal, com forma descendente, o que

já bastaria para caracterizar a diferença entre as duas.

No cruzamento com a OSAdv concessiva, não houve reconhecimento significativo algum

das ressínteses. Uma vez que ambos os formatos da F0 na STF são descendentes, essa não-

distinção não seria de todo inesperada. Observe-se, no entanto, que, como já analisado em 7.2,

acima, a ressíntese b para a pré-indicação concessiva mostrou-se significativamente distinguida

da pré-indicação temporal.

O cruzamento com a OSAdv conformativa indicou que a ressíntese b se mostra como

pré-indicativa de temporalidade na OP 1 neutra, e a ressíntese a, na OP 2 neutra. Como ambos os

índices foram idênticos (Chi2=5, df=1, p=0,025), não é possível estabelecer um direcionamento

para uma das ressínteses como sendo a que contém os parâmetros prosódicos apropriados a essa

pré-indicação. Observe-se que, da mesma forma que o contorno pré-indicativo temporal, o

conformativo também apresenta formato descendente da F0 na STF.

No cruzamento com a OSAdv consecutiva, a ressíntese a foi significativamente

reconhecida como pré-indicativa de temporalidade na OP 1 monotônica e na OP 2 neutra; a

ressíntese b, nas OPs 1 neutra e monotônica. Como os índices de significância mostraram-se

idênticos para a ressíntese b na OP 1 neutra e para a ressíntese a na OP 2 neutra, a tendência para

a caracterização da ressíntese b como a pré-indicativa de temporalidade se dá pelo melhor índice

de significância na OP 1 monotônica (Chi2=12,8, df=1, p=0,0003) que na ressíntese a

(Chi2=9,8, df=1, p=0,002). O primeiro fator a considerar é o contorno consecutivo apresentar

forma ascendente da F0 na STF, em oposição à pré-indicação temporal, o que facilitaria a

distinção. O segundo fator, no entanto, que parece beneficiar a ressíntese b é o fato de a VTF ter

sofrido uma redução em sua duração. É importante lembrar que, no caso da ressíntese b para a

pré-indicação consecutiva, houve um aumento de duração na consoante dessa mesma sílaba.

Embora a variação de duração tenha se processado, em um caso, na vogal, e no outro, na

consoante, houve variação de duração da sílaba como um todo, e talvez esse fator tenha se

mostrado como significativo.

O cruzamento com a OSAdv final evidenciou que tanto a ressíntese a quanto a b foram

reconhecidas significativamente como pré-indicativas de temporalidade nas OPs 1 neutra e

monotônica. Como os índices mostraram-se idênticos para as ressínteses a nas OPs 1 neutra e

monotônica e b na OP 1 neutra (Chi2=5, df=1, p=0,025), a diferenciação entre elas parece ser

sugerida pelo índice significativamente melhor da ressíntese b na OP 1 monotônica (Chi2=7,2,

df=1, p=0,007). Também neste caso, não se deve perder de vista o fato de o contorno pré-

indicativo final ser caracterizado pela forma ascendente da F0 na STF, em oposição ao que

ocorre na pré-indicação temporal.

De forma geral, a pré-indicação temporal (formato descendente da F0) parece ter a

ressíntese b como diferenciadora em relação a dois dos contornos ascendentes (consecutivo e

final), e a ressíntese a em relação ao terceiro (causal). Como se trata de contornos opostos,

parece inapropriado distinguir uma das ressínteses como responsável por essa diferenciação. Na

comparação com os outros dois contornos descendentes (concessivo e conformativo), no entanto,

não foi possível, de fato, estabelecer uma das ressínteses como responsável pela pré-indicação

temporal, considerando, inclusive, que no cruzamento com a OSAdv concessiva não houve um

único reconhecimento significativo. Um outro fator que se destaca é não ter havido

reconhecimento significativo algum para as ressínteses produzidas a partir da OP 2 monotônica.

A observação dos prosogramas gerados para as OPs 1 concessiva, conformativa e

temporal (contornos descendentes da F0) (cf. figura 7.1) indica que a F0 na VTF é percebida

pelo ouvido humano como constituída a partir de um movimento descendente nos dois primeiros

casos, mas não no terceiro. Essa indicação corroboraria, em princípio, a hipótese de que a forma

da F0 nesse segmento da pré-indicação temporal deve ser plana, sem apresentar variação

descendente. Essa sugestão, no entanto, não é confirmada para a OP 2 temporal (cf. figura 7.2),

em que a forma da F0 também se mostra descendente.

7.7 CRITÉRIOS PARA ESCOLHA DAS RESSÍNTESES REPRESENTATIVAS DOS PADRÕES

PROSÓDICOS PRÉ-INDICATIVOS

Como se pôde observar em relação aos resultados obtidos com o Teste 2, na maior parte

dos cruzamentos estabelecidos não foi possível identificar uma das duas ressínteses testadas

como a única a conter os parâmetros prosódicos responsáveis pelo valor pré-indicativo em

questão. É mais prudente entender que uma delas se mostrou como mais propensa a caracterizar

o contorno pré-indicativo representado, embora a outra também não possa ser desconsiderada. É

interessante lembrar que foram contrastadas, para cada subcategoria, duas ressínteses que

pareciam conter os pontos críticos na manipulação quer da F0, quer da duração, quer desses dois

parâmetros em conjunto, com a expectativa de que um deles pudesse suplantar o outro. No

entanto, como os resultados indicaram, parece mais apropriado, para a maior parte das

subcategorias pré-indicativas (à exceção da consecutiva), afirmar que ambas as ressínteses

representam o valor pré-indicativo em questão, embora a que tenha obtido maior freqüência de

reconhecimento no Teste 2 se apresente como a melhor candidata a conter as características

prosódicas específicas desse contorno. Isso, provavelmente, porque essa ressíntese apresentou

um resultado auditivo muito mais próximo da OP de referência, o que, em princípio, lhe confere

uma maior naturalidade.

As tabelas 7.2 a 7.7 evidenciam que, por vezes, nenhuma das duas ressínteses foi

significativamente identificada como pré-indicativa dos respectivos valores adverbiais. Em

outras, ambas as ressínteses obtiveram o mesmo índice de significância. Em outras ainda, uma

das ressínteses, ou ambas, foi reconhecida como pré-indicando a subcategoria adverbial oposta à

expectativa inicial testada no cruzamento. Em vista dessa irregularidade observada nos

resultados, decidiu-se indicar uma das duas ressínteses de cada subcategoria como a melhor

candidata a conter as especificações necessárias à configuração do contorno prosódico pré-

indicativo em questão a partir dos seguintes critérios:

a) inicialmente, desconsiderar os casos em que, nos cruzamentos com uma mesma

OSAdv (e.g., causal a x concessiva; causal b x concessiva), os índices de

significância tenham se mostrado idênticos para ambas as ressínteses. Assim, uma

ocorrência de um dado índice de significância para a ressíntese a anula uma

ocorrência desse mesmo índice para a ressíntese b;

b) desconsiderar os casos em que houve reconhecimento do valor pré-indicativo de

forma oposta à expectativa inicial (e.g., a ressíntese b para a pré-indicação causal ter

sido reconhecida como pré-indicativa de finalidade);

c) ainda que os índices de significância tenham sido p ≤ 0,05 para ambas as ressínteses,

selecionar aquela que obteve o melhor índice absoluto de significância;

d) eliminados os casos especificados em (a) e (b) acima, verificar nos cruzamentos com

cada OSAdv qual ressíntese prevalece quantitativamente sobre a outra (e.g., na tabela

7.3, desconsideram-se os cruzamentos com a OSAdv conformativa nos cruzamentos

relativos à OP 1. O resultado para a ressíntese b é numericamente superior ao da

ressíntese a: enquanto esta foi reconhecida significativamente no cruzamento para a

OP 1 monotônica, aquela foi reconhecida para a OP 1 monotônica e também para a

OP2 monotônica);

e) executado o procedimento listado em (d), acima, para os cruzamentos com todas as

OSAdvs, indicar como melhor ressíntese a que prevalecer por maioria absoluta (e.g.,

na tabela 7.3, a ressíntese a prevaleceu nos cruzamentos com as OSAdvs causal e

final; a ressíntese b, nos cruzamentos com as OSAdvs conformativa, consecutiva e

temporal. Portanto, a ressíntese b mostra-se como a melhor candidata a conter a

configuração prosódica responsável pela pré-indicação concessiva).

Aplicando-se esses critérios, verificam-se as seguintes indicações de ressínteses como

representativas das pré-indicações adverbiais:

a) causal: ressíntese a;

b) consecutiva: ressíntese b;

c) final: ressíntese b;

d) concessiva: ressíntese b;

e) conformativa: ressíntese a;

f) temporal: ressíntese b.

8. CONCLUSÃO

A pesquisa que ora se conclui teve por principais objetivos a confirmação do fenômeno

pré-indicativo prosódico, nos termos de Fónagy (1974), para o português brasileiro (PB) e para o

francês falado na França (FR); e a caracterização fonético-fonológica de contornos prosódicos

pré-indicativos de orações subordinadas adverbiais. Para isso, focalizaram-se as nove

subcategorias oracionais listadas pela gramática tradicional do PB (Bechara, 1992), cada uma

delas assumindo um dos seguintes valores circunstanciais: causa, comparação, concessão,

condição, conformidade, conseqüência, finalidade, proporcionalidade e temporalidade.

De acordo com os critérios listados na seção 5.3, os resultados do Teste 1 mostraram-se

consideravelmente diferentes no PB e no FR. No PB, foi possível identificar quatro pré-

indicações de forma estatitiscamente mais segura – a causal, a concessiva, a consecutiva e a

temporal. Caso se faça uma expansão do critério de reconhecimento das pré-indicações, a essas

quatro somam-se duas outras – a conformativa e a final. Para o FR, pelo critério mais restrito,

não foi possível identificar nenhum valor pré-indicativo; pelo critério expandido, três pré-

indicações passam a ser consideradas – a comparativa, a conformativa e a final. Por uma questão

de fiabilidade dos resultados, optou-se por dar prosseguimento à pesquisa da caracterização

fonético-fonológica dos contornos pré-indicativos apenas para o PB, incluindo-se, no caso, os

dois contornos verificados na expansão do critério seletivo.

Os resultados do Teste 1 confirmaram as duas hipóteses principais: a da existência do

fenômeno pré-indicativo prosódico em relação às orações subordinadas adverbiais, e a da

interferência negativa de uma sílaba pós-tônica na percepção do núcleo do contorno pré-

indicativo. Assim, parece razoável afirmar que o movimento central de um contorno prosódico

pré-indicativo terá um melhor nível de percepção caso seja imediatamente seguido de silêncio.

Um aspecto interessante a observar é o comportamento dos traçados melódicos nas

sílabas tônicas finais da OP 1 e da OP 2 para o PB (cf. figuras 4.1 e 4.2). A análise visual indica

um movimento da F0 muito mais acentuado na OP 1 que na OP 2, considerando-se a amplitude

da sua variação. Uma vez que a OP 2 conta com um número maior de sílabas que a OP 1

(inclusive uma sílaba pós-tônica final), a primeira impressão é a de que o contorno prosódico

dispõe de maior espaço para sua manifestação na OP 2. Moraes e Colamarco (2008) indicam, ao

discutir a questão da adequação de um contorno a uma enunciação quer pelo processo de

compressão, quer pelo processo de truncamento, que, no PB, a tendência se coloca no sentido da

compressão. Assim, ao invés de haver a supressão de determinado tom do contorno (suprimindo-

se, portanto, partes da F0), existe uma adequação da F0 a um menor espaço de movimentação,

comprimindo-se. Comparando-se as durações das vogais tônicas finais das OPs 1 e das OPs 2 de

referência (cf. Anexo 3), constata-se que, à exceção da OP 1 condicional, todas as demais OPs 1

apresentam esse segmento com durações menores que as verificadas nas OPs 2. Considerando-

se, portanto: a) que as OPs 2 de referência apresentam maior número de sílabas que as OPs 1; b)

que as durações das vogais tônicas finais das OPs 1 de referência são, quase em sua totalidade,

menores que as das OPs 2, parece possível afirmar que, nas OPs 1 de referência, houve

compressão dos contornos prosódicos pré-indicativos. Isso explicaria, em princípio, o

movimento visualmente mais acentuado da F0 nas sílabas tônicas finais das OPs 1.

Metaforicamente, pode-se estabelecer uma analogia à concentração do sal na água: uma mesma

quantidade de sal será mais intensamente percebida pelo paladar caso esteja diluída em uma

menor quantidade de água; quanto maior a quantidade de água, menor será a percepção do sal

pelo paladar.

No PB, o Teste 1 indicou, considerando a expansão do critério de seleção, como discutido

acima e remetido à seção 5.3, seis contornos pré-indicativos, que podem ser subdivididos em

dois grupos principais: a) os que apresentam contorno ascendente da F0 na sílaba tônica final –

causal, consecutivo, final; e b) os que apresentam contorno descendente da F0 na sílaba tônica

final – concessivo, conformativo, temporal.

Em termos absolutos, e assumindo-se a monotonização da OP, as características

prosódicas dos contornos pré-indicativos de OSAdvs no PB, segundo as tendências observadas

com os resultados obtidos a partir do Teste 2, podem ser sintetizadas da seguinte forma:

1. Contornos pré-indicativos com F0 ascendente na sílaba tônica final

a) causal (ressíntese a):

. formação do vale da F046

, com 1VR47

(20% abaixo da LR48

. centralização do vale da F0 na consoante (C) de ataque da STF;

. elevação da F0 5VRs (100%) acima da LR.

46 Como definido no capítulo 6, o vale da F0 se inicia na SPreTF e se conclui na STF, com caracterização

descendente-ascendente, formando uma curva côncava. O vale da F0 é limitado, em seu lado superior, pela linha de

referência. 47 Como definido no capítulo 6, o valor de referência (VR) é baseado na variação descendente da F0, constituída

entre o ataque na vogal da SpreTF e o valor mínimo de pitch verificado ao fim do movimento descendente. 1VR

corresponde a uma variação, em Hz, de 20%. 48 Como definido no capítulo 6, a linha de referência (LR) é uma linha paralela ao eixo temporal (abscissa), que

tangencia a F0 no primeiro momento de sua manifestação visual na vogal pré-tônica final. No caso de uma

monotonização, a LR será a própria F0.

b) consecutivo (ressíntese b):

. formação do vale da F0, com 2VRs (40% abaixo da LR);

. centralização do vale da F0 na consoante (C) de ataque da STF;

. elevação da F0 5VRs (100%) acima da linha de referência;

. duração da C de ataque da STF 31% maior que a média das durações das C da

OP, e 7% maior que a duração da VTF;

. duração da VTF 54% maior que a média da duração das vogais (V) da OP.

c) final (ressíntese b):

. formação do vale da F0, com 1,5VR (30% abaixo da LR);

. centralização do vale da F0 na C de ataque da STF;

. elevação da F0 4VRs (80%) acima da linha de referência;

. duração da C de ataque da STF 19% maior que a média das durações das C da

OP, e 26% menor que a duração da VTF;

. duração da VTF 65% maior que a média da duração das V da OP.

Figura 8.1 – Representação esquemática dos contornos prosódicos pré-indicativos de consequência, de causa e de

finalidade, para o PB. O movimento descendente da F0 se inicia na sílaba pré-tônica final. LR: linha de

referência; STF: sílaba tônica final; OP: oração principal; C-dur: duração da consoante; V-dur: duração da

vogal tônica.

C-dur V-dur

Na STF, em relação à média na OP:

pré-indicação consecutiva

pré-indicação causal

pré-indicação final

2. Contornos pré-indicativos com F0 descendente na sílaba tônica final

a) concessivo (ressíntese b):

. início do movimento descendente da F0 12% acima do pitch máximo da V na

sílaba anterior à sílaba pré-tônica final (SAPreTF);

. variação de -4% na F0 da VPreTF;

. variação de -30% na F0 da C de ataque da STF;

. variação de -50% na F0 da VTF;

. elevação do pitch de toda a frase em 30% (para compensar o rebaixamento

total);

. criação de um formato côncavo na F0 da VTF, com variação de 15%.

b) conformativo (ressíntese a):

SAPreTF;

. variação de -37% na F0 da C da STF;

. variação de -19% na VTF;

total);

c) temporal (ressíntese b):

SAPreTF;

. variação de -34% na F0 da C da STF;

. variação de -5% na F0 da VTF;

total);

. duração da VTF 47% maior que a média da duração das V da OP.

Figura 8.2 – Representação esquemática dos contornos prosódicos pré-indicativos de concessão, de conformidade e

de tempo, para o PB. O pico máximo da F0 se localiza na vogal da sílaba anterior à sílaba pré-tônica final. LR:

linha de referência; STF: sílaba tônica final; OP: oração principal; C-dur: duração da consoante; V-dur:

duração da vogal tônica.

Em relação à discussão estabelecida na seção 1.2 quanto a considerar os contornos

prosódicos como um todo ou como constituídos por partes, os dados obtidos para esta pesquisa

parecem indicar um direcionamento para a postura de Marandin (2004), que considera, para o

francês, os contornos como sendo constituídos de forma holística, ou seja, a informação

veiculada por um dado contorno não é devida a um tom específico, mas à combinação dos vários

eventos fonológicos verificados ao longo desse contorno. A observação das figuras 8.1 e 8.2, em

que três contornos prosódicos (portanto, com valores fonológicos distintos) estão representados

em dois tipos básicos de movimento da F0 na sílaba tônica final – ascendente ou descendente –,

parece indicar que os valores pré-indicativos desses contornos se devem à combinação de todos

os tons constitutivos simultaneamente.

No entanto, percebe-se também que a distinção entre cada contorno de um mesmo grupo

decorre de variações de ordem fonética. Uma vez que a identidade de cada um desses contornos

se deve à combinação dos tons como um todo49

, mas também e necessariamente a essas

variações de ordem fonética, coloca-se o questionamento quanto a não ser mais apropriado

assumir uma postura semelhante à de Aubergé et al. (2004), em que se considera o contorno

prosódico como sendo global (holístico), mas haver nele pontos-chave responsáveis por sua

49 E, em alguns casos, também a valores duracionais.

concavidade em 15%

pré-indicação concessiva

pré-indicação conformativa

pré-indicação temporal

Na STF, em relação à média na OP:

identidade. Resta ainda à teoria definir qual a melhor postura a ser adotada para a rotulação

desses contornos.

9. ÍNDICE ANALÍTICO

Contornos Prosódicos

abordagem composicional, 3, 25

abordagem holística, 24, 231

adição, 35

asserção prototípica, 76

atitudes/emoções, 44

atos discursivos prototípicos, 35

autonomia da F0, 45

comportamento constante, 21

compressão-truncamento, 25, 227

metáfora sal-água, 228

consciência do falante, 42

conteúdo proposicional, 40

contexto referencial

desambiguação, 42

continuação maior contendo continuações

menores, 78

contorno de continuação, 40, 70

contorno de finalização, 70

contorno estilizado, 31

contorno nananère, 76

contornos entonativos básicos, 35–36

contornos primitivos, 25

contradição, 35

declinação

grau em lookahead, 48

desambiguação, 40, 84, 87

acento frasal, 40

descrição melódica, 43

discurso real, 36

eventos localizados, 39

extensão de pitch, 70

identidade masculina/feminina, 31

idiossincrasia, 30

incompatibilidade, 35

interação com ouvinte, 41

interrogação, 22, 78, 85

questão alternativa, 86

main clause phenomena, 39

normalização/inicialização, 43

orações explicativas, 54

orações subordinadas adverbiais, 4

pares-mínimos, 36, 78

parte significativa, 29

questão total, 42

tema/rema, 86

testes contrastivos, 26–29

tons, 26

tons constitutivos, 71

valor de não-controvérsia, 34

valor emotivo-atitudinal, 22

valor fonológico, 21

valor lingüístico, 30

valor paralingüístico, 30

Função Entonativa

contorno interrogativo, 12

explicatura, 20

falante, 9

função atitudinal, 43

função gramatical, 9

inferências pragmáticas, 14

interação locutor-ouvinte, 10

interferências pragmáticas, 11, 18

sentido frasal, 8, 11

simbologia social, 21

valor semântico, 9

Metodologia

corpus

pares-mínimos, 91

critérios para escolha final das ressínteses,

critérios seleção para Teste 2, 136

fricativa alveolar surda, 99

gravação FR, 96

gravação PB, 93

OP1/OP2 FR, 95

OP1/OP2 PB, 91

prosograma, 110, 197, 205

ressíntese

alinhamento, 106

apenas PB no Teste 2, 104

elevação máxima F0, 107

justificativa para OP monotônica, 105

justificativa para OP neutra, 104

OP neutra, 104

configuração, 105

seqüenciação do processo, 105

Teste 2, 108

cruzamento, 108

diagramação, 108

variação entre programas, 106

voz masculina, 104

schwa, 95

sílaba pós-tônica, 91, 95

tão, 92

Teste 1 FR

aplicação, 103

cruzamento, 102

diagramação, 102

Teste 1 PB

aplicação, 101

cruzamento, 100

diagramação, 100

Modelos Entonativos

contornos prosódicos

estabelecimento, 67

francês

10 contornos (Delattre, 1966), 72

10 contornos (Post, 2000), 72

4 contornos descendentes (Marandin,

2004), 77

4 contornos finais (Marandin, 2004), 75

acentuação em primeiro nível, 67

acentuação no nível sintagmático, 73

asserção prototípica, 76

comprometimento (commitment), 80

conflito de acentos, 68

contorno nananère, 76

contornos ascendentes (Marandin,

2004), 77

controvérsia, 79

eventos fonológicos, 68

não-controvérsia, 79

níveis de fraseamento, 74

percepção de proeminências, 74

percepção do acento lexical, 74

inglês

22 contornos (Pierrehumbert 1980), 72

abordagem composicional, 73

status morfêmico, 73

inversão de pente, 68

português

acento frasal, 82

acento lexical, 81

acento secundário, 82

alternância rítmica, 82

antecipação, 85

causa-conseqüência, 87

coesão sintática, 83

desambiguação, 84

elevação expressiva da F0, 81

ênfase contrastiva, 88

hierarquia correlatos acústicos, 82

intensidade, 82

interrogação, 85

metalinguagem, 84

negação na OP, 88

questão alternativa, 86

sílaba acentuada, 82

sílaba pós-tônica, 82

tamanho dos constituintes, 83

tema/rema, 86

Pré-Indicação

adversidade, 47

atitudes/emoções, 44

definição, 3

downstep, 48

aumento na extensão do pitch, 49

cancelamento, 49

dagará, 49

elevação antecipatória, 51

iorubá, 48

japonês, 50

resetting, 50

enumeração, 47

índices antecipatórios, 85

ocorrência, 45

oração principal, 39

processamento do sinal, 36

tamanho do enunciado, 37, 46

valor cognitivo, 4, 37

valor probabilístico, 43

Ressíntese

cálculo grau concavidade, 151

cálculo grau convexidade, 154

cálculo redução da duração, 149

duração intrínseca fricativas, 169

F0 ascendente

descrição, 139, 140

F0 descendente

cálculo queda, 150

descrição, 142

formato côncavo/convexo, 142

linha de referência (LR), 140

modalidade monotônica, 143

modalidade neutra, 143

ressínteses OP1 ~ OP2, 170

valor de referência (VR), 139

Resultados

hipóteses para o FR, 135

Teste 2

OP neutra ~ OP monotônica, 191

Resultados FR

hipótese

diferença causal-comparativa, 128

diferença causal-consecutiva, 129

diferença comparativa-conformativa,

diferença comparativa-final, 129

diferença comparativa-proporcional,

diferença concessiva-final, 130

diferença final-proporcional, 133

diferença proporcional-temporal, 134

Resultados PB

hipótese

diferença causal-consecutiva, 113

diferença comparativa-final, 115

diferença concessiva-proporcional, 117

diferença concessiva-temporal, 117

diferença condicional-consecutiva, 118

diferença consecutiva-causal, 122

diferença consecutiva-condicional, 122

diferença consecutiva-final, 122

diferenciação concessiva-conformativa,

Sintaxe

arquicategoria adverbial (causa), 125

articulação do discurso, 61

atividade discursiva, 53

auto-suficiência, 8

coesão sintática, 83

condição de igualdade OP/coordenada, 57

coordenação, 52

equivalência semântica, 54

estrutura entonacional

estruturas internas múltiplas, 58

grupos tonais, 58

significado continuativo, 58

tipos de seqüências, 58

forma canônica OP-OSAdv, 90

Gramática Gerativa, 1

hierarquia OSAdv-OP, 90

hipotaxe, 52

de tom H a tom L, 59

grupos tonais, 57

subordinação gramatical sem

entonacional, 60

subordinação tonal sem sintática, 60

interface sintaxe-fonologia, 14

línguas OV/VO, 56

orações adjetivas, 53

orações adverbiais, 53, 54

orações completivas, 54

orações coordenadas adversativas, 4

orações subordinadas adverbiais, 4

orações substantivas, 53

parataxe, 52

período, 52

polissemia causa-condição / finalidade /

proporção / tempo, 124

polissemia causa-proporção, 124

polissemia tempo-condição, 119, 126

sentença complexa, 53

sentença composta, 53

subordinação, 53

testes sintáticos, 56, 91

critério pragmático, 57

deranking, 56

Teoria Prosódica

acento primário, 17

acentos de pitch, 65

alvo da F0, 32

análise fina, 44

categorias prosódicas, 15

clichê melódico, 64

códigos biológicos

código de esforço, 23

código de freqüência, 23

código de produção, 24, 69

condição de unidade de sentido, 16

constituinte entonacional

complexidade, 62

coordenação, 62

fronteira sintática, 63

contorno prosódico

questionamentos, 64

contornos entonacionais, 15

crítica ao não-detalhamento, 13

duração silábica, 74

entonação igualando léxico, 12

entonema, 64

escala tonal, 33

estrutura da F0, 46

cálculo da inclinação, 69

estrutura informacional, 12

estrutura sintática armazenada, 19

evento, 32

falha de detalhamento, 13

fraseamento entonacional, 16, 82

Gramática Gerativa, 8

grupo rítmico, 65

idiossincrasia, 21

independência prosódica, 2, 15

interface sintaxe-fonologia, 8, 16, 19

Linguist’s Theory of Intonational

Meaning, 2, 13

memória de curto-termo, 19

modelos normalizadores, 33

nível pós-lexical, 10

normalização de pitch, 34

pausa, 17

performance, 8

procursão, 45

segmentação prosódica, 65

princípios rítmicos, 67

sintaxe, 66

Sense Unit Condition, 11

sintagma fonológico, 73

sistema prosódico, 44

teoria métrico-autossegmental, 26, 32

transição, 32

unidade de sentido, 15

unidade entonacional, 16, 18, 64, 65

groupes de souffle, 69

tamanho, 62

tamanho médio, 19

unidade gramatical, 18

unidades entonacionais

tamanho médio, 68

unidades gramaticais totais, 18

valor específico, 23

valor fonológico, 3, 22

valor lingüístico, 3, 13, 45

valor paralingüístico, 1, 3, 12, 13, 22, 33

valor universal, 23

10. REFERÊNCIAS BIBLIOGRÁFICAS

ANDERSON, J. M. (2005) The non-autonomy of syntax. In: Folia Linguistica XXXIX:3-4, 223-

AUBERGÉ, V.; PILLAT, T. Gr; RILLIARD, A. (1997) Can we perceive attitudes before the end

of sentences - the gating paradigm for prosodic contours. In: Proceedings of Eurospeech

1997. Rhodes/Athens, Greece.

AUBERGÉ, V.; AUDIBERT, N.; RILLIARD, A. (2004) Acoustic morphology of expressive

speech: what about contours? In: Proceedings of the 2nd International Conference on Speech

Prosody 2004. Nara, Japan.

BÄNZIGER, T.; MOREL, M; SCHERER, K. (2003) Is there an emotion signature in

intonational patterns? And can it be used in synthesis? In: Proceedings of the Eurospeech

2003. Geneva.

BARBIZET, J.; LEDERER, M.; PERGNIER, M.; SELESKOVITCH, D. (1979) Vouloir-dire,

intonation et structures des phrases. In: Folia Linguistica XIII:3-4, 237-245.

BECHARA, E. (1992) Moderna gramática portuguesa. 34a ed. São Paulo : Companhia Editora

Nacional.

BERMÚDEZ-OTERO, R.; HONEYBONE, P. (2006) Phonology and syntax: a shifting

relationship. In: Lingua 116, 543-561.

BEYSSADE, C.; MARANDIN, J.-M. (2007) French Intonation and Attitude Attribution. In:

DENIS, P.; McCREADY, E.; PALMER, A.; REESE, B. (eds.) Proceedings of the 2004

Texas Linguistics Society Conference: Issues at the Semantics-Pragmatics Interface.

Disponível em http://www.lingref.com/cpp/tls/2004/.

BOERSMA, P., & WEENINK, D. (2005). Praat: doing phonetics by computer (Version 4.3.01)

[Computer program]. Disponível em http://www.praat.org/.

BOLINGER, D. (1985). The inherent iconism of intonation. In: HAIMAN, J. (ed.) Iconicity in

syntax. Proceedings of a symposium on iconicity in syntax, Stanford, June 24-6, 1983.

Amsterdam, Philadelphia : John Benjamins.

CHEN, A.-J. (2003) Language-specificity in the perception of continuation intonation. In:

Proceedings of the 15th

International Congress of Phonetic Sciences.

CHOMSKY, N.; HALLE, M. (1968) The sound pattern of English. New York : Harper and

Row; Boston : MIT Press.

COUPER-KUHLEN, E. (1985) An introduction to English prosody. Tübungen : Niemeyer,

CROFT, W. (1995) Intonation units and grammatical structure. In: Linguistics 33, 839-882.

Mouton de Gruyter, Berlin, New York.

CUNHA, C.; CINTRA, L. (1985) Nova gramática do português contemporâneo. 34a ed. Rio de

Janeiro : Nova Fronteira.

DARGNAT, M.; JAYES, J. (2007) La cohésion paratactique: une approche constructionnelle.

In: BÉGUELIN, J. (ed.) Actes du colloque La Parataxe (Neuchâtel). Manuscrito inédito.

DELAIS-ROUSSARIE, E.; RIALLAND, A.; DOETJES, J.; MARANDIN, J.-M. (2002) The

prosody of post-focus sequences in French. In: Proceedings of the 1st International

Conference on Speech Prosody 2002, 239-242.

DELATTRE, P. (1966) Les dix intonations de base du français. French Review, XL:1, 1-14.

DI CRISTO, A. (1985) De la microprosodie à l'intonosyntaxe. Publications Université de

Provence.

DI CRISTO, A. (2004) La prosodie au carrefour de la phonétique, de la phonologie et de

l'articulation formes-fonction. In: Travaux interdisciplinaires du Laboratoire Parole et

Langage d’Aix-en-Provence. Aix-en-Provence : Université de Provence.

DIAS, M.G.B.B.; VANDERLEI, R.B. (1999) A habilidade para diferenciar se de quando. In:

Psicologia: reflexão e crítica, 12:197-208.

DIESSEL, H. (2001) The ordering distribution of main and adverbial clauses: a typological

study. In: Language 77:3, 433-455.

D‟IMPERIO, M.; ELORDIETA, G.; FROTA, S.; PRIETO, P.; VIGÁRIO, M. (2005) Intonation

phrasing in Romance: the role of syntactic and prosodic structure. In: FROTA, S.;

VIGÁRIO, M.; FREITAS, M.J. (eds.) Prosodies. Berlin/New York : Mouton de Gruyter, 59–

FÓNAGY, I. (1974) La fonction préindicative de l‟intonation en français et en hongrois. In :

Travaux de l’Institut d’Études Linguistiques et Phonétiques. Vol. I, 44-75.

FOX, A. (1984) Subordinating and co-ordinating intonation structures in the articulation of

discourse. In: GIBBON, D.; RICHTER, H. (eds.) Intonation, accent and rythm studies –

phonology. Berlin : Walter de Gruyter.

FOX, A. (2000) Prosodic features and prosodic structure. Oxford : Oxford University Press.

FREITAS, M. A. de (1995) Prosódia e sintaxe: delimitação e contraste de estruturas. Tese de

doutorado. Rio de Janeiro : Universidade Federal do Rio de Janeiro. 228 fls. mimeo.

GOLDSMITH, J. A. (1976) Autosegmental phonology. Bloomington, Indiana : Indiana

University Linguistics Club.

GONÇALVES, C. A. V. (1997) Focalização no português do Brasil. Tese de doutorado. Rio de

Janeiro : Universidade Federal do Rio de Janeiro.

GOUVEIA, E. L.; ROAZZI, A.; O‟BRIEN, D. P.; MOUTINHO, K.; DIAS, M. da G. B. B.

(2001) Se e quando: sinônimos?!!! In: Psicologia: teoria e pesquisa. Vol. 17, 3:265-273.

GRICE, H. P. (1975) Logic and conversation. In: COLE, P.; MORGAN, J. (eds.) Syntax and

semantics. (3:41-58) New York : Academic Press.

GRØNNUM, N.; VIANA, M. (1999) Aspects of European Portuguese intonation. In:

Proceedings of the 14th International Congress of Phonetic Sciences, São Francisco, 1-7

August 1999, vol. 3, 1997-2000.

GROSJEAN, F. (1983) How long is the sentence? Prediction and prosody in the on-line

processing of language. In: Linguistics 21-3, 501-529.

GUSSENHOVEN, C. (2002a) Intonation and interpretation: phonetics and phonology. In:

Proceedings of the 1st International Conference on Speech Prosody 2002, 47-57.

GUSSENHOVEN, C. (2002b) Phonology of intonation. Cap. 11. The phonology of intonation.

Glot Internation. 6, No. 9/10, 271-284.

HARFORD, C.; DEMUTH, K. (1999) Prosody outranks syntax: an optimality approach to

subject inversion in Bantu relatives. In: Linguistic Analysis, 29 (1-2), 47-68.

HOUSE, J. (2006) Constructing a context with intonation. In: Journal of Pragmatics 38, 1542-

LADD, D. R., Jr. (1978) Stylized intonation. In: Language, 54:3, 517-540.

LADD, D. R., Jr. (1980) Intonation, main clause phenomena, and point of view. In: WAUGH, L.

R.; VAN SCHOONEVELD, C.H. The melody of language. Intonation and prosody.

Baltimore : University Park Press, 149-163.

LADD, D.R., Jr. (1996) Intonational phonology. Cambridge : Cambridge University Press.

MARANDIN, J.-M. (2004) Contours as constructions. In: ICCG-3: The Third International

Conference on Construction Grammars.

MARANDIN, J.-M.; BEYSSADE, C.; DELAIS-ROUSSARIE, E.; RIALLAND, A.; DE

FRONEL, M. (2004) The meaning of final contour in French. Disponível em

http://www.llf.cnrs.fr/fr/Marandin/

MARTIN, Ph. (1982) Phonetic realizations of prosodic contours in French. In: Speech

communication 1, 283-294.

MARTIN, Ph. (2002) The continuation contour in French. In: Proceedings of the 1st

International Conference on Speech Prosody 2002, Proceedings of the First International

Conference on Prosody, 239-242.

MATEUS, M. H. M.; BRITO, A. M.; DUARTE, I.; FARIA, I. H. (2003) Gramática da língua

portuguesa. Lisboa : Editorial Caminho.

MEJVALDOVÁ, J. (2001) Expressions prosodiques de certaines attitudes en tchèque et en

français: étude comparative. Thèse de Doctorat. Université Paris 7, Université Charles.

MERTENS, P. (2004) The prosogram: semi-automatic transcription of prosody based on a tonal

perception model. In: Proceedings of the 2nd International Conference on Speech Prosody

2004. Nara, Japan.

MORA, E.; COURTOIS, F.; CHRISTIAN, C. (1997-1998) L‟accent lexical espagnol: perception

par des francophones et des hispanophones. In: Travaux de l’Institut de Phonétique d’Aix.

18:105-112.

MORAES, J. A. (1984) Recherches sur l'intonation modale du portugais parlé à Rio de Janeiro.

Doctorat de 3ème cycle. Paris : Université de Paris III.

MORAES, J. A. (1998) Intonation in Brazilian Portuguese. In: HIRST, D.; DI CRISTO, A.

Intonation systems. A survey of twenty languages. Cambridge : Cambridge University Press.

MORAES, J. A.; COLAMARCO, M. (2008) Accomodation of intonational patterns in Brazilian

Portuguese short utterances: compression or truncation? Manuscrito inédito.

MORAES, J. A.; ESPESSER, R. (1988) La hiérarchie des indices prosodiques de l‟accent en

portugais. Une étude basée sur la synthèse de la parole. Texto lido na First International

Conference on Experimental Phonostylistics, Sociophonology and Speech Acoustic

Variability. Florianópolis, Universidade de Santa Catarina.

MORAES, J. A.; LEITE, Y. (1992) Ritmo e Velocidade da Fala na Estratégia do Discurso. In:

ILARI, R. (org.) Gramática do Português Falado. Vol. II: Níveis de Análise Lingüística.

Campinas: Editora Unicamp, pp. 65-77.

MORAES, J. A.; STEIN, C. C. (2006) Attitudinal patterns in Brazilian Portuguese intonation:

analysis and synthesis. In: Proceedings of the 3rd International Conference on Speech

Prosody 2006.

ORSINI, M. T. (2003) As construções de tópico no tortuguês do Brasil: uma análise sintático-

discursiva e prosódica. Tese de doutorado. Rio de Janeiro : Universidade Federal do Rio de

Janeiro.

PIERREHUMBERT, J. 1980 (1988) The phonology and phonetics of English intonation.

Bloomington : Indiana University Linguistics Club.

PIERREHUMBERT, J.; HIRSCHBERG, J. (1990) The meaning of intonational contour in the

interpretation of discourse. In: COHEN, P.; MORGAN, J.; POLLACK, M. (Eds.) Intentions

in communication. Cambridge, Massachussets : MIT Press.

PINEK, B.; CAVE, C. (1993) Temporal auditory integration and the pitch of glissandi:

differential perceptual effects. In: Travaux de l’Institut de Phonétique d’Aix, 15, 253-274.

PORTES, C.; BERTRAND, R. (2005) De la valeur interactionnelle du “contour continuatif” en

français. Résultats préliminaires. In: Travaux Interdisciplinaires du Laboratoire Parole et

Langage d'Aix-en-Provence 24, 139-157.

POST, B. (2000) Tonal and phrasal structures in French intonation. Holland Academic

Graphics, The Hague.

PREVOST, S.; STEEDMAN, M. (1994) Specifying intonation from context for speech

synthesis. Speech Communication.

RIALLAND, A. (2001) Anticipatory raising in downstep realization: evidence for preplanning in

tone production. In: KAJI, S. (ed.) Cross-linguistics studies of tonal phenomenon:

tonogenesis, typology, and related topics. Vol. 3. Institute for the Study of Languages and

Cultures of Asia and Africa (ILCAA).

ROSSI, M. (1971) Le seuil de glissando ou seuil de perception des variations tonales pour les

sons de la parole. In: Phonetica 23, 1-33.

ROSSI, M. (1978) La perception des glissandos descendants dans les contours prosodiques. In:

Phonetica 35, 11-40.

ROUSSEAU, A. (2002) La question de la subordonné au tournant du siècle (et au delà). In:

Modèles Linguistiques XXIII:1, 147-160.

SELKIRK, E. O. (1980) On prosodic structure and its relation to syntactic structure.

Bloomington : Indiana University Linguistics Club.

SELKIRK, E. O. (1984) Phonology and syntax: the relation between sound and structure.

Cambridge, London : The MIT Press.

SNEDEKER, J.; GLEITMAN, L.; FELBERBAUM, M.; PLACA, N.; TRUESWELL, J. (2000)

Prosodic choice: effects of speaker awareness and referential context. In: Proceedings of the

International Congress in Cognitive Science.

STEEDMAN, M. (1991) Structure and intonation. In: Language 67, 260-296.

STEEDMAN, M. (2000) Information structure and the syntax-phonology interface. In:

Linguistic Inquiry 31:4, 649-689.

STEIN, C. C. (2003) Para uma teoria da recepção. Interferências pragmáticas e prosódicas na

leitura. Dissertação de Mestrado. Rio de Janeiro : Universidade Federal do Rio de Janeiro.

139 fls. mimeo.

SWERTS, M.; BOUWHUIS, D. G.; COLLIER, R. (1994) Melodic cues to the perceived

“finality” of utterances. In: Journal of the Acoustic Society of America. 96:4, 2064-2075.

VAISSIÈRE, J. (1997) Langues, prosodie et syntaxe. In: Revue Traitement Automatique des

Langues. Número spécial Prosodie et syntaxe. ATALA, 38:1, 53-82.

VAISSIÈRE, J. (2004) Perception of intonation. In: PISONI, D. B.; REMEZ, R. E. (eds.)

Handbook of speech perception. Oxford : Blackwell.

11. ANEXOS

Contextualização Oração Principal Relação Oração Subordinada

Era uma pessoa muito dedicada, mas nem sempre tudo corria bem.

01. Ficava infeliz causal porque o trabalho não produzia frutos.

Seus trabalhos eram bons, mas seu nível de

exigência era muito elevado.

Vislumbrava um grande desafio pela frente. Mas havia muitos problemas.

O atleta era, sem dúvida, muito exigente. condicional se os exercícios não fossem adequados.

Sempre acreditou que para cada dia havia uma

desgraça.

Nunca se contentou com o desempenho mediano dos funcionários.

Queria se fazer passar por coitado o tempo todo. final para que todos sentissem pena dele.

Já não tinha a mesma garra da época da juventude. proporcional à medida que via seus planos desabarem.

Nunca admitiria ouvir opiniões diferentes sem que pudesse apresentar as suas próprias.

Era uma pessoa muito dedicada, mas nem sempre

tudo corria bem.

02. Mostrava-se cansado causal porque o trabalho não produzia frutos.

Seus trabalhos eram bons, mas seu nível de exigência era muito elevado.

Vislumbrava um grande desafio pela frente. Mas

havia muitos problemas.

O atleta era, sem dúvida, muito exigente. condicional se os exercícios não fossem adequados.

Sempre acreditou que para cada dia havia uma

desgraça.

Nunca se contentou com o desempenho mediano

dos funcionários.

Queria se fazer passar por coitado o tempo todo. final para que todos sentissem pena dele.

Já não tinha a mesma garra da época da juventude. proporcional à medida que via seus planos desabarem.

Nunca admitiria ouvir opiniões diferentes sem que

pudesse apresentar as suas próprias.

Anexo 1 – Contextualização das orações principais 1 e 2 para o PB, seguidas das nove possibilidades de orações subordinadas adverbiais, para a

formação do corpus oral utilizado no Teste 1.

Contextualização Oração Principal Relação Oração Subordinada

Paul recherche un emploi. 01. Il est ennuyé cause car le marché du travail est très exigeant.

Paul n‟a pas confiance en lui. comparaison comme s‟il allait échouer à tous ses examens.

Paul est surprenant. concession alors que tous les résultats sont positifs.

Paul est très perfectionniste. condition si les exercices ne lui sont pas adaptés.

Paul n‟a pas donné de nouvelles depuis

longtemps.

conformité d‟après ce qu‟a dit la petite fille de sa voisine.

Paul va être licencié. conséquence du coup il est désagréable avec ses amis.

Paul n’est pas majeur. but pour obtenir une autorisation de sortie.

Paul n‟est plus tout jeune. proportionalité à mesure qu‟il voit ses plans professionnels

échouer.

Paul veut vraiment réussir.

temporalité après avoir travaillé des heures sans comprendre.

Paul recherche un emploi. 02. Il se montre irritable cause car le marché du travail est très exigeant.

Paul n‟a pas confiance en lui. comparaison comme s‟il allait échouer à tous ses examens.

Paul est surprenant. concession alors que tous les résultats sont positifs.

Paul est très perfectionniste. condition si les exercices ne lui sont pas adaptés.

Paul n‟a pas donné de nouvelles depuis

longtemps.

conformité d‟après ce qu‟a dit la petite fille de sa voisine.

Paul va être licencié. conséquence du coup il est désagréable avec ses amis.

Paul n’est pas majeur. but pour obtenir une autorisation de sortie.

Paul n‟est plus tout jeune. proportionalité à mesure qu‟il voit ses plans professionnels

échouer.

Paul veut vraiment réussir.

temporalité après avoir travaillé des heures sans comprendre.

Anexo 2 – Contextualização das orações principais 1 e 2 para o FR, seguidas das nove possibilidades de orações subordinadas adverbiais, para a

formação do corpus oral utilizado no Teste 1.

OP 1 neutra OP 1 causal OP 1 comparativa OP 1 concessiva

média dur C 0,105 média dur C 0,087 média dur C 0,087 média dur C 0,082

média dur V 0,101 média dur V 0,091 média dur V 0,091 média dur V 0,092

F0 dur% média

durF0 dur

% média

durF0 dur

% média

durF0 dur

% média

dur- - - -

123 159 161 168

- 134 139 150

127 173 191 189

122 156 181 186

122 141 195 209

99 141 178 186

132 145 230 258

132 145 230 247

109 131 207 237

103 141 154 181

120 236 146 120

- - - -

a 0,121 21

0,027 -67

i 0,043 -57 i 0,044 -51 i 0,043

f 0,051 -52 f 0,056 -36 f

k 0,113 8 k 0,079 -9 k 0,071 -14

0,057 -30

i~ 0,077 -24 i~ 0,079 -13

0,086 -5 a 0,081 -12

v 0,071 -32 v 0,054

0,084 -8

f 0,108 3 f 0,132 51 f 0,099 21

e 0,077 -23 e 0,066 -27 e 0,075 -19

l 0,071 -32 l 0,117 34 l 0,092 12

0,177 93

S 0,214 105 S 0,086 -2 S

i 0,184 83 i 0,179 97

0,145 78

f 0,099 14%

i 0,058 -37%

k 0,067 -23%

v 0,045 -48%

a 0,077 -15%

i~ 0,083 -9%

f 0,110 26%

l 0,084 -3%

e 0,091 -1%

i 0,147 61%

S 0,116 33%

Anexo 3a – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP1 neutra e das OPs 1causal, comparativa e

concessiva de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em cada OP. Na

quarta coluna das tabelas, a variação percentual dos valores duracionais de cada fone em relação a essa média.

OP 1 neutra OP 1 condicional OP 1 conformativa OP 1 consecutiva

F0 dur% média

durF0 dur

% média

durF0 dur

% média

durF0 dur

% média

- - - -

123 161 149 -

- 139 135 -

127 191 152 174

122 181 162 166

122 195 180 176

99 178 182 162

132 230 242 172

132 230 238 172

109 207 216 126

103 154 157 149

120 146 131 223

- - - -

k 0,113 8

i 0,043 -57

f 0,051 -52

i~ 0,077 -24

v 0,071 -32

a 0,121 21

l 0,071 -32

e 0,077 -23

f 0,108 3

S 0,214 105

i 0,184 83

0,050 -42

f 0,090 -17

0,083 -2

k 0,088 -18

0,059 -45

0,075 -13

0,088 3

f 0,138 29

l 0,140 31

f 0,077 -18%

S 0,130 21

i 0,131 54

i 0,060 -38%

k 0,077 -18%

v 0,046 -51%

a 0,099 2%

i~ 0,087 -10%

f 0,120 27%

l 0,099 5%

e 0,075 -23%

i 0,165 69%

S 0,144 53%

k 0,098 5

a 0,088 -2

f 0,042 -55

i 0,053 -40

f 0,126 35

e 0,075 -15

v 0,051 -45

i~ 0,098 10

S 0,165 76

l 0,079 -16

i 0,131 47

Anexo 3b – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP1 neutra e das OPs condicional,

conformativa e consecutiva de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em

cada OP. Na quarta coluna das tabelas, a variação percentual dos valores duracionais de cada fone em relação a essa média.

OP 1 neutra OP 1 final OP 1 proporcional OP 1 temporal

F0 dur% média

durF0 dur

% média

durF0 dur

% média

durF0 dur

% média

- - - -

123 165 161 161

- - 139 139

127 171 191 191

122 142 181 181

122 144 195 195

99 148 178 178

132 166 230 230

109 129 207 207

103 156 154 154

120 202 146 146

- - - -

f 0,051 -52

e 0,077 -23

f 0,108 3

i~ 0,077 -24

v 0,071 -32

a 0,121 21

k 0,113 8

i 0,043 -57

S 0,214 105

i 0,184 83

l 0,071 -32

i 0,046 -49 i 0,047 -40

f 0,095 3 f 0,081

a 0,088 -3 a

k 0,080 -13

v 0,045 -52 v 0,059

k 0,085 -9

i~ 0,090 0 i~ 0,082 5

0,077 -2

e 0,078 -13 e

f 0,127 37

0,070 -11

l 0,110 19 l 0,106

f 0,129 38

0,101 8

S 0,098 6

i 0,149 65 i 0,115

i 0,058

k 0,066 -15%

0,060 -23%

i~ 0,082

a 0,088 11%

f 0,109 42%

0,041 -47%

i 0,159

e 0,091 14%

S 0,141 84%

0,104 35%

Anexo 3c – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP1 neutra e das OPs final, proporcional e

temporal de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em cada OP. Na

OP 2 neutra OP 2 causal OP 2 comparativa OP 2 concessiva

F0 dur% média

durF0 dur

% média

durF0 dur

% média

durF0 dur

% média

- 158 170 -

113 148 148 149

103 132 139 147

- - - -

124 156 - 192

116 148 163 187

116 147 173 192

118 146 178 203

110 147 177 201

- - - -

- 136 - -

127 153 219 237

100 135 190 221

- 146 170 -

114 179 125 113

120 191 125 114

- 171 - -

m 0,033 -53m 0,022 -72 m 0,018 -74

o 0,053 -41o 0,072 -22 o 0,081 -11

S 0,076 10S 0,079 2 S 0,076 6

t 0,049 -29t 0,056 -28 t 0,060 -16

4 0,038 -454 0,044 -43 4 0,040 -45

a 0,078 -13a 0,126 36 a 0,106 16

v 0,049 -29v 0,053 -32 v 0,035 -51

a 0,039 -56a 0,043 -54 a 0,047 -49

s 0,080 16s 0,125 61 s 0,100 39

ii 0,022 -77 i 0,039 -57

k 0,074 8k 0,088 13 k 0,088 23

a~ 0,105 18a~ 0,103 11 a~ 0,100 11

s 0,170 147s 0,151 95 s 0,186 158

a 0,186 109a 0,196 112 a 0,193 113

d 0,052 -25d 0,081 5 d 0,045 -38

u 0,073 -18u 0,086 -7 u 0,069 -24

o 0,071 -16%

m 0,028 -63%

S 0,092 22%

t 0,068 -10%

a 0,107 27%

4 0,019 -74%

v 0,045 -41%

a 0,047 -44%

i 0,036 -58%

s 0,107 41%

k 0,091 20%

a~ 0,105 25%

a 0,175 108%

s 0,175 132%

d 0,055 -27%

u 0,049 -42%

Anexo 3d – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP2 neutra e das OPs 2 causal, comparativa e

concessiva de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em cada OP. Na

OP 2 neutra OP 2 condicional OP 2 conformativa OP 2 consecutiva

F0 dur% média

durF0 dur

% média

durF0 dur

% média

durF0 dur

% média

- 170 173 -

113 148 156 140

103 139 163 141

- - - -

124 - - 155

116 163 179 143

116 173 182 141

118 178 196 139

110 177 187 144

- - - -

127 219 237 145

100 190 221 132

- 170 207 181

114 125 118 192

120 125 132 192

- - 111 160

m 0,018 -73

o 0,075 -17

S 0,073 7

t 0,056 -17

4 0,033 -51

a 0,104 14

v 0,044 -35

a 0,046 -50

s 0,080 17

k 0,093 37

a~ 0,101 11

s 0,165 143

a 0,183 101

d 0,049 -28

u 0,038 -59

o 0,056 -35

m 0,027 -62

S 0,081 13

t 0,042 -42

a 0,095 11

4 0,043 -41

v 0,037 -48

a 0,047 -44

s 0,097 35

k 0,097 36

a~ 0,094 11

a 0,157 84

s 0,179 149

d 0,043 -39

u 0,062 -27

o 0,067 -19%

m 0,038 -42%

S 0,107 63%

t 0,051 -22%

a 0,100 20%

4 0,013 -80%

v 0,042 -36%

a 0,046 -45%

s 0,092 41%

k 0,080 23%

a~ 0,100 20%

a 0,154 85%

s 0,152 131%

d 0,015 -78%

u 0,033 -61%

S 0,079 2

t 0,056 -28

m 0,022 -72

o 0,072 -22

v 0,053 -32

a 0,043 -54

4 0,044 -43

a 0,126 36

k 0,088 13

a~ 0,103 11

s 0,125 61

i 0,022 -77

d 0,081 5

u 0,086 -7

s 0,151 95

a 0,196 112

Anexo 3e – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP2 neutra e das OPs 2 condicional,

conformativa e consecutiva de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em

cada OP. Na quarta coluna das tabelas, a variação percentual dos valores duracionais de cada fone em relação a essa média.

OP 2 neutra OP 2 final OP 2 proporcional OP 2 temporal

F0 dur% média

durF0 dur

% média

durF0 dur

% média

durF0 dur

% média

- - 170 170

113 128 148 148

103 128 139 139

- - - -

124 161 - -

116 154 163 163

116 145 173 173

118 143 178 178

110 145 177 177

- - - -

127 143 219 219

100 130 190 190

- 183 170 170

114 149 125 125

120 129 125 125

- - - -

d 0,081 5

u 0,086 -7

s 0,151 95

a 0,196 112

k 0,088 13

a~ 0,103 11

s 0,125 61

i 0,022 -77

v 0,053 -32

a 0,043 -54

4 0,044 -43

a 0,126 36

S 0,079 2

t 0,056 -28

m 0,022 -72

o 0,072 -22

u 0,040 -57%

0,193 111%

a~ 0,105 15%

u 0,061 -27 u 0,050 -44

0,178 99

S 0,071

m 0,041 -38%

d 0,038 -49 d 0,049

s 0,181 159

d 0,015

s 0,172 162%

a 0,171 106 a

s 0,162 117

t 0,074 12%

0,074 -19%

a~ 0,103 24 a~ 0,095 7

v 0,042

4 0,018 -73%

a 0,047 -49%

0,090 -2%

kk 0,100 35 k 0,092

s 0,089 28

s 0,092 39%

i 0,027 -67 i

s 0,115 54

a 0,047 -44 a 0,034 -62

0,109 22

v 0,045 -39 v 0,053

4 0,032 -55

a 0,097 17 a

4 0,041 -45

t 0,061 -17 t 0,058 -18

0,069 -22

S 0,081 8 S 0,061

m 0,015 -79

o 0,075 -9 o

m 0,027 -63

Anexo 3f – Valores da F0 (em Hz) e da duração (em mseg) para os segmentos fônicos da OP2 neutra e das OPs 2 final, proporcional e

temporal de referência para o PB. Acima de cada tabela, os valores duracionais consonantal e vocálico médios em cada OP. Na

Livros Grátis( http://www.livrosgratis.com.br )

Milhares de Livros para Download: Baixar livros de AdministraçãoBaixar livros de AgronomiaBaixar livros de ArquiteturaBaixar livros de ArtesBaixar livros de AstronomiaBaixar livros de Biologia GeralBaixar livros de Ciência da ComputaçãoBaixar livros de Ciência da InformaçãoBaixar livros de Ciência PolíticaBaixar livros de Ciências da SaúdeBaixar livros de ComunicaçãoBaixar livros do Conselho Nacional de Educação - CNEBaixar livros de Defesa civilBaixar livros de DireitoBaixar livros de Direitos humanosBaixar livros de EconomiaBaixar livros de Economia DomésticaBaixar livros de EducaçãoBaixar livros de Educação - TrânsitoBaixar livros de Educação FísicaBaixar livros de Engenharia AeroespacialBaixar livros de FarmáciaBaixar livros de FilosofiaBaixar livros de FísicaBaixar livros de GeociênciasBaixar livros de GeografiaBaixar livros de HistóriaBaixar livros de Línguas

Baixar livros de LiteraturaBaixar livros de Literatura de CordelBaixar livros de Literatura InfantilBaixar livros de MatemáticaBaixar livros de MedicinaBaixar livros de Medicina VeterináriaBaixar livros de Meio AmbienteBaixar livros de MeteorologiaBaixar Monografias e TCCBaixar livros MultidisciplinarBaixar livros de MúsicaBaixar livros de PsicologiaBaixar livros de QuímicaBaixar livros de Saúde ColetivaBaixar livros de Serviço SocialBaixar livros de SociologiaBaixar livros de TeologiaBaixar livros de TrabalhoBaixar livros de Turismo

a prÉ-indicaÇÃo prosÓdica para as oraÇÕes subordinadas...

Documents

oraÇÕes subordinadas adverbiais -...

orações subordinadas adjetivas e orações …...4...

orações subordinadas adjetivas

orações subordinadas adjetivas

orações subordinadas adverbiais

orações subordinadas adjetivas e orações subordinadas

oraÇÕes subordinadas

oraÇÕes subordinadas substantivas

oraÇÕes subordinadas adverbiais

orações subordinadas

oraÇÕes subordinadas -...

professora: elizabete biedacha. orações subordinadas...

oraÇÕes subordinadas adjetivas

slide orações subordinadas

orações subordinadas adverbiais

orações subordinadas substantivas

orações subordinadas adverbias

orações subordinadas relativas

orações subordinadas substantivas

orações subordinadas