Psychologie du langage 10ème cours 17.01.00

La perception de la parole

Les sons, les mots varient selon leurs contextes, le débit, le locuteur.

Les sons, les mots ne sont pas séparés par des pauses.

Les frontières entre eux ne sont pas marquées.

Les sons, les mots se chevauchent.

Il est plus rapide de parler que d’écrire.

Les mots sont parfois prononcés incomplètement.

La variabilité est liée au contexte vocalique. Sur des spectrogrammes artificiels on peut analyser les formants des syllabes /di/ et /du/. La voyelle qui suit, influence sur la consonne. Plus audible encore avec /s/ qui est variable en fonction du contexte /sa/ et /su/.

FORMANT, linguistique 

Terme utilisé par les linguistes de l’école chomskienne. On distingue en grammaire générative les formants des morphèmes: les morphèmes sont les éléments qui composent les suites syntagmatiques terminales engendrées par la base de la grammaire (soit l’ensemble des règles syntagmatiques et le lexique) avant l’application des transformations. Les formants sont les éléments minimaux composant les suites transformationnelles terminales (obtenues par l’application de toutes les transformations aux suites syntagmatiques terminales). Certains formants correspondent à des morphèmes, d’autres non. Ce sont les suites composées de formants, plus nombreux que les morphèmes, qui reçoivent une interprétation sonore par application des règles phonologiques.

Formant est aussi un terme de phonétique désignant les fréquences d’un son complexe renforcées. Ainsi le pharynx et la bouche renforcent les fréquences de tous les sons émis. D’autres formants peuvent entrer en action si l’on fait intervenir d’autres résonateurs, les cavités nasales, par exemple, dans l’émission des voyelles nasales. Ce sont les formants qui définissent le timbre spécifique de chaque voyelle et de chaque consonne.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sur le spectrogramme des deux mots suivants " recognize speech " on voit qu’il y a pas de pose ou de séparation comme à l’écrit.

 

 

 

Sur le dessin on peut voir de recoupement du temps en fonction de la fréquence des 3 monèmes b ae g prononcés en un morphème.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

En moyenne 12 à 15 phonèmes sont produits par seconde, et 150 à 300 mots par minute.

Exemple de disparition de mots ou de sons :

Processus phonologique :

[il.t .di.kil.n .l.s .pa] " il te dit qu’il ne le sait pas "

[il.t .di.kil.n .ls .pa] " il te dit qu’il ne l’sait pas "

[i.t .di.kil.n .ls .pas] " ‘ite dit qu’il ne l’sait pas "

[it.di.ki .s .pa] " ‘it’dit qu’il’sait pas "

 

 

 

 

 

 

 

Questions importantes sur la perceptions de la parole :

Comment la parole est-elle segmentée et classifiée afin de construire la représentation infra-lexicale ?

Quelle est la nature de la représentation infra-lexicale qui est extraite du signal acoustique pour accéder au lexique ?

Signal acoustique à Représentation infra-lexicale à Lexique

Il y a deux opérations de traitement :

La segmentation :

La catégorisation (ou classification) :

Deux types d’indices :

 

Définition :

Le Voice Onset Time (VOT) est un indice qui détermine la nature voisée ou non voisée d’une consonne occlusive.

Voisé : b g d

Non voisé : p k t

Le VOT concerne le rapport temporel entre deux événements acoustiques :

Le schéma montre la séquence en msec. qu’il y a entre la prononciation des phonèmes /b/ et /p/. Le point 0 représente le relâchement inévitable mais perceptible entre les deux phonèmes.

En français la durée est de

-40 ms pour le pré-voisé

0 ms pour le voisé

+40 ms pour le non-voisé

En anglais la durée est de

-20 ms pour le pré-voisé

0 ms pour le voisé

+60 ms pour le non-voisé

Nous avons un système neuronal capable de traiter les transitions rapides qui se font dans le côté gauche du cerveau.

Définition :

La perception catégorielle est la perception de stimuli variable comme de des unités constantes

Les stimuli : une série de stimuli répartis sur un continuum entre deux sons clairement identifiables.

S1 : son1 S2 : son2

 

Le VOT (voice onset time) distingue les consonnes plosives voisées des non-voisées. (bdg) versus (ptk)

 

 

 

Les tâches expérimentales :

Les résultats :

Il y a deux classes d’unités perceptives

Voici 3 exemple d’unités

segmentation catégorisation

- syllabe syllabe

- syllabe phonème

- phonème phonème

Les unités non-linguistiques

Spectres extraits du signal (10ms)

Les unités linguistiques

Les traits distinctifs

Les phonèmes

Les composants de la syllabe (attaque, rime)

La syllabe

diphone : pa ac dans pactole

 

 

Exemples de tâches métaphonologiques :

exemple : chapeau 4 phonèmes ch a p o

2 syllabes cha peau

Les tâches portant sur des syllabes sont réussies avant les phonèmes

syllabes phonèmes

crèche 46 % 0 %

maternelle 48 % 17 %

école primaire 90 % 70 %

Liberman & Shankweilwer (1974)

Les sujets doivent répéter le mot sans le premier phonème.

Exemple : chapeau à /apo/

17 % de réussite chez des adultes illettrés

73 % chez les mêmes adultes après avoir appris l’écriture

Morais et al. (1979)

Tâche de détection de cible linguistique

Cible C : phonème, syllabe, mot

Séquence porteuse SP : syllabe, mot, non mot

Distracteurs D : séquence non cible

C D D D SP

/b/ /ta/ /ma/ /sa/ /ba/

/ba/ /ta/ /ma/ /sa/ /ba/

 

 

 

 

 

 

 

Procédure de détection de cible

Il s’agit de varier le rapport entre la cible et la séquence porteuse SP

Cible CV CVC

pa pal

SP CV-mot CVC-mot

pa-lace pal-mier

Résultats : CV<CVC dans les CV-mots

CVC<CV dans les CVC-mots

Inférence : La syllabe est l’unité de segmentation

/Meyhler, Dommergues, Freuenfelder & Segui, 1981)

Hypothèse phonémique vs. syllabique

stimuli

CV-mot CVC-mot

pa.lace pal.mier

Hypothèse phonémique :

Cibles à détecter pa.lace pal.mier

CV pa plus rapide plus rapide

CVC pal moins rapide moins rapide

Hypothèse syllabique :

Cibles à détecter pa.lace pal.mier

CV pa plus rapide moins rapide

CVC pal moins rapide plus rapide

 

 

 

 

 

 

 

Les modèles du traitement infra-lexical

Le modèle classique de Eimas :

signal à traits distinctifs à phonème à lexique

Le modèle RAP de Klatt :

signal à gabarits spectraux à lexique

Le modèle linguistique de Marlsen-Wilson :

signal à traits distinctifs à lexique

Les modèles syllabiques du traitement infra-lexical

Le modèle syllabique I de Mehler :

signal à syllabe à lexique

ß phonème

Le modèle syllabique II de Dupoux :

signal à demi-syllabe à syllabe à lexique