III
La mise en scène de
l’entretien
Interviews, entretiens,
débats, talk-shows constituent une part importante des
programmes de télévision [1]. Ils se proposent pour
la plupart comme des moments et des lieux d’échanges,
neutres et non partisans, dont la vocation est de faciliter
la diffusion des idées afin de favoriser la formation,
voire l’expression, de l’opinion
publique. Mais quelles sont les contraintes réelles
inhérentes aux dispositifs de mise en scène et jusqu’à
quel point la procédure énonciative peut-elle inférer
sur le déroulement des débats, d’une part, sur leur
interprétation par le spectateur d’autre part ?
Le présent travail se propose d’établir les bases d’une
théorie pragmatique de l’entretien qui puisse faciliter
l’interprétation des processus interactifs propres à
la représentation audiovisuelle.
1.
Champ sémiotique, champ sémantique
Tout
acte de communication se développe dans deux champs
complémentaires : le champ référentiel, informatif
ou constatif, et le champ relationnel, que l’on
peut encore qualifier de performatif ou d’énonciatif.
Ces deux champs correspondent aux deux fonctions canoniques
du langage, la fonction de représentation ou de constat
d’une part, la fonction pragmatique discursive, d’autre
part. Le langage sert à la fois à décrire et à agir.
Plus qu’opposées, ces deux
fonctions sont complémentaires, voire indissociables.
Il n’y a pas de récit sans discours, d’histoire sans
narrateur, ni non plus de discours sans récit, de message
sans contenu, de relation sans contexte. L’interpénétration
du discours et du récit, du sémantique et du sémiotique,
a été décrite par Émile Benveniste (1969 et 1974) à
partir d’une analyse de la subjectivité dans le langage
qui met en évidence le caractère intentionnel de la
production du sens.
Le sens n’est pas confiné
dans les lexiques virtuels des langues naturelles –
comme l’or des États-Unis dans les caves de Fort Knox
– mais se retrempe et se métamorphose continuellement
à l’usage infini du discours quotidien intersubjectif
qui constitue le jeu social. C’est ainsi que les énoncés
portent toujours deux valeurs de signification, un sens
dénotatif, cristallisé, lexicalisé, sémiotique,
qui renvoie au système de la langue, et un sens projectif,
sous contexte, sémantique, qui rend compte ou
qui organise l’échange intersubjectif. Cette valeur
sémantique de l’énoncé n’est pas soumise à une simple
intelligence de l’interlocuteur mais bien à une interprétation
dont il est en fin de compte le seul juge.
2.
Le discours et le récit
Tout
énoncé mêle une fonction informative, référentielle,
à une fonction relationnelle, pragmatique, mais on peut
distinguer les énoncés discursifs, à vocation
pragmatique dominante, des énoncés narratifs qui
manifestent une plus ou moins grande autonomie par rapport
au contexte de leur énonciation. La conversation
et l’entretien se déroulent dans le hic et
nunc d’un échange intersubjectif actuel, tandis
que le récit se déploie dans un jeu intersubjectif
dissocié, à l’intention d’un public passif ou virtuel.
La chaîne verbale, constitutive du discours, se caractérise
par l’alternance des points de vue propres aux locuteurs,
alors que la chaîne verbale constitutive du récit se
caractérise par la permanence et l’unicité du point
de vue énonciatif – quelle que soit au demeurant la
variété des artifices narratifs.
Le discours est une concaténation
de segments qui se caractérisent chacun par le locuteur
qu’ils manifestent, l’information qu’ils donnent et
l’intention qu’ils véhiculent, mais l’alternance des
propos ne peut s’organiser et se perpétuer que si les
acteurs s’accordent a minimo sur l’enjeu implicite
de l’échange. Ils se doivent donc d’élaborer un même
point de vue sur le sens de ce qui se joue. Autrement
dit, l’isotopie sémantique de la conversation n’est
concevable que du point de vue abstrait d’un tiers virtuel
auquel chacun des interlocuteurs accepte de s’identifier.
3. L’alternance des propos
Ce processus d’élaboration
d’une cohérence sémantique se situe de façon privilégiée
dans l’organisation de l’alternance des propos. Chevauchements,
silences, interruptions, dénégations, etc. sont – paradoxalement
– autant de procédures qui visent à pérenniser le contact
dans l’assentiment de l’autre. Ces artifices, qui ordonnent
et réduisent l’expression des subjectivités, sont tout
à fait comparables aux procédés de narration. Les règles
qui organisent le "tour de parole" sont les
règles mêmes qui président à la construction de tout
récit.
Les segments narratifs,
constitutifs du récit, rendent compte dans leur concaténation
et dans leur syntaxe du processus de ponctuation propre
au discours. Ils décrivent d’une part le contenu brut
du discours – on parlera en ce cas de segments référentiels
– et ils proposent d’autre part une interprétation de
la signification implicite de l’échange – et on peut
parler alors de segments énonciatifs.
Segments énonciatifs et
segments référentiels se mêlent plus ou moins intimement
dans le déroulement du récit, non sans manifester le
point de vue qui leur est propre et la fonction qu’ils
assument. Les segments référentiels rendent compte des
points de vue internes à la diégèse, alors que les segments
énonciatifs rendent compte du point de vue du narrateur,
voire de celui du lecteur ou du spectateur. Le mouvement
même du récit est une oscillation permanente entre le
champ de la diégèse et l’univers de l’énonciation, de
même que la dynamique du discours se règle dans l’alternance
des propos. La tension narrative qui entretient l’intérêt
du lecteur ou du spectateur est fondamentalement de
même nature que la tension discursive qui entretient
ou pérennise l’échange verbal.
4.
Point de vue et point d’écoute
Nous avons précédemment
formulé l’hypothèse (Desgoutte, 1997, pp. 97-109) que
le récit audiovisuel peut être analysé, à l’instar du
récit verbal, comme une concaténation de propositions
– usuellement appelées plans – qui se rapportent chacune
à un point de vue interne ou externe à l’histoire racontée.
En ce sens, la narration audiovisuelle est constituée
d’un enchaînement de segments diégétiques ou énonciatifs,
qui alternent les points de vue simulés des acteurs
de l’histoire racontée et les points de vue externes
du narrateur et/ou du spectateur.
Cette formulation nous permet
de mieux comprendre ce qui se joue dans l’enregistrement
d’un débat ou d’un événement. Le contenu de l’émission
enregistrée adresse au spectateur un certain nombre
d’éléments référentiels, directement puisé dans l’événement,
et un certain nombre d’éléments énonciatifs qui sont
le fait du metteur en scène et visent soit à rendre
explicites le sens de ce qui s’échange, soit à manifester
le point de vue du narrateur quant à ce qui s’échange.
L’entretien et le débat
audiovisuels ont à vrai dire un statut un peu particulier
par rapport au récit audiovisuel « canonique »,
en ce sens que les acteurs y ont une véritable autonomie
de comportement. Ils sont là pour débattre et inventent
ensemble le déroulement du propos. Ils règlent entre
eux, avec la participation éventuelle d’un animateur,
l’enchaînement des tours de parole. La structure de
la « narration » (la syntaxe du programme)
est donc le résultat d’une interaction ou d’un compromis
entre la logique du discours de référence et la rhétorique
de la mise en scène ou de la mise en image.
Si le réalisateur n’a pas
de maîtrise directe sur le contenu de l’échange ni sur
la ponctuation des propos, il a en revanche une grande
liberté de traitement de l’image puisqu’il peut choisir
le contenu, la valeur du plan et les mouvements de caméra,
et contrôler également l’usage des micros et l’enregistrement
du son.
Cette position particulière
du réalisateur n’est pas sans influence sur l’évolution
du débat dont elle peut tendre à accentuer ou au contraire
à effacer certains aspects. Le réalisateur est en position
d’analyste par rapport à la « chorégraphie »
du débat dont il peut anticiper ou retarder la représentation,
quant au tour de parole en particulier.
Si le discours ou l’entretien
se fondent prioritairement sur un échange de paroles,
ils donnent lieu également à un échange de regards et
d’expressions, de comportements et de postures qui ajoutent
à la signification du « dit » une signification
du « montré ». La restitution du jeu des regards,
des expressions et des comportements exige un dispositif
particulier d’enregistrement qui prenne en compte la
spécificité visuelle de l’échange.
Le point de vue de la caméra
rend compte de l’angle de narration (J.-P. Desgoutte,
1997, p. 125), c’est-à-dire de la position du narrateur
dans le dispositif énonciatif, soit qu’il adopte le
regard (intradiégétique) de l’un ou l’autre des acteurs,
soit qu’il reste extérieur à la scène référentielle.
La dissociation du son et de l’image permet de sophistiquer
le jeu énonciatif en séparant le (ou les) point d’écoute
du (ou des) point de vue. De même que l’enregistrement
du son simule par l’usage d’un ou de plusieurs micros
une position d’écoute du spectateur, de même
l’enregistrement de l’image simule par l’usage d’une
ou de plusieurs caméras un point de vue du spectateur.
Mais alors que le contexte sonore d’un événement est
peu ou prou commun à l’ensemble de ses acteurs (chacun
entend plus ou moins la même chose que les autres),
la restitution du contexte visuel nécessite l’identification
des divers points de vue à l’œuvre.
5.
Les catégories personnelles de l’image
Le discours est à la fois
un échange de propos et de comportements. Le sujet se
manifeste simultanément par ce qu’il dit et par ce qu’il
montre. En plus du contenu verbal du message qu’il adresse
à son interlocuteur, il manifeste, délibérément ou non,
un certain nombre d’attitudes et d’expressions, qui
révèlent ses émotions, ses sentiments ou ses intentions.
Il propose donc à son interlocuteur une image de soi
dont on peut dire qu’elle se partage en deux composantes,
une composante expressive – involontaire ou spontanée
– et une composante impressive, délibérée, intentionnelle.
Ces deux images, focalisées l’une sur le sujet, l’autre
sur son vis-à-vis, accompagnent à chaque instant le
jeu d’échange verbal. Le regard (comme la parole) peut
être caractérisé par sa polarisation émotive ou conative,
selon les termes de Roman Jakobson (1963) – expressive
ou impressive, selon nos propres termes. On peut ainsi
appeler fonction JE la dominante expressive et fonction
TU la dominante impressive (J.-P. Desgoutte, 1997, pp.
117-118). Le mouvement du dialogue mêle sans cesse les
images de l’un et de l’autre interlocuteurs, dans un
jeu quasi chorégraphique où alternent mouvements vers
l’autre et replis sur soi. Le foyer de l’échange, verbal
et visuel, oscille sur la ligne des regards, privilégiant
parfois l’un, parfois l’autre, donnant lieu également
à des affrontements, des conflits de territoire, ou
encore à des silences où chacun se retrouve au plus
intime de lui-même.
Ce mouvement caractéristique
du jeu intersubjectif, a été décrit, dans sa dimension
verbale, par Émile Benveniste. Il se manifeste dans
toute langue par le jeu plus ou moins complexe des pronoms
personnels. Nous nous proposons ici d’en formuler de
façon analogue la dimension visuelle en posant qu’il
existe trois images de tout sujet :
·
L’identité
du sujet est l’image dénotative ou descriptive simple.
Elle est présumée libre de toute expression et de toute
intention. On peut dire qu’elle appartient au référent
social.
·
L’expression du sujet manifeste – hors de toute intention – la subjectivité du locuteur.
·
Le regard
du sujet rend compte du rapport intentionnel que le
sujet entretient avec son vis-à-vis.
Cette transposition des catégories verbales personnelles
dans le domaine visuel est liée au développement depuis
un siècle d’une « grammaire implicite de l’image
animée ». Le cinéma et plus encore la télévision,
ont systématisé la simulation, l’enregistrement et la
diffusion des dialogues, conversations et débats. Les
réalisateurs et metteurs en scène ont ainsi été amenés
à élaborer de façon empirique des dispositifs de représentation
qui tendent à rendre compte, le mieux possible, de l’ensemble
de l’événement concerné, dans sa totalité et dans ses
parties.
Cette élaboration d’un dispositif
de représentation n’est rien d’autre, dans le fond,
qu’une théorie implicite de l’échange qui propose de
façon empirique un certain nombre de paradigmes visuels
représentatifs de la dynamique propre au discours. La
pratique de la réalisation conduit ainsi à faire un
certain nombre de choix de points de vue, cadrages,
angles, etc. qui sont autant de propositions d’analyse
de l’événement. Le découpage technique, propre à toute
représentation audiovisuelle, se propose, de fait et
par la force des choses, comme une théorie de l’action
sociale. Il mêle intimement une analyse « logique »
de l’événement à une interprétation énonciative, inhérente
à toute procédure de représentation.
6.
Le modèle de l’interview
Nulle part mieux que dans l’interview ne se révèle le jeu
d’implication qui lie l’instance référentielle et
l’instance énonciative. En effet, le principe même
de l’interview [2] est d’établir un
passage – voire une confusion – entre discours et
récit, performance et constat. L’interview mêle donc
les deux instances, topique, où la personne interrogée,
se livre à un échange discursif avec son interlocuteur,
et énonciative, où l’interviewer
met en scène le propos selon un dispositif plus ou
moins complexe à l’usage du public.
Le rôle de l’interviewer est d’ordonner, selon un schéma narratif interprétable
par un destinataire absent, les propos de l’interviewé.
Il intervient comme narrateur des deux côtés
de la frontière que constitue le cadre de l’entretien.
Il est partie prenante du
discours qu’il ordonne, sans toutefois s’y impliquer
personnellement, mais il est également narrateur du
récit destiné au public. Son rôle est modulable, de
la présence opaque à la transparence complète. Présent
dans la scène, il est acteur du drame. Silencieux,
voire absent du cadre, il tend à se confondre avec
le destinataire virtuel du propos. L’interviewer trace
le cadre énonciatif où le propos de l’interviewé viendra
s’inscrire. Il autorise ainsi la manifestation d’une
logique immanente au personnage en le conduisant à
donner de lui-même un récit structuré
[3] .
7.
Dialogue et conversation
La conversation et le dialogue,
peuvent être analysés à partir d’une généralisation
du modèle de l’interview. La représentation de la
conversation est assimilée, dans ce cas, à un double
jeu d’interviews simultanées où chacun prend à son
tour le rôle de narrateur-miroir. Chacun des interlocuteurs
assume donc le triple rôle d’émetteur, de récepteur
et de témoin.
Émetteur, il crée l’événement
en soumettant à son vis-à-vis une proposition dont
les fonctions sont multiples.
Récepteur, il propose un
cadre et une trame à l’image et au propos de son interlocuteur,
dont il produit une analyse instantanée. La logique
du propos de l’émetteur est donc déterminée par la
réaction du récepteur. Cette fonction du récepteur
est à rapprocher de celle de l’interviewer, en ce
sens que le récepteur est en position d’observateur
par rapport à l’émetteur et à son propos.
La réaction du récepteur
peut elle-même être objectivée du point de vue d’un
tiers. Autrement dit, le tiers institue une deuxième
instance d’observation qui révèle l’interactivité
propre à la conversation. Ce cadre est à la fois le
lieu d’un éventuel témoin et celui du réalisateur-narrateur.
Mais c’est également le lieu d’où l’émetteur observe
la réaction de son vis-à-vis à son propos. Ce qu’il
lit, dans le regard de l’autre, c’est sa propre image.
Il y a donc deux niveaux
de narration qui s’enchâssent. Le premier est assuré
par la présence active du vis-à-vis et le second par
la présence explicite ou implicite du tiers. L’interversion
des rôles d’émetteur et de récepteur présuppose ou
induit l’existence d’un champ d’observation externe
au dialogue où le jeu intersubjectif est observable
dans sa totalité. C’est le lieu où s’élabore une
logique commune aux propos de l’un et de l’autre.
Le référent – l’événement
– est constitué de plusieurs points de vue qui peuvent
et doivent être décrits dans leur unicité et dans
leur interrelation.
Si A, B et C sont respectivement
locuteur, destinataire et témoin de l’échange, la
représentation de l’échange doit rendre compte à la
fois du point de vue de A sur B, du point de vue de
B sur A et du point de vue tiers du témoin C, qui
encadre les deux précédents.
En ce lieu commun s’élabore
la logique du propos, qu’elle soit assumée par le
jeu intersubjectif, et donc immanente à l’événement,
ou qu’elle soit prise en charge par le narrateur,
et donc transcendante à l’événement.
Quand A parle, B fait fonction
de miroir de A, C révèle quant à lui, le jeu de B
par rapport à A. C’est la position de témoin qui juge
des interférences logiques entre A et B.
Il y a donc trois degrés
d’enchâssement. B est en position d’extériorité par
rapport à A, et C en position d’extériorité par rapport
à {A ® B}. Le rapport de C à A est médiatisé
par B. Si le sens du message s’inverse, le jeu d’enchâssement
se transforme : le rapport de C à B est médiatisé
par A.
La problématique de l’interview
se ramène donc à la métamorphose d’un discours – par
nature discontinu et intersubjectif – en un récit
cohérent, structuré, accessible et interprétable par
un tiers.
Cette problématique de la
métamorphose du discours en récit (ou, plus généralement,
de la parole en écriture) met en évidence la nécessité
d’un dispositif de médiation qui explicite les éléments
pragmatiques propres au discours. Le discours est
fondamentalement ininterprétable en dehors de son
contexte de manifestation, alors que le récit se doit
de pérenniser sa signification indépendamment du contexte
de son énonciation.
L’explicitation du discours
ne peut se faire que du point de vue du tiers. Elle
est prise en charge, d’une façon très générale, par
les médias. Le processus médiatique lève l’ambiguïté
propre au jeu intersubjectif dont il donne une représentation
ou, plus exactement, il en transforme la nature et
il en déplace le lieu. L’interprétation de ce qui
s’échange ne se joue plus à l’intérieur du discours
de référence mais entre les acteurs du jeu énonciatif.
Le travail de mise en scène
propre aux médias a pour nécessité – et pour objet
– de déplacer le processus performatif, créateur de
sens, de l’univers propre au discours de référence
à l’univers énonciatif, autrement dit de la « scène »
à la « salle ».
C’est ainsi que l’espace d’interprétation offert au spectateur est déterminé
à la fois par le support de médiation et par la sophistication
relative des choix de mise en scène.[4]
8. Les aspects du récit
audiovisuel
Qu’est-ce donc que rapporter un propos ? Est-ce se situer à la place de la personne
qui le profère ? A celle de celui à qui il est destiné
? Ou encore en un troisième lieu qui serait soit la
place d’un témoin de l’événement, soit la place d’un
observateur extérieur à l’événement [5]?
Faut-il mêler tous ces points de vue ou, à chaque
instant, privilégier l’un ou l’autre suivant en cela
quelque progression logique qui serait soit inhérente
à l’événement soit révélatrice de l’intelligence du
narrateur ?
La volonté de donner une représentation immanente et totalisante de l’événement
peut amener le narrateur à analyser l’événement en
autant de récits qu’il existe de points de vue. On
peut imaginer pour ce faire un dispositif enregistrant
les perceptions sonores et visuelles de chacun des
acteurs et les restituant sur un ensemble de moniteurs.
Dans le cas d’un dialogue, on aurait deux écrans côte
à côte [6], simulant chacun le regard et l’ouïe de
l’un des interlocuteurs. Mais quelle serait donc la
réalité du point de vue du spectateur observant les
deux écrans ? Point de vue du tiers exclu (voyeur) ?
Certes non, mais bien point de vue artificiellement
reconstitué d’une double présence simultanée à l’événement.
Le spectateur serait censé être à la fois l’un et
l’autre des interlocuteurs.
Si la simulation est parfaite,
le spectateur aura l’étrange sensation que l’un et
l’autre interlocuteurs ne
conversent pas ensemble mais s’adressent à lui spectateur.
En ce cas, il se trouve en effet projeté dans le lieu
de l’énonciation à la place même de l’un et l’autre
interlocuteurs. Il cesse dès lors d’être spectateur
sans pour autant acquérir le rôle d’acteur. Confronté
aux images simultanées des deux interlocuteurs, le
spectateur concentre alternativement ses regards sur
l’un ou l’autre de ses vis-à-vis, suivant la trajectoire
du message, et révèle ainsi un parcours signifiant
de l’événement. Ce mouvement manifeste que les divers
points de vue ne sont pas identiquement porteurs de
signification par rapport à l’événement. Le choix
parmi les points de vue disponibles, donne lieu à
une segmentation du propos qui est le propre du narrateur
(i.e. du réalisateur).
Pour restituer le discours
d’un orateur doit-on filmer la salle (on révèle l’effet
de la fonction impressive du discours) ou le visage
(voire le corps) de l’orateur (on révèle la fonction
expressive, l’intention consciente ou inconsciente
de l’orateur) ?
Doit-on filmer les deux
simultanément et laisser au spectateur le soin d’interpréter
les interactions visibles entre le propos de l’un
et le comportement des autres ?
Ou encore, montrera-t-on
alternativement les uns et les autres, mais le choix
du narrateur n’influera-t-il pas alors sur l’interprétation
de l’événement par le spectateur ?
À vrai dire, les trois cadres
disponibles ne sont pas équivalents ; ils sont subordonnés
les uns aux autres. Ainsi que nous l’avons vu précédemment,
l’accès à l’expression du sujet est médiatisé par
le regard de l’autre. Explicite ou implicite, présent
en amorce ou en contrechamp, l’autre est un cadre
à franchir pour accéder au sujet. Ce que l’on peut
formuler de la façon suivante : la médiatisation
imaginaire est nécessaire à l’interprétation du référent.
En fait, s’il y a une place
pour un tiers dans une conversation, place de témoin
ou de narrateur qui comprend quelque chose à ce qui
s’échange, c’est que cette place est toujours déjà
présente dans le jeu intersubjectif. L’acteur a toujours
trois types de rapport à l’événement : un rapport
réflexif, un regard qui interpelle et un regard qui
constate.
Le rapport réflexif est
expressif, le regard qui interpelle saisit le regard
de l’autre, le regard qui constate voit sa propre
image dans les yeux de l’autre. Et cette image-là
est objective, étrangère. Elle ne peut être perçue
que parce que le sujet se situe alors en un lieu tiers,
hors de son propre corps. Le lieu où le locuteur se
voit en même temps que l’autre est le lieu du tiers
ou du narrateur. La restitution d’un discours simule
l’évolution du message – sa trajectoire sursignifiante
– en jouant alternativement sur les regards et sur
les points de vue de l’un et de l’autre. Elle tend
ainsi à déterminer une place du narrateur où viendra
également s’installer le spectateur.
Il existe un point de vue logique sur le récit, qui donne une image de l’ensemble
des fonctions à l’œuvre. Ce point de vue mêle la logique
immanente au propos et la logique propre au regard
du narrateur. Nous en venons ainsi à l’idée que l’espace
du discours n’est pas homogène par rapport au sens
de ce qui s’y produit mais qu’à chaque instant un
ou plusieurs foyers de signification s’y révèlent,
instituant un ordre dans l’émergence des signifiants
ou encore un parcours du message. Ce foyer de la signification
est un lieu potentiellement consensuel, c’est-à-dire
que l’ensemble des acteurs s’y rejoignent en position
de témoin ou de narrateur (sans doute pas toujours,
et sans doute pas de façon continue mais c’est bien
l’ensemble des segments consensuels qui constituent
à proprement parler le résultat de l’échange ou encore
son récit potentiel). Participer à une conversation,
c'est donc essayer de rejoindre l'autre en un lieu
où l'on est à la fois témoin de sa propre performance
et de la performance de l'autre. À chaque instant,
l’évolution du message et de la situation de communication
tend à privilégier un cadre. Un événement en effet
ne se réduit pas à l’addition des subjectivités à
l’œuvre mais plutôt à la circulation et à la métamorphose
d’un message qui est premier et constituant de la
situation. Cette circulation du message dans le discours
donne lieu à une confrontation entre les acteurs qui,
d’une certaine façon, sont soumis à son parcours,
alors que dans le récit tout se passe comme si le
narrateur était lui-même le deux ex machina
qui élucide ou élabore a priori la nécessité
et la logique de l’échange. Du discours au récit,
le sujet passe d’une situation de soumission au message
et au jeu intersubjectif, à une situation de maîtrise
et de création. La représentation, en révélant le
parcours du message, métamorphose l’ordre réel en
ordre logique [7].
L’événement est à la fois
l’expérience vécue par chacun de ses acteurs (l’idée
que chacun se fait de ce que vivent les autres ou
l’idée que chacun se fait du regard de l’autre) et
la somme « géométrique » que le narrateur (ou
celui qui pour une raison ou pour une autre veut bien
prendre en charge le récit) réalise de l’événement.
A strictement parler, le récit dans sa fonction totalisante
et réductrice, se fait toujours du lieu du tiers.
Le récit ne commence que lorsque l’événement est clos.
Ainsi toutes les formes propres au discours, qui parsèment
le récit, ne fonctionnent que comme des parenthèses
« mimétiques ».
Le metteur en scène, narrateur
de l’événement, a la liberté de privilégier l’un ou
l’autre des cadres disponibles. Il peut adopter, indifféremment
l’un ou l’autre des points de vue. Le choix des cadres
et des angles de narration lui permet de révéler les
fonctions multiples du message et/ou d’en privilégier
l’un ou l’autre. La logique de la mise en scène peut
ainsi tendre à épouser la logique propre à l’évolution
de l’événement ou l’interpréter en toute liberté.
9.
Typologie de l’entretien audiovisuel
L’étude des dispositifs narratifs audiovisuels propres à l’interview, offre
un vaste panorama des relations que peuvent entretenir
les univers référentiel et énonciatif. L’interview,
dans ses multiples avatars, est en effet un lieu d’observation
privilégié des contradictions pragmatiques propres
aux programmes télévisuels.
L’interviewer joue le rôle
d’un miroir intelligent qui radicalise, en l’objectivant,
le rapport que tout individu entretient à sa propre
image. Les choix de mise en scène portent à la fois
sur le décor, la durée de l’entretien et la ponctuation
des propos.
Ø
Le décor tend à organiser ou à structurer
l’espace de l’échange pour en faciliter le développement
ainsi que la représentation. Il prend donc en compte
à la fois les contraintes propres à la dynamique de
l’échange et à la logique de la diffusion. Il anticipe
les rôles de chacun des acteurs et ménage les effets
de mise en scène (quant à la position et aux mouvements
des caméras, en particulier). Les places attribuées
à chacun des protagonistes se distribuent à la fois
selon le ou les axes de référence de la dynamique
de l’échange et selon le ou les axes de référence
de la logique énonciative. Toutes ces conventions
évoluent selon un usage soumis aux modes et aux enjeux
de la programmation.
Ø
La
durée de l’entretien répond le plus souvent à la logique
du dispositif de diffusion. Ce qui n’est pas sans
influence sur la configuration et le rythme de la
ponctuation discursive. La durée et le rythme de l’échange
en conditionnent évidemment le contenu.
Ø
La
ponctuation, ou l’enchaînement des tours de parole,
qui est souvent le lieu privilégié d’observation de
l’évolution de l’échange, est également l’objet de
toutes les convoitises intradiégétiques et extradiégétiques.
Elle peut donner lieu à un accord ou rester le privilège
du meneur de jeu, représentant le metteur en scène,
mais reste en tous cas sous le contrôle du réalisateur
qui impose en dernier recours le découpage final.
La ponctuation du propos détermine en dernière analyse
la durée de présence de chacun des interlocuteurs
à l’image.
Nous notons dès à présent
que les logiques diégétique et énonciative développent
des stratégies autonomes, ou largement indépendantes,
à l’intérieur d’un même projet narratif. Cette situation
ne peut manquer de donner lieu à des conflits ou des
contradictions entre contenu et mise en scène. Ces
conflits pragmatiques sont un enjeu essentiel de l’interprétation
en ce sens que contrairement à l’idée communément
admise, la réalité – sinon la vérité – n’est pas du
côté du contenu mais bien du côté de la mise en scène[8].
Le cadre en effet sépare le champ – imaginaire – du
spectacle de l’espace – réel – de son énonciation.
10.
La diffusion en direct
La diffusion en direct respecte
l’événement dans son intégrité. Le dispositif narratif
peut être réduit au minimum, une caméra fixe couvrant
la totalité du champ, pendant la totalité de l’événement.
L’angle que fait l’axe de la caméra par rapport à
l’axe de la conversation est alors la seule manifestation
concrète du projet narratif. En effet, si l’objet
de l’enregistrement est bien une interview (et non
une conversation : voir supra), l’angle
de prise de vues privilégiera la personne interviewée,
tendant par là même à éloigner l’interviewer du foyer
de l’événement et à le rapprocher du point de vue
extradiégétique d’où se
fait l’énonciation (i. e. l’objectif de la
caméra). Plus l’interviewer tend à limiter son intervention
à une fonction sémantique, c’est-à-dire à entretenir
et à relancer la parole, ou encore à manifester les
liens logiques latents aux propositions émises par
l’interviewé, plus il s’efface du champ. En effet,
la présence physique de l’interviewer, ses gestes,
ses expressions, révèlent soit la fonction expressive
de ses questions, soit la fonction impressive des
propos de son interlocuteur, toutes manifestations
qui gênent le rapport direct de l’interviewé au spectateur.
Dans le même ordre d’idée, les interventions verbales
de l’interviewer sont alors réduites au minimum :
elles n’ont pour strict objet que de lancer, de faire
rebondir ou de clarifier la logique immanente au propos.
La présence de l’interviewer
en amorce révèle parfois son appartenance aux deux
champs disjoints de l’événement et de l’énonciation.
L’amorce manifeste l’ambivalence du personnage qui
est à la fois partie prenante du jeu intersubjectif
propre à l’échange, et metteur en scène, médiateur
d’un récit qui s’adresse au spectateur.
Le parti pris d’extraire
complètement l’interviewer du champ du spectacle,
le fait basculer dans le champ de la narration, du
côté du spectateur. En ce cas de figure, il existe
encore une progression narrative, qui est liée à l’ouverture
relative de l’angle de narration. Plus l’angle est
aigu, plus l’interviewer est identifié au narrateur,
voire au spectateur, plus il est large, plus l’interviewer
est perçu comme appartenant au hors champ (et non
au hors cadre) de l’événement.
Le cas limite est celui
où l’angle est nul. En ce cas, la caméra et l’interviewer
se situent en un même lieu. Cette situation est assez
rare en raison des problèmes techniques et logistiques
qu’elle soulève. On l’identifie souvent, à tort, à
la position occupée par le présentateur du journal
télévisé, qui s’adresse, à travers la caméra, au spectateur.
L’interviewé confronté à un « homme-caméra » ne s’adresse
pas, quant à lui, au spectateur mais bien au narrateur
du récit (qu’il est en train de faire !) dont
la présence, transparente ou implicite, est indiscutable.
La position de l’interviewer
simule en fait une fonction interne au sujet. La fonction
narrative logique, sans cesse à l’œuvre, permet au
sujet de s’objectiver par rapport à lui-même, de structurer
son image et son histoire. C’est pourquoi la simulation
de la subjectivité du sujet (narrateur de sa propre
histoire), pour peu qu’elle n’entende pas se limiter
à la fonction sensorielle, ne révèle pas le regard
du sujet, mais bien son expression. Le Je de
la parole ne correspond pas au regard porté sur l’objet
mais à l’image que le sujet a de lui-même du point
de vue du miroir que simule le narrateur. Le sujet
qui dit Je se regarde en miroir.
11.
La diffusion en différé
Un pas de plus dans l’élargissement du dispositif narratif peut être franchi
si l’interview est transmise en différé. En effet,
la transmission en différé offre au réalisateur la
possibilité d’intervenir sur la structure de l’interview.
Cette intervention peut prendre la forme d’une segmentation
ou d’un effacement de l’une ou l’autre partie du propos.
Elle peut également prendre la forme d’un réarrangement
des éléments fragmentés. Cette intervention a posteriori
du narrateur peut être, ou non, rendue manifeste dans
le produit final, selon qu’elle épouse, ou non, les
fractures propres à la logique du propos [9].
Le montage sonore se
fonde, dans le meilleur des cas, sur le respect de
la cohérence morphologique interne des unités verbales
et sur la cohérence sémantique implicite externe au
discours. Il est facilité par les temps de « silence
» caractérisant la fragmentation du discours. Le
montage visuel, s’il veut simuler de même une continuité,
est tenu d’analyser et de prendre en compte les unités
propres à la perception visuelle. Le rapport entre
la parole et le silence dans l’univers sonore est
un rapport d’intensité. La parole se surimpose à l’ambiance
sonore. On peut dire que la parole est un objet sonore
qui recouvre en partie le décor sonore ambiant. De
même, un objet ou un personnage sont-ils identifiés
comme se détachant sur un décor ; d’où le double
usage, fréquent dans le montage d’interview, du fondu
et du plan de coupe. Le fondu au noir, suivi d’une
ouverture au noir, accompagne la baisse d’intensité
sonore caractérisant la fin de la proposition verbale
; le plan de coupe manifeste le retour au décor ambiant
caractérisant la fin d’un mouvement visuel. Ces deux
procédés classiques du montage d’interviews ont le
défaut de révéler plus ou moins l’intervention du
narrateur. Une autre technique est donc utilisée qui
se fonde non plus sur la structure logique propre
à l’objet représenté mais sur la structure logique
propre au narrateur (voire au spectateur). Le problème
en ce cas n’est pas (seulement) d’analyser les fractures
propres à l’événement — fin d’un mouvement, clignement
d’œil, gestes divers, etc. — mais de simuler les fractures
propres à l’attention du narrateur ou du spectateur.
Il s’agit de faire basculer l’image du côté de la
narration.
Deux procédés sont utilisés pour ce faire : d’une part la multiplication
des points de vue, d’autre part l’utilisation du contrechamp.
Dans l’un et l’autre cas, la position de l’interviewer
cesse de se confondre avec celle du narrateur. On
tend donc à une séparation plus nette des deux instances
de l’événement et de la représentation correspondant
à une mise en scène plus élaborée du propos.
La multiplication des points
de vue et des cadrages nécessite soit l’utilisation
de plusieurs caméras, soit un déplacement, objectif
ou subjectif, de la caméra utilisée. En chaque cas
la logique propre aux mouvements de caméra relève
de la logique du narrateur, qu’elle soit déléguée
à l’opérateur ou révélée par le mixage en direct.
Cette logique de la prise de vues, puis du montage
direct ou différé, s’inspire soit de la logique du
propos (on profite des temps faibles pour déplacer
la caméra, on accentue les temps forts en serrant
le cadre) soit du projet ou de la lecture du narraur
(qui peut fausser ou contredire la logique immanente
au propos, en accentuant les défauts, en mettant l’accent
sur les contradictions, etc.).
En tous cas, le montage qui peut être réalisé en différé à partir des
éléments ainsi filmés, a la possibilité de faire alterner,
selon une continuité subjective, un ensemble de prises
de vues qui manifestent ainsi à la fois des éléments
objectifs (diégétiques) et des éléments subjectifs
(narratifs). Ce qui est proposé dès lors au spectateur
n’est plus le spectacle d’un événement mais son récit,
c’est-à-dire la manifestation du regard et de la logique
du narrateur. La continuité du récit se substitue
à la continuité de l’événement.
Conclusion
Le récit audiovisuel est le lieu d’une double confrontation entre logique de
l’énoncé et logique de l’énonciation d’une part, logique
du verbe et logique de l’image d’autre part. C’est
ainsi que le sens de ce qui est donné à voir et à
entendre au spectateur procède d’une synthèse complexe
entre contenu (référentiel) de l’image et du son d’une
part, mise en image et commentaire d’autre part.
L’enregistrement et la représentation des entretiens et des débats procède de
la même logique et relève des mêmes contraintes. La
révélation du dispositif énonciatif permet donc la
mise en évidence des tensions, contradictions – voire
paradoxes – pragmatiques qui procèdent de la combinaison
de logiques hétérogènes ou de partis pris, conscients
ou inconscients du narrateur-réalisateur.
Notes
[1] Cet article a été publié dans La mise en scène du
discours audiovisuel, l'Harmattan, Jean-Paul
Desgoutte, éd. (1999).
[2] L’utilisation spécifique du mot interview
et la pratique même de l’interview sont attachées
aux débuts du journalisme moderne tel qu’il a été
inventé et mis en œuvre par les Anglo-saxons. Le
journaliste est un témoin sans qualité particulière.
Il est censé représenter le public le plus large.
Les questions qu’il se pose doivent être celles
que se poserait tout un chacun à sa place. Ce n’est
donc pas un spécialiste. Ce n’est pas non plus,
à proprement parler, le représentant d’un groupe
ou d’une institution. Il n’a pas d’autre mission
avouée que de raconter ce qu’il voit, de dire ce
qu’il entend. En ce sens, il n’appartient pas à
la scène qu’il décrit mais bien à la mise en scène,
au dispositif énonciatif, au canal médiatique. L’interview,
à l’instar du roman réaliste, prétend donner accès
à la réalité même du référent, hors de toute déformation
énonciative.
« Le
réalisme n’est pas seulement un discours aussi particulier
et aussi réglé que les autres ; l’une de ses règles
a un statut bien particulier : elle a pour effet
de dissimuler toute règle et de vous donner l’impression
que le discours est en lui-même parfaitement transparent,
autant dire inexistant, et que nous avons affaire
à du vécu brut, à une "tranche de vie" ».
Tzvetan Todorov (1982, p. 9)
Mais de fait l’interview n’est qu’un genre littéraire dont la forme et le
destin sont liés au développement des médias de
masse. Le journaliste de presse écrite est le premier
médiateur à se prétendre libre de toute interprétation
de la réalité qu’il décrit. Il donne accès au réel
afin de laisser le lecteur libre de ses opinions
et de ses jugements. Le développement technologique
va renforcer cet effet de réel. La radio en restituant
les caractéristiques individuelles de la parole,
propose en plus du contenu du propos le contexte
psychologique affectif tel qu’il se manifeste dans
le timbre, l’intensité et l’intonation de la voix.
Et l’image de cinéma, puis de télévision, parachève
l’effet de réalité en offrant au spectateur le contexte
visuel, spatial de l’entretien.
[3] Il tend, autrement dit à effacer le caractère intersubjectif
de l’échange. En ce sens, l’interview n’est pas
un discours, à peine un échange, mais le lieu et
le dispositif (narratif) qui autorisent à l’interviewé la manifestation d’une parole pleine à
l’usage d’un public virtuel. La parole est d’abord
une pratique du dialogue et le sujet construit son
identité linguistique, son JE, à partir des réponses
de l’autre, qui sont autant d’images spéculaires
de ses propos. C’est en ce sens que l’inconscient
se niche dans le discours de l’autre (Lacan,
1966). L’accès au récit, l’accès au monologue suppose
une phase ultérieure de construction linguistique
où le sujet intériorise son double en se situant
lui-même en position de tiers. Le dialogue avec
soi-même, qui achève l’image de soi, exige une scission
du sujet, car une parole pleine est une parole double,
unifiée du point de vue du tiers. C’est là que prend
place la talking cure freudienne, tout près
de l’interview journalistique en ce sens que le
thérapeute offre au patient un lieu d’observation
qui ne porte pas sur le contenu référentiel de ses
propos mais sur leur cohérence énonciative. L’analyste
comme le journaliste socialise la parole du sujet
en la confrontant au défilé radical de la mise en
scène.
[4] Le développement et la popularisation de l’interview,
sous ses multiples formes audiovisuelles, sont liés
à deux phénomènes concomitants, d’une part l’essor
d’un journalisme attentif à l’individu – à l’homme
sans qualités particulières – représentant présumé
de l’opinion collective, et d’autre part la sophistication
des moyens d’enregistrement et de diffusion du son
et de l’image. L’anonymat et le réalisme
font là fonction de garanties d’authenticité – ou
facilitent plus exactement la reconnaissance et
l’identification d’un public, devenu, par le biais
de l’audimat, de la consommation et des élections,
le véritable producteur des programmes. Le processus
de mise en scène permet d’adapter le produit de
consommation aux réactions du consommateur et l’interview
peut devenir le lieu privilégié d’une mystification,
qui fait passer de la forme pour du contenu – le
médiateur usant de son privilège d’interprète pour
cacher sa mise en forme derrière la prétendue transparence
du support. De fait et contrairement à ce qu’il
donne à voir, l’écran énonciatif – le dispositif
de représentation – implique dans son effort même
de transparence une mise en scène de plus en plus
sophistiquée.
[5] Sous une forme ou sous une autre, cette
question traverse la « narratologie » :
« [...] Il nous semble que le découpage ordinaire
est un compromis entre trois systèmes d’analyse
possible de la réalité :1° une analyse purement
logique et descriptive (l’arme du crime près du
cadavre) ; 2° une analyse psychologique intérieure
au film, c’est-à-dire conforme au point de vue de
l’un des protagonistes dans la situation donnée
(le verre de lait – peut-être empoisonné – que doit
boire Ingrid Bergman dans Notorious ou la
bague au doigt de Thérésa Wright dans l’Ombre
d’un doute) ; 3° enfin, une analyse psychologique
en fonction de l’intérêt du spectateur ; intérêt
spontané ou provoqué par le metteur en scène précisément
grâce à cette analyse : c’est le bouton de
porte tournant à l’insu du criminel qui se croit
seul (« attention ! » crieraient
les enfants à Guignol que le gendarme va surprendre) ».
André Bazin (1981, pp. 145-146)
[6] On note l’apparition, au début des années quatre-vingt-dix, d’une figure
narrative télévisuelle intéressante, qui consiste
à introduire dans le champ du locuteur un moniteur
révélant l’image de l’allocuteur. Le cadre propre
à la fonction impressive du propos est ainsi rendu
manifeste. Le contrechamp est inscrit dans le champ,
ce qui met en évidence la fonction de subordination.
[7] L’univers réel est
continu. Du point de vue du sujet, l’espace réel
est explorable dans sa continuité. Le sujet n’a
pas la possibilité réelle d’explorer l’espace de
façon discontinue ou fragmentaire. La trace de son
parcours dans l’espace, sa trajectoire, est continue.
Parallèlement, et de même, le temps du sujet est
continu, orienté et irréversible. Ajoutons que la
conscience d’un espace et d’un temps réel, qui outrepasse
et englobe celui reconnu par l’expérience réelle
du sujet, procède et présuppose la reconnaissance
de l’autre comme double de soi. Je ne partage l’espace
que si je reconnais l’autre comme mon identique
ou mon double. En reconnaissant l’autre comme mon
double, je prends place dans le monde à travers
son regard. En acceptant que l’autre puisse exister
en dehors de ma présence (hors de mon champ), j’accorde
au monde réel une existence objective indépendante
de moi. Ce n’est que par un détour imaginaire que
je peux accorder au monde une existence réelle.
Il en est de même du temps. L’originalité radicale
de mon rapport au temps ne peut être partagée. Et
si j’accepte de reconnaître l’autre après une absence,
c’est parce que j’admets d’une part qu’il possède
une temporalité propre, indépendante, identique
à la mienne, et que d’autre part nous participons
l’un et l’autre d’une même temporalité qui nous
outrepasse l’un et l’autre. Nous reconnaissons ainsi
trois types de rapports à l’espace et au temps :
·
le rapport individuel
perceptif, subjectif, le champ individuel, la trajectoire
d’exploration du réel, segment spatio-temporel continu,
·
le rapport à l’autre
avec qui je suis en relation, qu’on peut appeler
l’espace-contrechamp, en ce qu’il me met en scène
du point de vue de l’objet ou de la personne que
je regarde. L’autre fait fonction de cadre. Il ouvre
un espace imaginaire où je découvre ma propre image,
· le point
de vue d’un tiers abstrait, extérieur à l’événement,
au hic et nunc du sujet. Le point de vue
du tiers délimite un cadre «narratif» à l’intérieur
duquel Je suis présent avec l’autre. Le tiers-narrateur
n’intervient pas sur la dynamique du discours, même
si par son regard il constitue l’échange en objet,
réalisant ce faisant la clôture narrative de l’événement.
[8] « Le
discours évolue [...] dans deux dimensions différentes :
à côté de ce que dit un énoncé (l’état de choses
qu’il représente), il y a ce qu’il montre du fait
de son énonciation. Dès lors, il peut y avoir, dans
certains cas, une contradiction entre ce
qui est dit et ce qui est montré. Les contradictions
de ce type, appelées contradictions pragmatiques,
doivent être soigneusement distinguées des contradictions
logiques qui sont des contradictions internes à
ce qui est dit » François Récanati (1979, p.
195).
[9] Chacun garde à l’esprit ces saucissonnages d’interviews d’actualités
où quelques plans collés bout à bout restituent
l’essentiel d’un discours. Le procédé est légitime
en ce sens qu’il ne s’intéresse qu’au contenu du
propos, et que, dans le meilleur des cas, il en
respecte les unités prosodiques, voire la logique
de l’enchaînement. Mais les sautes d’images caractéristiques
de ce genre de montage révèlent l’« ellipse »
narrative.
|