Sous-titrage en direct

Un article de Wikipédia, l'encyclopédie libre.

Le sous-titrage en direct est une technique télévisuelle consistant à afficher des textes au bas de l'écran, lors de la diffusion d'un programme diffusé en direct.

Les autorités réglementaires de plusieurs pays obligent les télédiffuseurs à sous-titrer leurs émissions. C'est notamment le cas aux États-Unis, au Royaume-Uni et au Canada, où la plupart des programmes, y compris les journaux télévisés, les émissions d'affaires publiques et les rencontres sportives télédiffusés sont sous-titrés. En France, la Loi sur l’accessibilité datée du 11 février 2005 obligera les chaînes audiovisuelles dont l’audience moyenne annuelle dépasse 2,5% de l’audience totale des services de télévision à sous-titrer l’ensemble de leurs programmes d’ici 2010.

Diverses techniques sont à disposition des chaînes de télévision pour sous-titrer leurs programmes : la vélotypie, la dactylographie, la sténotypie assistée par ordinateur et la reconnaissance vocale.

Sommaire

[modifier] Techniques de sous-titrage en direct

[modifier] La vélotypie

La vélotypie utilise les principes de l’écriture syllabique. Deux opérateurs travaillent en simultané. Le premier opérateur écoute l’émission et synthétise le texte. Le second opérateur saisit le texte en frappant simultanément plusieurs touches d’un clavier vélotype afin de produire une syllabe. Afin de vérifier le texte ainsi produit, la ligne saisie n’est envoyée qu’après la saisie de deux autres lignes. Efficace, cette méthode demande un apprentissage poussé avant d’être bien maîtrisée et induit un léger décalage du sous-titrage en raison de l’envoi de la ligne de sous-titres à l’écran une fois les deux lignes précédentes validées. La vitesse de cette technique reste cependant limitée à 150 mots/minute.

[modifier] La dactylographie

L’opérateur écoute l’émission et tape sur son clavier les propos dictés. Cette méthode demande une organisation et des moyens importants dans le cadre d’une opération de sous-titrage en direct et n’est peut-être pas tout à fait adaptée à ce type d’usage.

[modifier] La sténotypie assistée par ordinateur

La sténotypie assistée par ordinateur utilise les principes de l’écriture phonétique. Il s’agit en fait de transcrire des sons en temps réel par le biais de codes phonétiques qui sont automatiquement traduits par l’ordinateur en texte à l’écran en direct à plus de 210 mots/minute.

Depuis la modélisation informatique de la langue française développée par IBM France dans les années quatre-vingts, il existe un logiciel TASF+, repris depuis par la Sténotype Grandjean (www.stenotype-grandjean.com), qui permet aux personnes malentendantes de disposer en temps réel et sous forme de texte du propos prononcé, soit sur un écran, soit incrusté dans une image (sous-titrage des émissions de Radio Télévision Canada).

[modifier] La reconnaissance vocale

Le principe d'opération de base est la reconnaissance vocale directe d'une source audio en direct. Afin de corriger une éventuelle faible performance de la reconnaissance vocale due, par exemple, à une mauvaise qualité de la source audio, un bruit de fond important, un environnement sonore bruyant, des interlocuteurs avec un fort accent, etc., et principalement afin de permettre une transcription rapide et efficace avec l'ajout de ponctuation et de formatage, les opérateurs répètent dans un micro ce qui est dit, en dictant la ponctuation. Le logiciel retranscrit le mot en fonction du son et des probabilités. Une deuxième personne apporte les corrections éventuelles au texte, qui est ensuite envoyé.

Le correcteur/validateur est optionnel pour des langues comme l’anglais. En revanche, la complexité de la langue française impose le travail d’un correcteur pour obtenir un sous-titrage complet, détaillé et de qualité.

Avec un décalage de 4 secondes, cette technique permet d’obtenir un sous-titrage complet, de qualité en un temps record. Cette technique séduit les chaînes françaises de par le résultat obtenu et le coût moindre engendré.

À ce jour, il existe deux logiciels en langue française : « PROTITLE Live » de NINSIGHT intégrant la technologie de reconnaissance vocale SPEECH Root™ des laboratoires IBM et les solutions de la société SYSMEDIA.

[modifier] Voir aussi

[modifier] Articles connexes

[modifier] Liens externes