Amara : réalisation communautaire de sous-titrages de vidéos

Rédigé par antistress le 09 octobre 2010 (mis à jour le 05 mai 2016) - 11 commentaires


An open system that lets anyone, anywhere create and view video subtitles


Commençons avec un paradoxe : la Toile rend l'information disponible mondialement. Mais, avec l'augmentation des capacités de stockage et de bande passante, l'information est de plus en plus présente sous forme de vidéos, qui ne peuvent être comprises par un grand nombre de personnes : soit qu'elles ne parlent pas la langue utilisée dans la vidéo, soit qu'elles sont atteintes de surdité. Au final des pans entiers de l'information ne peuvent être partagés à travers le monde, bien que le réseau l'autorise.

D'où la question suivante : comment rendre l'information accessible lorsque celle-ci se présente sous la forme d'une vidéo ?

La question se pose également au moment d'indexer automatiquement l'information partagée sur le réseau : les vidéos ne livrent pas aussi facilement leur contenu aux robots d'indexation du Web que les textes (Web sémantique, toussa).

Pour l'instant, l'intervention humaine est encore requise pour une extraction qualitative de l'information contenue dans ces vidéos.

La tâche est laborieuse mais elle permet alors d'attacher à une vidéo un fichier texte portant sa transcription, point de départ d'éventuelles traductions. Et pour peu que la transciption mentionne les informations temporelles nécessaires à la synchronisation du texte et de la vidéo, vous avez un fichier de sous-titres.

Amara (anciennement Universal Subtitles) vous permet justement de créer facilement de tels fichiers (pour ne rien gâcher, l'outil est conçu pour permettre le travail collaboratif), de les associer aux vidéos déjà disponibles en ligne (Amara n'héberge pas de vidéos, seulement les sous-titres), et finalement de proposer le résultat sur votre site :

  • soit en utilisant le lecteur spécifique en JavaScript proposé par Amara (méthode la plus simple),
  • soit en récupérant le fichier de sous-titres – ce que permet le site – et en assemblant le tout vous-même sur votre site au moyen des balises HTML5 video et track. Vous limiterez ainsi le recours à des ressources externes et éviterez l'emploi du Javascript. Mais vous ne profiterez pas des mises à jour collaboratives des sous-titres qui continueront éventuellement d'être enrichis sur le site d'Amara.
Yostral, un des piliers de Framalang, en a fait un journal pour LINUXFR.ORG que je reproduis ici avec son aimable autorisation :

Je viens de tester le site universalsubtitles.org, qui se veut le "Wikipédia des sous-titres".

Le but est simple : faciliter le sous-titrage dans n'importe-quelle langue de n'importe-quelle vidéo se trouvant sur le web.

Voyant les problèmes que nous avons à Framalang pour être efficace en sous-titrage vidéo, chacun faisant une étape dans son coin, sauf la traduction qui se fait via wiki, pas adapté à ça, j'ai donc fait un petit test sur une simple vidéo, en français, pour voir les possibilité de travail collaboratif, de traduction et bien sûr, de sous-titrage lui-même.

La première étape consiste bien sûr à "importer" une vidéo. En fait on travaille directement sur une vidéo déjà en ligne. Donc pas d'upload sur le site, pas de transcodage, rien. Il suffit simplement de donner l'adresse de la vidéo souhaitée. Pour le moment, les format supportés sont Ogg, WebM, FLV, Youtube et Blip.TV (Dailymotion et Vimeo sont en cours).

Cette vidéo apparaît ensuite dans leur "Widget" de traduction. Une page je suppose remplie de HTML5 et javascript, qui offre une interface relativement conviviale, claire et avec des raccourcis clavier. C'est succinct, mais suffisant pour faire ce qu'on lui demande. C'est donc ici que se déroule la première des trois étapes qui mènent au sous-titrage original de la vidéo : taper les sous-titres correspondant à la vidéo. Pour ceux qui ont 42 doigts, pas de soucis, vous laissez filer la vidéo et vous entrez le texte en temps réel... pour les autres, on peut toujours faire des pauses et naviguer avant/arrière tout simplement.

La seconde étape est la synchronisation du texte que vous avez tapé précédemment. Là, la vidéo défile et on doit appuyer sur une touche à chaque fois que l'on veut que le sous-titrage passe à la ligne suivante. Ici, faut être concentré ! Ok, on peut mettre en pause, revenir en arrière, mais le mieux est de faire défiler et synchroniser au fur et à mesure. Faisable, mais pas évident à tenir sur la distance.

La troisième étape est le peaufinage on va dire, où on peut ajuster les sous-titres plus précisément. Si on s'est un peu endormi à l'étape précédente, c'est ici qu'on se réveille.

Au final on nous donne un lien permanent vers la vidéo et ses sous-titres, ainsi qu'un bout de code pour l'intégration dans une page web. La vidéo est toujours la même au même endroit et seuls les sous-titres, qu'on peut se télécharger en .srt, sont sur le site d'universalsubtitles.org.

À partir de cette page, on peut rajouter des sous-titres, donc dans d'autres langues. Ça veut dire qu'une fois la transcription faite et synchronisée, en anglais ou autre, la traduction en français est vraiment simplifiée : on a juste à la rentrer dans les cases en dessous chaque ligne de sous-titres de la langue originale. On peut bien sûr la stopper puis la reprendre plus tard. On voit également sur cette page les langues disponible liées à la vidéo et l'avancement des traductions.

Bref, c'est vraiment du sous-titrage collaboratif. Les outils sont minimalistes mais font ce qu'on leur demande. On peut tout ré-éditer, sauvegarder. Et on peut même uploader un fichier .srt, pour ceux qui ont plus souvent l'occasion de traduire hors ligne plutôt que connectés à internet.

Comme je l'ai déjà dit, les outils sont, pour le moment en tout cas, assez minimalistes. Par exemple on ne peut pas régler les sous-titres : la police, la couleur, l'emplacement... limitation du HTML5 ou pas encore implanté dans ce programme ? On verra. Mais ça risque de poser parfois des gros problèmes de visibilité de sous-titres. Il m'est arrivé à plusieurs reprises, sur les vidéos qu'on a placées sur Framatube, de devoir rajouter une bande noire en-bas, ou les placer en haut, pour pouvoir lire convenablement les sous-titres.

un autre bémol, c'est qu'il faut s'enregistrer : il faut soit un compte Twitter, un compte OpenID ou un compte Google... En fait ça ne crée pas de compte à proprement parler, mais se sert de l'existant, ce qui est vraiment un moindre mal.

En tout cas c'est un bel outil qui va nous rendre bien des services pour nos sous-titrages.

Universal Subtitles : http://universalsubtitles.org/

Test fait avec une vidéo de Fred Couchet, de l'April, vidéo hébergée sur Blip.tv : http://universalsubtitles.org/videos/sMfosMDpVH7f

Voici un exemple, réalisé à partir du petit bout de code JavaScript (qui s'appuie sur la balise video de HTML5), proposé automatiquement par Amara :

Amara est un projet de la Participatory Culture Foundation, fondation à but non lucratif. Celle-ci a reçu à ses débuts une subvention de la Mozilla Foundation, autre fondation à but non lucratif à qui l’on doit le fameux navigateur web Firefox. Le projet Amara a ensuite reçu le parrainage du projet Mozilla Drumbeat visant à promouvoir des initiatives comme celle-ci, susceptibles d'aider à garder le Web Ouvert.

11 commentaires

#1  - dhoko a dit :

Excellente initiative, il en faut des sous titres. Nombreuses sont les vidéos sur le web qui ne sont pas.

Je pense aux nombreux tuto vidéo anglophone en particulier qui mériteraient ça :) Reste le problème de la balise video...

Répondre
#2  - antistress a dit :

@ dhoko : à quel genre de problème fais tu référence ?

Répondre
#3  - dhoko a dit :

Au fait qu'elle ne soit pas vraiment standardisé, ce qui n'est pas en soit un vrai problème mais, bon.

Le vrai problème en fait c'est que sur un serveur la balise vidéo ça bouffe en ressource quelque chose de bien.

Faudrait que Youtube et autres permettent de faire des lecteurs vidéos à partir du leurs pour y mettre ces sous-titres. Ainsi le problème des ressources seraient contourné :)

Répondre
#4  - antistress a dit :

@ dhoko : C'est exactement ce que fait Universal Subtitles : aider à concevoir des sous-titres qu'ils stockent pour te proposer un bout de code JavaScript assemblant le sous-titre crée et la vidéo hébergée sur YouTube (par exemple)...relis l'article !

Répondre
#5  - dhoko a dit :

Pas taper pas taper^^ Tu m'en veux pas, au bout de 3 jours j'ai zappé ce détails. Je lis trop de trucs :)

Répondre
#6  - antistress a dit :

concentre toi sur les bonnes adresses ;-)

Répondre
#7  - dhoko a dit :

C'est déjà fait ^^ Je lis que ce que je sélectionne :) (et chaque jour de nouvelles découvertes ^^ Merci Twitter

Répondre
#8  - Popolon a dit :

C'est dommage, la vidéo n'a plus l'air de marcher, et il y a écrit 'no subtitles available' (même pas en français, alors que c'est bien la première langue dans mon navigateur.

La vidéo a-t-elle été effacée ? On voit les sous-titres en français à droite et dans la liste en bas, l'anglais à 100 %

Éventuellement m'envoyer un mail, ça m’intéresse de travailler sur ce genre de choses, mais il faut que soit pérenne...

Répondre
#9  - antistress a dit :

@ Popolon : c'est la force et la faiblesse du projet : Universal Subtitles ne stocke pas les vidéos. On lui indique le lien d'une vidéo sur le Web, il aide à créer et héberge les sous-titres, et propose un player dédié.
Le projet est donc tout à fait pérenne quant aux sous-titres hébergés. Après si la vidéo est déplacée, il suffit d'indiquer le nouveau lien et tout rentre dans l'ordre.
Au cas d'espèce, je viens d'interroger Framasoft car la vidéo était hébergée sur leur compte blip.tv (Framatube : http://blip.tv/framatube cf http://www.framablog.org/index.php/post/2009/02/22/videos-logiciels-libres-framatube )

Répondre
#10  - Popolon a dit :

Merci de m'avoir répondu, en fait, entre temps, j'étais allé voir un peu plus loin, j'ai commencé a tester sur la traduction d'une vidéo en Chinois vers le français, mais je me suis aperçu au moment de charger que les sous titres étaient pas synchronisés en chinois.

De la j'ai testé l'interface pour synchroniser, c'est très bien fait, mais tout en flash, donc ca rame sur mon vieux PC (1.6Ghz) pour être utilisable et ça ne marche pas sous gnash. Du html5 aurait été utilisable, j'ai par contre trouvé subtitleeditor (gtk/gnome) et subtitlecomposer (QT/kde) qui sont pas trop mal, même si il manque les petites capsules de temps comme dans leur interface pour être plus rapide (on peut peut-être utiliser un logiciel du type PiTiVi, kdenlive, open movie editor, openshot video editor ou un autre pour ça ??? je vais fouiller un peu plus).

Et sinon, pour la traduction d'universalsubtitles, non finie, ils utilisent https://www.transifex.net (qui utilise lui même un logiciel libre installable chez soi) pour la traduction collaborative de logiciels, c'est pas mal aussi.

Merci pour les infos donc, et pour les quelques articles que j'ai lu sur ce blog qui sont assez pertinents.

Répondre
#11  - antistress a dit :

@ Popolon : tu dois te tromper, il n'y a pas de Flash, que des technos ouvertes !

Et merci pour tes encouragements :-)

Répondre

Fil RSS des commentaires de cet article

Écrire un commentaire

NB : en publiant votre commentaire, vous acceptez qu'il soit placé sous la licence CC BY-SA comme indiqué aux conditions d'utilisation du site

Quelle est la première lettre du mot lxzjh ?