[FR] Auto indexation sémantique des contenus vidéo

Les systèmes de transcription automatique trés performants arrivent sur le marché. Ils devraient bientôt nous aider à dépasser la nature continue des éléments binaires comme le son et la vidéo. Une fois transcrits , segmentés et indexés, les sons et les vidéos sont en somme "discrétisés".

Cette discrétisation offre des possibilités interressantes, comme :

  • La traduction automatique Dès lors qu'une transcription (qui plus est automatique et en temps-réel) est associée à un flux video, le champ des possibilités s'ouvre de façon surprenante. Une des premières applications est le sous-titrage et la traduction. Imaginez par exemple qu'un outil de traduction traite le flux de transcription automatique? Même imparfait il pourrait être d'une aide non négligeable à la compréhension...
  • L'extraction de mots clés et le chapitrage automatique Le découpage en séquences et l'association automatique de mots clés permettent d'enrichir les videos en données sémantiques et facilite ainsi la navigation à l'intérieur des contenus. Viddler propose depuis plusieurs années une solution de chapitrage et de taggage des videos en mode participatif. Cependant ce système reste peu utilisé par les internautes. L'automatisation de cette tâche grâce aux données de transcription devrait en revanche être bien plus efficace.
  • La recherche "pleine video" La transcription offre la possibilité d'indexation plein texte de la vidéo, aussi paradoxale que cela paraisse... et par conséquence autorise la recherche à l'intérieur même des contenus vidéos. Imaginez une télé dont le flux serait indexé en temps réel...

Exalead a mis en oeuvre une démonstration qui illustre les capacités de transcription et d'indexation sémantique des vidéos sur les contenus de France 24.

Cette technologie est en ce moment utilisée pour réaliser un lecteur haut débit interactif sur le Lab de France 24.