Au cœur des données
A l’heure du Big Data et de l’Open Data, les données et les métadonnées liées aux collections de l’Ina deviennent une matière ouvrant vers de nouveaux usages.
Ina STAT : l'usage statistique des données liées à l’information télévisée
Gérer au jour le jour des millions d’heures d’archives et les bases de données qui permettent de les décrire, c’est le métier de l’Ina, dont l’approche des collections évolue avec les technologies informatiques depuis les années 1980.
Aujourd’hui, les bases de données de l’Ina, qui ont plus de 20 ans de profondeur en ce qui concerne le dépôt légal, sont elles-mêmes devenues un objet de recherche autant qu’un outil de recherche. Elles nourrissent les recherches de certains universitaires, qui y trouvent des informations complètes et fiables.
Depuis plus de dix ans, Ina STAT propose des analyses fondées sur un usage statistique des données liées à l’information télévisée. Cet outil de suivi statistique propose un ensemble d’indicateurs quantitatifs qui rendent compte du contenu thématique des journaux télévisés diffusés par les 6 chaînes nationales historiques. Il permet d’établir des comparaisons, de suivre les évolutions dans le temps, de dégager les grandes tendances de la couverture médiatique et au final, de nourrir la réflexion sur le traitement de l’information.
Open Data : les data pour tous
Outre les lettres trimestrielles proposant des analyses thématiques , les données sont disponibles sur le site de l'Ina THEQUE et également sur le site gouvernemental d’accès aux données publiques data.gouv.fr.
C’est bien pour illustrer les usages possibles à partir des données qu’ Ina STAT a été créé en 2006. Depuis, l’Ina a créé de nombreux outils et projets de recherche, comme l’Observatoire transmédia, qui permet de constituer des études en croisant des données issues de différents médias (presse, télévision, radio, twitter, etc.). Ces recherches permettent de produire des études quantitatives dans le cadre de travaux universitaires.
Data mining : l'exploration des données
Enfin, la question de la documentation et de l’indexation de million d’heures d’images et de sons a aussi amené l’Ina à développer des projets de recherche orientés vers la fouille de données, le fameux "Data Mining".
Comment représenter visuellement des masses de données, repérer automatiquement des contenus dans un flux, ou encore identifier des locuteurs connus dans une émission et transcrire leurs paroles ? Ce sont là quelques-unes des recherches menées à l’Ina ces dernières années, dont les résultats sont à voir et à tester sur l’Espace recherche.