Aller au contenu principal
European Language Data Space

A propos

teamwork
© Freepik
European Language Data Space

Un marché européen des données

Comme le définit la stratégie européenne pour les données en 2020, les données sont le carburant du 21e siècle.

C'est la raison par laquelle la Commission européenne soutient le développement de Common European Data Spaces (espaces européens communs de données). Ces espaces rassembleront les infrastructures de données et les cadres de gouvernance pertinents afin de faciliter les échanges et le partage de données. Les données provenant de l'ensemble de l'UE seront ainsi mises à disposition et échangées de manière fiable et sécurisée, en garantissant aux entreprises et aux particuliers le contrôle des données qu'ils génèrent.[1]

Language Data Space

© European Commission

Un des Data Spaces actuellement en développement est Language Data Space (LDS). À travers lui, les acteurs concernés, notamment ceux de l'industrie de l'édition, des technologies de la langue ou de la presse, pourront partager et monétiser leurs données et ressources linguistiques (dont les modèles linguistiques) par le biais d'une plateforme unique, dans le respect des valeurs et des règles de l'UE.  Ainsi, avec LDS, c’est la quantité, la disponibilité et la qualité des données qui vont augmenter, favorisant la création et le déploiement de grands modèles linguistiques (LLM) ainsi que de d'autres services linguistique basés sur l'IA, à destination d'un large éventail d'entreprises.

La création de la plateforme LDS souhaite marquer un tournant dans l'approche de la collecte des ressources linguistiques : LDS contribuera à rendre l'industrie européenne plus compétitive au niveau mondial en comparaison avec les entreprises américaines ou chinoises du secteur, et à instaurer un climat de confiance tout au long du processus de partage des données linguistiques.

Fiche d'information

start
Début du projet

Le 19 janvier 2023, est entré en vigueur le contrat de service établi entre la Commission européenne et un consortium de quatre partenaires. Il a pour objet la création et la mise en œuvre de LDS.

duration
Durée du projet

Le contrat de service pour la réalisation de LDS est établi pour une durée initiale de 36 mois, avec une possibilité de reconduction de 12 mois.

tasks
Tâches prévues

Les tâches du projet sont structurées en cinq branches principales : coordination soutien ; gouvernance, ou l'ensemble des règles pour l'accès et le partage des données de LDS ; infrastructure, ou l'architecture technique de LDS ; promotion de LDS ; mise en conformité avec le  RGPD et avec le droit de la propriété intellectuelle.

design
Principes de conception

LDS est conçu pour concrétiser le principe de souveraineté des données, afin que les détenteurs de données conservent toujours le contrôle de leurs données. Parallèlement, il offrira une infrastructure conforme aux règles et valeurs de l'UE, qui permettra de valoriser ultérieurement les données grâce à des échanges et à une monétisation sécurisés et fiables.

globe
Acteurs potentiels

Toutes les organisations qui traitent des données linguistiques, grandes ou petites, privées ou publiques, appartenant à différents secteurs de l'industrie de la publicité aux médias, de l'édition aux technologies de la langue, ainsi qu'à la recherche, à l'administration publique, aux associations culturelles, bibliothèques, archives, ONG et citoyens sont invitées à participer au LDS.

strategy
Stratégie

LDS sera développé conformément aux préconisations de la Stratégie européenne pour les données et du programme de travail DIGITAL Europe. En d’autres termes, le déploiement d'infrastructures et de services conformes aux normes de l'UE visant à renforcer la souveraineté technologique, la compétitivité économique et le potentiel d'innovation de l'industrie européenne sera au centre du travail effectué.