Ein europäischer Datenmarkt
Wie 2020 in der Europäischen Datenstrategie festgestellt, sind Daten der Treibstoff des 21. Jahrhunderts.
Aus diesem Grund unterstützt die Europäische Kommission die Einrichtung von Common European Data Spaces in strategischen Wirtschaftssektoren und Bereichen von öffentlichem Interesse. werden relevante Dateninfrastrukturen und Governance-Rahmen zusammenbringen, um die Sammlung und gemeinsame Nutzung von Daten zu erleichtern. Dadurch können Daten aus der gesamten EU auf vertrauenswürdige und sichere Weise zur Verfügung gestellt und ausgetauscht werden, wobei Unternehmen und Einzelpersonen die Kontrolle über die von ihnen erzeugten Daten behalten.[1]
Der Language Data Space
Einer der derzeit entstehenden Data Spaces ist der Language Data Space (LDS). Dadurch werden relevante Interessengruppen, z. B. aus der Verlags-, Sprachtechnologie- oder Presseindustrie in der Lage sein, ihre Sprachdaten und andere Sprachressourcen (z. B. Sprachmodelle) über eine einzige Plattform auszutauschen und zu vermarkten, wobei die Werte der EU und die Einhaltung der EU-Vorschriften voll berücksichtigt werden. Dadurch wird der LDS die dringend benötigte Verfügbarkeit von sauberen, qualitativ hochwertigen und EU-konformen Sprachdaten zur Entwicklung modernster Sprachtechnologien (LT) für eine Reihe von Unternehmen signifikant erhöhen.
Die Einrichtung der LDS-Plattform soll einen Wendepunkt in der Herangehensweise an die Sammlung von Sprachressourcen einläuten, da dies der europäischen Industrie helfen wird, weltweit mit den von amerikanischen oder chinesichen Unternehmen angebotenen Sprachtechnologie-Diensten zu konkurrieren und Vertrauen in den gesamten Prozess der gemeinsamen Nutzung von Sprachdaten aufzubauen.
Fakten
- Projektstart
Am 19. Januar 2023 trat der Dienstleistungsvertrag zwischen der Europäischen Kommission und einem Konsortium von vier Partnern über die Erstellung und Umsetzung eines Common European Language Data Space – kurz LDS – in Kraft.
- Projektdauer
Der Dienstleistungsvertrag für die Entwicklung des LDS hat eine feste Laufzeit von 36 Monaten, kann aber um weitere 12 Monate verlängert werden.
- Geplante Tasks
Die Projekt-Tasks sind um fünf Hauptbereiche strukturiert: Projektkoordination; Governance, d. h. die Regelung für den Zugriff auf und den Austausch von LDS-Daten; Infrastruktur, d. h. die technische Architektur des LDS; Promotion-Kampagnen; Datenschutz und Einhaltung des Urheberrechts.
- Gestaltungsgrundsätze
Der LDS ist auf die Umsetzung des Datenschutz-Grundsatzes ausgelegt, d. h. die Dateninhaber werden stets die Kontrolle über ihre Daten behalten. Gleichzeitig wird es eine mit den EU-Vorschriften und -Werten konforme Infrastruktur bieten, in der Daten durch sicheren, vertrauenswürdigen Austausch und Monetarisierung weiter valorisiert werden können.
- Potentielle Teilnehmer
Alle Organisationen, die sich mit Sprachdaten befassen, d. h. große bis kleinere private oder öffentliche Einrichtungen aus Industrie – in verschiedenen Bereichen, von Werbung bis Medien, vom Verlagswesen bis zur Sprachtechnologie – Forschung und öffentlicher Verwaltung sowie Kulturverbände, Bibliotheken, Archiven, Nichtregierungsorganisationen und Bürger, sind zur Teilnahme am LDS eingeladen.
- Strategie
Der Common European Language Data Space wird im Einklang mit der Europäischen Datenstrategie und dem Arbeitsprogramm “DIGITAL” entwickelt, d. h. er wird sich sich auf die Einrichtung von EU-konformen Infrastrukturen und Diensten konzentrieren, welche die technologische Autonomie, die wirtschaftliche Wettbewerbsfähigkeit und das Innovationspotenzial der europäischen Industrie stärken werden.