Erhaltung der sprachlichen und kulturellen Vielfalt in Europa und Förderung der technologischen Exzellenz und Führungsrolle
Ein Europäisches Konsortium für digitale Infrastruktur (European Digital Infrastructure Consortium, EDIC) ist ein neuer Mechanismus für länderübergreifende Projekte, der im Rahmen des Digital Decade Policy Programme 2030 geschaffen wurde. EDICs ermöglichen es den Mitgliedstaaten, Finanzmittel und andere Ressourcen auf flexible und effiziente Weise zu bündeln, um in transformative digitale Projekte zu investieren. EDICs können auch gemeinsame Standards und Interoperabilität sicherstellen.
Weitere Informationen darüber, was ein EDIC ist und was seine Hauptmerkmale sind, finden Sie in unserem News-Bereich.
Die Allianz für Sprachtechnologien
Die ALT-EDIC, die Allianz für Sprachtechnologien, wurde im Dezember 2023 als eine der ersten EDICs vorgeschlagen. Am 7. Februar 2024 gründete die Europäische Kommission mit dem Durchführungsbeschluss (EU) 2024/458 die ALT-EDIC offiziell.
Die ALT-EDIC wird von Frankreich koordiniert und umfasst
- Zwölf Mitgliedsstaaten: Bulgarien, Kroatien, Frankreich, Griechenland, Irland, Italien, Lettland, Litauen, Niederlande, Polen, Slowenien und Spanien;
- Sieben beobachtende Mitgliedstaaten: Österreich, Belgien, Dänemark, Estland, Malta, Rumänien und die Slowakei.
Die Aufgabe der ALT-EDIC besteht darin, eine gemeinsame europäische Infrastruktur für Sprachtechnologien zu entwickeln, wobei der Schwerpunkt auf Large Language Models liegt. Ziel ist es, die europäische Wettbewerbsfähigkeit zu verbessern, die Verfügbarkeit von europäischen Sprachdaten zu erhöhen und die sprachliche Vielfalt und den kulturellen Reichtum Europas zu erhalten.
Der Aktionsplan der ALT-EDIC konzentriert sich auf fünf Themenbereiche:
Entwicklung einer zentralen Plattform für europäische Sprachressourcen und Sammlung hochwertiger Datensätze auf der Grundlage des Language Data Space. Die Schaffung strategischer Daten für ressourcenarme Sprachen wird ein besonderer Schwerpunkt sein.
Sammlung von Open-Source-Modellen, Feinabstimmung, Reduzierung und Optimierung dieser Modelle für die Verwendung in europäischen KMU sowie Bereitstellung von Methoden für ihre Bewertung, Zertifizierung und Normalisierung.
Einführung neuer Open-Source-Modelle (einschließlich Modellen mit multimodalen Fähigkeiten), effiziente Koordinierung des Zugangs zu EuroHPC-Computern für Unternehmen und Industriezweige in der EU und Unterstützung öffentlicher und privater Experten bei der Entwicklung neuer Modelle.
Bereitstellung von Methoden, um potenzielle Diskriminierung und Verzerrungen durch die Verarbeitung natürlicher Sprache zu beseitigen.
Entwicklung eines Start-Up Inkubators für Unternehmen, die am EDIC teilnehmen, Förderung von Verbindungen zwischen Industrie und Forschung, Erfüllung einer Schlüsselrolle im European Coordinated Plan on Artificial Intelligence, Vernetzung und Stärkung der LT-Gemeinschaft, gezielte Unterstützung von Institutionen bei Investitionen in LT und Entwicklung von Kulturprogrammen im Bereich von künstlicher Intelligenz für Sprache.
Welche Verbindung besteht zwischen dem ALT-EDIC und dem LDS?
Die ALT-EDIC ist ein Mehrländerprojekt, das von den Mitgliedstaaten, die sich zur Teilnahme bereit erklärt haben, betrieben und finanziert wird. Durch die Bündelung der Ressourcen können die Mitglieder die kritische Masse an Daten und anderen Ressourcen erreichen, die für die Erstellung und Feinabstimmung von LLMs erforderlich sind, was für ein einzelnes Mitglied nur schwer möglich wäre.
Der LDS ist einer von mehreren Datenräumen, die von der Kommission unterstützt werden, um ein Datenökosystem über viele Sektoren hinweg zu fördern. Der LDS wird eine Governance-Struktur für den Austausch von Daten aus verschiedenen Sektoren schaffen, die für die Entwicklung von Sprachtechnologie-Tools genutzt werden können. Diese Daten werden auch für die ALT-EDIC zur Verfügung stehen. Der LDS wird durch einen Vertrag im Rahmen des Digital Programmes finanziert.