tovotu

10. April 2014
Kostenlose Wörterbücher für die Offlinenutzung

Update vom 19.02.2015: Einige der hier gelisteten Wörterbücher können neuerdings direkt im StarDict-Format bezogen werden. Ein (Kommandozeilen-)Tool, mit dem die Wörterbuchdaten selbst gesammelt und erstellt werden können, habe ich inzwischen veröffentlicht: dictmaster.py (siehe auch die Anmerkungen am Ende dieses Artikels).

Nachdem ich im September 2012 drei gemeinfreie Wörterbücher für die Sprachen Altgriechisch und Latein vorgestellt habe,[1] soll es heute um eine größer angelegte Übersicht über kostenfrei verfügbare Wörterbücher für die Offlinenutzung gehen.

Eine solche Übersicht ist eine kompliziertere Angelegenheit, als es zunächst scheint. Hu Zheng, der Hauptentwickler von StarDict, führt auf seiner Homepage eine Liste frei zugänglicher StarDict-Wörterbücher. Diese Sammlung ist aber mit Vorsicht zu genießen: Gerade bei den hochwertigsten Wörterbüchern handelt es sich nämlich um urheberrechtlich geschützte Werke so großer Verlage wie Larousse, DUDEN, Langenscheidt, PONS oder Oxford University Press. Dabei wird die Veröffentlichung oft ohne Angabe von Quellen mit "Free to use" oder "GPL" legitimiert. Es gibt einigen Grund zu der Annahme, dass diese Lizenzangaben in den meisten Fällen falsch sind. Darüber hinaus befinden sich gerade die Wörterbücher, die wahrscheinlich wirklich auf legaler Grundlage angeboten werden, in schlechtem Zustand. Die Inhalte sind veraltet und oft chaotisch formatiert. Hu Zhengs Sammlung hat (trotz ihrer lizenzrechtlichen Fragwürdigkeiten!) in großen Teilen sogar Einzug in die Arch User Repositories gefunden.[2] Ich halte es daher für nötig, endlich in diesem Durcheinander aufzuräumen und die wirklich legal und kostenfrei verfügbaren Quellen herauszufiltern und in ihrer aktuellsten Version zugänglich zu machen.

dict.cc mehrsprachige Wörterbuchdatenbank
FreeDict.org
Wiktionary.org
BEOLINGUS Projekt der TU Chemnitz
WordNet Projekt der Princeton University
GNU Collaborative International Dictionary of English
Gutenberg Webster's Unabridged Dictionary
XMLitrré bzw. littre.org
Folkets Lexikon (Schwedisch-Englisch)
Anglicko-Český slovník (Tschechisch-Englisch)
CIA World Factbook
Dicionário Aberto (Portugiesisch einsprachig)
Sanskrit-Englisch Wortliste
CC-CEDICT (Chinesisch-Englisch)
HanDeDict (Chinesisch-Deutsch)
XDICT: Ein in China wohl sehr weit verbreitetes Chinesisch-Englisch-Wörterbuch. Als Autor wird Fu Jianjun angegeben, eine offizielle Quelle scheint es aber nicht zu geben. In den Paketquellen mehrerer Distributionen (Ubuntu, Debian, Mageia, Gentoo) schwirren Versionen dieses Wörterbuchs in unterschiedlichen Formaten herum. Unter welcher Lizenz die Nutzung und Distribution dieses Wörterbuch möglich ist, ist unklar.
Müller's English-Russian Dictionary

Alle aufgeführten Wörterbücher lassen sich theoretisch (gegebenenfalls mit geeigneter Download- und Konvertierungssoftware) herunterladen und in einem Format speichern, das die anschließende Konvertierung in beliebige Wörterbuchformate (StarDict, QuickDic, DICTD usw.) ermöglicht. Für die Konvertierung existieren Tools wie Penelope oder PyGlossary, die es mehr oder weniger einfach machen, die Wörterbücher anschließend auf Ebook-Readern, Smartphones und Desktop-PCs mit Tools wie GoldenDict, StarDict, DICTD, FireDict oder ColorDict zu verwenden.

Aufgrund der teilweise komplizierten lizenzrechtlichen Bestimmungen darf ich zu den meisten der aufgeführten Wörterbücher keinen direkten Download der Datensätze (etwa in einem weiterverwendbaren Format wie StarDict) bereitstellen. Es dürfte allerdings rechtlich unbedenklich sein, entsprechende Download- und Konvertierungssoftware zur Verfügung zu stellen, die eine Nutzbarmachung der Daten für private Zwecke ermöglicht. Für einen Großteil der Wörterbücher habe ich mir so eine Software geschrieben, die seit Februar 2015 auf GitHub und seit August 2018 auf FramaGit bezogen werden kann. Der Quellcode ist offen und jede Art von Mitarbeit ist willkommen. Näheres zur Verwendung und Funktionsweise erläutere ich in einem Artikel auf tovotu dev.

  1. tovotu.de/blog/520-...fr-die-Offlinenutzung
  2. Stand vom 09.04.2014: aur.archlinux.org/packages/?K=stardict

Kommentare

Neue Kommentare zu diesem Artikel bitte per Mail an kommentare-536(at)tovotu.de!