tovotu

26. März 2015, 22:44 Uhr
Buchkanten-Scanner für die private Buchdigitalisierung

Als Student hat man nicht viel Platz. Den braucht aber, wer sich gewissenhaft durch den täglich wachsenden Berg an empfohlener Fachliteratur wühlen will. Als Besitzer eines (großen) Ebook-Readers[1] bin ich oft mit digitalen Versionen der benötigten Bücher zufrieden. Und tatsächlich erhält man über die Universitätsbibliotheken seit ein paar Jahren großzügigen Zugang zum digitalen Angebot vieler Verlage. Einige Bücher existieren aber weiterhin nur in gedruckter Form und dann kommt man schon mal auf die Idee, diese einfach zu digitalisieren (und die Originalbücher anschließend irgendwo im Keller oder bei den Eltern zu stationieren).

Buchdigitalisierung könnte so einfach sein...

Ein Buch zu digitalisieren kann so einfach sein: Der ScanRobot 2.0 MDS des österreichischen Unternehmens Treventus scannt vollautomatisch 2500 Buchseiten pro Stunde und muss das Buch dafür nur in einem lächerlichen Winkel von 60 Grad öffnen. Die Tatsache, dass der Preis für dieses Wundergerät ein Geheimnis zu sein scheint, macht aber wenig Hoffnung, dass dieses Schätzchen für einen Privatnutzer erschwinglich wäre. Tatsächlich besitzt die Universitätsbibliothek zu Köln einen vergleichbaren Scanroboter.[2] Ein Scan-Roboter digitalisiert vollautomatisch bis zu 2500 Buchseiten pro Stunde.Der scheint aber mit universitätsinternen Angelegenheiten so beschäftigt, dass er für Außenstehende unter allen realistischen Umständen unzugänglich bleibt.

Die Universitätsbibliotheken halten oft dennoch ein attraktives Alternativangebot für ihre Nutzer bereit. In der Bonner Universitätsbibliothek steht Nutzern zum Beispiel der Buchscanner Zeutschel Zeta zur freien Verfügung. Wer es wagt, davon Gebrauch zu machen, muss aber die heilige Bibliotheksstille empfindlich stören. Und es dürfen damit, streng genommen (gemäß Nutzungsbedingungen), keine kompletten Bücher eingescannt werden.

... und dann hat man doch wieder die Qual der Wahl

Als die Zeitschrift c't (heise) im Mai 2012 dem Thema Buchdigitalisierung einen Artikel widmete, geriet sie über den Zeutschel Zeta regelrecht ins Schwärmen. Ein aufgeschlagen daliegendes Buch kontaktlos von oben abzulichten hat aber einige prinzipielle Nachteile, die die c't-Redaktion damals verschwieg: Taschenbücher klappen einfach wieder zu und können oft selbst mit beiden Händen nur extrem mühsam in Position gehalten werden. Und selbst bei gebundenen Büchern wölben sich die Buchseiten ungünstig und sorgen für ein verzerrtes Schriftbild. Zeutschel behauptet zwar, dieses Problem im Griff zu haben, aber mit einem Klick auf die Buchseite rechts beweise ich das Gegenteil: Diese Buchseite wurde mit dem Zeutschel Zeta gescannt (und das ist für mich kein akzeptables Ergebnis).[3]

Verführerisch wirkt die Möglichkeit, sein Buch aufgeschlagen auf einen herkömmlichen Flachbettscanner zu pressen. Je nach Buch wird eine unverzerrte Erfassung der Bereiche nahe der Buchmitte allerdings nicht ganz zerstörungsfrei möglich sein. Wer so ungeniert mit seinen Büchern umzugehen bereit ist, kann im Prinzip direkt den Buchrücken entfernen und die losen Seiten durch einen Einzug jagen. Das bringt allerdings wiederum seine eigenen technischen Schwierigkeiten mit sich[4] und ich persönlich bringe das Zerschneiden bei den meisten Büchern sowieso nicht übers Herz.

Die digitalkamerabasierten Lösungen, die in der Community von diybookscanner.org diskutiert werden, sind entweder mit hohem zeitlichen oder finanziellen Aufwand verbunden oder kranken an den gleichen Stellen wie der Zeutschel Zeta.

Flachbettscanner mit Buchkante

Über den oben zitierten c't-Artikel lernte ich eine weitere Methode der Buchdigitalisierung kennen: Flachbettscanner mit Buchkante. Das sind Flachbettscanner, deren Glasoberflächen an einer Gerätekante bündig abschließen. Ein zu scannendes Buch wird aufgeschlagen mit der Buchmitte auf dieser Kante platziert. Dazu muss das Buch nur um etwas mehr als 90 Grad aufgeschlagen werden und die auf der Glasoberfläche aufliegende Buchseite kann bis auf wenige Millimeter von der Buchmitte völlig verzerrungsfrei erfasst werden.

Freilich hat auch diese Methode ihre Nachteile:

  • Es können nicht zwei Seiten auf einmal gescannt werden.
  • Wenn wirklich mal eine Grafik oder Abbildung über beide Seiten gehen sollte, verliert man die wenigen Millimeter nahe der Buchmitte. Da hilft nur ein doppelseitiger Scan (mit der entsprechenden Verzerrung nahe der Buchmitte). Wie der Treventus ScanRobot in diesem Fall abschneidet, würde mich brennend interessieren.
  • Eine gewisse Beanspruchung erfährt das Buch natürlich auch bei dieser Methode - die Seiten sind schließlich nicht im 90-Grad-Winkel angeleimt, sondern parallel. Einen Winkel mit Gewalt in die Buchmitte zu pressen, wird einem also jedes Buch übelnehmen, auch wenn der Winkel eher klein ist.
  • Während man nach Flachbettscannern für 80 Euro nicht lange suchen muss, ist kein Buchkantenscanner für unter 200 Euro zu bekommen. Man sollte eher 300 oder 400 Euro einplanen.

Trotzdem halte ich die Buchkanten-Methode für die vielversprechendste im Privatbereich. Darum habe ich mir das Modell FB2280E von Avision in den letzten Tagen mal genauer angesehen. Die anderen auf dem Markt befindlichen Geräte (ebenfalls in dem oben zitierten c't-Artikel erwähnt) sind leider überhaupt nicht mit Linux kompatibel.[5][6] Der Vollständigkeit halber seien sie trotzdem hier aufgeführt: Von Plustek gibt es das Opticbook 3800 (bzw. den großen Bruder Opticbook 4800) und von Microtek den XT3300 sowie dessen großen Bruder XT3500. (Außerdem gibt es von Avision noch das größere Modell FB6280E, das sich aber in einem ganz anderen Preisbereich bewegt. Noch teurer ist Kodaks i2900.) Einen einigermaßen ausführlichen Vergleich dieser Geräte findet man in einer Kundenrezension auf Amazon.de.

Leider muss man momentan auch für den Betrieb des Avision-Modells unter Linux tricksen.[7] Aber es lohnt sich: Mit dem kleinen Bash-Script, das ich mir für die Verwendung des FB2280E[8] unter Linux geschrieben habe, erreicht man gut und gerne zwischen 400 und 600 Seiten pro Stunde. Das Skript startet automatisch einen Scanauftrag nach dem anderen und lässt dazwischen jeweils einige Sekunden Zeit zum Umblättern. Mit ./scan_batch.sh scannt man die geraden (linken) Seiten, mit ./scan_batch.sh 1 anschließend die ungeraden (rechten). Das Buch muss so also zweimal komplett durchgeblättert werden.

Das Umblättern ist fehleranfällig (man erwischt oft zwei Seiten auf einmal), beansprucht das Buch und verlangsamt den ganzen Prozess. Deswegen ist es eine Überlegung wert, das Buch direkt nach jeder geraden Seite um 180 Grad zu drehen und die gegenüberliegende Seite zu scannen, bevor man umblättert (und wieder um 180 Grad dreht). So halbiert sich die Anzahl der Blättervorgänge. Das Script könnte man leicht entsprechend anpassen und dabei für das Wenden des Buches kleinere Pausen als für das Umblättern einplanen. Allerdings sollte man nicht die zusätzliche Komplexität unterschätzen, die eine solche Drehung in diese Akkordarbeit einbringen würde.

Fazit: Nur Kompromisse, wohin das Auge sieht

Zuletzt entschied ich mich übrigens doch gegen einen Scanner mit Buchkante. Die Investition von fast 300 Euro war schwer mit meinem Studentengewissen vereinbar. Und dann sind die Geräte (vor allem der FB2280E von Avision) ganz schön klobig - will ich sowas wirklich in meinen 15 Quadratmetern unterbringen? Vielleicht bleibe ich doch beim Zeta. Eventuell kann ich ja mit einer Glasplatte auf dem Buch der Wölbung beikommen?

  1. tovotu.de/blog/515-...annt-digital-Schmkern
  2. ub.uni-koeln.de/bib...tepark/index_ger.html
  3. Dass Zeutschel zu viel verspricht, sieht man in deren eigenem Video, wo die rechte Buchseite schief und die linke im oberen Bereich verzerrt bleibt: youtu.be/zHj2QznDDC4?t=106
  4. Ein Problem ist, dass Buchseiten oft sehr dünn sind und von Einzügen 'gefressen' werden können.
  5. Keine Linux-Unterstützung für Microtek XT-3300: linuxmintusers.de/i...dex.php?topic=13037.0
  6. Keine Linux-Unterstützung für Opticbook-Modelle: gjaeger.de/scanner/plustek.html
  7. alioth.debian.org/t..._id=30186&atid=410366
  8. Das Script ließe sich natürlich auch mit anderen Buchkanten-Scannern benutzen, wenn es denn welche gäbe, die mit Linux kompatibel wären.

Kommentare

Administrator 22. Oktober 2015, 15:57 Uhr

Die folgenden Anmerkungen beziehen sich nur auf den Linux-Betrieb des FB2280E. Unter Windows mit der Avision-Software stellt sich die Sache völlig anders dar:

Auf Nichttext habe ich nicht explizit geachtet, kann aber trotzdem etwas dazu sagen, weil ich einen Reiseführer eingescannt habe, in dem es viele Bilder gibt. Wie unter dem Link [7] beschrieben, gibt es Probleme mit Helligkeit und Kontrast. Selbst mit den unter [7] vorgeschlagenen Parametern ist das Problem nicht vollständig behoben. Die Scans wirken etwas kontrastarm und unterbelichtet. Hier mein Scan mit den Einstellungen aus [7]: tovotu.de/img/artikel/20151022_scan.jpg Zum Vergleich hier die Seite aus der "Blick ins Buch"-Funktion von Amazon: tovotu.de/img/artik...1022_blickinsbuch.jpg

Wenn man reine Textinhalte hat, kann man solche Scans anschließend mit einer Software wie ScanTailor in ein reines Monochrom-Format umwandeln - das beseitigt diese Probleme vollständig. Bei farbigem Material kann ich mir vorstellen, dass es durch entsprechende Nachbearbeitung möglich ist, die Probleme des Linux-Treibers auszugleichen. Ich habe mich damit aber nicht weiter beschäftigt.

Robert 21. Oktober 2015, 15:01 Uhr

Interessanter Artikel zu Buchscannern.
Ich hatte mir bei Amazon auch schon mal einen ausgeguckt, der unter Linux nutzbar war (finde ihn allerdings gerade nicht), der FB2280E von Avision scheint ganz nett zu sein und im Vergleich zu den anderen eine noch schmalere Kante zu haben.
Funktioniert der Scanner out of the Box unter Linux? Laut Seite des Sane-Projektes gibt es für diesen gar keine Unterstützung bzw. er ist auf der Seite nicht gelistet.
Ah ich seh' gerade Fußnote 7. Der FB2080E wird lt. Sane-Projekt auch nur mit Basis-Funktionanität unterstützt. Was komisch ist, viele andere Scanner werden vollständig unterstützt. (Ich kann mir nicht vorstellen, dass die so grundlegend anders sind...)
600 dpi ist nur für Dias bzw. Negative zu wenig. Wie waren die Ergebnisse von Nichttext?

Administrator 14. April 2015, 21:45 Uhr

Kürzlich bot sich eine Gelegenheit, dem Zeutschel Zeta eine neue Chance zu geben, nachdem ein Zeutschel-Mitarbeiter mir mitgeteilt hatte, ich solle es doch nochmal versuchen, wenn der letzte Versuch bereits eine Weile her sein sollte. Es gebe da inzwischen Fortschritte.

Ein Buch mit 260 Seiten hatte ich wie beim letzten Mal in erfreulichen 25 Minuten erfasst. Allerdings taten mir die Daumen vom krampfhaften Fixieren der Seiten am äußersten Rand auch diesmal wieder weh. Auf 82 der 260 Seiten waren deutliche Verzerrungen des Textes zu sehen. Davon waren 20 so fehlerhaft, dass sie wirklich völlig unbrauchbar wurden. Es war zu keinem Zeitpunkt ersichtlich, was diese Fehler verursacht haben könnte. Die Daumen konnte die Zeutschel-Software außerdem nur auf durchschnittlich jeder zweiten Seite erfolgreich herausrechnen.

Damit musste ich also im Schnitt jede dritte Seite neu einscannen und der Geschwindigkeitsvorteil dieser Scanmethode gegenüber der im Artikel vorgestellten Buchkantenscanner geht vollständig verloren. Ich muss sagen, dass es auch wirklich eine unangenehme psychische Erfahrung ist, eine Akkordarbeit zu machen, bei der jeder dritte Schritt ein Fehltritt ist.
« 1 2 3 4
Neue Kommentare zu diesem Artikel bitte per Mail an kommentare-546(at)tovotu.de!