27. Januar 2016
Wie EBSCO, Springer, UTB und Co. den Bezug von Fachbüchern künstlich erschweren

Mit SpringerLink, dem Angebot des Wissenschaftsverlags Springer, beschäftigte sich tovotu in den letzten Jahren ausführlich im Zuge mehrerer Artikel.^[1] Gelobt wurde damals der umfangreiche und unkomplizierte Zugang zu (digitalen) PDF-Versionen zahlreicher Springer-Publikationen. Inzwischen ist Springer dazu übergegangen, den Bezug einiger Fachbücher künstlich zu erschweren.

In Einzelfällen können Springer-Publikationen, die im SpringerLink-Paket einer Universität nicht enthalten (also gesperrt) sind, auf anderem Wege über das Uni-Netzwerk bezogen werden: dann nämlich, wenn der Eintrag der Universitätsbibliothek auf ebscohost.com, das Angebot des amerikanischen Literaturdatenbankanbieters EBSCO, verweist. Während man bei SpringerLink direkt PDF-Dateien herunterlädt, ist bei EBSCO die Darstellung der Inhalte im Browser vorgesehen.

Publikationen auf EBSCO können also weder offline (z.B. unterwegs in der Bahn), noch mit einer anderen Software (etwa um Anmerkungen hinzuzufügen oder sich den Text vorlesen zu lassen) oder auf einem anderen Lesegerät (Tablet, Smartphone, E-Book-Reader ...) gelesen werden, was alles andere als zeitgemäß ist. Ich würde sogar behaupten, dass die gegebenen Einschränkungen die meisten Vorteile digitalen Lesens zunichte machen.

Der Export von bis zu 60 Seiten als PDF-Datei ist bei EBSCO zwar möglich. Es ist aber nicht gerade komfortabel, große Bücher in Häppchen von 60 Seiten (jeweils in einer neuen Browsersitzung) herunterzuladen und anschließend per Hand wieder zu einer Datei zusammenzufügen. Außerdem enthalten diese Dateien keine Metadaten wie das Inhaltsverzeichnis oder die korrekte Seitennummerierung.

Ein Blick hinter die Kulissen lässt die Lage etwas absurd erscheinen: Beim Betrachten der Publikationen auf EBSCO passiert nichts anderes, als dass der Browser im Hintergrund die benötigten Inhalte unverfälscht (ohne Wasserzeichen etc.) in Form von unverschlüsselten und kopierschutzfreien PDF-Dateien herunterlädt und mittels einer modifizierten Version des JavaScript-PDF-Readers pdf.js (aus dem Hause Mozilla) auf dem Bildschirm darstellt.

Die Fachbücher befinden sich also beim Betrachten bereits im gewünschten Format (PDF) auf dem Computer des Benutzers. Über seinen Uni-Zugang hat er de facto uneingeschränkten Zugriff auf die PDF-Publikationen. Man verrät dem Nutzer nur nicht, worauf genau er zugreifen muss. Das verrät man stattdessen dem Browser, der aber nicht weiß, dass er die Dateien einfach irgendwo frei zugänglich auf dem Computer ablegen könnte.

Ganz ähnlich ist das Prozedere beim Angebot von UTB, also den (roten) "Uni-Taschenbüchern". Auf utb-studi-e-book.de erhält man über zahlreiche Uni-Netzwerke Zugang zu einem Großteil der UTB-Fachbücher - allerdings nur zur Online-Ansicht im Browser (wieder mittels pdf.js). Ein PDF-Export ist auf 30 Seiten pro Sitzung beschränkt und man muss dafür einen Account anlegen.

Technische Hintergründe zur Verschleierungstaktik von UTB und EBSCO.

Im Fall von UTB kann Über die JavaScript-Konsole des Browsers (bei Firefox erreicht man die beispielsweise mit der Taste F12 und Auswahl von Console) das Öffnen der PDF-Datei in einem neuen Fenster erzwungen werden:

PDFViewerApplication.pdfDocument.getData().then(function (r) {
    window.open(
        window.URL.createObjectURL(
            new Blob([r.buffer], { type: "application/pdf" })
        )
    );
});

EBSCO gibt sich etwas mehr Mühe bei der Verschleierung der im Hintergrund geladenen Daten: Der Browser lädt nach Bedarf für jede Seite des Buches eine einzelne PDF-Datei herunter, sodass man das Buch ohne Einschränkungen nur in Form zahlreicher PDF-Dateien beziehen kann. Um eine Seite als PDF-Datei herunterzuladen, reicht folgender curl-Aufruf:

curl 'http://web.a.ebscohost.com/ehost/ebookviewer/artifact/{BOOK_ID}/EB/{SESSION_ID}/0/{PAGE_ID}' \
-H 'User-Agent: {USER_AGENT}' -H 'Cookie: {COOKIE_DATA}'

Dabei muss man den Wert {COOKIE_DATA} eines aktuellen Cookies von ebscohost.com, die zugehörige Session-ID {SESSION_ID} und die ID {BOOK_ID} der Publikation kennen. Eine Liste der Werte, die man jeweils für {PAGE_ID} einsetzen muss, kann man über die JavaScript-Konsole ermitteln:

var outstr = "";
for (var i = 0; i < ep.ebookViewer.dataManager.currentDoc().pageCount; i++) {
     outstr += ep.ebookViewer.dataManager.getPageByIndex(i).artifactId.split("#")[0] + "\n";
}
console.log(outstr);

Eine Anleitung ist das freilich noch nicht. Nach neuesten Gerichtsentscheidungen müsste ich sogar fürchten, mich mit so einer Anleitung strafbar zu machen, weil sie eine "technisch wirksame Schutzmaßnahme" (in diesem Fall wäre "wirksam" hoffentlich übertrieben) umgehen würde.

Es ist völlig unklar, welchem Zweck dieser künstlich eingeschränkte Zugang überhaupt dienen soll. Für eine sinnvolle wissenschaftliche Arbeit mit den Fachpublikationen ist die Lösung von EBSCO oder UTB jedenfalls nicht zu gebrauchen. Indem sie die vielen Möglichkeiten der Arbeit mit digitalen Dokumenten auf ein Minimum reduziert, ist sie nicht nur unzeitgemäß, sondern schlicht unbrauchbar. Sowas könnte man als kostenlose Vorschau für interessierte Käufer einsetzen, aber diesen Zugang für Geld an Universitätsbibliotheken zu verkaufen ist reine Geldmacherei.

tovotu.de/blog/514-...SpringerLink-beziehen

27. Januar 2016 Wie EBSCO, Springer, UTB und Co. den Bezug von Fachbüchern künstlich erschweren

Kommentare

27. Januar 2016
Wie EBSCO, Springer, UTB und Co. den Bezug von Fachbüchern künstlich erschweren