Gescannte oder fotografierte Texte und PDFs optimieren – Ein kleines Scan Tailor-Tutorial für Windows

In immer mehr Bibliotheken stehen mittlerweile Buchscanner, vielerorts dürfte daher das Scannen von Texten oder ganzen Büchern das zwar ebenso zeitaufwendige, aber in der Regel kostenpflichtige Kopieren ersetzt haben. Steht kein Aufsichtsscanner zur Verfügung, etwa in kleineren Archiven, übernimmt oft eine handelsübliche Digitalkamera diese Funktion. Die Qualität solcher Scans oder Fotografien lässt oftmals aber sehr zu wünschen übrig, der eigentliche Text ist häufig schlecht zu erkennen. Insbesondere, wenn man seine mühsam in Archiv gesammelten Quellenschätze anderen zur Verfügung stellen möchte, sollte man daran noch etwas ändern.

Schon vor einiger Zeit habe ich das Programm Scan Tailor ScanTailor Advanced entdeckt, mit dem man die Bildqualität von solchem Material nachträglich deutlich verbessern kann. ScanTailor ist eine Software, die dazu verwendet wird, Bücher zu digitalisieren, es kann weitgehend automatisiert die Seiten aufteilen, den Text begradigten, schwarze Ränder entfernen und den Text gegenüber dem Hintergrund hervorheben. Scans, die mit Scan Tailor optimiert wurden, sind deutlich besser zu lesen und haben darüber hinaus den Vorteil, dass sie bei einer erneuten Überführung auf Totholz (aka „Drucken“) umweltfreundlicher sind, da Toner gespart wird. Außerdem lässt sich mit ScanTailor die Dateigröße eines PDFs oftmals deutlich reduzieren. Aber seht selbst.

Vorher

Nachher

„Gescannte oder fotografierte Texte und PDFs optimieren – Ein kleines Scan Tailor-Tutorial für Windows“ weiterlesen

Mein Fazit zur #digigw2013: Digitale Geschichtswissenschaft sollte dezentral, nachhaltig und offen sein

Gestern war ich auf der Auftakttagung der „AG Digitale Geschichtswissenschaft“ des deutschen Historikerverbandes in Braunschweig und möchte hier jetzt ganz persönliches Fazit der Veranstaltung ziehen. Weitere Kommentare zu der Veranstaltung sind bislang hierhier und hier zu finden.

Während die Vorträge und die Podiumsdiskussion (Programm der Tagung) sehr allgemein Fragen der Digitalisierung von Quellen, elektronischen Publizierens, Institutionen und „Big Data“ in der deutschen Geschichtswissenschaft thematisierte, war die sich parallel auf Twitter stattfindende Diskussion deutlich spannender und teilweise sehr viel kritischer und emotionaler. Leider gab es keine Twitterwall, sodass die Diskussion auf den Kreis der ohnehin sehr netzaffinen twitternden Historiker beschränkt blieb – schade, eine Rückbindung an Twitter hätte zumindest die Podiumsdiskussion beleben können.

Mein Zwischenfazit von der Diskussion und der Stimmung vor Ort auf Twitter habe ich in zwei Tweets zusammengefasst:

Beide Punkte möchte ich hier etwas näher ausführen, insbesondere, was ich unter einer dezentralen, nachhaltigen und offenen digitalen Geschichtswissenschaft verstehe.

„Mein Fazit zur #digigw2013: Digitale Geschichtswissenschaft sollte dezentral, nachhaltig und offen sein“ weiterlesen