Xerox-Multifunktionsgeräte verändern Scanergebnisse

Das man Texterkennungs-Software nur bedingt trauen kann ist hinlänglich bekannt. Trotz stetig besser werdender Software für diesen Zweck schleichen sich immer noch Fehler ein, die zu ernsten Problemen führen können, wenn sie nicht korrigiert werden. Das ein Scanner ohne den Einsatz von Texterkennung das Gescannte ändert, dürfte den meisten allerdings neu sein. Solch ein Verhalten hat jetzt allerdings ein Informatiker bei Geräten von Xerox festgestellt.

Durch einen Zufall entdeckte man in einem Unternehmen einen Fehler in der Kopie eines Bauplans wo die Quadratmeterzahl eines Raumes falsch angegeben war. Erstaunlicherweise handelte es sich dabei um einen sehr „sauberen“ Fehler, ganz so als hätte jemand mittels digitaler Bildbearbeitung die Zahlen säuberlich ausgetauscht und den Plan dann ausgedruckt.

Wie der Informatiker David Kriesel in seiner Untersuchung des Problems zeigt, liefern Geräte der „WorkCentre“-Serie von Xerox bei diesem Bauplan reproduzierbare Fehler. Getestet mit einem Gerät vom Typ 7535 und einem des Typs 7556 tauchen in Dokumenten, die direkt in ein PDF gescannt werden, wiederholt falsche Bildstellen auf. Aus der Ziffer 6 wird eine 8, aber auch der vollständige Austausch längerer Ziffernkombinationen passiert.

Als Grund für diese Fehler scheint sich der verwendete Kompressionsalgorithmus verantwortlich zu zeichnen. Der verwendete „JBIG2″-Standard speichert einmal verarbeitete Bildstellen in einem „Wörterbuch“ zwischen und setzt diese wieder ein, falls eine Bildstelle gefunden wird, deren Abweichung nur marginal zur bereits gespeicherten ist. Offensichtlich passiert genau dies innerhalb der Xerox-Geräte. Eine unglückliche Kombination aus der Größe der gespeicherten Bildstelle und der Objektgröße im Dokument, beispielhaft erzeugte eine Arial mit 7 pt entsprechende Probleme, führt dazu, dass der Scanner eine gescannte 6 durch eine 8 ersetzt etc.

Es handelt sich damit wahrscheinlich um reinen Software-Fehler, der durch die Wahl einer kleineren Größe für die gespeicherten Bildstellen behoben werden kann. Bisher steht eine Reaktion von Xerox zu diesem Problem aus, auch Geräte mit aktuellster Firmware sind davon betroffen. Wie lange dieser Fehler schon existiert ist unbekannt.

Bis zu einer Behebung des Problems bietet es sich an, Dokumente zunächst als TIFF-Datei zu scannen und daraus ein PDF zu erzeugen. In diesem Fall kommen für die Komprimierung der TIFFs und des PDFs andere Verfahren zum Einsatz, bei denen keine entsprechenden Fehler bekannt sind.

Xerox reagierte mit einer Stellungnahme im firmeneigenen Blog. Offenbar plant das Unternehmen nicht, das Problem zu beheben – etwa durch ein Update.

Stattdessen fügt Xerox in die Drucker-Steueroberfläche im Internet einen Warnhinweis ein, dass es zu Fehlern kommen kann, wenn in den Einstellungen das Kompressionslevel erhöht (Einstellung „normal“) wird, um kleinere Dateiformate zu erzielen. Bei Bildern sei das ohnehin nicht der Fall, aber bei Text könne es zu Zeichen-Fehlern kommen. Zudem empfiehlt der Hersteller, einfach die Werks-Einstellungen zu verwenden, bei denen keinerlei Probleme auftreten würden.

Quelle: Weblog von David Kriesel

0

Dein Warenkorb

Durch die weitere Nutzung der Seite stimmst du der Verwendung von Cookies zu. Weitere Informationen

Die Cookie-Einstellungen auf dieser Website sind auf "Cookies zulassen" eingestellt, um das beste Surferlebnis zu ermöglichen. Wenn du diese Website ohne Änderung der Cookie-Einstellungen verwendest oder auf "Akzeptieren" klickst, erklärst du sich damit einverstanden.

Schließen