Objekt-Metadaten

Verbesserung, Lokalisierung und Entzerrung von Textdokumentaufnahmen
Block-Berlitz, Marco

HaupttitelVerbesserung, Lokalisierung und Entzerrung von Textdokumentaufnahmen
TitelvarianteImproving, detecting and deskewing images of text documents
AutorBlock-Berlitz, Marco
Geburtsort: Rüdersdorf
GutachterProf.Dr. Raúl Rojas
weitere GutachterProf.Dr. Frank Pasemann
Freie SchlagwörterTextlokalisierung, Layouterkennung, Entzerrung
DDC000 Informatik, Informationswissenschaft, allgemeine Werke
ZusammenfassungIn der vorliegenden Arbeit wird eine Methode zur Lokalisierung von Text in realen Aufnahmen von Textdokumenten mit beliebigem Hintergrund vorgestellt. Dieses bottom-up Verfahren, das auf lokaler Hauptkomponentenanalyse basiert, identifiziert die Layoutstruktur eines Dokumentes.
Eine neue Methode zur Segmentierung von Text wird vorgeschlagen, die sich im Vergleich
zu Standardverfahren als robuster gegenüber Änderungen der Lichtverhältnisse erweist. So lassen sich handgeschriebene Texte an Kreidetafel und Whiteboard ebenso gut segmentieren, wie gedruckte Dokumentaufnahmen.
Eine Bildaufnahme genügt nicht immer, um alle wichtigen Bildbereiche zu fokussieren
und ausreichend auszuleuchten. So wird eine neue Methode vorgeschlagen, die basierend auf den Kantenintensitäten verschiedene Aufnahmen zusammenfasst. Die Erkennungsraten sind dabei besser als bei den untersuchten aktuellen Methoden.
Da die Layoutstuktur oft verzerrte Textblöcke identifiziert, die nicht in Blockform vorliegen,
wird ein Entzerrungsalgorithmus vorgestellt, der sich an den lokalen Buchstabenausrichtungen orientiert und dieses Problem löst. Nachdem die Textblöcke begradigt sind, können diese adaptiv segmentiert werden. Für die Ermittlung der Dokumentrichtung lassen sich die SITT-Merkmale einsetzen, die Punktkomponenten in Buchstaben identifizieren.
Dokumente
pdf-Datei
Falls Ihr Browser eine Datei nicht öffnen kann, die Datei zuerst herunterladen und dann öffnen.

Anhang
Falls Ihr Browser eine Datei nicht öffnen kann, die Datei zuerst herunterladen und dann öffnen.
 
Seitenzahl271 S.
Fachbereich/EinrichtungFB Mathematik und Informatik
Erscheinungsjahr2009
Dokumententyp/-SammlungenDissertation
Medientyp/FormatText
SpracheDeutsch
Rechte Nutzungsbedingungen
Tag der Disputation11.05.2009
Erstellt am14.05.2009 - 10:33:46
Letzte Änderung19.02.2010 - 13:06:32
 
Statische URLhttp://www.diss.fu-berlin.de/diss/receive/FUDISS_thesis_000000010048
URNurn:nbn:de:kobv:188-fudissthesis000000010048-1
Zugriffsstatistik