Skip to content

Workflow Testergebnisse

Robert Sachunsky edited this page Apr 12, 2024 · 2 revisions

Die Vorgänge wurden aus der Kitodo-Oberfläche mit drei unten beschrieben Workflows prozessiert. Die Ergebnisse und die Rechenzeiten (gesamt und separat für jeden Workflow-Schritt) werden auf Folgeseiten gezeigt.

Workflows

Einschrittiger WF tesserocr-recognize („Simple“):

tesserocr-recognize -P segmentation_level region -P model frak2021 -I OCR-D-IMG -O OCR-D-OCR

fileformat-transform -P from-to "page alto" -P script-args "--no-check-border --dummy-word" -I OCR-D-OCR -O FULLTEXT

Mehrschrittiger WF mit eynollah-segmentierung („Complex_Var2“):

sbb-binarize -P model default-2021-03-09 -I OCR-D-IMG -O binar

eynollah-segment -P models default -P curved_line true -P allow_scaling true -I binar -O segment

cis-ocropy-dewarp -I segment -O dewarp

tesserocr-recognize -P textequiv_level word -P find_tables true -P model frak2021 -I dewarp -O output

fileformat-transform -P from-to "page alto" -P script-args "--no-check-border --dummy-word" -I output -O FULLTEXT

Mehrschrittiger WF mit ocropy-segmentierung („Complex_Var5“):

sbb-binarize -P model default-2021-03-09 -I OCR-D-IMG -O binar

cis-ocropy-segment -I binar -O segment -P level-of-operation page

cis-ocropy-dewarp -I segment -O dewarp

tesserocr-recognize -P textequiv_level word -P find_tables true -P model frak2021 -I dewarp -O output

fileformat-transform -P from-to "page alto" -P script-args "--no-check-border --dummy-word" -I output -O FULLTEXT

Vorgang aus Colibri-Sammlung mit Kitodo-Test ID 5644, publiziert im Testsystem mit Signatur 0000-0004 (eine Seite)

Vorgang aus pharm. Zeitung mit Kitodo-Test ID 5645, publiziert im Testsystem mit Signatur 0000-0002 (eine Seite)

Vorgang aus mit Kitodo-Test ID 5640, publiziert im Testsystem mit Signatur 0000-0003 (sieben Seiten)