Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

OCR Status für jede Datei für Editors sichtbar machen #337

Open
stijnvermeeren-swisstopo opened this issue Nov 6, 2024 · 0 comments
Open

Comments

@stijnvermeeren-swisstopo

In Editier-Modus soll für jede PDF-Datei (egal ob normale Datei oder rechtliche Einwilligung) den OCR Status (z.B. "processing", "success", "error", wie in der Datenbank in der Spalte file.ocr_status gespeichert) für den Editor sichtbar gemacht werden.

Sonst gibt es für den Editor, wenn etwas komisch ist mit einer PDF-Datei, keine Möglichkeit zu unterscheiden zwischen "OCR wurde ausgeführt, aber die Qualität von der Texterkennung war wohl mangelhaft", "OCR wird noch ausgeführt, es dauert einfach lange", "OCR wurde gar nicht ausgeführt, es gab einen Fehler". (Ausser der Editor hat auch Datenbankzugriff und gibt sich sie mühe in der Datenbank nachzuschauen was los ist; das ist aber mühsam und kostet viel Zeit.)

Anderseits darf unter "Administration" den Arbeitsstatus "OCR prozessiert" entfernt werden. Der "OCR Status" sollte nämlich nicht pro Asset, sondern für jede Datei separat getrackt werden (was auch bereits passiert über die Spalte file.ocr_status in der Datenbank). Ich sehe darum den Mehrwert von diesem zusätzlichen Arbeitsstatus "OCR prozessiert" im Moment nicht.

Screenshot 2024-11-06 080429

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant