Question 1

Verwendet ihr meine Uploads, um KI zu trainieren oder dieses Benchmark zu erweitern?

Accepted Answer

Nein. Dateien, die Sie zu ScanToExcel hochladen, werden ausschließlich im Arbeitsspeicher verarbeitet und in dem Moment endgültig gelöscht, in dem Ihr Download bereit ist. Wir speichern sie nicht, trainieren nicht damit und fügen sie nicht zum Evaluationsset hinter diesen Zahlen hinzu. Die 3000 Testdokumente stammen aus öffentlichen Datensätzen und unseren eigenen Dokumenten — nicht aus Nutzer-Uploads. Details siehe Datenschutzerklärung.

Question 2

Wie genau ist ScanToExcel?

Accepted Answer

ScanToExcel erreicht 98,0 % gewichtete Genauigkeit über 3000 echte Dokumente in sechs Dokumenttypen. Rechnungen 99,5 %, Tabellenbilder 99,2 %, Kreditkartenabrechnungen 98,8 %, Quittungen 97,3 %, Kontoauszüge 98,7 % und Gehaltsabrechnungen 94,6 %.

Question 3

Welcher Dokumenttyp ist am genauesten?

Accepted Answer

Rechnungen, mit 99,5 % F1 über 600 echte Testdokumente. Tabellenbilder (99,2 %) und Kreditkartenabrechnungen (98,8 %) folgen knapp.

Question 4

Welcher Dokumenttyp ist am wenigsten genau?

Accepted Answer

Gehaltsabrechnungen, mit 94,6 % F1 — vor allem, weil sie das größte Schema haben (40 Felder) und Arbeitgeber sehr unterschiedlich layouten. Header, Summen und Zeilenposten liegen weiterhin über 92 %; die Schwachstellen sind das Parsen von Sätzen und die Klassifizierung SALARY vs. HOURLY.

Question 5

Wie schnell ist eine einzelne Konvertierung?

Accepted Answer

Die meisten Dokumente sind in 2 – 7 Sekunden fertig. Quittungen und Tabellenbilder am schnellsten (Median 2,3 – 2,6 s); Kontoauszüge brauchen am längsten (Median 10,2 s, 95 % unter 17,2 s), weil sie die längsten Dokumente sind.

Question 6

Was ist der F1-Score?

Accepted Answer

F1 ist das harmonische Mittel aus Precision und Recall. Precision: „Wie viel von dem, was wir zurückgegeben haben, war richtig.“ Recall: „Wie viel von dem, was wirklich da war, haben wir erfasst.“ F1 fasst beides in einer Zahl zusammen — der Industriestandard für strukturiertes OCR.

Question 7

Testen Sie auf echten Dokumenten?

Accepted Answer

Ja — und zur Klarstellung: keines davon ist ein Nutzer-Upload. Das Set besteht überwiegend aus echten Quittungen, Rechnungen, Auszügen und Gehaltsabrechnungen aus öffentlichen Datensätzen sowie Dokumenten, die uns gehören oder die wir lizenziert haben, plus einem kleineren Anteil synthetischer Dokumente, die wir selbst erzeugen, um Randfälle gezielt zu stressen — etwa ungewöhnliche Layouts, schlechte Scans und knifflige Summen.

Question 8

Sind die Zahlen auf dieser Seite echt?

Accepted Answer

Ja. Sie stammen direkt aus dem letzten Evaluations-Lauf gegen unser 3000-Dokumente-Set. Modell und Prompts werden vor jedem Release vollständig neu bewertet.

Dokumenttyp	Testdokumente	Genauigkeit	Precision	Recall	Median (p50)	Langsam (p95)
Rechnungen	600	99,5%	0.993	0.997	3.3 s	5.1 s
Tabellenbilder	200	99,2%	0.992	0.992	2.6 s	7.0 s
Kreditkartenabrechnungen	500	98,8%	0.989	0.987	6.4 s	8.8 s
Kontoauszüge	650	98,7%	0.989	0.985	10.2 s	17.2 s
Quittungen	600	97,3%	0.959	0.988	2.3 s	3.1 s
Gehaltsabrechnungen	450	94,6%	0.952	0.940	5.5 s	8.7 s

Dokumenttyp	Fixtures	Vollständig korrekt
Rechnungen	600	96,2%
Bildtabellen	200	95,9%
Kreditkartenabrechnungen	500	95,7%
Kontoauszüge	650	95,2%
Quittungen	600	93,9%
Gehaltsabrechnungen	450	92,1%

Dokumenttyp	Hauptset	Held-out-Set	Δ
Rechnungen	99,5% (n=600)	97,8% (n=150)	−0.017
Tabellenbilder	99,2% (n=200)	96,7% (n=50)	−0.025
Kreditkartenabrechnungen	98,8% (n=500)	99,9% (n=130)	+0.011
Kontoauszüge	98,7% (n=650)	99,8% (n=160)	+0.011
Quittungen	97,3% (n=600)	98,6% (n=150)	+0.013
Gehaltsabrechnungen	94,6% (n=450)	95,3% (n=110)	+0.007

Leistung

Wie genau ist ScanToExcel?

Genauigkeit nach Dokumenttyp

Vollständig korrekt extrahierte Dokumente

Held-out-Validierung

Was wir bewerten

Rechnungen (16 fields)

Tabellenbilder (5 fields)

Kreditkartenabrechnungen (20 fields)

Kontoauszüge (16 fields)

Quittungen (11 fields)

Gehaltsabrechnungen (40 fields)

So messen wir

Echte Dokumente — niemals Ihre

Von Hand geprüfte Lösungen

F1, Precision, Recall — auf Feldebene

Held-out-Validierungsset

Ende-zu-Ende-Geschwindigkeit

Kontinuierliche Neubewertung

Häufig gestellte Fragen

Verwendet ihr meine Uploads, um KI zu trainieren oder dieses Benchmark zu erweitern?

Wie genau ist ScanToExcel?

Welcher Dokumenttyp ist am genauesten?

Welcher Dokumenttyp ist am wenigsten genau?

Wie schnell ist eine einzelne Konvertierung?

Was ist der F1-Score?

Testen Sie auf echten Dokumenten?

Sind die Zahlen auf dieser Seite echt?

Probieren Sie es mit Ihren eigenen Dokumenten