ERP & Automatisierung

Auftragserfassung automatisieren: PDF-Bestellungen ohne EDI ins ERP übernehmen

Von Robin Maier 12. Juni, 2026 9 min Lesezeit

Im Vertriebsinnendienst eines typischen Industrieunternehmens sieht der Auftragseingang so aus: Eine Bestellung kommt als PDF per E-Mail — erzeugt vom ERP-System des Kunden, sauber formatiert, alle Daten vorhanden. Dann öffnet ein Mitarbeitender das ERP und tippt genau diese Daten wieder ein: Bestellnummer, Kommission, Positionen, Artikelnummern, Mengen, Preise, Termine, Lieferadresse.

Strukturierte Daten werden in ein Bild von Daten verwandelt, per Mail verschickt — und auf der Empfängerseite von Hand zurück in strukturierte Daten übersetzt. Dieser absurde Medienbruch ist im B2B-Geschäft der Normalfall, und er steht selten auf einer Digitalisierungsagenda, weil er sich als Alltag tarnt. Dabei ist die Auftragserfassung der Beleg-Prozess mit dem größten Automatisierungshebel — und seit kurzem auch der am besten lösbare.

Warum gerade die Auftragserfassung

Drei Gründe machen den Auftragseingang zum lohnendsten Ziel der Belegautomatisierung — noch vor dem Rechnungseingang, auf den sich die meisten Lösungen am Markt konzentrieren:

Erstens: Hier hilft keine Regulierung. Die deutsche E-Rechnungspflicht strukturiert nach und nach den Rechnungsverkehr — für Bestellungen, Auftragsbestätigungen und Lieferscheine gibt es nichts Vergleichbares, und es ist auch nichts in Sicht. In der Schweiz fehlt selbst für B2B-Rechnungen eine Pflicht. Wer auf die Regulierung wartet, wartet beim Auftragseingang vergeblich.

Zweitens: Fehler sind hier am teuersten. Eine falsch erfasste Rechnung fällt spätestens beim Abgleich auf. Eine falsch erfasste Bestellung setzt eine physische Kette in Gang: falsche Menge kommissioniert, falscher Artikel produziert, falscher Liefertermin bestätigt. Die Folgekosten — Retoure, Express-Nachlieferung, Gutschrift, beschädigtes Kundenvertrauen — übersteigen die reinen Erfassungskosten um ein Vielfaches.

Drittens: Geschwindigkeit ist Umsatz. Aufträge, die mittags im Postfach liegen und abends erfasst werden, verlieren einen halben Tag Durchlaufzeit — bei Lagerware mitunter den Versandtag. In Branchen mit Liefertermin-Wettbewerb ist die Erfassungslatenz direkt vertriebsrelevant.

Die EDI-Lücke: warum 80 Prozent der Kunden PDFs schicken

Die klassische Antwort auf den Medienbruch heißt EDI — elektronischer Datenaustausch von ERP zu ERP. Wo EDI läuft, ist das Problem gelöst. Nur: EDI läuft fast nie flächendeckend.

Eine EDI-Anbindung ist ein Projekt pro Geschäftspartner — Format-Abstimmung, Mapping, Tests, Betrieb. Das rechnet sich für die zehn größten Kunden mit täglichen Bestellungen. Für den langen Rest der Kundenliste — den Maschinenbauer, der viermal im Jahr bestellt, den Händler mit wechselnden Abrufen — rechnet es sich nie. Das Ergebnis ist in fast jedem Unternehmen dasselbe Muster: Eine Handvoll Großkunden bestellt per EDI, die große Mehrheit schickt PDFs. Häufig stammen 20 bis 50 Prozent des Auftragsvolumens aus genau diesem langen Schwanz.

Auch WebEDI — Lieferantenportale, in die kleinere Partner ihre Daten manuell eintragen — löst das Problem nicht, sondern verschiebt es nur: Statt des eigenen Innendiensts tippt der Geschäftspartner. Entsprechend unbeliebt sind solche Portale, und entsprechend lückenhaft werden sie gepflegt.

Die realistische Architektur für den Mittelstand kombiniert deshalb beides: EDI für die angebundenen Großkunden, KI-Extraktion für alle anderen. Die Pipeline behandelt das PDF wie eine eingehende EDI-Nachricht — sie liest, strukturiert, validiert und übergibt an das ERP. Für den Kunden ändert sich nichts: Er bestellt weiter so, wie er immer bestellt hat. Genau das macht den Ansatz im Vertrieb durchsetzbar — niemand muss Geschäftspartner umerziehen.

Was Auftragsautomatisierung können muss — und woran einfache Lösungen scheitern

Bestellungen sind die anspruchsvollste Belegart im Eingang. Wer Rechnungs-OCR kennt, unterschätzt regelmäßig, was bei Aufträgen dazukommt:

Positionsdaten sind der Kern. Bei einer Rechnung reichen zur Not Kopf-Daten und Bruttobetrag. Ein Auftrag besteht aus seinen Positionen — zehn, fünfzig, zweihundert Zeilen mit Artikelnummern, Mengen, Einheiten, Preisen, Rabatten, Terminen. Genau auf Tabellenzeilen passieren die meisten Extraktionsfehler.
Mehrzeilige Positionen und Seitenumbrüche. Artikelbezeichnungen laufen über drei Zeilen, eine Position wird durch einen Seitenwechsel samt Zwischensumme („Übertrag”) zerschnitten, Größen- und EAN-Angaben stehen unter der eigentlichen Zeile. Klassische, vorlagenbasierte OCR bricht an solchen Layouts; template-freie Sprachmodell-Extraktion liest sie wie ein Mensch — im Kontext.
Fremde Artikelnummern. Kunden bestellen mit ihren eigenen Artikelnummern, nicht mit den hauseigenen. Die Pipeline muss beide erfassen und gegen den Artikelstamm auflösen — inklusive der Fälle, in denen die Zuordnung mehrdeutig ist und ein Mensch entscheiden sollte.
Zwei „Totals” und versteckte Rabatte. Endsumme mit und ohne Mehrwertsteuer, Positionsrabatte in Fußnoten, Staffelpreise: Felder, die sich leicht verwechseln lassen — und die sich zum Glück mathematisch verifizieren lassen.

Der letzte Punkt zeigt das Konstruktionsprinzip, das belastbare von oberflächlichen Lösungen trennt: Das Sprachmodell schreibt ab, es rechnet nicht. Es überträgt ausschließlich, was wörtlich im Beleg steht. Anschließend prüft deterministischer Code die Arithmetik: Menge × Preis abzüglich Rabatt muss den Positionsbetrag ergeben, die Positionssummen müssen zur Auftragssumme passen. Ein Zahlendreher — aus 12,80 wird 12,08 — fliegt mathematisch auf, bevor er zur falschen Lieferung wird. Dazu kommt der Belegbarkeits-Check: Jeder extrahierte Wert muss sich im Originaltext des PDFs wiederfinden lassen, sonst gilt er als nicht extrahiert. Was alle Prüfungen besteht, wird automatisch als Auftrag angelegt; alles andere landet mit den vorausgefüllten Daten in einer Review-Maske, in der die Prüfung Sekunden dauert statt Minuten. (Die vollständige Architektur ist hier beschrieben: PDF-Belege automatisch ins ERP übernehmen — der Leitfaden)

Die Wirtschaftlichkeit: eine Beispielrechnung

Ein mittelständischer Hersteller erhält 30 PDF-Bestellungen pro Tag mit durchschnittlich 8 Positionen. Die manuelle Erfassung dauert je nach Positionszahl 5 bis 15 Minuten — im Schnitt 8 Minuten, bei 45 Euro Vollkostensatz:

30 Bestellungen × 8 Minuten = 4 Stunden Erfassungsarbeit täglich
≈ 180 Euro pro Tag, knapp 40.000 Euro pro Jahr — reine Erfassung, ohne Fehlerfolgekosten
Dazu: vermiedene Falschlieferungen. Schon bei einer Erfassungsfehlerquote von 2 Prozent und durchschnittlich 250 Euro Folgekosten pro Fehlerfall kommen weitere rund 33.000 Euro jährlich zusammen (30 × 220 Arbeitstage × 2 % × 250 €).

Dem stehen bei einer On-Premise-Pipeline einmalige Projektkosten plus geringe Betriebskosten gegenüber — Hardware in der Größenordnung einer einzelnen GPU-Workstation oder kompakten KI-Appliance (wenige tausend Euro), Strom, Wartung. Keine Stückpreise pro Dokument, keine Abo-Staffeln, die mit dem eigenen Erfolg mitwachsen. Die Amortisation liegt bei diesen Volumina typischerweise unter einem Jahr; bei höheren Belegvolumina entsprechend früher. Und anders als bei SaaS-Lösungen bleibt das Einsparpotenzial vollständig im Haus, statt anteilig als Volumengebühr zurückzufließen.

Mindestens so wertvoll wie die Kostenseite ist die Kapazitätsseite: Der Innendienst gewinnt täglich Stunden für das, was tatsächlich Umsatz macht — Kundenberatung, Angebotsverfolgung, Reklamationslösung. Auftragsspitzen und Urlaubsvertretungen verlieren ihren Schrecken, weil die Maschine nicht in den Urlaub fährt.

Einführung: in drei Stufen zum automatischen Auftragseingang

Der belastbare Einführungsweg ist unspektakulär und genau deshalb wirksam:

Pilot mit ~10 echten Bestellungen. Reale Belege von 2–3 unterschiedlichen Kunden, für die das korrekte Ergebnis manuell festgelegt wird (Gold-Set). Die Pipeline läuft End-to-End bis zum Auftragsentwurf im ERP; ein bewusst eingebauter Fehler muss von den Prüfungen gefangen werden.
Validierung mit ~100 Bestellungen — inklusive Kunden, die das System noch nie gesehen hat. Hier entstehen die Kennzahlen, die zählen: Durchlaufquote ohne Korrektur, Positionsgenauigkeit, Verhalten bei unbekannten Layouts. Daraus wird die Schwelle kalibriert, ab der ein Auftrag automatisch angelegt wird.
Produktivbetrieb mit Review-Queue. Unsichere Fälle gehen an den Innendienst — vorausgefüllt, in Sekunden geprüft. Korrekturen fließen in die Pipeline zurück; die Review-Quote sinkt über die ersten Monate spürbar.

Vom Kick-off bis zum Produktivbetrieb vergehen so wenige Wochen bis wenige Monate — kein ERP-Großprojekt, sondern ein präzise umrissenes Modul, das an den bestehenden Auftragsprozess andockt.

Häufige Fragen

Funktioniert das auch bei Bestellungen mit 100+ Positionen? Ja — gerade dort liegt der größte Nutzen, weil manuelle Erfassung mit der Positionszahl linear teurer und fehleranfälliger wird. Die Arithmetik-Prüfung skaliert mit: Jede Position wird einzeln nachgerechnet, die Gesamtsumme gegen die Positionssummen geprüft.

Was ist mit Bestellungen als Excel-Anhang oder im E-Mail-Text? Strukturierte Anhänge (CSV/Excel) werden deterministisch geparst und brauchen gar keine KI — sie sind der einfachste Fall. Bestellungen im E-Mail-Fließtext sind extraktionsfähig, laufen aber mit konservativeren Schwellen häufiger durch die Review-Queue.

Ersetzt das unsere EDI-Anbindungen? Nein, es ergänzt sie. Bestehende EDI-Verbindungen bleiben der beste Kanal für die angebundenen Großkunden. Die Pipeline schließt die Lücke für alle Geschäftspartner, bei denen sich ein EDI-Projekt nie rechnen wird — ohne dass diese ihr Verhalten ändern müssen.

Müssen unsere Kunden etwas umstellen? Nein. Kunden bestellen weiter per PDF und E-Mail wie bisher. Genau das unterscheidet den Ansatz von Lieferantenportalen und WebEDI, die den Erfassungsaufwand nur zum Geschäftspartner verschieben.

Bleiben die Bestelldaten im Haus? Bei einer On-Premise-Pipeline: ja, vollständig. Extraktion und Validierung laufen auf eigener Hardware im eigenen Netzwerk; kein Dokument geht an einen Cloud-Dienst. Details dazu: KI-Dokumentenverarbeitung on-premise.

Fazit

Die Auftragserfassung ist der wertvollste und zugleich am meisten übersehene Kandidat der Belegautomatisierung: keine Regulierung wird sie lösen, EDI deckt nur die Spitze ab, und jeder Erfassungsfehler kostet physisch Geld. Template-freie KI-Extraktion mit deterministischer Validierung schließt diese Lücke — Bestellungen laufen automatisch, geprüft und nachvollziehbar ins ERP, während Kunden weiter bestellen wie immer.

kitun baut Auftragserfassungs-Pipelines als maßgeschneiderte ERP-Module — on-premise, template-frei, mit direkter Integration in das vorhandene ERP, ohne Stückkosten pro Beleg. Ein 20-minütiges Erstgespräch genügt für eine erste Einschätzung des eigenen Auftragseingangs.

→ Die Lösung im Überblick: kitun Dokumenten-Pipeline