ERP & Automatisierung
Auftragserfassung automatisieren: PDF-Bestellungen ohne EDI ins ERP übernehmen
Im Vertriebsinnendienst eines typischen Industrieunternehmens sieht der Auftragseingang so aus: Eine Bestellung kommt als PDF per E-Mail — erzeugt vom ERP-System des Kunden, sauber formatiert, alle Daten vorhanden. Dann öffnet ein Mitarbeitender das ERP und tippt genau diese Daten wieder ein: Bestellnummer, Kommission, Positionen, Artikelnummern, Mengen, Preise, Termine, Lieferadresse.
Strukturierte Daten werden in ein Bild von Daten verwandelt, per Mail verschickt — und auf der Empfängerseite von Hand zurück in strukturierte Daten übersetzt. Dieser absurde Medienbruch ist im B2B-Geschäft der Normalfall, und er steht selten auf einer Digitalisierungsagenda, weil er sich als Alltag tarnt. Dabei ist die Auftragserfassung der Beleg-Prozess mit dem größten Automatisierungshebel — und seit kurzem auch der am besten lösbare.
Warum gerade die Auftragserfassung
Drei Gründe machen den Auftragseingang zum lohnendsten Ziel der Belegautomatisierung — noch vor dem Rechnungseingang, auf den sich die meisten Lösungen am Markt konzentrieren:
Erstens: Hier hilft keine Regulierung. Die deutsche E-Rechnungspflicht strukturiert nach und nach den Rechnungsverkehr — für Bestellungen, Auftragsbestätigungen und Lieferscheine gibt es nichts Vergleichbares, und es ist auch nichts in Sicht. In der Schweiz fehlt selbst für B2B-Rechnungen eine Pflicht. Wer auf die Regulierung wartet, wartet beim Auftragseingang vergeblich.
Zweitens: Fehler sind hier am teuersten. Eine falsch erfasste Rechnung fällt spätestens beim Abgleich auf. Eine falsch erfasste Bestellung setzt eine physische Kette in Gang: falsche Menge kommissioniert, falscher Artikel produziert, falscher Liefertermin bestätigt. Die Folgekosten — Retoure, Express-Nachlieferung, Gutschrift, beschädigtes Kundenvertrauen — übersteigen die reinen Erfassungskosten um ein Vielfaches.
Drittens: Geschwindigkeit ist Umsatz. Aufträge, die mittags im Postfach liegen und abends erfasst werden, verlieren einen halben Tag Durchlaufzeit — bei Lagerware mitunter den Versandtag. In Branchen mit Liefertermin-Wettbewerb ist die Erfassungslatenz direkt vertriebsrelevant.
Die EDI-Lücke: warum 80 Prozent der Kunden PDFs schicken
Die klassische Antwort auf den Medienbruch heißt EDI — elektronischer Datenaustausch von ERP zu ERP. Wo EDI läuft, ist das Problem gelöst. Nur: EDI läuft fast nie flächendeckend.
Eine EDI-Anbindung ist ein Projekt pro Geschäftspartner — Format-Abstimmung, Mapping, Tests, Betrieb. Das rechnet sich für die zehn größten Kunden mit täglichen Bestellungen. Für den langen Rest der Kundenliste — den Maschinenbauer, der viermal im Jahr bestellt, den Händler mit wechselnden Abrufen — rechnet es sich nie. Das Ergebnis ist in fast jedem Unternehmen dasselbe Muster: Eine Handvoll Großkunden bestellt per EDI, die große Mehrheit schickt PDFs. Häufig stammen 20 bis 50 Prozent des Auftragsvolumens aus genau diesem langen Schwanz.
Auch WebEDI — Lieferantenportale, in die kleinere Partner ihre Daten manuell eintragen — löst das Problem nicht, sondern verschiebt es nur: Statt des eigenen Innendiensts tippt der Geschäftspartner. Entsprechend unbeliebt sind solche Portale, und entsprechend lückenhaft werden sie gepflegt.
Die realistische Architektur für den Mittelstand kombiniert deshalb beides: EDI für die angebundenen Großkunden, KI-Extraktion für alle anderen. Die Pipeline behandelt das PDF wie eine eingehende EDI-Nachricht — sie liest, strukturiert, validiert und übergibt an das ERP. Für den Kunden ändert sich nichts: Er bestellt weiter so, wie er immer bestellt hat. Genau das macht den Ansatz im Vertrieb durchsetzbar — niemand muss Geschäftspartner umerziehen.
Was Auftragsautomatisierung können muss — und woran einfache Lösungen scheitern
Bestellungen sind die anspruchsvollste Belegart im Eingang. Wer Rechnungs-OCR kennt, unterschätzt regelmäßig, was bei Aufträgen dazukommt:
- Positionsdaten sind der Kern. Bei einer Rechnung reichen zur Not Kopf-Daten und Bruttobetrag. Ein Auftrag besteht aus seinen Positionen — zehn, fünfzig, zweihundert Zeilen mit Artikelnummern, Mengen, Einheiten, Preisen, Rabatten, Terminen. Genau auf Tabellenzeilen passieren die meisten Extraktionsfehler.
- Mehrzeilige Positionen und Seitenumbrüche. Artikelbezeichnungen laufen über drei Zeilen, eine Position wird durch einen Seitenwechsel samt Zwischensumme („Übertrag”) zerschnitten, Größen- und EAN-Angaben stehen unter der eigentlichen Zeile. Klassische, vorlagenbasierte OCR bricht an solchen Layouts; template-freie Sprachmodell-Extraktion liest sie wie ein Mensch — im Kontext.
- Fremde Artikelnummern. Kunden bestellen mit ihren eigenen Artikelnummern, nicht mit den hauseigenen. Die Pipeline muss beide erfassen und gegen den Artikelstamm auflösen — inklusive der Fälle, in denen die Zuordnung mehrdeutig ist und ein Mensch entscheiden sollte.
- Zwei „Totals” und versteckte Rabatte. Endsumme mit und ohne Mehrwertsteuer, Positionsrabatte in Fußnoten, Staffelpreise: Felder, die sich leicht verwechseln lassen — und die sich zum Glück mathematisch verifizieren lassen.
Der letzte Punkt zeigt das Konstruktionsprinzip, das belastbare von oberflächlichen Lösungen trennt: Das Sprachmodell schreibt ab, es rechnet nicht. Es überträgt ausschließlich, was wörtlich im Beleg steht. Anschließend prüft deterministischer Code die Arithmetik: Menge × Preis abzüglich Rabatt muss den Positionsbetrag ergeben, die Positionssummen müssen zur Auftragssumme passen. Ein Zahlendreher — aus 12,80 wird 12,08 — fliegt mathematisch auf, bevor er zur falschen Lieferung wird. Dazu kommt der Belegbarkeits-Check: Jeder extrahierte Wert muss sich im Originaltext des PDFs wiederfinden lassen, sonst gilt er als nicht extrahiert. Was alle Prüfungen besteht, wird automatisch als Auftrag angelegt; alles andere landet mit den vorausgefüllten Daten in einer Review-Maske, in der die Prüfung Sekunden dauert statt Minuten. (Die vollständige Architektur ist hier beschrieben: PDF-Belege automatisch ins ERP übernehmen — der Leitfaden)
Die Wirtschaftlichkeit: eine Beispielrechnung
Ein mittelständischer Hersteller erhält 30 PDF-Bestellungen pro Tag mit durchschnittlich 8 Positionen. Die manuelle Erfassung dauert je nach Positionszahl 5 bis 15 Minuten — im Schnitt 8 Minuten, bei 45 Euro Vollkostensatz:
- 30 Bestellungen × 8 Minuten = 4 Stunden Erfassungsarbeit täglich
- ≈ 180 Euro pro Tag, knapp 40.000 Euro pro Jahr — reine Erfassung, ohne Fehlerfolgekosten
- Dazu: vermiedene Falschlieferungen. Schon bei einer Erfassungsfehlerquote von 2 Prozent und durchschnittlich 250 Euro Folgekosten pro Fehlerfall kommen weitere rund 33.000 Euro jährlich zusammen (30 × 220 Arbeitstage × 2 % × 250 €).
Dem stehen bei einer On-Premise-Pipeline einmalige Projektkosten plus geringe Betriebskosten gegenüber — Hardware in der Größenordnung einer einzelnen GPU-Workstation oder kompakten KI-Appliance (wenige tausend Euro), Strom, Wartung. Keine Stückpreise pro Dokument, keine Abo-Staffeln, die mit dem eigenen Erfolg mitwachsen. Die Amortisation liegt bei diesen Volumina typischerweise unter einem Jahr; bei höheren Belegvolumina entsprechend früher. Und anders als bei SaaS-Lösungen bleibt das Einsparpotenzial vollständig im Haus, statt anteilig als Volumengebühr zurückzufließen.
Mindestens so wertvoll wie die Kostenseite ist die Kapazitätsseite: Der Innendienst gewinnt täglich Stunden für das, was tatsächlich Umsatz macht — Kundenberatung, Angebotsverfolgung, Reklamationslösung. Auftragsspitzen und Urlaubsvertretungen verlieren ihren Schrecken, weil die Maschine nicht in den Urlaub fährt.
Einführung: in drei Stufen zum automatischen Auftragseingang
Der belastbare Einführungsweg ist unspektakulär und genau deshalb wirksam:
- Pilot mit ~10 echten Bestellungen. Reale Belege von 2–3 unterschiedlichen Kunden, für die das korrekte Ergebnis manuell festgelegt wird (Gold-Set). Die Pipeline läuft End-to-End bis zum Auftragsentwurf im ERP; ein bewusst eingebauter Fehler muss von den Prüfungen gefangen werden.
- Validierung mit ~100 Bestellungen — inklusive Kunden, die das System noch nie gesehen hat. Hier entstehen die Kennzahlen, die zählen: Durchlaufquote ohne Korrektur, Positionsgenauigkeit, Verhalten bei unbekannten Layouts. Daraus wird die Schwelle kalibriert, ab der ein Auftrag automatisch angelegt wird.
- Produktivbetrieb mit Review-Queue. Unsichere Fälle gehen an den Innendienst — vorausgefüllt, in Sekunden geprüft. Korrekturen fließen in die Pipeline zurück; die Review-Quote sinkt über die ersten Monate spürbar.
Vom Kick-off bis zum Produktivbetrieb vergehen so wenige Wochen bis wenige Monate — kein ERP-Großprojekt, sondern ein präzise umrissenes Modul, das an den bestehenden Auftragsprozess andockt.
Häufige Fragen
Funktioniert das auch bei Bestellungen mit 100+ Positionen? Ja — gerade dort liegt der größte Nutzen, weil manuelle Erfassung mit der Positionszahl linear teurer und fehleranfälliger wird. Die Arithmetik-Prüfung skaliert mit: Jede Position wird einzeln nachgerechnet, die Gesamtsumme gegen die Positionssummen geprüft.
Was ist mit Bestellungen als Excel-Anhang oder im E-Mail-Text? Strukturierte Anhänge (CSV/Excel) werden deterministisch geparst und brauchen gar keine KI — sie sind der einfachste Fall. Bestellungen im E-Mail-Fließtext sind extraktionsfähig, laufen aber mit konservativeren Schwellen häufiger durch die Review-Queue.
Ersetzt das unsere EDI-Anbindungen? Nein, es ergänzt sie. Bestehende EDI-Verbindungen bleiben der beste Kanal für die angebundenen Großkunden. Die Pipeline schließt die Lücke für alle Geschäftspartner, bei denen sich ein EDI-Projekt nie rechnen wird — ohne dass diese ihr Verhalten ändern müssen.
Müssen unsere Kunden etwas umstellen? Nein. Kunden bestellen weiter per PDF und E-Mail wie bisher. Genau das unterscheidet den Ansatz von Lieferantenportalen und WebEDI, die den Erfassungsaufwand nur zum Geschäftspartner verschieben.
Bleiben die Bestelldaten im Haus? Bei einer On-Premise-Pipeline: ja, vollständig. Extraktion und Validierung laufen auf eigener Hardware im eigenen Netzwerk; kein Dokument geht an einen Cloud-Dienst. Details dazu: KI-Dokumentenverarbeitung on-premise.
Fazit
Die Auftragserfassung ist der wertvollste und zugleich am meisten übersehene Kandidat der Belegautomatisierung: keine Regulierung wird sie lösen, EDI deckt nur die Spitze ab, und jeder Erfassungsfehler kostet physisch Geld. Template-freie KI-Extraktion mit deterministischer Validierung schließt diese Lücke — Bestellungen laufen automatisch, geprüft und nachvollziehbar ins ERP, während Kunden weiter bestellen wie immer.
kitun baut Auftragserfassungs-Pipelines als maßgeschneiderte ERP-Module — on-premise, template-frei, mit direkter Integration in das vorhandene ERP und vollständiger Code-Übergabe. Ein 20-minütiges Erstgespräch genügt für eine erste Einschätzung des eigenen Auftragseingangs.