Synthetische Probefahrt

Wie ein Autohersteller synthetische Fahrerdaten nutzte, um Risikomodelle zu trainieren – ohne eine einzige reale Fahrt zu erfassen

Scrollen

Herausforderung

Daten ohne Treiber

Ein globaler Automobilhersteller entwickelte ein Unfallrisikomodell der nächsten Generation, um Sicherheitstechnik, Garantieplanung und potenzielle Versicherungspartnerschaften zu unterstützen. Echte Daten zum Fahrerverhalten waren unerlässlich – aber die Erhebung dieser Daten von Fahrzeugen oder Fahrern führte zu Datenschutz-, Einwilligungs- und behördlichen Hürden. Das Unternehmen benötigte eine Möglichkeit, Risikomodelle in großem Maßstab zu trainieren und zu validieren, ohne Produktzyklen zu verzögern oder Kundendaten preiszugeben.

Der Autohersteller musste ein Unfallrisikomodell der nächsten Generation trainieren. Doch das Sammeln von Verhaltensdaten von echten Fahrern gab Anlass zu Datenschutzbedenken – und erforderte monatelange Compliance-Überprüfungen. Versicherungspartner waren vorsichtig. Die Kunden waren vorsichtig. Und interne Rechtsteams legen eine Pause ein.

Nicht genug, nicht schnell genug

Es gab kaum reale Fahrdaten. Telematikaufzeichnungen deckten nur 4 % der Fahrzeuge ab. Grenzfälle wie starkes Bremsen, Nachtfahrten oder Haushalte mit mehreren Fahrern waren unterrepräsentiert. Und selbst wenn Daten vorhanden waren, dauerte die Bereinigung, Anonymisierung und Sicherung Monate.

Was wäre, wenn Sie es simulieren könnten?

Was wäre, wenn Sie realistische Daten zum Fahrerverhalten in großem Maßstab generieren könnten – ohne persönliche Informationen, ohne Sensoren und ohne Compliance-Verzögerungen? Was wäre, wenn Sie Risikomodelle anhand Tausender unterschiedlicher Fahrerprofile trainieren könnten – ohne jemals eine reale Person zu verfolgen?

Ansatz

Also haben wir die Treiber generiert

Wir haben einen synthetischen Fahrerdatensatz erstellt: 500.000 einzigartige, simulierte Profile mit vollständigen Fahrtverläufen, Fahrzeugtypen, Risikostufen und geografischen Tags. Das Fahrverhalten wurde mithilfe einer regelbasierten Engine generiert, die so abgestimmt ist, dass sie reale Telemetrie nachahmt – validiert anhand der bestehenden Telematik-Benchmarks des Autoherstellers.

Lösung

Wir haben das Modell trainiert

Mithilfe dieses synthetischen Datensatzes haben wir ein überwachtes ML-Modell trainiert, um die Unfallrisikowahrscheinlichkeit anhand von 17 verhaltensbasierten Merkmalen vorherzusagen. Das Modell erreichte 93 % seiner realen Benchmark-Genauigkeit – ohne jemals einen echten Treiber zu verwenden. Simulierte Randfälle ermöglichten es uns, das Modell in seltenen Hochrisikoszenarien einem Stresstest zu unterziehen, der im großen Maßstab schwer zu erfassen wäre.

Methodik

Wir verwendeten einen dreistufigen Ansatz: (1) Entwurf eines synthetischen Datengenerators, der auf die bestehenden Telematik-Benchmarks des Autoherstellers (Geschwindigkeit, Bremsen, Fahrtlänge, Tageszeit, Geografie) kalibriert ist; (2) Generieren Sie mehr als 500.000 Fahrerprofile mit vollständigen Fahrthistorien und risikorelevanten Funktionen; (3) Trainieren und validieren Sie das Risikomodell anhand synthetischer Daten und vergleichen Sie dann die Genauigkeit und Stabilität mit Modellen, die auf realen Daten trainiert wurden, sofern verfügbar. Durch die Validierung wurde sichergestellt, dass die synthetische Verteilung mit den wichtigsten Statistiken aus der Praxis übereinstimmte.

Datenquellen

Synthetische Fahrerprofile (über 500.000) mit Fahrthistorie, Fahrzeugtyp und geografischen Tags. Reale Telematik-Benchmarks (intern, anonymisiert), die nur zur Kalibrierung und Validierung verwendet werden – keine individuellen Fahrerdaten im Trainingssatz. Risikokennzeichnungen und 17 verhaltensbasierte Merkmale (z. B. Häufigkeit starker Bremsungen, Anteil an Nachtfahrten, Kilometerleistung), abgeleitet von der synthetischen Engine. Keine personenbezogenen Daten; keine Einwilligung erforderlich; keine Compliance-Verzögerung.

Wir haben es in die Forschung und Entwicklung integriert

Das Risikomodell wird jetzt von Sicherheitstechnik- und Datenwissenschaftsteams verwendet, um Fahrzeugsysteme zu testen, Garantieprognosen zu erstellen und Experimente zur Versicherungspreisgestaltung zu unterstützen – ohne dass Live-Fahrerdaten erforderlich sind oder auf Datenerfassungszyklen gewartet werden muss.

„Früher haben wir sechs Monate auf genügend Fahrdaten gewartet. Jetzt können wir simulieren, was wir brauchen – über Nacht.“

— Leitender Datenwissenschaftler, Fahrzeugsicherheit

Wir haben das Risiko buchstäblich reduziert

Durch die Entfernung sensibler Kundendaten aus der Schulungspipeline eliminierte das Unternehmen Compliance-Risiken und gewann an Geschwindigkeit. Durch die Verwendung von synthetischen Randgehäusen steigerten sie die Robustheit des Modells. Und da sie alles intern entwickeln, verfügen sie nun über ein wiederholbares Framework für jede zukünftige Version. Visuals Dazu gehörten Verteilungsdiagramme synthetischer vs. Benchmark-Daten, Risikobewertungs-Heatmaps nach Fahrersegment und Validierungsberichte, in denen die Modellleistung synthetischer vs. realer Holdout-Daten verglichen wurde.

Zeitplan für die Umsetzung

Wochen 1–4: Anforderungen, Zugriff auf Telematik-Benchmarks und Generatordesign. Wochen 5–8: Generierung synthetischer Daten (500.000 Profile) und Validierung anhand von Benchmarks. Wochen 9–12: Modellschulung, Validierung (93 % Benchmark) und Integration in F&E-Workflows. Woche 13–14: Übergabe und Dokumentation. End-to-End-Lieferung in weniger als vier Monaten – vs. Sechs+ Monate für einen typischen Echtdatenerfassungs- und Compliance-Zyklus.

Machen Sie den nächsten Schritt

Erfahren Sie, wie Intellimark Ihnen dabei helfen kann, KI sicher zu trainieren – mit synthetischen Daten, die sich schneller als die Realität bewegen.

Kontaktieren Sie uns

Ergebnis

Der Autohersteller trainierte seine Modelle, ohne echte Fahrerdaten zu berühren:

Metriken/Ergebnisse

500,000+ synthetische Fahrerprofile erstellt

93% Genauigkeitsbenchmark im Vergleich zu realen Daten

17 Risikovariablen, die über alle Fahrbedingungen hinweg simuliert werden

<4 Monate vom Kickoff bis zur Produktion im Vergleich zu mehr als 6 Monaten für den Ansatz mit echten Daten

Flosse.

Synthetische Daten gaben ihnen, was echte Daten nicht konnten: Geschwindigkeit, Abdeckung und Kontrolle.

Entdecken Sie mehr

Forschung · Analytik

Nabe · Erfahrung mit Wirkung