Sprachbasierte Interaktion rückt in Fahrzeugen in den Fokus: Forschende der Purdue University haben große Sprachmodelle in ein automatisiertes Testfahrzeug eingebunden und zeigen, dass Natürliche Sprachverarbeitung das Fahrverhalten personalisieren kann. Die Studie untersucht, wie LLMs wie ChatGPT oder vergleichbare Systeme auf Passagierwünsche reagieren und welche Hürden für eine praktische Umsetzung bestehen.
Untersucht wurden Reaktionen auf direkte und indirekte Anweisungen sowie die Integration von Sensorinformationen. Ergebnisse deuten auf bessere Verständigung, mehr Fahrkomfort und neue Einsatzfelder für Sprachassistenten im Automobilsektor hin – dennoch bleiben technische und regulatorische Fragen offen.
Integration großer Sprachmodelle in automatisierte Fahrzeuge und erste Ergebnisse
Das Kernexperiment der Forschungsgruppe um Ziran Wang an der Purdue University verband das Bord-Spracherkennungssystem eines Versuchsfahrzeugs mit Cloud-basierten LLMs. Eingaben von Testpersonen reichten von klaren Befehlen bis zu indirekten Äußerungen wie „Mir ist gerade ein bisschen übel“.
Versuchsaufbau, Funktionsweise und messbare Effekte
Vor den Tests wurden die Modelle mit unterschiedlichen Prompt-Strategien trainiert, um Verkehrsregeln, Wetterdaten und Sensoreingaben zu berücksichtigen. Das System wandelte vom LLM generierte Anweisungen in Steuerbefehle für das Drive-by-Wire-System um.
Die Forschenden berichteten, dass Teilnehmende eine geringere Unzufriedenheit mit Fahrentscheidungen angaben als bei herkömmlichen SAE-Level-4-Systemen ohne LLM-Unterstützung. Zudem übertraf das automatisierte Fahrzeug Benchmarks zu Beschleunigungs- und Bremsverhalten, selbst bei neuen, nicht zuvor gelernten Sprachbefehlen.

Technische Chancen und offene Herausforderungen für Sprachverarbeitung im Auto
Die Studie hebt die Vorteile der Sprachverarbeitung hervor: intuitive Bedienung, weniger Ablenkung für Fahrende und höhere Barrierefreiheit für mobilitätseingeschränkte Personen. Dialogsysteme ermöglichen den Zugriff auf Navigation, Mediensteuerung und Informationen zum Zielort durch natürlichsprachliche Interaktion.
Verarbeitungszeit, Halluzinationen und regulatorische Hürden
Gleichzeitig identifizierten die Forscher technische Grenzen. Die durchschnittliche Latenz betrug etwa 1,6 s pro Befehl, was in nicht zeitkritischen Situationen akzeptabel ist, in schnelleren Konfliktszenarien jedoch verbessert werden muss. Ein weiteres Problem sind sogenannte „Halluzinationen“ von Modellen, also die Generierung falscher Fakten.
Vor einer breiten Umsetzung fordern die Autoren klare Prüf- und Zulassungsprozesse. Hersteller müssten Sicherheitsmechanismen implementieren und Behörden die Zulassung intelligenter Sprachassistenten für fahrrelevante Entscheidungen klären.
Breitere Auswirkungen für die Automobilbranche und Zukunftstechnologien
Über die direkte Fahrsteuerung hinaus eröffnen Maschinelles Lernen und Künstliche Intelligenz neue Anwendungsfelder in Entwicklung und Test: Bosch Engineering und andere Anbieter sehen LLMs als Werkzeug im Requirements- und Test-Engineering, etwa zur Verbesserung von Lastenheften und Zeitersparnis im Entwicklungsprozess.
Car-to-Car-Kommunikation und multimodale Modelle als nächste Schritte
Das Purdue-Team plant weitere Versuche, unter anderem die Nutzung großer Sprachmodelle für die Car-to-Car-Kommunikation an Kreuzungen sowie den Einsatz großer Sichtmodelle für widrige Wetterbedingungen. Erste Vergleiche mit Alternativen wie Googles Gemini und Metas Llama zeigten, dass ChatGPT bislang bei manchen Sicherheits- und Effizienzindikatoren vorn lag, die finale Publikation steht noch aus.
Für die Branche stellt sich die Frage, wie sich Sprachbasierte Interaktion in bestehende Architekturen einfügt und welche Schnittstellen zu Sensorik, Spracherkennung und Echtzeitsteuerung nötig sind. Die Integration wird sowohl die Produktentwicklung als auch regulatorische Standards beeinflussen und ist ein zentraler Punkt der Debatte um die Zukunftstechnologien der Mobilität.





