Fakultät Informatik/Mathematik

Ethische KI im E-Commerce: Vertrauen schaffen, Standards setzen

Generative KI transformiert den E-Commerce mit hoher Geschwindigkeit. Intelligente Chat- und Voice-Bots, automatisierte Produktempfehlungen oder KI-generierte Fashion- und Produktvideos eröffnen neue Potenziale für Kundenerlebnis, Effizienz und Skalierbarkeit. Gleichzeitig entstehen dabei anspruchsvolle ethische, technische und regulatorische Fragestellungen.

Die Kooperation zwischen der Otto Group one.O und der HTW Dresden adressiert diese Herausforderungen konsequent. Unser Ziel: leistungsstarke KI in verantwortungsvolle, transparente und vertrauenswürdige KI-Systeme zu überführen.

Im Zentrum stehen methodische und technische Lösungen, die ethische Anforderungen operationalisieren und entlang der gesamten KI-Wertschöpfungskette absichern. Dazu entwickeln wir konkrete Frameworks, Instrumente und Prototypen, um Fairness, Transparenz und Compliance (insbesondere gemäß EU AI Act) zuverlässig umzusetzen.

Forschungsschwerpunkte

Die gemeinsamen Forschungs- und Entwicklungsschwerpunkte gliedern sich aktuell in drei Bereiche:

 

1.Automatisierte Bewertung von Chatbots

Dieser Forschungsschwerpunkt widmet sich der zentralen Herausforderung, die Sicherheit und Vertrauenswürdigkeit von LLM-gesteuerten Chatbots im E-Commerce systematisch zu gewährleisten. Generative KI-Chatbots bieten zwar erhebliche Vorteile in der Kundenkommunikation, bergen jedoch auch Risiken wieBias, Toxizität, Halluzinationen und inkonsistente Personalisierung. Zur objektiven Beurteilung und Behebung dieser Probleme hat die Kooperation ein umfassendes Framework auf Basis des „LLM-as-a-Judge“-Ansatzes entwickelt.

Dieses Framework ermöglicht eine automatisierte und systematische Bewertung von Chatbot-Antworten über kritische Dimensionen hinweg:

  • Ethische Dimensionen: Voreingenommenheit (Bias), Toxizität und eine verantwortungsvolle Personalisierung.
  • Qualitätsdimensionen: Faktische Korrektheit und Einhaltung der Markensprache (Brand Language).

Die gewonnenen Erkenntnisse dienen als technische Basis für die Entwicklung eines Zertifizierungsrahmens zur Einhaltung zukünftiger Regulierungen (insbesondere des EU AI Act). Ein zentrales Element unserer Arbeit ist die Erstellung des FAIRBOTBENCH [1], eines bilingualen Benchmark-Datensatzes, der speziell für die mehrstufige, transaktionale Natur von E-Commerce-Dialogen konzipiert wurde. Dieser Datensatz, der 600 praxisnahe Dialoge aus diversen Nutzerszenarien umfasst und mit menschen-annotierter Ethik-Bewertung versehen ist, dient als Grundlage für die Entwicklung und Validierung unserer Bewertungsstrategien.

 

2. Ethische KI in visuellen Medien

Im Fokus steht die qualitative und ethische Analyse KI-generierter Fotos und Videos, insbesondere im Fashion-Kontext. Dies umfasst die Entwicklung eines automatisierten Bewertungssystems zur Analyse von Fashion-Videos. Hierfür werden relevante Dimensionen wie Bias, Toxizität, unangemessene Darstellungen oder stereotype Inszenierungen definiert und untersucht. Weiterhin erfolgt die Formalisierung beobachtbarer Merkmale, wie Framing (Kamerawinkel, Bildausschnitte) , Pose-Kategorisierung (neutral vs. sexualisierend) , und die Ableitung quantifizierbarer Indikatoren. Zentral ist auch der Aufbau eines annotierten Goldstandard-Datensatzes mit passenden Positivbeispielen und gezielt generierten Negativbeispielen, die klare Verstöße gegen die definierten Ethik-Kriterien darstellen.

3. KI-gestützte Interaktion im Liveshopping

Dieser Bereich widmet sich dem Einsatz von KI zur Verbesserung der Kundenkommunikation und der Interaktionsqualität in Liveshopping-Formaten. Dazu gehört die Entwicklung KI-basierter Verfahren zur Erkennung auffälliger Chatverläufe und zur Qualitätsbewertung in Echtzeit. Hierbei werden relevante Parameter wie Korrektheit, Bias, Kundensentiment sowie Zielgrößen wie Engagement, Conversion oder Umsatz definiert. Auf Basis dieser Kriterien erfolgt die Konzeptualisierung intelligenter Assistenzfunktionen, die Moderatoren in Echtzeit unterstützen und Interaktionen gezielt verbessern. Abschließend werden die Effekte KI-gestützter Qualitätsmetriken systematisch analysiert, indem Chat- und Interaktionsverläufe mit und ohne KI-Unterstützung verglichen werden.

 

Team

Name Telefon
(0351 462 - )
Raum E-Mail Aufgabenbereich
Hempel, Gunnar (Dr. iur.) 2702 U 621 E-Mail
Janusko, Tamás (M.Sc.) 2096 U 444 E-Mail
Bochnia, Ricardo (M.Sc.) 2156 U 619 E-Mail Digitale Dienstleistungssysteme

Publikationen

[1] Tamás Janusko, Ricardo Bochnia, Gunnar Hempel, Steffen Tomschke, Jürgen Anke, and Maik Thiele: FairBotBench: A Bilingual Benchmark for Evaluating Chatbot Behavior in E-commerce. CONVERSATIONS 2025 - International Symposium on Chatbots and Human-centred AI, Lübeck, Germany, November 12-13, 2025

[2] Tamás Janusko, Tanja Dietrich, Paulus Tamm, Ricardo Bochnia, Gunnar Hempel, Steffen Tomschke, Jürgen Anke, and Maik Thiele: FairBotLive: Exploring Bias, Personalization, and Toxicity in LLM-Powered Chatbots. CONVERSATIONS 2025 - International Symposium on Chatbots and Human-centred AI, Lübeck, Germany, November 12-13, 2025

[3] Tamás Janusko, Ricardo Bochnia, Moritz Harnisch, Anna-Magdalena Krauß, Daniel Richter, Gunnar Hempel, Steffen Tomschke, Jürgen Anke, Maik Thiele: Toward Safer and Trustworthy Chatbots in E-Commerce: An LLM-as-a-Judge Approach for Ethical Evaluation. AIAI (4) 2025: 417-430

Projektleitung