Ein Shop kann heute gleichzeitig bei Google auf Platz 1 stehen, eine solide Conversion Rate haben – und in ChatGPT überhaupt nicht vorkommen. Kein schlechtes Ranking. Nicht existent. Wer das nicht misst, merkt es erst, wenn der Wettbewerb in KI-Antworten bereits empfohlen wird und die eigenen Zahlen unauffällig stabil bleiben. Genau diese Lücke sollen die neuen KI-KPIs sichtbar machen – bevor sie zum Umsatzproblem wird.
Wer heute verstehen will, ob sein Shop in KI-Suchen wie ChatGPT, Perplexity oder Google AI Overviews gefunden wird, ob KI-gestützte Empfehlungen wirklich zu mehr Umsatz führen und ob KI-Tools im Team genutzt werden, braucht andere Messgrößen als Bounce Rate und ROAS.
Die Digital Commerce Performance Roadmap (DCPR) von Blackbit ergänzt das klassische KPI-Set um 13 KI-spezifische Kennzahlen, gegliedert nach den drei DCPR-Themen Launch & Ernte, Optimierung und Expansion. Dieser Artikel erklärt alle 13 – was gemessen wird, womit und was realistische Zielwerte bedeuten.
Die Wahrscheinlichkeit, dass ChatGPT, Perplexity oder Google AI Overviews Ihren Shop überhaupt zitieren, hängt heute schon von Entscheidungen ab, die Sie nicht messen. Schema.org-Markup, robots.txt-Einstellungen, Autorensignale – wer diese Hygiene-KPIs nicht kennt, weiß nicht, ob sein Shop für KI-Systeme überhaupt sichtbar ist, geschweige denn empfohlen wird.
Das ist kein Zukunftsthema. Kaufentscheidungen verlagern sich bereits in KI-Antworten – Wettbewerber, die diese Lücke früher schließen, bauen einen Vorsprung auf, der sich nicht über Nacht aufholen lässt: Sichtbarkeit in generativen Antworten verstärkt sich selbst, je häufiger ein Anbieter zitiert wird, desto wahrscheinlicher wird er erneut zitiert. Wer heute keine Baseline misst, vergleicht sich in sechs Monaten mit niemandem – er weiß schlicht nicht, wo er steht.
Klassische Performance-Kennzahlen messen Verhalten auf der eigenen Plattform. Was davor passiert – ob ein Shop in einer KI-Antwort empfohlen wird, bevor jemand überhaupt sucht – bleibt unsichtbar. KI-KPIs schließen genau diese Lücke: Sie messen Sichtbarkeit in generativen Suchsystemen, die Wirkung von KI-Features im Shop und die KI-Nutzung im Team.
In der Launch- und Ernte-Phase geht es darum, überhaupt gefunden und als vertrauenswürdig eingestuft zu werden – von Suchmaschinen genauso wie von KI-Systemen.
Misst, wie viel Prozent der Seiten korrektes strukturiertes Markup tragen. Voraussetzung dafür, dass KI-Systeme eine Seite überhaupt korrekt einordnen können. Tools: Screaming Frog, Google Search Console.
Prüft, ob GPTBot und PerplexityBot die Seiten indexieren dürfen. Wer GPTBot in der robots.txt blockiert, reduziert die Wahrscheinlichkeit deutlich, in ChatGPT-Antworten als Quelle berücksichtigt zu werden – unabhängig von Content-Qualität oder GEO-Score. Tools: Screaming Frog, Google Search Console.
Ein von Blackbit eingesetzter Composite-Index, der misst, wie sichtbar eine Marke in generativen KI-Antworten von ChatGPT, Perplexity, Google AI Overviews und Copilot erscheint. Berechnet über Conductor Intelligence (Alternativen: Rankscale, Profound, Otterly.ai) anhand eines festen Sets von Benchmark-Prompts. Zielwert: +20 % gegenüber Baseline in 6 Monaten.
Eigene Brand-Mentions im Verhältnis zu Wettbewerber-Mentions in KI-Antworten, gemessen über dasselbe Benchmark-Prompt-Set wie der GEO Score. Zielwert: > 25 % SoV im DACH-Benchmark. Tool: Conductor.
Anteil aller Website-Besuche, die nachweislich aus KI-Antworten stammen – erkennbar über Referrer wie chatgpt.com oder perplexity.ai. Relevant für Attribution: Ohne Baseline lässt sich später nicht belegen, ob GEO-Maßnahmen gewirkt haben. Tool: Google Analytics 4.
Ein Audit-basierter Composite aus messbaren Vertrauensfaktoren: Autorenprofile mit Schema.org-Auszeichnung, About-Seite, Backlink-Qualität, Bewertungen, HTTPS, Impressum. Relevant, weil KI-Systeme Quellen mit strukturierten Autorensignalen nachweislich häufiger zitieren. Zielwert: > 75/100. Tool: Conductor.
Tonalität von Nutzerfeedback und externen Erwähnungen aus Reviews, Social Media und Foren. Werte sind toolabhängig – sinnvoll ist, ein Tool konsequent zu nutzen und die Entwicklung zu beobachten statt Absolutwerte zu vergleichen. Zielwert: > 70 % positive Erwähnungen. Tool: Conductor, Brand24, Mention.
Sobald Sichtbarkeit besteht, entscheidet die Optimierungsphase darüber, ob aus Aufmerksamkeit auch Umsatz wird.
Gemessen über Post-Conversation-Befragung direkt nach dem Gespräch. Der Zielwert > 4,0/5,0 ist ein Orientierungswert – sinnvoller als ein absoluter Vergleich ist die eigene Baseline vor dem ersten Chatbot-Update, gegen die spätere Werte verglichen werden. Tools: Intercom, HubSpot Service Hub.
Anteil aller Suchanfragen im Shop, die zu einem Klick auf ein Ergebnis führen – kein Null-Ergebnis, kein sofortiger Abbruch. Zielwert: > 70 %. Tools: DooFinder, Algolia
Conversion-Effekt von KI-Empfehlungen gegenüber nicht-personalisierter Standardansicht, gemessen per A/B-Test. Orientierungswert: > 15 % Uplift; in der Praxis berichten Nosto-Kunden je nach Kategorie und Traffic von 10–30 %. Tool: Nosto.
Misst, ob Personalisierung den Customer Lifetime Value messbar erhöht. Zielwert + 10 % in 6 Monaten ist ambitioniert – sinnvoller ist, zunächst eine Baseline zu etablieren und dann quartalsweise zu beobachten. Tool: HubSpot CRM.
Expansion gelingt nur, wenn Team und Prozesse mit der KI-Strategie mitwachsen.
Anteil der Teammitglieder, die KI-Tools in einem definierten Zeitraum aktiv genutzt haben – gemessen über Login-Daten und Nutzungsevents, nicht über Lizenzanzahl. Zielwert: > 70 % aktive Nutzung nach 3 Monaten. Tools: Microsoft 365 Admin Center, Notion Analytics.
Durchschnittliche Zeit vom Content-Briefing bis zur Freigabe. Misst, ob KI-Schreibassistenz die Content-Produktion beschleunigt. Zielwert: Reduktion > 30 % gegenüber dokumentierter Baseline. Tools: Pimcore Editorial Workflow, Jira.
Nicht alle 13 KPIs lassen sich gleichzeitig einführen. Für den Einstieg:
KI-KPIs im E-Commerce sind Kennzahlen, die messen, wie gut ein Online-Shop in generativen KI-Systemen sichtbar ist, wie effektiv KI-Funktionen im Shop wirken und wie tief das Team KI-Tools im Arbeitsalltag nutzt. Die DCPR von Blackbit gliedert 13 solcher KPIs entlang der drei Themen Launch & Ernte (Schema.org-Abdeckung, KI-Crawl-Status, GEO Score, AI Share of Voice, AI-Traffic %, E-E-A-T Score, Sentiment Score), Optimierung (Chatbot-CSAT, Semantische Sucherfolgsrate, Personalisierungs-Uplift %, CLV-Steigerung) und Expansion (AI Adoption Rate, Time-to-Content). Gemessen werden sie mit Tools wie Conductor, GA4, Nosto und HubSpot – monatlich im DCPR-Quartalsrhythmus. Blackbit setzt diese KPIs bei mittelständischen E-Commerce-Unternehmen im DACH-Raum ein, um KI-Investitionen steuerbar und nachweisbar zu machen.
Weiterführend:
→ Was ist die DCPR? Das Wachstumsrahmenwerk für E-Commerce erklärt
→ GEO Score: Wie sichtbar ist Ihr Shop in ChatGPT und Perplexity?