Produktdaten mit KI optimieren: So werden aus lückenhaften Texten umsatzstarke Produktseiten

Ein Produktkatalog mit 5.000 Artikeln, davon 2.000 ohne vernünftige Beschreibung, 800 falsch kategorisiert und ein Drittel ohne relevante SEO-Attribute — das ist kein Worst-Case-Szenario, sondern der Alltag vieler mittelständischer Online-Shops. Die Folge: Produkte, die niemand findet, Retouren wegen falscher Erwartungen und ein Shop, der bei Google hinter der Konkurrenz verschwindet.
Die gute Nachricht: Genau dieses Problem lässt sich heute mit KI-gestützten Werkzeugen deutlich schneller lösen als noch vor zwei Jahren. Aber — und das ist entscheidend — nicht per Knopfdruck und nicht ohne menschliche Qualitätskontrolle. Dieser Beitrag zeigt, was KI bei Produktdaten realistisch leisten kann, wo die Grenzen liegen und wie ein E-Commerce-Team im Mittelstand damit konkret starten kann.
Warum Produktdaten über Umsatz entscheiden
Laut einer Studie des Baymard Institute brechen 20 % der Kaufabbrüche im E-Commerce direkt mit unzureichenden oder unklaren Produktinformationen zusammen. Ategra (ehemals Akeneo) beziffert den Umsatzverlust durch schlechte Produktdaten auf bis zu 25 % des potenziellen Online-Umsatzes.
Für einen mittelständischen Shop mit einem Jahresumsatz von 2 Millionen Euro bedeutet das: bis zu 500.000 Euro, die auf dem Tisch liegen bleiben. Nicht wegen eines schlechten Produkts, sondern weil die Produktseite nicht überzeugend genug war.
Typische Probleme, die KMUs im Tagesgeschäft kennen:
Herstellertexte als Produktbeschreibung übernommen — identisch mit dutzenden anderen Shops, null SEO-Wert
Fehlende Attribute wie Material, Maße oder Pflegehinweise — kritisch für Filter und Vergleichbarkeit
Inkonsistente Kategorisierung — Produkte tauchen in falschen Kategorien auf oder fehlen in relevanten Filtern
Kein internes Team für Content — der Einkauf pflegt Produkte ein, Texte bleiben auf der Strecke
Wer diese Probleme manuell lösen will, braucht bei 5.000 Produkten schnell mehrere Monate Vollzeit-Arbeit. Genau hier wird KI zum Hebel.
Was KI bei Produktdaten heute realistisch leisten kann
Bevor wir in die Praxis einsteigen, eine ehrliche Einordnung: KI ist kein magischer "Produktdaten reparieren"-Knopf. Was sie sehr gut kann, ist Muster erkennen, Texte generieren und große Mengen strukturieren. Was sie nicht kann: fachliche Korrektheit garantieren oder Marken-Tonalität ohne Briefing treffen.
Drei Bereiche, in denen KI heute den größten Unterschied macht:
1. Produktbeschreibungen generieren und verbessern
Large Language Models wie GPT-5, Claude oder Mistral können aus spärlichen Eingangsdaten — etwa einem Produktnamen, einer EAN und drei Stichworten — eine lesbare, suchmaschinenoptimierte Beschreibung erzeugen. Die Qualität hängt dabei entscheidend vom Prompt-Design ab.
Ein gut strukturierter Prompt liefert erfahrungsgemäß Texte, die in der Mehrzahl der Fälle mit kleinen Anpassungen direkt verwendbar sind. Der Aufwand pro Produkt sinkt von durchschnittlich 20–30 Minuten manueller Texterstellung auf wenige Minuten Review und Feinschliff.
Praxis-Tipp: Erstellen Sie ein Prompt-Template, das Ihre Markensprache, Zielgruppe und gewünschte Textlänge definiert. Füttern Sie es mit den vorhandenen Rohdaten aus Ihrem PIM oder ERP. Die besten Ergebnisse erzielen Sie, wenn Sie dem Modell 3–5 Beispieltexte Ihrer besten Produktseiten als Referenz mitgeben.
2. Automatische Kategorisierung und Tagging
Gerade bei wachsenden Sortimenten wird die Kategorisierung schnell zum Engpass. Ein neuer Lieferant liefert 500 Produkte mit seiner eigenen Kategoriestruktur — und jemand muss diese manuell in den eigenen Kategoriebaum einsortieren.
KI-Modelle können hier auf Basis vorhandener, korrekt kategorisierter Produkte lernen, welches Produkt wohin gehört. Dafür braucht es kein teures Custom-Modell: Ein Embedding-basierter Ansatz mit einem Standardmodell und Ihrem bestehenden Kategoriebaum als Referenz reicht in vielen Fällen aus.
Dasselbe Prinzip funktioniert für Attribut-Extraktion: Aus einem Freitext wie "Rotes Baumwoll-T-Shirt, Größe M, Rundhals" kann KI strukturierte Attribute ableiten — Farbe: Rot, Material: Baumwolle, Größe: M, Ausschnitt: Rundhals. Das klingt trivial, aber bei tausenden Produkten ohne gepflegte Filterattribute ist es ein enormer Zeitgewinn.
3. SEO-Optimierung auf Produktebene
Produktseiten sind die wichtigsten Landingpages eines Online-Shops — und gleichzeitig die am meisten vernachlässigten. KI kann hier gezielt unterstützen:
Meta-Titles und Meta-Descriptions automatisch generieren, angepasst an Suchintention und Zeichenlimit
Alt-Texte für Produktbilder erzeugen — ein SEO-Faktor, den die meisten Shops komplett ignorieren
Duplicate Content erkennen — wenn 200 Produkte identische Herstellertexte haben, ist das ein Google-Ranking-Killer. KI kann Varianten generieren, die inhaltlich gleich, aber textuell einzigartig sind
Interne Verlinkung vorschlagen — auf Basis von Produktbeziehungen, die das Modell aus dem Katalog ableitet
Wer gleichzeitig für klassische Suchmaschinen und KI-gestützte Suchen wie ChatGPT Search oder Google AI Overviews optimieren will, profitiert besonders: Strukturierte, eindeutige Produktdaten sind die Grundlage für beides.
Shopware und Magento: Wo KI-Produktdaten konkret andocken
Die Integration von KI in bestehende Shop-Systeme muss nicht aufwendig sein. Beide großen Plattformen im DACH-Raum bieten Ansatzpunkte:
Shopware 6 hat seit Version 6.5 den AI Copilot integriert — ein Feature-Set, das unter anderem Produktbeschreibungen generieren, Bilder per Prompt erzeugen und Bewertungen zusammenfassen kann. Shopware setzt dabei auf die OpenAI-API, lässt aber auch eigene Modelle anbinden. Für Shops, die bereits auf Shopware 6 laufen, ist das der schnellste Einstieg: kein zusätzliches Tool, keine neue Infrastruktur.
Wer über den eingebauten Copilot hinausgehen will — etwa für Batch-Verarbeitung von tausenden Produkten oder Anbindung an ein PIM-System — kann über die Admin API eigene Workflows aufsetzen. Ein typischer Ansatz: Ein Skript liest Produkte ohne Beschreibung aus der API, generiert Texte via LLM und schreibt sie zurück. Das lässt sich als Cronjob oder manuell gesteuert umsetzen.
Magento 2 (Adobe Commerce) verfolgt mit Adobe Sensei und der GenAI-Integration in Adobe Experience Platform einen ähnlichen Ansatz, allerdings stärker auf Enterprise-Kunden zugeschnitten. Für KMUs auf der Open-Source-Variante von Magento gibt es Plugin-basierte Lösungen und die Möglichkeit, über die REST API eigene KI-Pipelines anzubinden — analog zum Shopware-Ansatz.
Praxis-Tipp: Starten Sie nicht mit dem gesamten Katalog. Identifizieren Sie die 20 % Ihrer Produkte mit dem höchsten Traffic oder Umsatzpotenzial und optimieren Sie dort zuerst. So sehen Sie schnell messbare Ergebnisse, ohne ein monatelanges Projekt zu starten.
Zum Budget: Die reinen API-Kosten für die Textgenerierung sind überschaubar. Bei den gängigen Anbietern liegen sie für 1.000 Produktbeschreibungen — je nach Textlänge und Modell — zwischen 5 und 50 Euro. Der eigentliche Kostenfaktor ist die interne Review-Zeit, nicht die KI selbst.
DSGVO und Qualitätskontrolle: Was beim KI-Einsatz zu beachten ist
Beim Einsatz von KI für Produktdaten gibt es zwei Themen, die E-Commerce-Verantwortliche nicht ignorieren sollten:
Datenschutz: Wenn Produktdaten über eine externe API (z. B. OpenAI, Anthropic) verarbeitet werden, verlassen Daten das eigene System. Bei reinen Produkttexten ist das datenschutzrechtlich in der Regel unproblematisch, da keine personenbezogenen Daten betroffen sind. Anders sieht es aus, wenn Kundenbewertungen oder Nutzerdaten in die Generierung einfließen — hier greifen DSGVO-Anforderungen wie Auftragsverarbeitungsverträge und Zweckbindung.
Wer auf Nummer sicher gehen will, kann auf Self-Hosted-Modelle setzen. Open-Source-LLMs wie Llama 4 oder Mistral Small lassen sich auf eigener Infrastruktur betreiben — mit höherem Aufwand, aber voller Datenkontrolle.
Qualitätskontrolle: Der häufigste Fehler ist, KI-generierte Texte ungeprüft zu veröffentlichen. Auch die besten Modelle halluzinieren gelegentlich — sie erfinden Eigenschaften, verwechseln Maßeinheiten oder beschreiben Features, die das Produkt nicht hat. Das ist nicht nur ein SEO-Problem, sondern kann Retouren und Vertrauensverlust verursachen.
Bewährte Praxis ist ein "Human-in-the-Loop"-Workflow: KI generiert einen Textentwurf, ein Teammitglied prüft, korrigiert und gibt frei. Das klingt nach Mehraufwand, ist aber erfahrungsgemäß immer noch um ein Vielfaches schneller als die rein manuelle Erstellung.
Checkliste: KI-Produktdaten-Projekt im eigenen Shop starten
Wer nach dem Lesen dieses Beitrags konkret loslegen will, kann sich an dieser Reihenfolge orientieren:
Bestandsaufnahme machen: Wie viele Produkte haben keine oder mangelhafte Beschreibungen? Exportieren Sie Ihren Katalog und sortieren Sie nach Textlänge — alles unter 50 Wörtern ist ein Kandidat.
Prioritäten setzen: Fokussieren Sie auf Produkte mit hohem Traffic, hoher Marge oder vielen Seitenaufrufen ohne Conversion. Ihr Analytics-Tool zeigt Ihnen, wo das größte Potenzial liegt.
Prompt-Template erstellen: Definieren Sie Tonalität, Textlänge, Zielgruppe und welche Attribute immer enthalten sein müssen. Testen Sie das Template an 10 Produkten und iterieren Sie.
Pilotprojekt mit 100–200 Produkten: Generieren Sie Texte, lassen Sie sie vom Team prüfen, veröffentlichen Sie sie und messen Sie nach 4–6 Wochen die Auswirkung auf Traffic, Conversion Rate und Retourenquote.
Skalieren: Wenn die Ergebnisse stimmen, rollen Sie den Workflow auf den gesamten Katalog aus. Automatisieren Sie den Export-Generierung-Review-Import-Zyklus so weit wie möglich.
Was sich in den nächsten 12 Monaten verändern wird
Die KI-gestützte Produktdaten-Optimierung steht noch am Anfang einer größeren Entwicklung. Drei Trends zeichnen sich ab:
Multimodale Modelle werden Produktbilder direkt in die Textgenerierung einbeziehen. Statt nur auf Rohdaten zu basieren, analysiert die KI das Produktfoto und leitet daraus Farbe, Material, Stil und Einsatzzweck ab. Google Gemini und GPT-5 zeigen bereits, wohin die Reise geht — und Shopware arbeitet laut eigener Roadmap an einer Vertiefung der AI-Copilot-Features.
KI-Agenten werden Produktdaten-Workflows ganzheitlich steuern: Ein Agent prüft den Katalog auf Lücken, generiert fehlende Texte, schlägt Kategorien vor und erstellt einen Review-Report — alles ohne manuelle Zwischenschritte. Die Rolle des Teams verschiebt sich vom Erstellen zum Kuratieren.
Generative Engine Optimization (GEO) wird SEO ergänzen. Produkte müssen nicht nur für Google ranken, sondern auch für KI-gestützte Kaufberater auffindbar sein. Strukturierte, semantisch reiche Produktdaten werden zur Voraussetzung dafür, dass ein ChatGPT- oder Perplexity-Nutzer Ihr Produkt empfohlen bekommt.
Für E-Commerce-Verantwortliche bedeutet das: Wer jetzt anfängt, Produktdaten systematisch mit KI-Unterstützung aufzubauen, legt das Fundament für die nächste Generation der Produktsuche — egal ob über Google, ChatGPT oder den eigenen Shop.