KI-Sichtbarkeit: Technik, Standards & Implementierung

Technische Dokumentation: llms.txt, Schema.org, IndexNow, MCP, A2A, TDMRep, AIPREF und 29+ unterstützte KI-Crawler.

Dieser Artikel richtet sich an Entwickler, SEO-Experten und technisch interessierte Studiobetreiber. Er erklärt im Detail, welche Standards und Technologien hinter der KI-Sichtbarkeit auf fitnessstudiovergleich.de stehen.

Was ist KI-Sichtbarkeit?

KI-Sichtbarkeit bedeutet, dass ein Fitnessstudio in den Antworten von KI-Systemen wie ChatGPT, Gemini, Claude, Copilot oder Perplexity auftaucht. Damit das funktioniert, müssen strukturierte Daten in standardisierten Formaten bereitgestellt werden, die KI-Crawler lesen und verarbeiten können.

Unsere Plattform übernimmt diese Arbeit automatisch für alle Studios mit Plus- oder Premium-Abo.

KI-Profil (ab Plus)

Für jedes Studio ab dem Plus-Abo wird ein KI-Profil generiert – eine Sammlung maschinenlesbarer Dateien unter /gym/{studio-slug}/, die KI-Systemen alle relevanten Informationen bereitstellt.

KI-Profil Datei Beschreibung
KI-Beschreibung llms.txt, llms-full.txt Maschinenlesbare Beschreibung im llmstxt.org-Format
Strukturierte Daten structured-data.json Schema.org JSON-LD (Typ: HealthClub) für Google, Bing und KI-Systeme
Profilseite index.md Studio-Profil im Markdown-Format für KI-Crawler
Meta-Daten (inline) KI-Meta-Tags, Schema.org JSON-LD und KI-Tag im HTML der Studio-Seite

Die Dateien werden täglich durch unseren Sitemap-Generator aktualisiert und in der Sitemap mit changefreq: daily indexiert.

KI-Push (Premium)

Premium-Studios profitieren von Aktiver Indexierung: Wenn sich Studio-Daten ändern, werden die wichtigsten KI-Systeme und Suchmaschinen direkt benachrichtigt – nicht erst beim nächsten Crawl.

Dienst Übermittlung Beschreibung
OpenAI ChatGPT Bing Content Submission API ChatGPT Search nutzt den Bing-Index als Datenquelle
Google Gemini Google Indexing API Beschleunigt Aufnahme in Google AI Overviews und Gemini
Microsoft Copilot Bing Content Submission API Copilot verwendet Bing-Daten als Grounding-Quelle
IndexNow IndexNow-Protokoll Benachrichtigt alle weiteren Suchmaschinen und Crawler (Bing, Yandex, Naver, Seznam u.a.)

Plattform-Level Infrastruktur

Neben den Studio-spezifischen Dateien betreiben wir eine umfangreiche Plattform-Level-Infrastruktur, die allen KI-Systemen als Einstiegspunkt dient.

Kerndateien

Datei Zweck Link
llms.txt Plattform-Kurzübersicht für LLMs /llms.txt
llms-full.txt Erweiterte Version mit Beispiel-Studios /llms-full.txt
structured-data.json Schema.org JSON-LD Manifest /structured-data.json
openapi.yaml OpenAPI 3.1 Dokumentation /openapi.yaml
ai.txt KI-Crawler-Metadaten (Einstiegspunkte, Lizenz, Crawl-Hinweise) /ai.txt

KI-Metadaten (.well-known/ai-metadata/)

Datei Standard Link
model.jsonld Schema.org SoftwareApplication /.well-known/ai-metadata/model.jsonld
webpage.jsonld Schema.org WebPage /.well-known/ai-metadata/webpage.jsonld
dataset.croissant.json Croissant ML Datensatz-Beschreibung /.well-known/ai-metadata/dataset.croissant.json
dcat.jsonld W3C DCAT v3 Datenkatalog /.well-known/ai-metadata/dcat.jsonld

Agenten-Erkennung

Zwei Protokolle ermöglichen es KI-Agenten, unsere Plattform automatisch zu entdecken und zu nutzen.

MCP Well-Known Discovery

Die Datei /.well-known/mcp/servers.json folgt dem Model Context Protocol-Standard. MCP-kompatible Clients wie Claude Desktop, Cursor oder VS Code können unsere Suchfähigkeiten automatisch erkennen.

A2A Agent Card

Die Datei /.well-known/agent-card.json implementiert Googles Agent-to-Agent Protocol. Damit können A2A-kompatible Systeme (Google, AWS Bedrock, IBM und 50+ Partner) unsere Fähigkeiten entdecken.

Meta-Daten

Inline LLM Script Tags

Auf allen Seiten befindet sich ein globales <script type="text/llms.txt">-Tag im HTML-Head mit einer Plattform-Kurzbeschreibung. Auf Studio-Detailseiten (nur Plus/Premium) kommt ein zusätzliches studio-spezifisches Tag hinzu. Dieses Format folgt dem Vercel-Vorschlag für inline LLM-Anweisungen.

Browser ignorieren den unbekannten type-Wert – die Tags sind ausschließlich für KI-Crawler sichtbar.

KI-Meta-Tags

Jede Seite enthält spezialisierte Meta-Tags, die KI-Systemen helfen, den Inhalt einzuordnen:

Meta-Tag Beispielwert Zweck
ai:content_type local_business_profile Seitentyp für KI-Systeme
ai:summary Beschreibungstext Kurzfassung des Inhalts
ai:page_type content_page Seitenklassifikation
ai:data_freshness 2025-06-01 Aktualität der Daten
ai:target_audience fitness_interested_people Zielgruppe
ai:geographic_focus Berlin Geografischer Bezug
ai:content_category business_profile Inhaltskategorie

Zusätzlich werden Dublin Core Metadaten (dc:language, dc:creator, dc:publisher, dc:date) für standardisierte Ressourcenbeschreibung gesetzt.

Im HTML-Head jeder Seite verweisen <link>-Tags auf die wichtigsten KI-Dateien:

  • llms.txt – LLM-Kontextdatei
  • structured-data.json – Schema.org Manifest
  • openapi.yaml – API-Dokumentation
  • model.jsonld, dataset.croissant.json, webpage.jsonld – KI-Metadaten
  • dcat.jsonld – W3C DCAT Datenkatalog

Auf Studio-Detailseiten (ab Plus) kommen zusätzliche Links zu den studio-spezifischen KI-Dateien hinzu (llms.txt, llms-full.txt, structured-data.json, index.md).

Schema.org Structured Data

Jede Seite enthält mehrere JSON-LD-Blöcke mit Schema.org-Daten:

Schema Seiten Inhalt
Organization alle Plattform-Informationen, Kontakt, Logo
WebSite alle Website-Beschreibung mit SearchAction
WebPage alle Seitenmetadaten, Speakable-Spezifikation
HealthClub Studio-Detail Name, Adresse, Geo, Öffnungszeiten, Tarife, Bewertungen
FAQPage Studio-Detail Frage-Antwort-Paare
BreadcrumbList Studio, Artikel Navigationsstruktur
CollectionPage Suchergebnisse Auflistung der gefundenen Studios
Article Artikel Überschrift, Autor, Veröffentlichungsdatum

Studio-Seiten enthalten außerdem SpeakableSpecification für Sprachassistenten und ReserveAction für die Probetraining-Buchung.

IETF AIPREF Content-Usage

Jede HTML-Antwort enthält den HTTP-Header und das Meta-Tag:

Content-Usage: train-ai=y, search=y, ai-input=y

Dieser Header folgt dem aktuellen IETF AIPREF Working Group-Entwurf und signalisiert KI-Systemen standardisiert, dass unsere Inhalte für Training, Suche und Inference verwendet werden dürfen.

Compliance & Rechte

W3C TDMRep

Die Datei /.well-known/tdmrep.json implementiert den W3C TDMRep-Standard. Sie signalisiert EU-konform (Digital Single Market Directive), dass Text- und Data-Mining auf unseren Inhalten erlaubt ist.

Cloudflare Content Signals

In der robots.txt ist ein Cloudflare Content Signal Kommentar enthalten:

# Content-Signal: search=yes, ai-train=yes, ai-input=yes

Lizenzen

Alle KI-bezogenen Inhalte stehen unter CC-BY-4.0 Lizenz (siehe ai.txt).

Unterstützte KI-Crawler

Unsere robots.txt erlaubt explizit den Zugriff für 29+ KI-Crawler User-Agents:

OpenAI: GPTBot, OAI-SearchBot, ChatGPT-User

Anthropic: ClaudeBot, Claude-SearchBot, Claude-User, Claude-Web, Anthropic-AI

Google: Google-Extended, Google-CloudVertexBot, GoogleAgent-Mariner, Googlebot

Meta: FacebookBot, Meta-ExternalAgent, Meta-ExternalFetcher

Microsoft: Bingbot

Apple: Applebot, Applebot-Extended

Weitere: PerplexityBot, Perplexity-User, Amazonbot, Bytespider, CCBot, cohere-ai, DeepSeekBot, DuckAssistBot, MistralAI-User, Diffbot, YandexBot

Die Liste wird laufend aktualisiert, wenn neue KI-Systeme erscheinen.

GEO/AEO Content-Optimierung

Alle Studio-Beschreibungen und KI-Dateien folgen den Best Practices für Generative Engine Optimization (GEO) und Answer Engine Optimization (AEO):

  • Faktenbasierte Sätze: Klare Entity-Konsistenz (z.B. „{Name} ist ein Fitnessstudio in {Stadt}. Tarife ab EUR{Preis}/Monat.")
  • Strukturierte Preistabellen: Tarife als maschinenlesbare Angebote (Schema.org Offer)
  • FAQ-Format: Frage-Antwort-Paare mit FAQPage-Schema
  • Klare Heading-Hierarchie: H2/H3-Struktur für einfaches Parsing

KI-Sichtbarkeits-Score

Jedes Studio erhält einen Score von 0-100, der die KI-Sichtbarkeit misst. Der Score setzt sich aus drei Kategorien zusammen:

Profilvollständigkeit (max. 52 Punkte)

  • Basisdaten vorhanden (Name, Adresse, Telefon, E-Mail)
  • Profilbild vorhanden
  • Beschreibung mit mehr als 100 Zeichen
  • Öffnungszeiten für 5+ Tage konfiguriert
  • Mindestens 3 Fotos
  • Mindestens ein Tarif mit Preis
  • Website-URL, Ausstattung, Bewertungen, Zusatzleistungen
  • FAQs (ab Basis)
  • Studio-Videos (ab Basis)
  • Aktive Neuigkeiten & Aktionen (ab Basis)
  • Auszeichnungen (ab Basis)
  • Social-Media-Präsenz (Facebook, Instagram, TikTok, YouTube)

KI-Funktionen (max. 35 Punkte)

  • KI-Profil: KI-Beschreibung, Strukturierte Daten, Profilseite, Meta-Daten (ab Plus)
  • KI-Push: OpenAI ChatGPT, Google Gemini, Microsoft Copilot, IndexNow (Premium)

Top Platzierung (max. 13 Punkte)

  • Sichtbarkeitsradius (2km Basis / 5km Plus / 10km Premium)

Maximaler Score nach Abo-Stufe

Stufe Max. Score
Free 36
Basis 57
Plus 83
Premium 100

Studios sehen ihren Score, die Aufschlüsselung nach Kategorie und konkrete Verbesserungsvorschläge direkt im Dashboard.

Häufig gestellte Fragen (FAQ)

Werden die Dateien automatisch aktualisiert? Ja. Der Sitemap-Generator läuft täglich und aktualisiert alle Dateien. Zusätzlich werden bei jeder Studio-Änderung sofort IndexNow- und Google-Benachrichtigungen ausgelöst.

Muss ich als Studiobetreiber etwas technisches tun? Nein. Die gesamte KI-Infrastruktur wird automatisch verwaltet. Du musst lediglich dein Studio-Profil aktuell halten.

Welche Standards werden verwendet? llmstxt.org, Schema.org (HealthClub), OpenAPI 3.1, Croissant ML, W3C DCAT v3, W3C TDMRep, IETF AIPREF, MCP Well-Known, Google A2A, IndexNow und Cloudflare Content Signals.

Was passiert, wenn neue KI-Standards erscheinen? Wir beobachten die Entwicklung kontinuierlich und integrieren neue Standards, sobald sie relevant werden. Studios müssen nichts unternehmen.

Fazit

KI-Profil und KI-Push umfassen über 15 verschiedene Standards und Protokolle, die zusammenwirken, damit Fitnessstudios in KI-Antworten empfohlen werden. All das läuft vollautomatisch im Hintergrund – Studiobetreiber müssen sich nur um ihr Profil kümmern.