# TAG24 — llms.txt > TAG24 ist ein reichweitenstarkes Nachrichtenportal (Unterhaltung, Politik, Regionales, Sport). Diese Datei dient als LLM-Wegweiser zu zentralen Bereichen und Ressourcen. ## Wichtige Hinweise: - Nutzung: Retrieval/RAG mit klarer Quellenangabe ist erwünscht; Einbeziehung in Trainingsdatensätze ist nicht gewünscht. - Steuerung/Policy: Technische Zugriffsvorgaben und Verbote regeln wir über robots.txt, HTTP-Header/X-Robots-Tag/Meta - Kontakt: Impressum/Datenschutz verlinkt unten; für Rückfragen bitte korrekten User-Agent inkl. Kontakt angeben. ## Überblick - [Startseite](https://www.tag24.de): Aktuelle News aus Deutschland - [Berlin](https://www.tag24.de/berlin): Aktuelle Nachrichten aus Berlin - [Chemnitz](https://www.tag24.de/chemnitz): Aktuelle Nachrichten aus Chemnitz - [Dresden](https://www.tag24.de/dresden): Aktuelle Nachrichten aus Dresden - [Erfurt](https://www.tag24.de/erfurt): Aktuelle Nachrichten aus Erfurt - [Frankfurt](https://www.tag24.de/frankfurt): Aktuelle Nachrichten aus Frankfurt - [Hamburg](https://www.tag24.de/hamburg): Aktuelle Nachrichten aus Hamburg - [Köln](https://www.tag24.de/koeln): Aktuelle Nachrichten aus Köln - [Leipzig](https://www.tag24.de/leipzig): Aktuelle Nachrichten aus Leipzig - [Magdeburg](https://www.tag24.de/magdeburg): Aktuelle Nachrichten aus Magdeburg - [München](https://www.tag24.de/muenchen): Aktuelle Nachrichten aus München - [Stuttgart](https://www.tag24.de/stuttgart): Aktuelle Nachrichten aus Stuttgart - [Unterhaltung](https://www.tag24.de/unterhaltung): Promis, TV/Streaming, Musik, Royals - [Fußball](https://www.tag24.de/fussball): Ergebnisse, Transfermarkt & Spielpläne - [Sport](https://www.tag24.de/sport): Aktuelle Sport-Storys, Meldungen & Ergebnisse - [Tiere](https://www.tag24.de/thema/tiere): Nachrichten über Hunde, Katzen & mehr - [Horoskope](https://www.tag24.de/thema/mystery/horoskope): Aktuelle Horoskope - [Ratgeber](https://www.tag24.de/ratgeber): Tipps zu Gesundheit, Ernährung & Alltag ## Unternehmen - [Karriere](https://www.tag24.de/karriere): Jobs & Einstieg - [Leitbild](https://www.tag24.de/unternehmen/leitbild): Mission & Werte - [Redaktionen & Standorte](https://www.tag24.de/unternehmen/redaktionen): Teams & Redaktionen ## Sitemaps - https://www.tag24.de/sitemap_tag24.xml - https://www.tag24.de/sitemap/googlenews - https://www.tag24.de/sitemap_tag24_d.xml ## Kontakt & Rechtliches - [Impressum](https://www.tag24.de/impressum): Impressum - [Datenschutz](https://www.tag24.de/datenschutz): Datenschutz - [AGB](https://www.tag24.de/agb): Allgemeine Geschäftsbedingungen ## Standards & Steuerung - https://www.tag24.de/robots.txt # --------------------------------------------------------------------------- # Bot Access Policy (informativ) # Definitionen: # - Allow-Training: Gestattet die Nutzung für Modelltraining/Fine-Tuning. # - Allow-Retrieval: Gestattet Indexierung/Embeddings/RAG mit Quellenangabe. # - Nicht gelistete Bots folgen der Default-Regel. # --------------------------------------------------------------------------- - User-agent: ccbot # Common Crawl aggregiert Daten für Trainingskorpora – nicht erwünscht. Allow-Training: no Allow-Retrieval: no # Default Rule for Unspecified or Future Bots - User-agent: * Allow-Training: no Allow-Retrieval: yes # --------------------------------------------------------------------------- # Bedingungen für Retrieval/RAG # --------------------------------------------------------------------------- # • Quellenpflicht: Deutliche Nennung „TAG24“ + klickbarer Link zur Original-URL. # • Snippet-Grenze: max. 200 Wörter fortlaufender Text je Abfrage. # • Kein Volltext-Republishing, kein systematisches Archivieren. # • Paywalls/Cache-Control/Canonicals/ETag/If-Modified-Since respektieren. # • Moderate Rate: ≤ 1 Request/Sekunde, ≤ 4 gleichzeitige Verbindungen. # • Korrekte UA-Kennung + gültige Kontaktadresse im UA-String.