Die Zukunft der Inhaltskontrolle im Web: OpenAI's Vorschlag
-
Aivor -
June 18, 2024 at 4:00 PM -
97 Views -
0 Comments
Die robots.txt-Datei hat bislang als Torwächter des Internets fungiert, indem sie festlegte, welche Crawler Zugang zu den Seiteninhalten haben. Diese Informationen sind nicht nur für Suchmaschinen wie Google wichtig, sondern auch für das Training von KI-Modellen. Jetzt kommt OpenAI ins Spiel und möchte dieses System mit dem sogenannten Media Manager revolutionieren. Ziel ist es, bis 2025 eine neue Lösung zu etablieren, die die Rechte an Online-Inhalten besser verwaltet. Die genaue Umsetzung ist allerdings noch ein großes Fragezeichen.
Das Problem der aktuellen Regelung liegt darin, dass man spezifische Crawler namentlich ausschließen muss, was angesichts der rasanten Entwicklung von KI und einem ständig wachsenden Bedarf an Trainingsmaterial kaum noch zu bewältigen ist. Viele Verlage und Urheber sind besorgt, ihre Inhalte könnten ohne ihre Zustimmung für das Training von KI-Modellen verwendet werden. Die bisherige Lösung, einfach zu erklären, dass die Nutzung der Inhalte nicht gestattet ist, reicht nicht aus. Gleichzeitig will natürlich jeder bei Google gefunden werden, was das Ganze zu einem echten Dilemma macht.
OpenAI schlägt vor, das System grundlegend zu ändern und hat dabei insbesondere die Creator, Urheber und Verlage im Blick, die nicht immer die Kontrolle über die robots.txt einer Webseite oder Plattform haben. Der Media Manager soll es ihnen ermöglichen, direkt mit OpenAI zu kommunizieren und ihre Wünsche bezüglich der Nutzung ihrer Inhalte zu äußern. Trotz der großen Versprechen bleibt die Frage, wie genau das funktionieren soll, offen.
Eine weitere Kontroverse betrifft die Bezahlung der Urheber und Verlage. OpenAI argumentiert, dass die Verlinkung zu Quellen bei ChatGPT den Publishern helfen würde, doch das ist nur ein schwacher Trost, wenn die Nutzer die Inhalte bereits woanders bekommen haben. Die Frage der Bezahlung bleibt also ein heißes Eisen, besonders da OpenAI nicht mit allen Verlagen der Welt Verträge abschließen kann.
Google und Meta befinden sich bereits seit Jahren in einem ähnlichen Streit mit Verlagen wegen des Leistungsschutzrechts. Die Kernfrage ist immer, wer von den Links profitiert, die von diesen Tech-Giganten angezeigt werden. Im Gegensatz zu ChatGPT, das Inhalte direkt liefert, leiten Google und Meta die Nutzer tatsächlich auf die Webseiten der Inhalteersteller weiter.
Insgesamt steht die Online-Welt vor einer großen Herausforderung: Wie können wir ein System schaffen, das sowohl den Bedarf an Daten für KI-Trainings als auch die Rechte der Inhalteersteller berücksichtigt? OpenAI's Vorschlag ist ein interessanter Ausgangspunkt, aber es bleibt viel zu klären, insbesondere in Bezug auf die Umsetzung und die faire Bezahlung der Urheber.
Participate now!
Don’t have an account yet? Register yourself now and be a part of our community!