Die Untersuchung des Atlantic zum OpenSubtitles-Datensatz zeigt, dass viele generative KI-Systeme mit Drehbüchern aus Film und Fernsehen trainiert wurden, darunter aus über 53. 000 Filmen und 85. 000 TV-Episoden. Diese Systeme wurden von großen Unternehmen wie Apple, Meta, Nvidia und Salesforce entwickelt und nutzen einen Datensatz, der Dialoge aus Filmen und Serien wie "Der Pate, " "Die Simpsons" und "Breaking Bad" enthält. Die Daten stammen von OpenSubtitles. org und bestehen aus Untertiteldateien, die von Nutzern extrahiert und hochgeladen wurden. Diese Methode bietet eine reichhaltige Quelle an Dialogen, die für das Training von KI zur Nachahmung natürlicher Sprache unerlässlich ist. Verschiedene KI-Modelle, wie Claude von Anthropic und die mit dem iPhone kompatiblen LLMs von Apple, wurden mit diesen Daten trainiert. Diese Entwicklungen haben jedoch Bedenken bei Hollywood-Autoren und Künstlern ausgelöst, die sich Sorgen machen, dass ihre Arbeit ohne Erlaubnis genutzt wird.
Rechtliche Herausforderungen in Bezug auf die Verwendung von urheberrechtlich geschütztem Material für das Training von KI stehen weiter aus, und die Transparenz von Technologieunternehmen bleibt eingeschränkt. Während einige Schöpfer wie Jörg Tiedemann, ein Initiator des OpenSubtitles-Datensatzes, über die breitere Nutzung erfreut sind, sehen andere dies als Verletzung geistigen Eigentums an. Der OpenSubtitles-Datensatz ist Teil einer größeren Sammlung namens The Pile, die vielfältige Texte umfasst und von KI-Entwicklern weit verbreitet genutzt wird. Trotz seiner Verfügbarkeit ist der Inhalt komplex und erfordert spezielle Werkzeuge zur Navigation. Da sich KI weiterentwickelt, wirft die Nutzung kreativer Inhalte ohne Zustimmung oder Entschädigung ungelöste ethische und rechtliche Dilemmata auf.
KI-Training mit OpenSubtitles: Ethische und rechtliche Herausforderungen
Eine Version dieser Geschichte erschien im Nightcap-Newsletter von CNN Business.
Im heutigen schnelllebigen digitalen Marktplatz kämpfen kleine Unternehmen oft darum, mit größeren Firmen mitzuhalten, da diese umfangreiche Ressourcen und fortschrittliche Technologien nutzen, um online sichtbar zu sein und Kunden zu gewinnen.
Nvidia, ein weltweit führendes Unternehmen im Bereich der Grafikprozessortechnologie und künstlichen Intelligenz, hat die Übernahme von SchedMD bekannt gegeben, einem Softwareunternehmen, das sich auf KI-Softwarelösungen spezialisiert hat.
Geschäftsführer aus verschiedenen Branchen betrachten generative künstliche Intelligenz (KI) nach wie vor als eine transformative Kraft, die die Abläufe, die Kundenbindung und strategische Entscheidungen neu gestalten kann.
Im heutigen schnelllebigen Umfeld vonRemote-Arbeit und virtueller Kommunikation machen bedeutende Fortschritte bei Videokonferenz-Plattformen durch die Integration fortschrittlicher künstlicher Intelligenz (KI)-Funktionen.
Das Internationale Olympische Komitee (IOK) plant, fortschrittliche Künstliche Intelligenz (KI)-Technologien bei den kommenden Olympischen Spielen einzusetzen, um die operative Effizienz zu steigern und das Zuschauererlebnis zu verbessern.
Zeta Global kündigt exklusive Programmierung für CES 2026 an, präsentiert KI-gesteuertes Marketing und Athena-Entwicklung 15
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today