november 8, 2024

Groenhuis

Groenhuis is de toonaangevende aanbieder van kwalitatief Nederlands nieuws in het Engels voor een internationaal publiek.

AI-dataset: Het copyrightteam verwijdert de Nederlandstalige AI-dataset

AI-dataset: Het copyrightteam verwijdert de Nederlandstalige AI-dataset

De in Nederland gevestigde auteursrechthandhavingsgroep BREIN heeft een grote taaldataset verwijderd die bedoeld was voor het trainen van AI-modellen, zei de organisatie dinsdag.

De dataset bevat informatie die zonder toestemming is verzameld uit Nederlandstalige ondertitels uit tienduizenden boeken, nieuwssites en ‘talloze’ films en tv-series, aldus BREIN in een verklaring.

Directeur Bastian von Ramshorst vertelde Reuters dat het onduidelijk was of de dataset al door AI-bedrijven was gebruikt, en hoe breed deze mogelijk zou zijn gebruikt.

“Het is heel moeilijk om dat te weten, maar we proberen op tijd te zijn”, zei hij.

Hij zei dat de AI-wet van de EU AI-bedrijven verplicht openbaar te maken welke datasets ze hebben gebruikt om hun modellen te trainen.

In de VS is het door Microsoft gesteunde OpenAI getroffen door verschillende rechtszaken, onder meer door de New York Times, wegens het zonder toestemming gebruiken van auteursrechtelijk beschermd materiaal om zijn modellen te trainen.

Vind verhalen die u interesseren


In Denemarken heeft een auteursrechtbeschermingsgroep genaamd de Danish Rights Alliance vorig jaar opdracht gegeven voor een grote dataset genaamd “Books3”. De persoon die de Nederlandse dataset heeft aangeleverd, heeft ingestemd met de voorwaarden van een last onder dwangsom en deze van de downloadbare website verwijderd, aldus BREIN. Het bedrijf heeft de identiteit van de persoon niet bekendgemaakt, daarbij verwijzend naar de Nederlandse privacyregels.

READ  Sundowns zinken Nederlands topteam op Euro Tour