De dataset bevat informatie die zonder toestemming is verzameld uit Nederlandstalige ondertitels uit tienduizenden boeken, nieuwssites en ‘talloze’ films en tv-series, aldus BREIN in een verklaring.
Directeur Bastian von Ramshorst vertelde Reuters dat het onduidelijk was of de dataset al door AI-bedrijven was gebruikt, en hoe breed deze mogelijk zou zijn gebruikt.
“Het is heel moeilijk om dat te weten, maar we proberen op tijd te zijn”, zei hij.
Hij zei dat de AI-wet van de EU AI-bedrijven verplicht openbaar te maken welke datasets ze hebben gebruikt om hun modellen te trainen.
In de VS is het door Microsoft gesteunde OpenAI getroffen door verschillende rechtszaken, onder meer door de New York Times, wegens het zonder toestemming gebruiken van auteursrechtelijk beschermd materiaal om zijn modellen te trainen.
Vind verhalen die u interesseren
In Denemarken heeft een auteursrechtbeschermingsgroep genaamd de Danish Rights Alliance vorig jaar opdracht gegeven voor een grote dataset genaamd “Books3”. De persoon die de Nederlandse dataset heeft aangeleverd, heeft ingestemd met de voorwaarden van een last onder dwangsom en deze van de downloadbare website verwijderd, aldus BREIN. Het bedrijf heeft de identiteit van de persoon niet bekendgemaakt, daarbij verwijzend naar de Nederlandse privacyregels.
“Reisliefhebber. Razend bescheiden lezer. Ongeneeslijke internetspecialist.”
More Stories
Nederland roept Israël op om het UNRWA-embargo te heroverwegen en dringt aan op een staakt-het-vuren
Bizar… Nederlands veldrittalent maakt het uit met Belgisch team, dat woedend reageert: ‘Ik hoop dat je faalt’
De Asieldienst kreeg in april een boete van 50.000 euro per dag opgelegd