-
Notifications
You must be signed in to change notification settings - Fork 24
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Extra maatregel: over juiste licentiegebruik bij datasets #432
Comments
Ah, bruikbaar inzicht, dankjewel! Denk je dat het goed zou zijn om een extra maatregel toe te voegen in het Algoritmekader over licentiegebruik bij data die je ter beschikking stelt? Dus een maatregel in de trant van: Met dan in de toelichting informatie zoals jij die aangeeft over de CC BY-SA. Of verwoord ik het advies dat we de gebruikers van het kader willen geven dan niet goed? Een andere mogelijkheid is dat we deze informatie aanvullen in een bestaande maatregel. In dit opzicht zouden deze maatregelen relevant kunnen zijn denk ik:
Dank voor de suggestie, we kunnen dit denk ik in elk geval ergens in verwerken! Ik ben benieuwd wat jij denkt dat het beste zou zijn! |
Dag Nout,
Ik denk inderdaad dat het goed is om een extra maatregel toe te voegen in het Algoritmekader over licentiegebruik bij publicatie/terbeschikkingstelling van data, zoals jij hieronder voorstelt. CC-BY-SA kan dan in de toelichting. Het Nationaal Archief heeft gekozen voor deze Creative Commons licentie (die gelden in zowel auteursrecht als databankrecht en zijn goed machine-leesbaar), maar het kan ook anders. Data kan ook bijvoorbeeld gepubliceerd worden als Publiek Domein met de voorwaarde dat bronvermelding verplicht is voor alle hergebruik.
De bestaande maatregelen die jij noemt in je mail gaan vrijwel allemaal over het verzamelen van data voor het zelf maken van AI, en niet over het beschikbaarstellen/publiceren van data voor AI van anderen, waaronder scraping door commerciële partijen. De enige maatregel waarbij het toegevoegd zou kunnen worden is “Controleer de auteursrechten van eigen data” want die gaat over publicatie van data, maar dan moet die titel vanzelfsprekend worden veranderd, bijvoorbeeld in jouw voorstel "Gebruik de juiste licenties bij het ter beschikking stellen van (open) data".
Groet,
Ine
|
@IneVrenkenNationaalArchief ik wil deze maatregel goed opschrijven, en dat gaat deze release niet meer lukken helaas. Ik wilde je even updaten dat we hem niet vergeten, en ik hem op de lijst heb staan om meteen in het nieuwe jaar op te pakken. Wellicht kom ik dan nog bij je terug voor meer informatie! |
Hoi @IneVrenkenNationaalArchief. Ik heb een voorstel gedaan voor een nieuwe maatregel. Je kunt de preview daarvan hier bekijken. Ik heb hierin ook jouw voorbeeld van het Nationaal Archief verwerkt! Jij hebt er al langer/vaker over nagedacht en zit hier wellicht beter in dan ik, dus graag ontvang ik je feedback. Als je dat eerder hebt gebruikt op GitHub, voel je dan ook vrij voorstellen voor wijziging te doen via de Pull Request waarin ik deze maatregel toevoeg: #571 of daar je comments te geven. En anders is het ook prima als je hieronder je feedback geeft en dan verwerk ik die! |
Beschrijf je suggestie
Omschrijving.
De digitale samenleving met vele kopieën van data, big tech dominantie en ontwikkelingen op het gebied van (generatieve) AI vragen ook om herijken van het beschikbaarstellen van open data, waaronder het eisen van bronvermelding van de oorspronkelijke bron. Het Nationaal Archief kiest ervoor om de CC-BY-SA licentie te gaan gebruiken, om de burger te beschermen tegen oncontroleerbare mis/desinformatie o.a. door generatieve AI die bronvermelding achterwege laat. Met deze CC-BY-SA licentievorm blijven we open data publiceren, maar is public domain zonder voorwaarden/CC0 niet meer het ultieme doel. Het belangrijkste argument voor het toepassen van CC-BY-SA is dat het er voor zorgt dat de burger de hoognodige informatie krijgt die nodig is om mis/desinformatie te herkennen. Bijkomend voordeel van de CC-BY-SA licentie is o.a. dat die veranderd kan worden wanneer dat in de toekomst nodig zou zijn; in tegenstelling tot de onherroepelijke CC0.
Leg uit waarom dit een goede toevoeging is aan het Algoritmekader
Verantwoord datagebruik gaat niet alleen om het intern gebruik van data voor AI, maar ook over het ter beschikking stellen van open data voor externe AI. Naast de zeer belangrijke bronvermelding kan middels een goede open data licentie ook recht gedaan worden aan eigendomsrecht/auteursrecht.
The text was updated successfully, but these errors were encountered: