De Nederlandse Publieke Omroep pioniert zorgvuldig met AI

De Nederlandse Publieke Omroep (NPO) onderzoekt nieuwe technologieën en pioniert ook met Artificial Intelligence. Wat doet de NPO precies op het gebied van AI? We vroegen het aan Sarah van der Land. Zij is namelijk bij de NPO Lead van het Experiment Team binnen NPO Innovatie.

9 november 2023 6 minuten

Sarah is niet nieuw bij de NPO: “Ik werk sinds 2017 bij de NPO en ik kan je verzekeren, we pionieren echt met AI en dat soort technieken. Wie tijdens Dutch Media Week de keynote van Ezra Eeman hoorde, weet dat de ontwikkelingen rondom AI de NPO bezig houden. Sinds 1 juni is Ezra directeur Strategie en Innovatie bij de NPO en heeft daarmee ook AI in zijn portefeuille. Het is mooi om te zien dat er steeds meer mensen binnen de NPO met het onderwerp bezig zijn”.

AI wordt een co-piloot

Voor de media zijn er zoveel uitdagingen en kansen. De belofte van AI die voor ons heel relevant is, onder andere ‘personaliseren en aanbevelingen doen’. Daarmee kunnen we de content namelijk zo presenteren dat het zo goed mogelijk aansluit bij de behoefte van onze gebruikers. En in het hele proces van het creëren van content is AI natuurlijk een grote kans én uitdaging. Ik geloof dat AI een co-piloot wordt om steeds mee te schakelen. Niet de captain, want de mens moet altijd in de loop blijven. We willen alles goed en zorgvuldig doen voor de gebruikers van onze applicaties”.

Zorgvuldigheid enorm belangrijk

“De grote massa weet sinds november 2022 eigenlijk pas wat zoiets als ChatGPT kan. Wij zijn daar al sinds 2015 of langer mee bezig, met data en dit soort technieken, zoals Natural Language Models. Zorgvuldigheid is daarbij enorm belangrijk, dus we staan zeker ook stil bij de ethische vraagstukken die nieuwe technologie met zich meebrengt. In 2021 hebben we een intentieverklaring verantwoord gebruik van KI in de media opgesteld. Dat deden we samen met RTL en Beeld en Geluid. Daarin staat bijvoorbeeld beschreven hoe we modellen willen trainen. Maar sinds 2021 zijn er alweer zoveel nieuwe ontwikkelingen. Denk aan Generatieve AI, denk aan ChatGPT. Onze richtlijnen zijn al weer toe aan een update, die we binnenkort zullen presenteren”.

Een visie op de rol van de NPO

“Met de kaders en richtlijnen voor het toepassen van AI willen we uiteindelijk komen tot een visie op wat onze rol als publieke omroep zou moeten zijn als het gaat om AI. We kijken natuurlijk goed naar wat er op Europees niveau gebeurt, met de AI Act bijvoorbeeld. Daarvan willen we een specifieke visie voor de mediasector maken”.

Context en nuancering nodig

Wat daarbij belangrijk is, is dat we context en nuancering aanbrengen. Op Europees niveau zie je dat gezichtsherkenning als groot risico gezien wordt. Dat zal ook in Nederland worden overgenomen en dan zul je horen: ‘gezichtsherkenning mag niet meer’. Maar Beeld & Geluid bijvoorbeeld gebruik het juist heel veel om in hun enorme archieven te kunnen zoeken. Nuancering en context zijn dus echt nodig; Wanneer mag gezichtsherkenning wel en wanneer niet? We moeten de vertaalslag maken: wat betekent AI voor de media sector?

Clash met publieke waarden

“We zijn huiverig voor een monopolie-positie van vaak grote, Amerikaanse tech-bedrijven die een eigen agenda hebben, die ligt meestal niet in lijn met onze publieke waarden. Vanuit onze CTO, Willem Roskam, is het devies: zoveel mogelijk zelf bouwen als dat mogelijk is. Onze Machine-Learning-engineer, Bob van de Velde, zegt weleens dat we “alles” de afgelopen twee jaar hebben vervangen en zelf hebben gebouwd. Daar zitten natuurlijk haken en ogen aan als je kijkt naar tijd en capaciteit, en de vraag wat voor bedrijf je wilt zijn. We zullen in ieder geval ook modellen van anderen onderzoeken. Zijn die bijvoorbeeld wel transparant over hoe ze getraind zijn? Op basis van welke data, en zeggen ze iets over de bias in de data?”.

Innoveren moet je samen doen

We werken veel met kennisinstellingen, omroepen, mediabedrijven en andere organisaties samen. Als het gaat om responsible AI, dan is de DRAMA samenwerking daar een mooi voorbeeld van. DRAMA staat voor Designing Responsible AI for Media Applications en het is een samenwerking tussen de NPO en onder andere de Hogeschool Rotterdam en de Hogeschool Utrecht. In de regio Utrecht werken we ook met Thomas Dohmen van de AI Labs van de Universiteit Utrecht. We haken aan bij usecases, zodat PhD-studenten er ook van kunnen leren.

Mijn collega Egon Verharen, manager innovatie werkt samen met veel partijen aan een Nederlandse Datakluis. Data is natuurlijk brandstof voor AI. Met een datakluis worden gebruikers van applicaties de baas over hun data. Ze bepalen zelf wat ze in welke situatie wel en niet ter beschikking stellen. Een van de onderzoeksvragen daar wordt hoe je AI algoritmes op de persoonlijke data in de datakluis kan laten werken in plaats van op geaggregeerde data aan de kant van onze diensten. Dat soort grote projecten kun je niet alleen! Innoveren op deze schaal moet je samen doen. Het mooie van de Datakluis is dat er ook veel potentie is voor bijvoorbeeld de gezondheidssector. De lessen die we leren in het datakluisproject worden daarvoor natuurlijk gedeeld”.

ai

Experimenteren voor betere metadata

Aan de ene kant zijn we bezig met kaders, de wettelijke en ethische vraagstukken, redactierichtlijnen en het vormen van een visie, en aan de andere kant gaan we door met experimenten met AI. In het Experiment Team werken we in challenges van 8 weken om uit te vinden of een idee potentie heeft. Potentie kan zitten in de constatering dat het publiek behoefte heeft aan het idee, maar ook in de vraag of het idee technisch haalbaar is, en of het idee waarde toevoegt voor de NPO. We kunnen zo in vrij korte tijd op basis van data bepalen of we verder moeten gaan met het idee, het idee moeten opschalen naar de “groeifase” of juist het idee in de ijskast te zetten.

Een van onze experimenten richt zich nu op de vraag hoe we de kwaliteit van metadata met een AI-tool, zoals die van openAI, kunnen verbeteren. Je moet je voorstellen, sommige omroepen maakten zelf programmabeschrijvingen, terwijl anderen hele lappen tekst kregen van hun leveranciers om te beschrijven waar een programma over gaat. Die teksten moesten mensen bij de omroepen dan zelf inkorten tot 650 woorden, en een verkorte versie van 200 woorden. Die programmabeschrijvingen stuurden ze dan naar de NPO, naar de afdeling Access Services. Deze afdeling is onder meer verantwoordelijk voor de toegankelijkheid van content, zoals programmabeschrijvingen en ondertiteling. In de teksten die zij aangeleverd kregen zaten soms spelfouten en grammaticafouten. Bovendien voldeed het niet altijd aan de NPO style guide. Dat maakt de content minder toegankelijk en kost bovendien veel tijd van verschillende mensen om aan te passen. Sinds vorig jaar november – sinds ChatGPT een heel stuk verder is – kunnen we teksten sneller, makkelijker en met minder fouten inkorten. Daarvoor hebben we het AI-model eerst zelf getraind met veel data. Daarna nog een keer samen met Access Services, en nu ook met omroepen. Met al deze input wordt de metadata steeds beter en het hele proces van metadateren veel efficiënter, voor iedereen”.

Good data is better than big data

Van het trainen van een AI-model met metadata hebben we enorm veel geleerd. De belangrijkste take away was wel: om een model goed te trainen heb je meer aan goede data dan aan veel data.  ‘Good data is better than big data’ gaat dus echt op. Je kunt beter trainen met echt goede voorbeelden dan met enorme lappen tekst, waarvan de kwaliteit discutabel is”.

De kansen van AI zijn nu tastbaarder

Toen ik in 2017 bij NPO kwam, met een achtergrond in de wetenschap, was ik heel erg geïnteresseerd in data en AI. Ik zag grote kansen voor NPO om content en gebruikers te matchen. Dan moet je goed weten waar je content over gaat, dus moet je metadata op orde zijn. Ik dacht: daar kunnen we heel veel mee. Maar de tijd was nog niet daar. Ik kreeg nog niet iedereen mee. Dat is natuurlijk heel vaak zo als je met innovatie bezig bent. Nu wordt de urgentie steeds groter en staan mensen echt open voor AI en ze zien de kansen. Het is voor heel veel mensen binnen de omroepen nu veel tastbaarder en toegankelijker hoe het je werk leuker en beter kan maken. Ik ben best trots als ik zie dat er nu bij bijeenkomsten die we over AI organiseren zoals de AI Week  door mijn collega Tialda Siebinga veel mensen vanuit de omroepen aanwezig zijn. We pakken het nu echt samen op! “

Mis geen ondernemersnieuws uit de regio Utrecht!