Lokale omroepen gezocht voor onderzoek naar betere spraakherkenning

feed Nieuws
edit_note 30 april 2025

Voor een onderzoek naar betere spraakherkenning van het Nederlands is de NPO op zoek naar lokale publieke omroepen die content willen aanleveren waarin regionale accenten of dialecten voorkomen. Deze content is van groot belang om de technologie te verbeteren, zodat ook minder standaardtaal beter herkend wordt door automatische systemen.

De oproep maakt deel uit van het project HOSAN (HOogwaardige Spraakherkenning voor Al het Nederlands), dit is een samenwerking tussen de NPO, Beeld & Geluid, Radboud Universiteit, SURF, Alliantie Digitaal Samenleven, de Nederlandstalige Spraakcoalitie en de Nationale Politie. Het doel is te onderzoeken of er een beter spraakherkenningsmodel ontwikkeld kan worden.

Voordat er grootschalig data verzameld wordt waarmee het nieuwe model getraind kan worden, moeten er eerst een aantal zaken onderzocht worden. Denk aan de technische en organisatorische haalbaarheid, maar ook aan de juridische en ethische voorwaarden waaronder het model ontwikkeld en gebruikt mag worden.

Regionale en lokale accenten

In de eerste fase van het technische onderzoek (2025) verzamelen ze testdata en ontwikkelen we testmodellen op kleine schaal. Deze modellen worden nog niet ter beschikking gesteld aan derden. Wel kunnen ze helpen om te voorspellen wat voor soort data, en hoeveel daarvan, nodig is om een bepaalde kwaliteit van spraakherkenning te bereiken. De NPO levert hiervoor bijvoorbeeld 200 uur volledig getranscribeerde radio- en tv-programma’s aan. Deze content is echter niet geselecteerd op regionale accenten, terwijl die juist nodig zijn voor het verbeteren van het uiteindelijke model. Daarom zoekt de NPO voorbeeldcontent met zulke accenten.

We horen graag van lokale publieke omroepen die willen meewerken aan dit onderzoek en een paar uur content ((audio van) tv- en/of radioprogramma’s), bij voorkeur met regionale accenten of in dialect, ter beschikking willen stellen. De content hoeft niet getranscribeerd te zijn, maar we hopen wel op enige metadata (zoals titel en omschrijving van de content). Indien er ondertitels zijn, ontvangen we die ook graag. Het technische formaat maakt op dit moment niet uit, zolang het maar digitaal is.

Aanmelden voor deelname kan via techniek@nlpo.nl. Vragen over dit traject? Mail Egon Verharen via egon.verharen@npo.nl.

Vergelijkbaar

Wellicht interessant