Godaw’ do: Nu skal danske dialekter samles i en digital bank

Projektet skal sikre, at stemmestyret teknologi kan forstå de mange danske dialekter.

Indsamlingen af dialekter kommer rundt i hele landet, og bliver skudt i gang i dag i Nordjylland. På sigt skal de mange timers tale blandt andet hjælpe medarbejdere på alarmcentralen med at forudse hjertestop. (Foto: © Grafik: Clara Juliane Münnecke, DR)

‘Siri, spil lig’ a Thomas Helmig mæ æ' stupid man’.

I et nyt projekt kan danskerne nu være med til at gøre fremtidens teknologi endnu bedre.

Og det gør de ved at tale en masse.

Digitaliserings- og ligestillingsministeriet og forskningsvirksomheden Alexandra Instituttet vil nemlig indsamle omkring 1500 timers tale med danske dialekter fra rundt omkring i Danmark.

Det skal bruges til at fx en stemmestyret digital assistent bedre kan forstå danskerne. De mest kendte eksempler på stemmestyrede digitale assistenter er Apples Siri og Google Assistent.

Den store dialekt-bank kan også bruges til at gøre teknologi bedre til at oversætte dansk tale til tekst - eksempelvis når en læge skal journalføre. Så kan lægen i højere grad blot indtale sine noter, og så bliver det skrevet rent.

- Det er vigtigt, at det danske sprog og dialekter også er repræsenteret i den digitale verden, siger Marie Bjerre (V), der er digitaliseringsminister og minister for ligestilling.

Projektet kommer rundt i hele landet, men det starter i dag i Nordjylland, hvor nordjyderne kan besøge et bibliotek og indtale lidt af deres dialekt.

Passer på vores dialekter og sprog

Projektet bliver lavet for, at kommende teknologiske fremskridt ikke ender med at bero på det engelske sprog.

Det så vi eksempelvis ved Siri, hvor danskere i starten måtte tale engelsk til den stemmestyrede assistent. Siri blev tilføjet som en funktion i iPhones i 2011, men først i 2015 kunne Siri forstå dansk.

- Vi har set hvordan det danske sprog har haltet efter eksempelvis engelsk, når man har lavet forskellige digitale sprogløsninger. Det er vigtigt, at det danske sprog spiller en rolle, siger Marie Bjerre.

Det er mellem 1500 og 2000 danskeres tale, der frem mod slutningen af 2024 skal optages til dialekt-banken.

- Vi kommer til at se i fremtiden, at vi får mere sprogteknologi, hvor man eksempelvis spørger teknologien om noget. Her er det vigtigt, at teknologien også forstår de danskere, der taler med dialekt, så de selvfølgelig også kan bruge teknologien, siger Marie Bjerre og fortsætter:

- På den måde er det også en måde at passe på det danske sprog og vores dialekter, som er en vigtig del af vores kultur.

Projektet koster 22 millioner, hvor langt de fleste af pengene kommer fra forskellige fonde som Innovationsfonden og Alexandra Instituttet.

Vil du selv se, hvor god du er til at gætte danske dialekter? Så prøv vores quiz lige her:

Hjælper på alarmcentralen

Når de mange timers tale er indsamlet, vil al data blive tilgængelig for virksomheder, udviklere og offentlige institutioner, så de kan bruge det til at lave nye tale-teknologier.

Én af de teknologier, der eksempelvis kan få gavn af de mange timers tale, er en teknologi der skal hjælpe på alarmcentralen. Teknologien kommer fra det danske firma Corti, der er partner på projektet.

Det fortæller direktør Niels Husted Kjær fra Alexandra Instituttet, der også står bag det nye indsamlings-projekt.

- Virksomheden bruger kunstig intelligens til at analysere stemmen på borgere, der ringer ind til alarmcentralen. På baggrund i forskellige mønstre i stemmen, kan softwaren forudse om et hjertestop er på vej. Det er lidt vildt, siger Niels Husted Kjær, og fortsætter:

- Og der er selvfølgelig mange flere muligheder end blot det, når vi får udviklet mere software og teknologi med alle de mange timers tale.