Digitaliseringsstyrelsen og en række samarbejdspartnere kommer til at invitere 1.500 danskere til oplæsning og samtale i et nyt projekt. Det bidrag skal medvirke til at stemmeassistenter og voicebots bliver markant bedre til at forstå dansk – og vores mange dialekter.
Vi har nok alle prøvet at skulle starte en rute eller få afspillet en sang, hvor vi kun når et resultat ved at ta-le eks-tremt ty-de-ligt til vores stemmeassistent i bilen eller derhjemme. Det skal forbedres, så danskerne får en bedre oplevelse, når vi kommunikerer med vores elektronik.
Derfor skal et nyt projekt indhente 1000-1500 timers samtale og oplæst tale fra danskere. De danske stemmer vil være med dialekter lige fra Skagen til Gedser og fra Blåvandshuk til Bornholm. De mange timers tale vil være open source, så både virksomheder og myndigheder har mulighed for at bruge dem.
Det kan projektet bidrage til
- Udvikling af voicebots og stemmeassistenter, der kan udføre rutinebaserede opgaver som it-hjælp som for eksempel nulstilling af passwords, hjælp til at navigere på hjemmesider. Det betyder kortere telefonkøer for borgerne, og øger myndighedernes effektivitet, så medarbejderne får mere tid til andre opgaver.
- Maskinoversættelse til kommunikation på tværs af sprog.
- Forbedring af digitale assistenter som oplæseren i en GPS eller i offentlig transport.
- Forbedring af løsninger til at diktere tale til tekst.
Kilde: Digitaliserings- og ligestillingsministeriet
”Jeg har altid været overbevist om, at dialekter har stor kulturel værdi for danskerne. Men dette projekt åbner helt nye perspektiver for værdien af vores regionale dialekter. Med over tusind timers tale med dialekter, vil virksomheder og myndigheder få bedre muligheder for at skabe nye løsninger inden for taleteknologi, som bruger det danske sprog. Det vil være til gavn for den enkelte borger, som får en bedre oplevelse, men også for samfundet generelt,” siger digitaliseringsminister Marie Bjerre.
Bag projektet står Alexandra Instituttet, som er en privatejet non-profit organisation, som har til formål at ‘skabe fremtidens digitale Danmark’. I projektet her gør de det i samarbejde med Digitaliseringsstyrelsen, Københavns Universitet og virksomhederne Alvenir og Corti. Projektet er navngivet Danish Conversational and Read-aloud Speech Dataset (CoRal).
Der skal bruges mellem 1.500 og 2.000 danskere til at oplæse og samtale til projektet. Det vil foregå på tværs af hele landet og man kan melde sig som deltager her.