Tämä mediatutkimusraportti käsittelee puhesynteesin käyttöä tuotannon ja julkaisemisen työkaluna media-alalla. Raportti kattaa useita tapauksia, joissa ihmisäänen korvaaminen tai lisääminen voi parantaa media-artikkelin saavutettavuutta tai perinteisen audiotuotannon kustannustehokkuutta.
Raportti käsittelee myös puhesynteesiteknologian täysin uusia tekijänoikeushaasteita sekä uutisjournalismissa tunnettujen esiintyjien luotettavuusnäkökulmaa. Raportin tavoitteena on avata puhesynteesiteknologian nykykäyttöä mediassa sekä tulevaisuuden mahdollisuuksia.
Johtopäätöksenä raportissa ennustetaan puhesynteesin käyttöä media-alalla viiden vuoden päästä. Voiko puhesynteesillä toteutettu uutistenlukija korvata oikean ihmisen, ja missä määrin?
Tutkimuksen painopiste rajataan puhesynteesin hyödyntämiseen perinteisessä suomalaisessa media-alassa suomen kielellä. Puheavustajien (puhelimet, autot) tai englanninkielisen puhesynteesin käyttöä ei käsitellä. Yksittäisiä esimerkkejä rajauksen ulkopuolelta on kuitenkin mukana havainnollistamassa teknologian nykytilaa.
Puhesynteesin käyttö laajenee jatkuvasti, ja siihen liittyvä teknologia kehittyy nopeasti. Raportti perustuu olettamukseen, että olemassa olevat perinteiset mediakanavat säilyvät, mutta teknologia voi avata mahdollisuuksia myös uusille toimijoille ja julkaisumuodoille.
Audion kulutus 2020-luvulla
Tutkimusten mukaan audioformaatissa kulutetun verkkosisällön määrä on kasvanut viimeisen kymmenen vuoden aikana monissa maissa. Trendi on samanlainen esimerkiksi Yhdysvalloissa ja Suomessa. Keskimääräinen kuunteluaika kasvaa muutamalla minuutilla joka vuosi.
Audiomedian etuna on, että sitä voi kuluttaa muun tekemisen ohessa. Audio on ainoa mediakanava moniajoon tottuneille ihmisille, jotka suosivat median kulutusta esimerkiksi autolla ajaessa, liikkuessa tai kotitöitä tehdessä, mutta myös näkövammaisille tai heikkonäköisille.
Uudet audioformaatit
Perinteisten mediakanavien ja formaattien kuten musiikin ja lineaarisen radion rinnalle ovat tulleet podcastit ja äänikirjat. Vuonna 2019 äänikirjoja kuunteli 13 prosenttia suomalaisista, vuonna 2020 osuus oli jo 23 prosenttia. Podcastit, jotka virallisesti alkoivat vuonna 2004, kattavat nykyisin laajan ja monipuolisen aihekirjon, johon perinteinen radio ei yllä. Täysin uusi genre on yritysten itse tuottamat podcastit, ns. yrityspodcastit.
Audion vetovoimasta kertoo myös kiinnostus uusia audiosisältöjä kohtaan. Jos uutis- ja aikakausmedioissa julkaistaisiin enemmän ääneen luettua kirjallista sisältöä, yli 40 prosenttia vastaajista kuuntelisi sitä varmasti tai todennäköisesti. Erityisesti miehet, alle 40-vuotiaat ja suurkaupungeissa asuvat olisivat kiinnostuneita kuluttamaan ääneen luettua sisältöä.
Sanomalehtikustantajien kannattaa kierrättää artikkeleita eri sisältömuotoihin ja huomioida erilaiset kulutustavat. Ääniartikkeleihin ja niiden tarinoihin on lukijan helpompi palata, kun ne on koottu esimerkiksi verkkosivulle omaan osioonsa tai Spotify-podcastiin. Tämä pidentää artikkeleiden elinkaarta.
Uudet audiojulkaisumuodot osoittavat, että audion uudet avaukset on otettu yleisesti hyvin vastaan, ja ala kykenee merkittävästi uudistumaan – mikä voi myös mahdollistaa ennakkoluulottoman puhesynteesin käytön.
Puhesynteesin nykyiset sovellukset suomalaisessa mediassa
Saavutettava audioartikkeli lehtiartikkelista
Synteettisen äänen äänenlaatu on nykyään jo niin hyvä ja miellyttävä, ettei kuulija välttämättä erota ääntä aidosta ihmisäänestä. Teknologian kehitys mahdollistaa pitkienkin artikkeleiden kuuntelemisen tekoälyäänellä. Tämä mahdollistaa syventävien suomenkielisten verkkoartikkelien audiojulkaisut.
Esimerkiksi Kirkko ja kaupunki lanseerasi joulukuussa 2021 palvelun, jossa kaikki sen kirjallinen sisältö on kuunneltavissa. Saavutettavuuden näkökulmasta mahdollisuus kuunnella artikkeleita auttaa näkövammaisia ja oppimis- tai lukivaikeuksista kärsiviä lukijoita. Suomessa näitä ihmisiä on satoja tuhansia.
Suomen Kuvalehti on saanut positiivista palautetta audioartikkeleista, jotka on tuotettu suomalaisen a.i.materin Ilona-koneäänellä. Vaikka artikkeleiden alussa kerrotaan äänen olevan koneääni, kuulijat ovat silti yllättyneet äänen luonnollisuudesta.
Lyhyet uutislähetyskokeilut
Kesäkuussa 2021 Ylen teknologiakokeiluyksikkö Yle Sandbox vihjasi Twitterissä kokeilevansa radion uutisohjelmien automatisointia puhesynteesillä. Toistaiseksi synteettisiä uutislähetyksiä ei ole vielä lähetetty radiossa, mutta tämä lienee vain ajan kysymys.
“Yle is just about to start experimenting how to automate creation of radio news program from text to voice via speech synthesis. Stay tuned.”
Toukokuussa 2022 Svenska Yle teki kokeilun, jossa uutislähetyksiä luotiin mahdollisimman automaattisesti puhesynteesillä. Kokeilun mukaan englanninkielistä puhesynteesiä on vaikea erottaa ihmisestä, mutta suomenruotsalainen puhesynteesi ei vielä yllä samalle tasolle.
Pitkällä tähtäimellä teknologia voisi mahdollistaa esimerkiksi yöaikaan lähetettävät uutiset, kun toimitus ei ole paikalla.
Media-alan ikonien kulttuuri
Formaalisti laadukkaan ja ymmärrettävän uutislähetyksen tuottaminen tekstistä ei ole enää teknologisesti mahdotonta. Uutistenlukijan työ kuitenkin sisältää muutakin kuin kirjoitetun tekstin ääneenlukemista.
Uutisankkurit luotettavimpien ihmisten joukossa
Suomalaisista uutisankkureista esimerkiksi Arvi Lind on koettu maan luotettavimpana ihmisenä. Luottamus pohjaa pitkään uraan ja vakuuttavaan läsnäoloon. Esiintymistaidot ja tekstin mukauttaminen esitystilanteeseen ovat merkittävä osa työtä.
Tekijänoikeushaasteet
Tunnettujen esiintyjien jäljittely tekoälyllä herättää uusia tekijänoikeuskysymyksiä. Näyttelijät ovat nostaneet esiin tilanteita, joissa heidän ääntään on käytetty kaupallisiin tarkoituksiin ilman lisäkorvauksia.
Johtopäätös
Voisiko tekoäly tulevaisuudessa tehdä kopioita tunnetuista uutisankkureista samalla tavoin kuin viime vuosien deepfake-videoissa on tehty tunnetuista henkilöistä? Säilyttäisikö tämä jatkuvuus uutismedian uskottavuuden vai muuttaisiko se uutiset viihteeksi? Voisiko uutisankkureiden työsopimuksiin tulevaisuudessa sisältyä lupa käyttää heidän ääntään tekoälyuutisten tuottamiseen? Vai voisiko toisaalta pelkkä synteettinen, persoonallinen ja taitavasti ohjelmoitu ääni-algoritmi nousta maan tunnetuimmaksi ja luotettavimmaksi uutisankkuriksi?
Aihe herättää yhtä paljon kysymyksiä kuin mahdollisuuksia, joten tulevaisuuden ennustaminen muuttuu entistä mielenkiintoisemmaksi.
Seuraavan viiden vuoden aikana Yle todennäköisesti aloittaa puhesynteesiavusteisten uutisten lähettämisen radiossa joissain lähetysajoissa, kuten öisin, Svenska Ylen suunnitelmien mukaisesti. Jos ruotsinkieliset uutiset voidaan toteuttaa laadukkaalla puhesynteesillä, toteutus suomen kielellä on myös erittäin todennäköistä. Teknologinen kehitys ja positiiviset kokemukset puhesynteesistä Suomen Kuvalehden verkkosisällöissä tukevat tätä ennustetta.
Syventävien radio-ohjelmien, kuten podcastien, suosion kasvu ja tarve ihmisvoimin tehdyille keskusteluohjelmille pitävät henkilökohtaiset ja ammattitaitoiset uutisankkurit varmasti jatkossakin eetterissä. Tämä kehitys voi johtaa selvempään jakoon lyhyiden uutislähetysten ja syväluotaavien uutisten välillä. Uutisten lukeminen synteettisesti tunnetun henkilön äänellä tuskin tulee olemaan yleinen tapa toteuttaa perinteisiä uutislähetyksiä, mutta teknologian hyödyntämisellä kontrolloiduissa ja asianmukaisesti korvatuissa deepfake-yhteyksissä on varmasti paikkansa viihdeteollisuudessa.
Yhden asian ennustan tapahtuvan seuraavien viiden vuoden aikana: ilmeikkään ja persoonallisen synteettisen uutistenlukijan fanikunnan syntymisen. Tästä on jo nyt viitteitä nykyisten koneäänien brändäämisessä ja nimeämisessä samalla tavoin kuin tunnetut Applen ja Amazonin ääniavustajat. Tällainen brändätty synteettinen lukija voi tulla kuulijoille niin tutuksi, että siihen aletaan luottaa yhtä vahvasti kuin pitkän uran tehneisiin uutisankkureihin.
Lähteet
a.i.mater 1.10.2021. Ilona-koneääni lukee Suomen Kuvalehden artikkeleita. Luettu 23.4.2022.
a.i.mater 22.4.2022. Lehtiartikkelista audioartikkeli. Luettu 23.4.2022.
Cookis M. 15.10.2019. Podcasts are the new radio for younger generations. The Massachusetts Daily Collegian. Luettu 15.5.2022.
Deloitte 9.12.2019. The ears have it: The rise of audiobooks and podcasting. Luettu 15.5.2022.
Hurme T. 8.12.2021. Kaikki Kirkko ja kaupungin artikkelit voi nyt kuunnella miellyttävän koneäänen lukemana Kirkko ja kaupunki. Luettu 15.5.2022.
Lindberg J-U. Svenska Yle experimenterar med talsyntes – lyssna på datorrösten som läser nyheter. Svenska Yle. Luettu 3.5.2022.
Jaworski R. 9.4.2021. Numbers and facts you need to know about audio content in 2021. Luettu 15.5.2022.
Matilainen V. 13.1.2017. Suomen luotettavin mies, Arvi Lind, ja liki 40 vuotta uutisia. Luettu 23.4.2022.
Sanoma 25.3.2022. Sanoma tutki: Musiikki ja radion kuuntelu ovat suosituimpia digitaalisen audion kulutuksen muotoja – Podcastien ja äänikirjojen suosio kasvaa kohisten. Luettu 15.5.2022.
Vallance C. 20.4.2022. Actors launch campaign against AI ’show stealers’. Luettu 23.4.2022.
Yle Sandbox 8.6.2021. Twitter. Luettu 15.5.2022.
