Puheentunnistusohjelma voi helpottaa kirjoitusurakkaa

Teksti: Ari Tervashonka
Pisteet ja pilkut on viilattava omin käsin. Kuva: Pixabay.

Pitkän tekstin kirjoittaminen on äärimmäisen hankalaa jo pelkästään näppäilyn takia. Ihmiset asettuvat tässä asiassa melko eriarvoiseen asemaan, koska näppäilynopeus määrittää kirjoituksen nopeutta. Henkilöt jotka kirjoittavat nopeammin voivat käytännössä myös ajatella kirjoituksen kannalta nopeammin. Esimerkiksi tenttikirjoittamisessa sähköisen tentin kohdalla tämä on tietyssä mielessä eriarvoistava ongelma. Se voidaan korjata esimerkiksi sillä, että annetaan kirjoittajille lisäaikaa, mikäli he eivät kirjoita koneella niin nopeasti.

Ongelma ei kuitenkaan ole tentissä. Ongelma on siinä, että mikäli joutuu kirjoittamaan muutaman sadan sivun verran tekstiä yliopiston aikana, ajatus ja puhe ovat paljon nopeampia kuin kirjoituksen nopeus. Hyvin harva pikakirjoittaja pystyy kirjoittamaan yhtä nopeasti kuin innokkaasti puhuva puhuu. Suorassa puhumisessa on myös hyötynä se, että ajattelu toimii vapaammin, eikä tarvitse käyttää aivojen neuroverkkoja kirjoittamiseen. Kuitenkin kenellä on varaa palkata kirjoittamista varten oma sihteeri? Ei juuri kellään.

Puheentunnistuksen teknologiaa on kehitetty vuosikymmeniä. Monesti tämä kehitys on suunnattu lähes poikkeuksetta englannin kielen tunnistamiseen. Kuitenkin viimeisen kymmenen vuoden aikana puheentunnistus suomen kielellä on tehnyt suuria harppauksia. Varsinkin Googlen ansiosta puheentunnistus on kehittynyt huomattavasti siitä, mitä se oli vuosikymmeniä sitten. Näet esimerkiksi nyt edessäsi tekstin, joka on kirjoitettu kokonaan sanelemalla puheentunnistusohjelmalla. Käytännössä tässäkin on rajoitteensa. Henkilön pitää puhua mahdollisimman selkeästi puhelimeen tai vastaavan laitteeseen, joka ottaa äänen vastaan. Myöskään versiossa jota käytän, ei pysty spesifioimaan pisteen tai pilkun paikkaa. Välillä myös kirjoitusvirheitä ilmaantuu. Esimerkiksi sanan ”tai” kirjoittaminen tuntui olevan hankalaa, tosin hankalien sanojen esiintyminen riippuu hirveästi siitä, kuka puhetta tekee tai puhuuko suomea murtaen.

Kaikesta huolimatta tämä teksti muodostui yli 80-prosenttisesti ilman virheitä. Tekstistä on korjattu 13 kirjoitusvirhettä tähän mennessä ja olen lopuksi jakanut tekstit pisteillä ja pilkuilla. Virheiden korjaamisesta huolimatta tekeminen tällä tavalla tulee olemaan todennäköisesti paljon nopeampaa kuin sen kirjoittaminen omin käsin. Myös kirjoittamisen perusvirheet voidaan korjata käyttämällä esimerkiksi Voikko-ohjelmaa, joka löytyy netistä sellaisenaan. Ei tarvitse tiliä, eikä tarvitse ladata mitään. Voit laittaa sivulle tekstin ja se tarkistaa suomen kielen kohtuullisen hyvin. Kuitenkaan edes tämä sivu ei poista manuaalisen tarkistuksen tärkeyttä. Ohjelma voi korvata eri sanalla alun perin tarkoitetun sanan. Tällöin Voikko ei pysty tunnistamaan virhettä, koska käytetty sana itsessään on oikein. Mikäli kirjoittaja kirjoittaa ammattimaista tekstiä, joudutaan kirjoittamaan joka tapauksessa osittain uudestaan. Nämä menetelmät ovatkin parhaita raakatekstin luomisessa, jossa ei vielä mietitä kirjoitusasua.

Vielä lopuksi voidaan todeta, että vastaavanlaiset ohjelmat jotka hyödyntävät Google Speech Recognition -palvelua löytyvät eri merkkisille älypuhelimille. Eli kuka tahansa voi tehdä vastaavalla tavalla. Ette ainoastaan katso tulevaisuuteen, tulevaisuus on jo täällä.

Tekstin kirjoittamiseen käytetty ohjelma: Speechnotes – Speech to text (Google play store, ilmainen)
Hardware: Oneplus 3 -puhelin
Sanavirheitä pisteitten ja pilkkujen lisäksi noin parikymmentä.