Puheteknologian historiaa Suomessa

Puheteknologian historia Suomessa alkaa 1970-luvulla jolloin Suomessa tuli käyttöön yleiskäyttöiset mikroprosessorit. [1]

Synte 2 -puhesyntetisaattori

Ensimmäinen suomalainen puheteknologiakeksintö oli maailman ensimmäinen kannettava mikroprosessoripohjainen sääntösynteesillä varustettu formanttipuhesyntetisaattori Synte 2. Se saatiin Euroka Oy:ssä tuotantoon jo 1970-luvun puolella. [2]

Vocom Ky

Vocom ky oli ensimmäinen suomalaisen digitaalisen signaalinkäsittelyn ja puheteknologian yritys. Se toimi vuodesta 1980 vuoteen 2003 ja aluksi TTKK:n elektroniikan laitoksen tiloissa. Vocom ky:n tärkein tuote oli SPS2-puheanalyysijärjestelmä. [3]

SPS2-puheanalysaattori

Syksyllä 1980 tuli käyttöön mikroprosessoripohjainen SPS2-puheanalysaattori. Se oli Vocom ky:n tuotantoa[1]. SPS2 kehitettiin pohjautuen Motorola Exorset 30-mikrotietokoneeseen, jossa oli 8/16-bittinen M6809-mikroprosessori. SPS2 sisälsi yrityksen kehittämän muunninkortin, laskossuodinkortin ja mikrofonivahvistimen. Käytettävissä oli taajuusalue 20–5 000 Hz ja 12 bitin dynamiikka. SPS2-puheanalyysiohjelmisto sisälsi FFT-spektrin, LPC-spektrin, auditorisen spektrin ja signaalinäytön sekä tulostuksen kuvaruudulle ja piirturille. Ohjelmisto oli kirjoitettu BASIC-kielellä ja apuna käytettiin konekielellä koodattuja analyysirutiineja laskentojen nopeuttamiseksi. SPS2 oli ensimmäinen Suomessa ja Tampereella kehitetty mikroprosessoripohjainen puheanalysaattori. SPS2:n kehitti TTKK:n silloinen yliassistentti tekniikan tohtori Matti A. Karjalainen 1980[3].

Sana1-puheentunnistin

Vuosina 1979–1980 Matti A. Karjalainen kehitti TTKK:n elektroniikan laitoksella mikroprosessoripohjaista Sana1-puheentunnistinta SPS2:n pohjalta. [4]

Korkean tason SPL1-puhesynteesikieli

Vuonna 1981 Raimo O. Toivonen ryhtyi TTKK:n elektroniikan laitoksella ja omassa insinööritoimistossaan kehittämään korkean tason puhesynteesikieltä ja sen kääntäjää Motorolan Exorset30-ympäristöön. Kääntäjä toteutettiin 1981–1983 M6809-mikroprosessorin assemblykielellä. Alkuperäinen tavoite oli luoda sen aikaiseen Motorolan kehitysympäristöön konekieltä sopivampi tapa kirjoittaa Synte-formanttipuhesyntetisaattoreille puhesynteesiohjelmia. Ajatus uuden ohjelmointikielen luomisesta syntyi professori Yrjö Neuvon 1976–1978 jatko-opintokursseilla TTKK:n elektroniikan laitoksella. Käännös oli kaksivaiheinen. SPL1-kääntäjä käänsi ensin M6809:n symboliselle assemblykielelle ja Motorolan assemblerkääntäjä käänsi ohjelman sitten M6809:n konekoodiksi. SPL1-kieli sisälsi puhesynteesiä varten ilmaisuja, joita ei löytynyt muista sen aikaisista M6809:n ohjelmointikielistä. Tärkein tällä kielellä ohjelmoitu tuote oli SPL1-tutkimuspuhesyntetisaattori akateemiseen tutkimuskäyttöön.

SPL1-tutkimuspuhesyntetisaattori

Tammikuussa 1983 ilmestyi mikroprosessoripohjainen SPL1-tutkimuspuhesyntetisaattori akateemiseen käyttöön. Se oli Insinööritoimisto Raimo Toivosen tuotantoa[1]. Kirjallisuutta kohdassa on opinnäytteitä, joissa on SPL1-tutkimuspuhesyntetisaattorin käyttöä.

Computer Voice Fields -analyysiohjelma ja F0/A0-analyysiohjelma foniatriseen käyttöön

Joulukuussa 1984 ilmestyi Computer Voice Fields -analyysiohjelma ja F0/A0-analyysiohjelma foniatriseen käyttöön. Ne toimitettiin ensimmäiseksi Kinkomaan sairaalan foniatrian poliklinikalle Jyväskylään 20.12.1984. Ne olivat Insinööritoimisto Raimo Toivosen tuotantoa[1] ja toimivat Vocom ky:n SPS2-puheanalysaattorin yhteydessä. Äänikenttäkuvat ja F0/A0-kuvat tulostettiin piirturilla paperille. Ihmisäänen perustaajuuden F0 ilmaisevaa algoritmia ja F0/A0-analyysiohjelmaa Raimo O. Toivonen on kehittänyt Tampereella vuodesta 1982 lähtien. Algoritmi on edelleen käytössä Intelligent Speech Analyser (ISA) -puheanalyysiohjelmassa. Aluksi Computer Voice Fields oli ei-reaaliaikainen, mutta jonkin ajan kuluttua siihen lisättiin 16-bittistä NEC uPD7720 -signaaliprosessoria käyttävä reaaliaikainen Computer Voice Fields -kortti ja Computer Voice Fields -analyysiohjelma. Computer Voice Fields of Connected Speech, Symposium on Voice Disorders on maailman ensimmäisen mikroprosessoripohjaisen Computer Voice Fields -puheanalyysimenetelmän kansainvälinen julkaisu 1985[5]. Kirjallisuutta kohdassa on julkaisuja, joissa on Computer Voice Fields:in käyttöä.

F0/A0-analyysiohjelma foneettiseen käyttöön

Lokakuussa 1985 ilmestyi ei-reaaliaikainen F0/A0-analyysiohjelma foneettiseen käyttöön. Se toimitettiin ensimmäiseksi Helsingin yliopiston fonetiikan laitokselle 7.10.1985. Se toimi Vocom ky:n SPS2-puheanalysaattorin yhteydessä. F0/A0-kuvat tulostettiin piirturilla paperille. Se oli Insinööritoimisto Raimo Toivosen tuotantoa[1].

Intelligent Speech Analyser (ISA) -puheanalysaattori

Joulukuussa 1986 ilmestyi käyttöön signaalitietokonepohjainen Intelligent Speech Analyser (ISA) -puheanalysaattori. Tässä omalla signaalimuistilla varustetussa signaalitietokoneessa käytettiin Texas Instrumentsin TMS32010-signaaliprosessoria. Myöhemmin se muuttui tietokoneohjelmaksi. Se on Pitchsystems Oy:n tuotantoa[1].

Kuvia

Katso myös

Lähteet

    Kirjallisuutta

    • Karjalainen, Matti & Laine, Unto: Speech Research and Technology in USA. Report of a visit to USA, April 1980. Application Report 5/1980, 58 sivua. Tampere University of Technology Electronics Laboratory, 1980. ISBN 951-720-516-3.

    Väitöskirja Synte 2:n kehittämisestä

    • Karjalainen, Matti: An approach to hierarchical information processes with the application to speech synthesis by rule. Tampere University of Technology, 20.10.1978. ISBN 951-666-105-X.

    Opinnäytteitä SPL1-tutkimuspuhesyntetisaattoria käyttäen

    • Ensimmäinen opinnäyte: Nieminen, Anna-Liisa: Suomen intonaation identifiointi ja diskriminointi. Akateeminen pro gradu tutkielma. HY:n fonetiikan laitos, 1983.
    • Ensimmäinen sivulaudaturtyö: Nieminen, Anna-Liisa: Suomen yksisanaisten myöntövastausten intonaatiosta. Akateeminen sivulaudaturtyö. Helsingin yliopiston suomen kielen laitos, 1984.
    • Ensimmäinen lisensiaattityö: Nieminen, Anna-Liisa: Suomen yksisanalausumien intonaatiosta – havaintokokeita synteettisellä puheella. Akateeminen lisensiaattityö. HY:n fonetiikan laitos, 1985.
    • Toinen lisensiaattityö: Aulanko, Reijo: Puheen havaitsemisen psykofysiologisista perusteista: formanttitransitioiden havaitseminen. Akateeminen lisensiaattityö. HY:n fonetiikan laitos, 1989.

    Julkaisuja SPL1-tutkimuspuhesyntetisaattoria käyttäen

    • Sovijärvi, Antti & Aulanko, Reijo: Suomen lauseintonaation eräistä piirteistä. Fonetiikan päivät – Espoo 1988, Papers from the 15th Meeting of Finnish Phoneticians, (Karjalainen M., Laine Unto, toim.). Julkaisu 31, s. 247–259. Espoo: TKK:n akustiikan laboratorio, 1988. ISBN 951-679-741-5.
    • Sovijärvi, Antti & Aulanko, Reijo: Abstract: Some Aspects of Finnish Sentence Intonation. Espoo: Helsinki University of Technology, Acoustics Laboratory, 1988. ISBN 951-754-741-2.
    • Sovijärvi, Antti & Aulanko, Reijo: Synthesis of Certain Speech Sounds and Sentence Intonation of Hungarian, Finnish, and Finland-Svedish. Commentations humanarum Litterarum, Vol. 101. Societes Scientiarum Fennica, The finnish Society of Sciences and Letters, 1994. ISBN 951-653-271-3.

    Julkaisuja Computer Voice Fields™:iä käyttäen

    • Ensimmäinen julkaisu: Sonninen, Aatto & Hurme, Pertti & Toivonen, Raimo: Computer Voice Fields of Connected Speech. Sweden: Symposium on Voice Disorders, August 23, 1985.
    • Sonninen, Aatto & Hurme, Pertti & Toivonen, Raimo: Computer Voice Fields of Connected Speech, s. 93–111. Papers in Speech Research, 6,. Jyväskylän yliopisto, 1985.
    • Vilkman, Erkki & Sonninen, Aatto & Hurme, Pertti: Observations on Voice Production by Means of Computer Voice Fields, s. 370–371. Tokyo: In: Logopedics and Phoniatrics. Issues for Future Research. Proceedings of the XXth Congress of the International Association Logopedics and Phoniatrics, 1986.
    • Jaroma, Marjatta & Sonninen, Aatto & Hurme, Pertti & Toivonen, Raimo: Computer Voice Field Observations of Menopausal Dysphonia. Vienna: Paper presented at the 13th Congress of the European Union of Phoniatricians, 1986.
    • Aaltonen, Olli & Raimo, Ilkka & Vilkman, Erkki: Äänen korkeuden säätelyyn vaikuttavien mekanismien tutkimisesta, s. 7–31. XIII Fonetiikan päivät – Turku 1985 (toim. Aaltonen O. & Hulkko T.) Suomalaisen ja yleisen kielitieteen laitoksen julkaisuja 26. Turku: Turun yliopisto, 1985. ISBN 951-642-751-0.
    • Sonninen, Aatto & Hurme, Pertti & Vilkman, Erkki: Observations of voice production by means of Computer Voice Fields. Folia Phoniatrica 1986;38:366.
    • Sonninen, Aatto: Ihmisäänen rekistereistä, s. 4–21. Laulupedagogi 1989–1990. Laulupedagogit ryn vuosijulkaisu. Helsinki: Yliopistopaino, 1990.
    • Vilkman, Erkki: An Apparatus for Studying the Role of the Cricothyroid Articulation in the Voice Production of Excited Human Larynges. Folia Phoniatrica 1987;39:169–177.
    • Vilkman, Erkki: Studies on human voice production. Acta Universitatis Tamperensis ser A vol 232, 1987.

    Julkaisuja SPS2-puhenalysaattoria käyttäen

    • Iivonen, Antti: Eräistä vokaalien akustiikan ja havaitsemisen välisistä suhteista, s. 85–127. XIII Fonetiikan päivät – Turku 1985 (toim. Aaltonen O. & Hulkko T.) Suomalaisen ja yleisen kielitieteen laitoksen julkaisuja, 26. Turun yliopisto, 1985. ISBN 951-642-751-0.
    • Iivonen, Antti & Nieminen, Anna-Liisa: Puhujantunnistus fonetiikan juridisena sovelluksena. Fonetiikan laitoksen monisteita, 11. Helsingin yliopisto, tammikuu 1986. ISBN 951-45-3879-X.

    Yleistä

    • Iivonen, Antti: Reaaliaikainen spektrianalyysi foneettisissa sovellutuksissa. Fonetiikan laitoksen monisteita, 8. Turun yliopisto, huhtikuu 1978. ISBN 951-42-0583-9.
    • Fant, Gunnar: Acoustic Theory of Speech Production. Mouton De Gruyter, The Hague, 1970. ISBN 90-279-1600-4.
    This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.