Turingin testi
Turingin testi eli Turingin koe on Alan Turingin vuonna 1950 esittämä tapa kysymyksen "voivatko koneet ajatella?" ratkaisuun. Koe on tarkoitettu mittaamaan tekoälyn ihmismäisyyttä asettamalla se keskustelemaan kokeen tarkkailijana toimivan ihmisen kanssa. Ajatuksena on, että tietokone on älykäs, jos sen vastauksia ei pysty erottamaan ihmisen vastauksista, eli tarkkailija ei osaa sanoa, onko keskustelukumppani ihminen vai kone. Turingin testin läpäisevä tekoäly onnistuu siis ainakin vaikuttamaan ajattelevalta. Jotta kokeen kielellisiä taitoja mittaava universaali luonne säilyisi, toteutetaan se tekstipohjaisesti.
Alan Turing kuvasi tekoälytestin 1950 ilmestyneessä julkaisussaan Computing machinery and intelligence. Testiä alettiin myöhemmin kutsua hänen mukaansa. Siitä on tullut tekoälytutkimuksen klassikko. Turingin testistä on tehty elokuva nimeltä The imitation game.
Ajatus
Turingin testin alkusysäyksenä oli tarve pystyä esittämään kysymys "voivatko koneet ajatella" siten, ettei törmättäisi käsitteiden "kone" ja "ajattelu" määrittelyongelmiin. Alan Turing kuvaili artikkelissaan käytännöllisen kokeen, jossa hyödynnettävät käsitteet ovat yksiselitteisiä. Testin innoituksena on matkimispeli, jossa mies ja nainen yrittävät tekstivälitteisesti kysymyksiin vastaamalla uskotella muille olevansa toista sukupuolta kuin ovat. Turingin versiossa kuvataan tällaisen pelin tilanne, jossa sekä mies että nainen yrittävät osoittaa olevansa naispuolisia, ja kuvitellaan, mitä tapahtuisi, jos esimerkin miehen tilalle vaihdettaisiin kone. Turing kysyy, pystyisikö kone esittämään uskottavasti ihmistä tällaisessa viestien vaihdossa.
Turingin testi yksinkertaistetaan käytännössä kysyjän ja vastaajan kahdenväliseksi kommunikaatioksi, vastaajan ollessa joko ihminen tai ihmistä esittävä kone. Turingin artikkelissaan esittelemässä alkuperäisessä matkimispelissä on kolme osanottajaa, kysyjä ja kaksi vastaajaa, joista esimerkissä toinen yrittää näytellä jotain muuta kuin on, toisen yksinkertaisesti yrittäessä todistaa olevansa sitä mitä on. Testin periaatteen kannalta pelaajien määrä ei ole tärkeä, kunhan siinä vain on kysyjä ja olemukseltaan tuntematon vastaaja.
Yksityiskohtia
Turingin testin tarkoitus on selvittää tietokoneen ihmismäisen kielellisen kommunikaation kykyä, joten kommunikaatioväline ei ole olennainen. Testi toteutetaan siis kirjallisesti, kokeentekijän esimerkiksi kirjoittaessa kysymyksensä näppäimistöltä ja saadessa vastaukset tekstinä näyttöpäätteelle. Näin ei aseteta vaatimuksia erillisille viestinlaitteille, kuten puhesyntetisaattoreille, jotka olisivat epäolennaisia testattavan asian eli koneen älykkyyden kannalta. Tähän liittyvä sovellus on totaalinen Turingin testi, jossa hyödynnetään ääni- ja videosignaalia ja kone (robotti) ei ole ulkonäöltään tai ääneltään erotettavissa ihmisestä, sen lisäksi että läpäisee tavallisen Turingin testin.
Vastakkaisia näkökohtia
Ennen Turingia ei koneiden ajattelukyvyn testaamiseen ollut esitetty helppotajuista koetta. Koneiden ajattelu oli kuitenkin suosittu keskustelunaihe, ja sekä sen puolesta että sitä vastaan oli käytetty puheenvuoroja. Niinpä Turing käsitteli artikkelissaan joitakin vastaväitteitä, joilla hänen koettaan voitaisiin kritisoida, ja vastasi niihin:
- Teologinen vastalause: Tämän mukaan ajattelu liittyy ihmisen kuolemattomaan sieluun, eikä siten ole mahdollista eläimille saati koneille. Vastalause on epätieteellinen, mutta Turing huomauttaa kuitenkin, ettei kaikkivoivalle Jumalalle varmastikaan olisi mahdotonta antaa sielua koneellekin, jos niin haluaisi.
- "Päät painettuina hiekkaan" -vastalause: "Seuraukset koneiden ajattelukyvystä olisivat kammottavia. Toivokaamme etteivät ne pysty siihen." Kysymyksessä on argumentum ad consequentiam, seurauksiin vetoava argumentaatiovirhe; asian epätoivottavuus ei estä sen olemassaolon mahdollisuutta.
- Matemaattinen vastalause: Tämä käyttää matemaattisia teorioita, kuten Gödelin epätäydellisyyslausetta, osoittaen rajoitukset sille, millaisiin kysymyksiin looginen tietokonejärjestelmä voi vastata. Turing katsoo ihmistenkin olevan usein väärässä, joten koneen mahdollisuus väärin vastaamiseen ei haittaa.
- Tietoisuusargumentti: Tämä professori Geoffrey Jeffersonin 1949 esittämä perustelu väittää, että "vasta kun kone voi kirjoittaa sonetin tai säveltää konsertin tuntemiensa ajatusten ja tunteiden pohjalta, eikä sattuman kautta, voidaan konetta pitää aivojen vertaisena". Turing vastaa, ettei meillä itse asiassa ole varmaa tapaa tietää, tunteeko yksikään olento itseämme lukuun ottamatta tunteita, emmekä siis voi hyväksyä tällaista vastalausetta.
- Erinäisten rajoitusten argumentit: Usein esitetään vastalauseita, joiden mukaan kone ei koskaan pystyisi johonkin tiettyyn asiaan, kuten tunteisiin, huumorintajuun, uusien asioiden oppimiseen tms. Turing ei pidä näitä vastalauseita perusteltuina, ja huomauttaa koneiden silminnähtävien rajoitusten olevan seurausta tuonaikaisesta hyvin vähäisestä tallennuskapasiteetista ja konetehosta, eikä jostain ylittämättömästä esteestä.
- Lady Lovelace -vastalause: Tämän kuuluisan vastalauseen mukaan koneet eivät kykene omaperäisyyteen. Soveltaen se toteaa, ettei tietokone voi tehdä mitään oikeasti uutta. Toteamuksen alkuperäinen esittäjä on itse Ada Lovelace, jonka mukaan koneelta puuttuu kyky itsenäiseen oppimiseen. Turing esittää vastineessaan, että Lady Lovelacen oletukseen on vaikuttanut teknisen kehityksen silloinen taso, ja että uudemman tieteellisen tiedon perusteella on ilmeistä, että aivoilla ja tietokoneilla on paljon yhteistä.
- Hermojärjestelmän jatkuvuus (tiedonkäsittely) -vastalause: Kone käsittelee tietoa merkki kerrallaan, ihminen holistisesti. On esitetty, ettei erillisten tilojen pohjalta toimiva kone voi jäljitellä hermojärjestelmää; matkimispelissä tämä ei kuitenkaan aiheuta ongelmaa. (Viimeaikainen kehitys rinnakkaislaskennan ja sumean logiikan tutkimuksessa on lähentänyt tällaisen koneen toimintaa ihmisen hermojärjestelmään tapaan.)
- Vapaamuotoinen käyttäytyminen (vapaa tahto): Vastalauseessa esitetään, että määrättyjen sääntöjen mukaan toimiva järjestelmä on ennustettavissa eikä siten aidosti älykäs. Turing vastaa, ettei jokaista tilannetta varten erikseen määriteltyjä sääntöjä tulisi sekoittaa ohjeluontoisiin yleisiin toimintatapoihin, ja että sääntöjen ollessa riittävän löyhästi määriteltyjä (vrt. ihminen) olisi koneen käytöksen ennustaminen hyvin vaikeaa.
- Yliaistinen havaitseminen: Tässä kohdassa Turing vaikuttaa väittävän, että olisi olemassa todisteita (näennäistieteellisestä) "yliaistillisesta havaitsemisesta". Esittelemänsä testin suhteen hän kuitenkin toteaa, ettei tällainen "telepatia" pääsisi vaikuttamaan tuloksiin, mikäli testiolosuhteet järjestetään oikein.
Ongelmia
Usein esitetty kritiikki Turingin testiä kohtaan toteaa, että se, vaikkakin mielenkiintoinen, ei ole käyttökelpoinen määrittelemään koneen älykkyyttä tai ajattelua ainakaan seuraavista syistä: ensinnäkin testin läpäisevä kone voi kyllä matkia ihmisen keskustelukäyttäytymistä, mutta olla silti vailla älykkyyttä, seuraten vain nokkelasti määriteltyjä sääntöjä. Tekoälytutkimuksessa tähän vastataan joskus, ettemme voi tietää, seuraavatko ihmisetkin tällaisia sääntöjä. Esimerkki kritiikistä on John Searlen kiinalaisen huoneen argumentti. Toiseksi, kone voi hyvinkin olla älykäs, vaikkei osaisikaan kommunikoida ihmisen lailla. Kolmanneksi, monet älykkäinä pidetyt ihmisetkin, esimerkiksi lapset tai lukutaidottomat, saattaisivat epäonnistua testissä.
Edellisiin liittyen huomautetaan usein myös, että vaikka Turingin testi antaisikin hyvän määritelmän älykkyydelle, ei se silti välttämättä kerro mitään koneen mahdollisesta tietoisuudesta, ajattelusta tai sen toiminnan intentionaalisuudesta. Sangen yleisen näkemyksen mukaan älykkyys ei edellytä tietoisuutta, mahdollisesti näin on toisin päinkin. Monilla nykyaikaisilla tekoälysovelluksilla on älykkyyttä siinä mielessä, että ne oppivat asioita, mutta mitä ilmeisimmin niiltä silti puuttuu tietoisuus, eivätkä ne toimi intentionaalisesti.
Nimen alkuperä
Turing käytti alkuperäisessä artikkelissaan nimitystä matkimispeli (engl. imitation game) sekä ehdottamalleen testille että miesten ja naisten pelaamalle pelille. Turing kuoli jo 1954, mutta testistä nykyään yksinomaisesti käytetty nimi Turingin testi (engl. Turing test) ilmaantuu käyttöön vasta paljon myöhemmin. Nimen on mahdollisesti keksinyt, ja ainakin tuonut yleiseen käyttöön Arthur C. Clarke klassikoksi muodostuneessa science fiction -romaanissaan 2001 Avaruusseikkailu (1968), jossa sitä käytetään HAL 9000 -tietokoneen yhteydessä.
Kehityskulku
Turingin testi sai ensin huomiota lähinnä filosofian tutkijoilta, osittain siksi, että alkuperäinen essee "Computing machinery and intelligence" ilmestyi filosofian aikakauskirjassa Mind. Tieteelliset viittaukset testiin ovat 1960- ja 70-luvuilla filosofisissa artikkeleissa, vasta 1980-luvulta alkaen kiinnostus siihen suureni käytännön tekoälypiireissä.
Erilaisista testille esitetyistä vaihtoehdoista varteenotettavin on ehkä Lovelacen testi, joka perustuu siihen, ettei tarkkailija pysty selittämään tapaa, jolla kone on tulosteensa tuottanut. Turingin testiä kohtaan esitetystä kritiikistä huolimatta se on ensimmäisenä tekoälytestinä säilyttänyt asemansa myös niistä kuuluisimpana.
Muunnelmia
Sellainen koe, jossa roolit on vaihdettu esimerkiksi niin, että ihminen matkii konetta, on käänteinen Turingin testi.
Ihmistä matkivan sovelluksen kuulustelu voidaan rajoittaa jollekin tarkalle erikoisalalle. Tällaisessa testissä koneen tulee pystyä matkimaan kyseisen erikoisalan asiantuntijaa vain tämän alan puitteisiin rajatussa keskustelussa.
Eräs muunnelma on ns. "Minimum Intelligent Signal Test", jossa vastaukset ovat pelkästään binäärisiä eli kaksiarvoisia; siis kyllä/ei tai oikein/väärin.
Käänteisen Turingin testin yksi muoto perustuu joidenkin tutkijoiden esittämään ajatukseen mielestä "mielentunnistuslaitteena". Koneen haasteena olisi tässä selvittää, keskusteleeko se ihmisen vai toisen koneen kanssa. Tämä on huomattavasti pidemmälle viety tehtävä kuin se, jota Turing alun perin lähti selvittämään, mutta saattaisi olla riittävä kriteeri selvittämään, ajatteleeko kone samalla tavoin kuin ihminen.
Paitsi alkuperäinen testi, on myös totaalinen Turingin testi science fiction -kirjallisuudessa hyödynnettyä materiaalia. Tunnettu esimerkki on Philip K. Dickin romaani Palkkionmetsästäjä (Do Androids Dream of Electric Sheep?) (1968), josta on tehty elokuva Blade Runner (1982). Romaanin kuvaamassa läheisessä tulevaisuudessa keinotekoiset ihmisen näköiset replikantit ovat käytännössä erottamattomia ihmisestä. Replikantit pyritään tunnistamaan Voight-Kampffin testillä, joka testaa testattavan empaattisuutta, johon replikanttien ei uskota kykenevän.
Väitettyjä testin läpäisyjä
Useiden tietokoneohjelmien on väitetty läpäisseen Turing-testin. Kyse on poikkeuksetta ollut chatbot-tyyppisistä tietokoneohjelmista, jotka on ohjelmoitu käymään alkeellista keskustelua kykenemättä kuitenkaan syvempään ajatteluun, ja siksi näillä tietokoneohjelmilla ei ole ollut muita sovelluksia kuin viihde ja suppeasti muotoiltujen Turing-testien läpäisy-yritykset.
Vuonna 1991 julistettiin jaettavaksi Loebner-palkinto sovellukselle, joka tuomarien mielestä läpäisee Turingin testin; sitä ei ole kesäkuuhun 2014 mennessä jaettu kenellekään. Lokakuussa 1992 järjestetyssä testissä arvioitiin 6 tietokoneohjelman ja kahden ihmisen ihmisyyttä rajoitetuista aiheista käytyjen keskusteluiden perusteella. Hölynpölyistä (engl. whimsical) keskustelua käyvää tietokoneohjelmaa moni arvioija piti ihmisenä [1].
Vuonna 2011 Cleverbot-niminen chatbot äänestettiin 59,3 prosenttisesti ihmiseksi Intiassa järjestetyssä Turing-testissä. [2]
Vuonna 2012 UT²- ja MirrorBot-nimiset chatbotit saavuttivat kumpainenkin 52 prosentin ihmisyyslukeman University of Texas at Austin:ssa järjestetyssä testissä [3].
Kesäkuussa 2014 näyttävästi julkisuuteen päässyt "Eugene Goostman", 13-vuotiaaksi ukrainalaiseksi pojaksi esitelty chatbot vakuutti 33 prosenttia arvioijista ihmisyydestään. Kokeen suoritti brittiläinen Royal Society of London -tiedeakatemia.[4] "Goostmanin" suunnittelivat Yhdysvalloissa asuva venäläissyntyinen Vladimir Veselov ja Venäjällä asuva ukrainalaissyntyinen Eugene Demtsenko. Eugene Goostman oli osallistunut samankaltaisiin Turing-testeihin useana aikaisempana vuonna huonommalla menestyksellä.
Lähteet
- The Turing Test and the Loebner Prize Communications of the Association for Computing Machinery, volume 37, number 6, pages 70–78, 1994.
- New Scientist
- Artificially Intelligent Game Bots Paas the Turing Test
- Tietokone läpäisi ensimmäistä kertaa tekoälyä mittaavan testin. Yle, Julkaistu: 8.6.2014
Kirjallisuutta
- Alan Turing: Computing machinery and intelligence, Mind 59 (#236): 1950, 433–460. Verkkoversio (Arkistoitu – Internet Archive), Toinen verkkoversio.
- A. P. Saygin; I. Cicekli; V. Akman: Turing Test: 50 Years Later, Minds and Machines 10(4): 2000, 463–518. (uudelleenjulkaistu teoksessa The Turing Test: The Elusive Standard of Artificial Intelligence edited by James H. Moor. Kluwer Academic, 2003) ISBN 1-4020-1205-5. Verkkoversio (Arkistoitu – Internet Archive).
Aiheesta muualla
- Turingin testi (Arkistoitu – Internet Archive) dmoz.org -sivustolla
- Artikkeli Turingin testistä Stanford Encyclopedia of Philosophy -sivustolla
- Vedonlyönti siitä, läpäiseekö kone testin 2029 mennessä. Vedonlyöjinä Mitch Kapor ja Ray Kurzweil.
- www.turinghub.com/
- Tietokone läpäisi testin, The Telegraph/