Vektorisuoritin
Vektorisuoritin (toisinaan taulukkosuoritin, engl. array processor) on alun perin erikoistarkoitukseen suunnattu suoritin supertietokoneissa. Nykyisin vektorisuoritin on toteutettu käskykantalaajennoksena tavallisessa suorittimessa.
Vektorisuorittimen määritelmä on suoritin, joka voi operoida kokonaisella vektorilla yhdellä käskyllä.[1][2] Käskyjen operandit ovat kokonaisia vektoreita yksittäisen elementin sijaan.[3] Vektorien käyttö vähentää käskyjen haun (engl. fetch) ja purkamisen (engl. decode) aiheuttamaa kuormaa koska käsiteltäviä käskyjä on vähemmän.[3]
Vektoriyksiköt ovat tyypillisesti SIMD käskykantoja, mutta myös MIMD tyyppisiä käskykantoja on käytetty sekä erilaisia yhdistelmiä, joissa tavanomainen suoritin jakaa tehtäviä SIMD-yksiköille (ks. Cell BE[4]).
Käyttökohteet
Vektorisuoritin soveltuu käyttökohteisiin jossa data on luontevasti rinnakkaista.[5]
SIMD-tyyppisessä suorituksessa sama komento suoritetaan jokaiselle elementille:
- RGB-väriarvon muuttamiseksi voidaan lisätä jokaiseen komponenttiin (R, G, B) sama arvo. Pseudokoodilla:
ADD 1, r0, r1, r2
, jossa arvo 1 lisättään rekisterien r0-r2 arvoihin. - Verteksin sijainnin tai asennon muuttamiseksi voidaan koordinaatit kertoa samalla arvolla. Pseudokoodilla:
MUL 0.2, r0, r1, r2
, jossa arvolla 0.2 kerrotaan rekisterien r0-r2 arvot.
Vektorisuorittimen etu voi esiintyä myös kahden lukusarjan käsittelyssä rinnakkain:[4]
__vector signed int va1[] = { 1, 2, 3, 4}, va2[] = { 5, 6, 7, 8 };
__vector signed int vb = vec_add(va1, va2);
Tavanomaisessa käskykannassa on kaksi operandia kerrallaan: ADD 1, r0
Tavanomaisella käskykannalla on siis suoritettava kolme erillistä komentoa kolmen operaation suorittamiseksi, joka SIMD-käskykannalla voidaan suorittaa yhdellä komennolla. Mikäli SIMD-komento vie yhden kellojakson nopeusero voi olla kolminkertainen tavanomaiseen verrattuna.
Toteutuksesta riippuen SIMD-komento voi vähentää myös muistista latausta ja talletusta (load and store), jolloin nopeutus voi olla nelinkertainen (16 komentoa -> 4 komentoa) skalaariseen verrattuna.[6]
Useissa tapauksissa suorittimen vektorirekisterit ja käskykanta tukevat käsittelyä erikokoisina lohkoina. Esimerkiksi 128-bittistä rekisteriä voidaan käyttää joko kahtena 64-bittisenä operandina tai neljänä 32-bittisenä operandina.
Edut ja haitat
Vektorisuorittimilla saadaan pienempi ohjelmakoko, koska yksittäinen komento voi piilottaa ehtorakenteen ja toistorakenteen.[3] Toisaalta suoritin tarvitsee erikoistuneempaa laitteistoa (vähemmän yleisesti saatavia komponentteja), sekä piirille sijoitettavaa muistia, joka on kallista valmistaa.[3]
Historia
Yksi ensimmäisistä vektorisuorittimia käyttävistä tietokoneista oli Illinois’n yliopiston kehittämä ILLIAC IV.[7]
Vektorisuorittimia käyttäneitä tietokoneita:[8][6]
- Texas Instrumentsin (TI) Advanced Scientific Computer (ASC)[9]
- Control Data Corporationin (CDC) STAR-100
- Cray Cray-1 (1976)
- Fujitsu FACOM VP-100 (1982)[10]
- Fujitsu FACOM VP-200 (1982)
- Hitachi HITAC S-810 (1982)[11]
- NEC SX-1 (1983)[12]
- NEC SX-2 (1983)
- Convex Computer C1 (1984)[8]
- Hitachi HITAC S-820 (1987)[13]
- Cray Cray J90 (1994)
- NEC SX-3 (1995)
- Fujitsu VP300 (1996)
- Cray Cray SV1 (1998)
Toteutuksia
Esimerkkejä itsenäisistä vektorisuorittimista:
Käskykantalaajennoksia:
Katso myös
Lähteet
- Vector Processors phy.ornl.gov. Viitattu 16.2.2017.
- Aldakheel, Eman & Chandrasekaran, Ganesh & Prof. Kshemkalyani, Ajay: VECTOR PROCESSORS cs.uic.edu. Viitattu 16.2.2017.
- Manadhata, Pratyusa & Sekar, Vyas: Vector Processors (PDF) cs.cmu.edu. Viitattu 9.9.2018.
- Chapter 2 Basics of SIMD Programming kernel.org. Viitattu 18.2.2017.
- Mutlu, Onur: Computer Architecture: SIMD/Vector/GPU ece.cmu.edu. Viitattu 16.2.2017.
- Welch, Eric & Evans, James: Vector and SIMD Processors meseec.ce.rit.edu. Viitattu 16.2.2017.
- ILLIAC IV archive.computerhistory.org. Viitattu 16.2.2017.
- Patterson, David A.: Lecture 6: Vector Processing people.eecs.berkeley.edu. Viitattu 16.2.2017.
- Watson, W. J.: The TI ASC-A highly modular and flexible super computer architecture computer.org. Viitattu 16.2.2017.
- 【Fujitsu】 FACOM VP-100 Series IPSJ Computer Museum. Viitattu 16.2.2017.
- 【Hitachi】 HITAC S-810 IPSJ Computer Museum. Viitattu 16.2.2017.
- 【NEC】 SX-1, SX-2 IPSJ Computer Museum. Viitattu 16.2.2017.
- 【Hitachi】 HITAC S-820 IPSJ Computer Museum. Viitattu 16.2.2017.