Lyra (koodekki)
Lyra on Googlen kehittämä koodekki, joka on tarkoitettu puheen pakkaamiseen. Lyra on suunniteltu toimimaan alhaisella bittinopeudella (bittimäärällä), jolloin puhetta voidaan siirtää myös hyvin hitaissa verkoissa. Lyra hyödyntää koneoppimisella koulutettuja malleja.[1][2]
Koodekki pakkaa äänen 3 kbps (kilobittiä sekunnissa) bittimäärälle laadulla, joka Googlen mukaan on laadultaan vertailukelpoinen muihin koodekkeihin.[3] Googlen mukaan Lyra 3 kbps bittimäärällä on vertailtavissa Opus-pakkaukseen 8 kbps bittimäärällä, jolloin kaistan tarve vähenee 60 prosenttia.[1] Lyra versio 2 perustuu arkkitehtuuriltaan SoundStream-koodekille.[2][4]
Google on julkaissut koodekin lähdekoodit avoimena lähdekoodina huhtikuussa 2021 Apache-lisenssillä.[5][6] Lyra on kirjoitettu C++-kielellä.[2] Lyra on tuettu Androidilla, Linuxilla, macOS:llä ja Windowsissa.[6] Kääntämiseen tarvitaan Bazel-käännösjärjestelmä.[6]
Lähteet
- Lyra: A New Very Low-Bitrate Codec for Speech Compression ai.googleblog.com. 25.2.2021. Viitattu 11.11.2022. (englanniksi)
- Lyra V2 - a better, faster, and more versatile speech codec opensource.googleblog.com. 30.9.2022. Viitattu 11.11.2022. (englanniksi)
- Kyle Wiggers: Google launches Lyra codec in beta to reduce voice call bandwidth usage venturebeat.com. 6.4.2021. Viitattu 11.11.2022. (englanniksi)
- SoundStream: An End-to-End Neural Audio Codec (PDF) arxiv.org. Viitattu 11.11.2022. (englanniksi)
- Michael Larabel: Google Posts Initial Code For Lyra Speech Codec phoronix.com. 6.4.2021. Viitattu 11.11.2022. (englanniksi)
- google / lyra github.com. Viitattu 11.11.2022. (englanniksi)
Aiheesta muualla
- Wavenet based low rate speech coding (PDF) (englanniksi)
- Handling Background Noise in Neural Speech Generation (PDF) (englanniksi)
- Generative speech coding with predictive variance regularization (PDF) (englanniksi)
- SoundStream: An end-to-end neural audio codec (PDF) (englanniksi)