Gartnerin teknologiatrendit 2025 – energiatehokas tietojenkäsittely – tekoälyn energiankulutus ja sen hallinta
Artikkeli on kolmas osa energiatehokkaasta tietojenkäsittelystä käsittelevästä blogisarjasta.
Gartner julkaisi lokakuussa 2024 vuoden 2025 kymmenen tärkeintä teknologiatrendiä -katsauksensa. Ensimmäistä kertaa trendiraportissa mainittiin myös energiatehokas tietojenkäsittely (energy efficient computing), trendinä numero kuusi.
Edellisissä osissa tutustuttiin tietotekniikan energiankulutukseen ja sen kasvun taustasyihin ja avattiin energiankulutusta ohjelmistoissa. Tämä kolmas osa pureutuu trendaavaan aiheeseen – tekoäly ja energiankulutus.
Tekoälyn energiankulutus on voimakkaassa kasvussa
Tekoälyn käyttö on kasvanut viimeisten parin kolmen vuoden aikana merkittävästi ja saamme nähdä uusia tekoälyn sovelluksia viikoittain. Samoin toteutuksien tuotosten laatu on parantunut merkittävästi, erityisesti generatiivisisten tekoälyjen suhteen. Toisaalta maailmalla on herätty myös tekoälyratkaisujen energiankulutukseen ja päästöihin. Ratkaisujen laaja käyttö on johtanut uusien datakeskusten perustamiseen ja sitä myötä käytönaikaisten (operative) ja tuotesidonnaisten (embedded) päästöjen kasvuun.
Tekoälyn kuluttaman energiamäärän arviointia on haitannut pitkään yhteismitallisen datan puute. Tekoälytarjoajat ovat olleet – syystäkin – vaitonaisia kulutuksesta ja tarjonneet lähinnä yleisluontoisia huomioita energian käytöstään. Toisaalta, tekoälyn energiankulutus on ollut pääsyynä esimerkiksi Microsoftin ja Googlen vaikeuksiin leikata hiilijalanjälkeään. Molempien jalanjälki kasvoi viime vuonna ja tällä menolla kumpikaan ei tule pääsemään hiilitavoitteisiinsa. Microsoft osti Three Mile Islandin surullisenkuuluisan ydinvoimalan tuotannon tekoälyn tarpeisiin vuodesta 2028 eteenpäin – tällöin kunnostettu voimala alkaa tuottaa uudestaan sähköä.
Lopultakin mittausdataa energiankulutuksesta ja päästöistä
Vuoden 2024 aikana saatiin ensimmäiset tieteelliset artikkelit tekoälyn energiankulutuksesta tai päästöistä. Toki näissäkin artikkeleissa todetaan edelleen, että aihealue on vielä varsin alitutkittu. Uusia tutkimuksia on varmasti tulossa, mutta päätöksiä ilmastonmuutoksen suhteen tulee tehdä jo nyt eikä ole aikaa odottaa.
Toinen haaste on ollut määritellä yhteismitallista mittaustapaa erilaisille tekoälyratkaisuille, joiden ominaisuudet, konfiguraatio ja opetusdata, ja sitä myöten energiankulutus, voi vaihdella merkittävästi. Samoin laitteiden toimittajat ovat olleet haluttomia paljastamaan tekoälyn käyttämien laitteiden, tyypillisesti grafiikkasuorittimien (GPU), valmistuksesta syntyvää tuotesidonnaista hiilijalanjälkeä. Ensimmäisiä arvioita näistä on saatu ja niissä on todettu, että laitteiden tuotesidonnainen jalanjälki voi olla jopa puolet käytönaikaisesta. Tämä on varsin suuri luku verrattuna palvelinten ja verkon 80–20 jalanjäljen jakaumaan käytönaikaisiin ja tuotesidonnaisiin päästöihin.
Suuria eroja tekoälyllä suoritettavien toimien välillä
Äskettäisessä artikkelissa on mitattu usean erilaisen tekoälyllä suoritettavan toimenpiteen hiilijalanjälkeä, esimerkiksi tekstin ja kuvien luokittelu ja tuottaminen, hahmontunnistus, yhteenvetojen laadinta ja kuvatekstien laadinta. Koska kaikki testit ajettiin samassa pilvipalvelussa, niiden hiilijalanjälki vastaa suoraan energiankulutusta.
Erot eri toimien välillä ovat valtavia. Vähiten energiaa kulutti tekstin luokittelu, 0,002 kWh tuhatta toimea kohti ja vastaavasti eniten kuvien generointi, 2,9 kWh samoin tuhatta toimea kohtia. Molemmat luvut ovat keskiarvoja useammasta testistä eri tekoälymoottoreilla. Testien ääripäät ovat vieläkin kauempina, tehottomimman kuvantuotannon energiankulutus on 6 833 kertaa suurempi kuin tehokkaimman tekstintuotannon energiankulutus. Yleisesti havaittiin, että tekstin käsittely on kuvien käsittelyyn verrattuna merkittävästi energiatehokkaampaa, mikä johtuu pitkälti tarvittavien tokenien määrästä.
Samoin mallien koko vaikuttaa energiankulutukseen – suuret mallit kuluttavat enemmän kuin pienet. Mallin koon vaikutus on kuitenkin pienempi kuin mallin käyttötarkoituksen. Kaikkinensa mittausten hajonta oli suuri, vaikka eri tehtävät erottuvat osin päällekkäisinä klustereina.
Olennainen havainto oli, että tiettyyn tarkoitukseen suunnitellut mallit kuluttavat merkittävästi vähemmän energiaa kuin yleisen mallin käyttö samaan tarkoitukseen. Esimerkiksi tiivistelmien teossa tehtävään suunnitellut mallit tuottavat 4-10 gCO2eq tuhannelle toimelle ja yleiset mallit 20-30 gCO2eq samalla tehtävälle. Tämä on sinänsä ymmärrettävää, koska tehtävään suunnitellun mallin koko oli korkeintaan 600 miljoonaa parametria, kun taas suurimmat yleismallit olivat kooltaan noin 11 miljardia parametria.
Tekoälyjärjestelmien opettamisen kustannukset
Ajoaikaisen energiankulutuksen lisäksi tekoälyjärjestelmissä täytyy ottaa huomioon myös opetusdatan kokoamisen, siivoamisen ja järjestelyn sekä varsinaisen mallin opettamisen energiankulutus. Valitettavasti tästä ei ole vielä juurikaan tietoa saatavilla yleisesti käytössä olevien mallien suhteen. Mikäli tekoälyn opettaa itse, opettamisen energiankulutus kannattaa mitata ja miettiä keinoja pienentää sitä. Yksi suoraviivainen tapa vähentää päästöjä oman yrityksen kannalta on opettaa malli pienen hiili-intensiteetin energiantuotannon maissa. Suomi ja muut Pohjoismaat ovat hyviä kandidaatteja tähän. Toki kannattaa muistaa, että maailman energiankulutus kasvaa edelleen nopeammin kuin uusiutuvien tuottaminen, joten on olennaista myös säästää energiaa siellä missä mahdollista.
Suositukset tekoälyn energiankulutuksen sekä päästöjen hillintään
Tekoälyn käyttöä ei voida käytännössä kieltää yrityksissä, henki on jo tässä suhteessa päässyt pullosta. Sen sijaan energiankulutusta ja päästöjä voidaan hillitä:
-
1
Valitse, mitä tehtäviä tekoälyllä ratkaistaan
-
2
Käytä tehtävään suunniteltua mallia yleisen mallin sijaan, mikäli mahdollista
-
3
Ota mallin käyttämä energia – jos tiedossa – huomioon vertailtaessa eri malleja
-
4
Opeta järjestelmät matalan hiili-intensiteetin datakeskuksissa ja mieluiten silloin, kun yhteiskunta kuluttaa vähemmän sähköä tai uusiutuvaa on tarjolla normikulutusta enemmän
Sarjan seuraavassa osassa tutustutaan erilaisiin tapoihin, joilla IT-palvelujen ostajat, tekijät ja käyttäjät voivat hillitä ratkaisujen energiankulutusta.
Ajatuksiaan jakoi