Ajankohtaiskatsaus AI-aiheeseen: 80 vuotta vanha visio käy viimein toteen, mutta minne tuottavuuskasvun hyöty valuu?

Tämä teksti perustuu Qvikin AI-aiheisessa tapahtumassa 11.5.2023 pitämääni puheenvuoroon. Se pohdiskelee uusien generatiivisten tekoälyratkaisujen merkitystä erityisesti digipalveluiden kehityksen ja suunnittelun näkökulmasta sekä jakaa muutamia omia käytännöllisiä vinkkejäni sekä kasan hyväksi havaittuja lähteitä. Ennen kaikkea se dokumentoi ajankuvaa ja näyttää luultavasti herttaisen vanhentuneelta vuoden kuluttua.

18 minuuttia

Käytän tässä tekstissä tekoäly-sanaa liberaalisti kuvaamaan kaikenlaista automaattista ja ihmeellistä silläkin uhalla, että tiedän, että monia aihetta syvällisemmin tuntevia ärsyttää kutsua tällaisia kielimalleja millään tavalla älykkäiksi.

Johdanto

Tämä on ensimmäinen kerta, kun kirjoitan AI-aiheesta julkisesti, joten olisi hyvä perustella, miksi minua kannattaa kuunnella. Onnistuin keksimään perusteeksi, että olen sentään tehnyt tätä hommaa jo aika pitkään. Vuonna 2017 kun AI-aiheet olivat viimeksi muodissa, kauppasimme Qvikillä tuotteistettua miniprojektia nimeltä ML Sprint. Designsprintistä inspiroitunut konsepti näytti kalvoilla ihan pätevältä. Yhtään projektia emme tällä mallilla lopulta myyneet, joten en osaa sanoa, olisiko se toiminut. Epäilen.

Koneoppimissprinttejä voi kaupata tällaisella mallilla, mutta en suosittele sitä

Ehkä olimme liikkeellä väärään aikaan, ehkä tällä kertaa on toisin. Tekee mieli muistella, miltä Gartnerin hypekäyrä näyttää.

Gartner hype curve

Gartnerin hypekäyrälle voi sijoittaa tarpeen mukaan erilaisia asioita eri kohtiin

Kaaviossa ei näy aikajanaa, joten täytyi kysyä apua botilta. Tässä on kyseessä Chrome-selaimen laajennos, jolla ChatGPT:tä hyödyntävän Monica-botin saa tulkitsemaan Google-hakuja.

Jos haluat sen käyttöösi, tätä linkkiä käyttämällä saat samalla ilmaisen GPT4-kyselyn. Ja minä myös.

Bot explains Gartner curve

Tosiaan, ensimmäisen intoilun ja todellisen läpimurron välissä on tyypillisesti ainakin viisi vuotta aikaa. Vuodesta 2017 on kulunut jo yli viisi vuotta, joten nyt saattaa todellakin olla läpimurron aika.

Noihin aikoihin yksi usein viittaamani lähde oli entisen kollegani ja nykyään Qvikin designjohtajana toimivan Lassi Liikkasen mainio artikkeli, jossa hän käsitteli, millaisia vaikutuksia koneoppimisratkaisuilla on käyttöliittymäsuunnittelijoille. Artikkelissaan Lassi jaotteli ratkaisut kolmeen kategoriaan: tunnistamiseen, ennakointiin ja luomiseen.

Detection, prediction and generation are the main categories where one can utilize machine learning according to Lassi Liikkanen

Koneoppimisen sovelluskohteet Liikkasen artikkelin mukaan

Näistä viimeisestä oli aina vaikeaa keksiä kunnon esimerkkejä. Photarissa on se automaattinen kontekstuaalinen täyttö, joka toimii joskus aika hyvin. Ja sitten oli se yksi projekti, jossa kone sävelsi ihan uskottavaa hissimusiikkia.

Tulevaisuuden kuva 80 vuoden takaa

Nyt kun muistelun makuun päästiin, katsotaan vielä hieman kauemmas. Aina kun uudet teknologiat nostavat päätään, tekee mieli palata Vannevar Bushin klassikkoartikkeliin As we may think vuodelta 1945.

Pidän jo otsikon kaksoismerkityksestä. Koska tai niin kuin voimme ajatella.

Vannevar Bushin artikkeli on kiehtovan osuva ennustus tulevasta maailmasta

Artikkelissaa Bush esittää tulevaisuuden informaationkäsittelyjärjestelmän, joka toimii ihmisaivojen tapaan ja vahvistaa ihmisen kongnitiivisia kykyjä samaan tapaan kuin mekaaniset koneet tekevät meistä vahvempia. Vähän niin kuin Jobs puhui paljon myöhemmin mielen polkupyörästä.

Koska artikkelia googlaamalla hakutulosten viereen ilmestyy Monica-botin yhteenveto, kiusaus kurkistaa sitä itse jutun lukemisen sijaan on kova. Näin se sanoo.

Screenshot of Monica plugin showing a summary of the article As we may think

Aivan, Memex sen järjestelmän nimi oli. Kuinka se toimikaan?

Screenshot of Monica bot experiencing high traffic and not being able to answer

[Oletko miettinyt, että tällainen vitsailu saattaisi toimia paremmin esityksessä kuin blogitekstissä?]

Bot summarizing how Memex would have worked. It was supposed to use a combination of microfilm, cameras and screens to let the user access a web of information.

Melkoinen visio kaikkiaan. Onkohan nykyäänkin ihmisiä, jotka kirjoittavat näin tarkkoja pohdintoja siitä, miltä maailma voisi näyttää 80 vuoden kuluttua?

Nykyisillä generatiivista tekoälyä käyttävillä palveluilla olisi helppoa luoda pätevän oloinen esitys tältä pohjalta. Esimerkiksi antamalla Tome-palvelulle kehotteen ”Create a presentation that connects As we may think to the current AI discussion” saa oikein uskottavan 8 kalvon esityksen aihetta varten luodulla kuvituksella.

Otsikoksi se keksi ihan iskevästi: From as we may think to AI: A journey through time and technology.

Tome created a presentation about AI and As we may think

Tome laati pätevän esityksen aiheesta As we may think ja moderni tekoälykeskustelu

Esitys tuntuu loppuvan vähän kesken, joten siihen voisi vielä laatia yhteenvedon. Pyydetään sellaista: Create a summary slide to the end.

A summary slide created by Tome service

Tome laati esitykselle kiltisti yhteenvetokalvon, kun sellaista pyydettiin

Yhteenvetokin saatiin. Kaikkiaan tällainen sisällöntuotanto on niin helppoa, että ahdistaa aika tavalla, millainen määrä turhaa tauhkaa meitä odottakaan ja millaisia apureita tarvitaan luotsaamaan reittiä kaiken syntyvän sälän lävitse.

Douglas Engelbart ja käyttöliittymien sukupolvet

Kaikki eivät ole kuulleet Vannevar Bushista, mutta hiiren keksijänä tunnettu Douglas Engelbart on jo tutumpi nimi. Hänen kerrotaan vaikuttuneen Bushin visiosta ja sanoneen:

”If in your office, you…could be surrounded by a suite of computer-driven aids that would let you amplify your intellect, you would be able to make a significant qualitative leap in your effectiveness.”

Tai no, botti väitti näin. Toivottavasti se on totta.

Engelbart with his mouse and a screenshot of mother of all demos

Onhan hiirikin jo keksitty” kerrotaan Nasan käytävillä tokaistun, kun joku keksi kyseenalaistaa, olisiko ihmisestä matkustamaan kuuhun saakka

Engelbart keksi paljon muutakin kuin hiiren. Niin sanotussa Mother of all demos -tilaisuudessa vuonna 1968 hän esitteli hiiren lisäksi mm. hyperlinkin, kollaboratiivisen reaaliaikaisen tekstinkäsittelyn, ikkunoidun käyttöliittymän, leikepöydän ja videopuhelun.

Engelbartin kannalta kehitys kulki ikävään suuntaan. Visio ihmisen kykyjen augmentoinnista jäi pitkäksi aikaa taka-alalle, ja tietokonemaailma keskittyi enemmän automaatioon ja prosessien tehostamiseen. Hiirikin yleistyi vasta niin monta vuosikymmentä myöhemmin, että Engelbartin patentti oli ehtinyt vanhentua.

Tässä hengessä on kiinnostavaa miettiä, kuinka käyttöliittymien sukupolvet ovat sittemmin kehittyneet. Ensin olivat fyysiset ohjaimet ja reikäkortit, kunnes tulivat joustavat ja tehokkaat komentorivikäyttöliittymät. Tehokäyttäjien näkökulmasta tämän jälkeen ei tietenkään ole mitään hyödyllistä enää tullutkaan.

Fout generations of user interfraces: command line interface, full screen menus, graphic user interface, direct manipulation

Käyttöliittymien sukupolvia. Olen tehnyt kalvoni muistaakseni mukauttaen Nielsenin Usability engineering -kirjassa esitettyä mallia. Se poikkeaa hieman siitä, miten Nielsen esittää aihetta verkkoartikkelissaan.

Näitä seurasivat erilaiset koko ruudun valikot, joissa saattoi liikkua nuolinäppäimillä. Graafinen käyttöliittymä hiirineen muutti 80-luvulla kaiken. Se paitsi mahdollisti uuden tyyppisten asioiden tekemisen tietokoneella, myös paransi oleellisesti toimintojen opittavuutta ja muistettavuutta, kun kaikkea ei tarvinnut tietää ennakkoon ja muistaa ulkoa. Kosketusnäyttöjen suora vuorovaikutus on ollut seuraava askel, joka on sekä tuonut että vienyt tehokkuutta.

Joissain versioissa tähän on tapana piirtää AR- ja VR-käyttöliittymät seuraavaksi, mutta nyt kun metaversumi on hetkeksi peruutettu, täytyy palata asiaan myöhemmin.

Tekstisyötteisiin pohjautuvien tekoälypalveluiden myötä tuntuu kuin olisimme palanneet takaisin alkuun. ChatGPT:n tai Midjourneyn kehote on toki paljon anteeksiantavampi kuin komentorivi, sillä se antaa mielekkäitä lopputuloksia epätäydellisilläkin ohjeilla. Mutta sama tarjolla olevien mahdollisuuksien hahmottamisen hankaluus sitä vaivaa. Sekä toisaalta vaikeus ilmaista tarkasti, mihin kohtaan vaikka kuvaa haluaa muutostoiveensa vaikuttavan. Vähän kuin tekisi suunnittelutyötä ilman kursoria.

Generations of user interfaces where the first two generations are in focus

Nykyiset tekstikomentoihin perustuvat AI-käyttöliittymät vievät käyttöliittymiä joiltain osin taaksepäin

Nyt hetkellisesti näyttää, että suurimpia velhoja ovat he, jotka osaavat kertoa Midjourneylle juuri oikeat loitsut, joilla sen saa luomaan halutunlaisia kuvia. Äkkiseltään tuntuisi, että tämä ei voi olla lopullinen ratkaisu.

Screenshot of two confusing Midjourney promts

Nyt kun pohjalla oleva tekniikka alkaa olla hämmentävän hyvällä tasolla, on minusta erityisen kiinnostavaa nähdä, millainen käyttäjäkokemus sen päälle kyetään rakentamaan. Parhaat tavat yhdistää tekoälyä ja vuosikymmenien käyttöliittymäsuunnittelun perinnettä ovat varmasti vasta tulossa. Ja nyt kun mietin asiaa, muistan, että olen kirjoittanut tästä aiemminkin. Vuonna 2016 chat-pohjaiset käyttöliittymät olivat muodissa edellisen kerran ja silloin pöhistiin harhaanjohtavasta käsitteestä ”no UI”.

Generations of user interfaces where the last two generations are in focus

Paras on varmasti vielä tulossa.

AI:n integroiminen graafisiin käyttöliittymiin

Aiheesta on käyty keskustelua viime aikoina. Tässä Linkedin-viestissä mietittiin ensin, olisiko optimaalinen käyttöliittymä verkkokaupalle vain fiksu hakuluukku, jolle saisi kertoa, mitä haluaa. Kommenteissa minä ja kumppanit viisastelimme edellä mainitun pohjalta, että se olisi osittain askel taaksepäin.

Puheenvuoroni jälkeen tämäkin keskustelu on ehtinyt edetä. Luke Wroblewski on kirjoittanut vuosien varrella niin paljon fiksuja asioita perinteisten lomakkeiden suunnittelusta ja mobiilioptimoidusta suunnittelusta, että olen opetellut kirjoittamaan hänen sukunimensä. Nyt hän kirjoitti artikkelin parhaista käytännöistä toteuttaa tekoälyyn pohjautuvia chat-käyttöliittymiä. Pohjalla on hänen kokemuksensa mainion Ask Luke -botin kanssa. Siltä voi kysyä näkemyksiä käyttöliittymäsuunnittelusta ja se vastaa Wroblewskin artikkelien pohjalta ja osaa myös linkittää alkuperäislähteisiin.

Yksi selvästi nähtävissä oleva uhka on tämä.

A meme image where the guy is looking over his shoulder after "AI workarounds" while his partner "Proper usability engineering" feels neglected

Meemikuvien ei pitäisi tarvita kuvatekstejä.

Palveluihin lisätään AI-avustimia, joilla tehtävät saa hoidettua ja sen varjolla perinteisen käyttöliittymän kehitys jätetään retuperälle.

Kerron kohta hyviä esimerkkejä siitä, mihin kaikkeen Notion-sovelluksen AI-ominaisuudet taipuvat, mutta aloitan tällaisella laastariesimerkillä.

Tiedonhallintasovellus Notionilla voi tehdä melkein mitä vain (itse olen korvannut sillä vaihtelevalla menestyksellä Jiran ja Confluencen), mutta tietääkseni siinä ei ole helppoa keinoa muuttaa numeroimatonta listaa numeroiduksi. Nykyään kun mukana on tekoälyavustin, tämä ihmeellinen tehtävä on yhtäkkiä mahdollinen.

Screenshot of Notion with an unordered list selected and a prompt: Convert this to a numbered list

Notionin järjestämätön lista on valittu ja AI-avustimen on käsketty muuttaa se numeroiduksi

Screenshot of Notion with a list that the AI has converted to a numbered list

Kuinka ihmeellinen tapahtuu – lopputuloksena on järjestetty lista.

Vähän samassa hengessä tämä Microsoft 365 Copilot näyttää esittelyvideolla oikein vaikuttavalta. Ja sen myötä voi hyvin käydä niin, että Microsoftia kiinnostaa yhä vähemmän parantaa sovellustensa käyttöliittymiä.

Viitteet väitettyyn huonouteen saatavilla pyydettäessä.

Screenshot of Microsoft promo video talking about copilot for Powerpoint and a text that says I'm afraid Powerpoint will continue to suck
Screenshot of Microsoft promo video talking about copilot for Excel and a text that says and pivot tables continue to be unnecessarily confusing
Screenshot of Microsoft promo video showing a fancy effect of Excel cells that flip over in 3D and a text that says: Well, as long as we get the 3D cells, I'm in.

Läpimurron tekevät suunnitteluapurit ovat vielä näkemättä

On paljon lupaavia palveluita, jotka kertovat automatisoivansa käyttöliittymäsuunnittelun. Esimerkiksi Uizard lupaa paljon. Mutta näkisin, että pelkkä AI ei riitä vaan niiden pitäisi mahdollistaa myös manuaalinen suunnittelu tai integroitua täysin saumattomasti Figmaan.

Eikä ole mahdotonta, että Figman asema vielä murtuisi. Sketch romahti hämmentävän nopeasti, kun Figma toi ensimmäisenä palveluna käyttöön saumattoman monen käyttäjän tuen. Ylivertaisen AI-avustimen tuova ratkaisu voisi periaatteessa onnistua kaappaamaan markkinat, mutta en pidä todennäköisenä, että Figma epäonnistuisi tässä siirtymässä.

Tapahtumassa ennen puheenvuoroani ehdin törmätä Mukesh Israniin, joka on mukana Aalto-yliopiston tiimissä, joka kehittää Design.ai-nimistä Figmaan integroituvaa työkalua. He ovat lähteneet liikkeelle lopputulosten arvioinnista varsinaisen suunnittelun automatisoinnin sijaan. Työkalu vaikuttaa kiinnostavalta, mutta en ole vielä ehtinyt kokeilla sitä kunnolla.

Käyttöliittymäsuunnittelu on oma lajinsa, mutta erilaisten kuvituskuvien puolella AI-apurit ovat jo lyöneet läpi. Discord-keskustelualustan sisällä toimiva Midjourney lienee eniten julkisuutta saanut työkalu. Sen kehotteiden viilaamisesta on tullut oma taiteenlajinsa. En selvästikään vain osaa, mutta itse koen Midjourneyn ympäristönä hankalaksi. Ei ole kivaa kokeilla uutta vierasta maailmaa julkisesti niin, että kaikki muut näkevät tyhmät kehotteeni ja epäonnistuneet kuvani.

Screenshot of confusing Midjourney flow inside Discord

Discord-keskustelualustan sisällä toimivan Midjourneyn kakofonia ahdistaa aloittelijaa.

Esityksen kuvitukset tein Wombon Dream-nimisellä sovelluksella. Se tuntui helposti lähestyttävältä, mutta ei tuota yhtä hienoja lopputuloksia kuin Midjourney.

Yksi yksinkertainen, mutta arvokas generatiivisen tekoälyn mahdollistama apuri on myös keinotekoinen resoluution kasvattaja. Tein esityksen kansikuvan neliön muotoiseksi ja nyt tarvitsinkin lisää resoluutiota, jota kuvaa pystyi käyttämään blogitekstin otsikkokuvana. Vanha kunnon Pixelmator onnistui taikomaan lisää pikseleitä koneen alun perin kuvittelemaan kuvaan.

Suosittelen Pixelmatoria kaikille, jotka haluvat joskus muokata kuvia, mutta eivät tarvitse Photoshopin ominaisuuksia eivätkä tykkää maksaa ohjelmistoistaan kuukausivuokraa.

Hero image of the article, scaled up with Pixelmator

Vasemmalla alkuperäinen kuva ja oikealla Pixelmatorin skaalaama versio

[Lisäys 25.5.] Tämäkin aihe edistyy niin nopeasti, että menee pää pyörälle. Ensin kohistiin muutaman päivän ajan DragGAN-työkalusta, joka ei ole vielä edes yleisesti saatavilla. Twitter-virrassani näkyi peräkkäin useampi samaa demovideota jakanut viesti lepää rauhassa Photoshop -saatteilla.

Sitten pari päivää myöhemmin julkaistiin demovideoita uudesta AI-avusteisesta Photoshopista. Myös Adobe kutsuu apuria Microsoftin tapaan co-pilotiksi, tosin yhdysmerkillä. Uusi Photari vaikuttaa tarjoava juuri sitä mitä kerroin kaipaavani: mahdollisuuden valita, mihin osaan kuvaa haluaa AI:n tekevän taikojaan. Tässä ketjussa näytettiin kiinnostavia käytännön kokemuksia. Vaikuttaa lupaavalta! Kokeiluversiokin on jo julkisesti saatavilla.

Tekoälyunelmia ja toimistohommia

Täydellisen suunnitteluapurin antaessa odotella itseään olen havainnut erilaiset AI-apurit hyödyllisiksi arkisissa askareissa. Tässä esimerkissä minulla oli hallussani Excel-tiedosto, jossa oli monimutkainen annuiteettilainan kaava, joka minun oli tarpeen ymmärtää, jotta olisin voinut määrittää ohjelmistokehittäjälle, mitä hänen pitäisi toteuttaa. Tuntui uuvuttavalta lähteä katsomaan, mitä kaava oli syönyt sisäänsä, joten kopioin sen ChatGPT:hen ja toivoin, että se olisi voinut piirtää sen auki selkeämmin hahmottuvana yhtälönä.

Sitä se ei tehnyt, vaan se yllätyksekseni tunnisti kaavan muodosta, millaisesta laskusta oli kyse ja selitti, mitä eri muuttujat tarkoittavat.

Valitettavasti se teki samalla virheen, joka johti meitä hieman harhaan. Tarkkana näissä saa olla jatkuvasti.

Screenshot of ChatGPT sorting out a confusing Excel formula about mortgage payments

ChatGPT auttoi luomaan merkitystä Excel-kaavalle tietämättä dokumentista mitään muuta.

Tuota kaavaa käytimme pohjalla toteuttaessamme Newil&Baun asiakkaiden profiiliin uuden asuntolainalaskurin.

Screenshot of a mortgage calculator

ChatGPT:n avulla selvitetty kaava pääsi tuotantokäyttöön uudessa lainalaskurissamme.

Määrittelyiden laatimisen ohella toinen ohjelmistokehitykseen läheisesti liittyvä viheliäinen puuha on bugien raportoiminen. Bugit olisi hyvä raportoida määrämuotoisesti. Mitä tein, mitä oletin tapahtuvan, mitä oikeasti tapahtui ja niin edelleen.

Luonteva tapa taas on jättää kuvauksesta noin kolme neljännestä pois ja sanoa vain lyhyesti, mikä oli pielessä. Kokeilin, kuinka hyvin Notion osaisi luoda suomeksi kirjoitetusta raapaisusta virallisen muotoisen bugiraportin englanniksi. Yllättävän hyvin!

Screenshot of Notion: creating a proper bug report in English from a simple sentence in Finnish.

Notion osaa luoda hyvän pohjan bugiraportille yksinkertaisen lauseen pohjalta. Eikä tarvitse edes kirjoittaa englanniksi.

Vielä astetta nihkeämpää on laatia suunnitelmia ominaisuuksien testaamisesta. Notion osaa auttaa alkuun siinäkin, vaikka kehote on kirjoitettu näin epämääräisesti.

Screenshot of Notion: creating a proper test plan in English from a simple sentence in Finnish.

Notion luo kattavan testisuunnitelman epämääräisen kuvauksen perusteella.

Tällä viikolla minulla oli tarve luoda sähköpostisoitteita nimilistasta eikä huvittanut lähteä muokkaamaan käsin. Eikä onneksi tarvinnutkaan.

Notion muodostaa nimistä sähköpostiosoitteita yksinkertaisella pyynnöllä.

Yksi päteväksi havaitsemani työkalu on nimeltään GPT for Work. Se on Google Sheets -laajennus, jonka avulla Sheets-taulukoihin voi tuoda käyttöön tekoälyn ryydittämiä ominaisuuksia. Palvelu on toistaiseksi maksuton, mutta hyödyntää taustalla GPT-tilin krediittejä.

Sen avulla voidaan ideoida mainoslauseita jäätelökauppiaille, mutta erityisen käteviä ovat keinot korjata puutteellista dataa tai luoda erilaisia yhteenvetoja. Kuvakaappaus on laajennoksen mukana tulevasta harjoittelutaulukosta.

GPT for Work -esimerkkejä. Epämääräisesti kirjoitettujen nimien vakioimista, rikkinäisten sähköpostiosoitteiden korjaamista, tekstin tiimistämistä pyydetyn formaatin mukaisesti.

Tein tätä esitystä varten oman kokeilun. Paremman puutteessa teemana on yhdistää uutta teknologiaa ja vanhakantaista ajattelua. Päätin kokeilla, kuinka hyvin apuri osaisi olettaa henkilön sosiaalisen sukupuolen (gender) nimen perusteella, jos vaikka markkinointi kaipaisi tällaista asiakasrekisteristä puuttuvaa demografiatietoa. Yllättävän hyvin toimi. Kimi tulkittiin naiseksi ja Kaino-nimen kohdalla tulokset vaihtelivat.

Kun GPT for Work -laajennus on lisätty Google Sheetsiin, käyttöön saa tukun GPT-alkuisia komentoja. GPT_CLASSIFY-komennolle annetaan syötteeksi kategorisoitava asia ja kategoriat. Lisäksi voidaan antaa esimerkkejä lisäohjeeksi, mutta suomalaiset nimet onnistuivat ihan lonkalta.

Tällaisia oletuksia nimen perusteella tehtiin

Tulokset komennon käyttämisen jälkeen. Kaino-nimellä vastaukset vaihtelivat, Kimi tulkittiin johdonmukaisesti naiseksi.

Pelkkään ChatGPT:hen verrattuna tämän laajennuksen lisäarvo on siinä, että erilaista dataa on helppoa saada valumaan Google Sheetsiin, dataa voidaan käsitellä siellä määrämuotoisesti ja raportoida eteenpäin. Komentoja ja niiden parametreja voidaan myös hallita tarkemmin kuin chat-käyttöliittymässä. Aikomukseni on kokeilla tätä seuraavaksi asiakastutkimuksen yhteydessä tähän tapaan.

Typeform on joustava kyselytyökalu, josta vastaukset saa valumaan reaaliajassa Google Sheetsiin. GPT for Workin avulla avoimia vastauksia voi analysoida automaattisesti. Looker Studio on kätevä työkalu Google Sheetsissä sijaitsevan datan raportointiin.

Erilaisten laadullisten tutkimusten tulosten läpikäynti jää usein ohueksi ja lopulta raportoidaan joko puutteellisesti yhteen vedettyä raakadataa tai ennakko-oletusten vinouttamia poimintoja. Oletettavasti koneen ottaminen analyysiavuksi sekä tehostaa prosessia että parantaa lopputulosta.

Tutkimukseen liittyen. Syntheticusers vaikuttaa kiinnostavalta palvelulta, mutta en ole vielä saanut beta-kutsua, jotta olisin päässyt testaamaan.

Toinen kiinnostava palvelu, jota en ole kokeillut on Airtablen uusi AI-laajennus. Airtable vaikuttaa kaikkiaan ihan ilman AI:takin alustalta, joka olisi hyvä ottaa haltuun. Tulee sellainen vaikutelma, että sillä voi tehdä melkein mitä vain.

Ihan kohta kaikki on valtavirtaa

Kehitys on ollut niin nopeaa, että sitä on vaikea käsittää. Notion oli ensimmäinen ohjelma, jonka kautta altistuin viime syksynä uuden aallon generatiiviselle tekoälylle – enkä ollut demovideon nähtyäni uskoa silmiäni. Vähän myöhemmin ChatGPT tuli yleisesti saataville ja muutti odotuksia niin, että kun sain viimein Notionin AI-ominaisuudet käyttööni, ne eivät enää suuremmin yllättäneet.

Vaikeinta on edelleen muistaa käyttää näitä ominaisuuksia. Odotan innolla, että vastaava voima tulee käyttöön suoraan käyttöjärjestelmätasolle. AI:lla ryyditetty Spotlight olisi melkoinen taikasauva.

[Lisäys 25.5. Microsoft näkyy olevan näissä suunnitelmissaan jo pitkällä. Julkaistut tiedot Windows Copilotista näyttävät lupaavilta.]

On kaikkiaan kiinnostavaa nähdä, kuinka Apple pysyy mukana kehityksessä. Applen yksityisyyttä ja paikallista tiedonkäsittelyä suosiva lähestymistapa istuu intuitiivisesti huonommin tähän aihepiirin kuin vaikkapa Googlen pilvipohjaisuus ja höllempi suhtautuminen yksityisyyteen. (Applen kerrotaan myös kieltäneen työntekijöiltään AI-apureiden käytön tietovuotojen estämiseksi.)

Siitä huolimatta hetken aikaa ehdittiin olla huolissaan siitäkin, onko Google menettämässä pelin, kun Microsoft ehti ensimmäisenä integroida AI-ominaisuuksia hakukoneeseensa. Google piti puheenvuoroani edeltävänä iltana vuotuisen I/O-tapahtumansa, ja siellä julkaistut uutuudet pakottivat minut päivittämään kalvojani vielä viime hetkellä.

Tämä Googleen yhteenvetovideo maalailee lupaavasti, kuinka uutta toiminnallisuutta on tarkoitus tuoda tarjolle haun yhteyteen.

Tässä on hyvä analyysi Googlen uuden hakusivun suunnitteluperiaatteista. AI-apuri ei ole rento ja jutusteleva kaveri, vaan etusijalla on faktakeskeisyys. Oleellisena erona puhtaisiin chat-ratkaisuihin on lähteistyksen tärkeys. Uusi hakusivu tarjoaa yhä suoria linkkejä eteenpäin alkuperäislähteisiin.

Pidemmät koostevideot koko tapahtumasta näyttävät lisää esimerkkejä. Googlen visio on saman kaltainen kuin Microsoft 365 Copilotilla. AI-avustin tulee käyttöön joka paikkaan. Vaikuttaa, että ei kestä kauaa, että tekoälyjuttujen hyödyntäminen vaatii erilaisiin eksoottisiin työkaluihin perehtymistä, vaan toiminnot tulevat tarjolle palveluihin, joita kaikki käyttävät jo muutenkin.

Haun lisäksi Googlella on tarjolla ChatGPT:n kaltainen keskusteleva apuri nimeltään Bard. Se ei ole käytettävissä EU:ssa, mutta viime viikonloppuna Englannissa käydessäni pääsin testaamaan sitä hieman. Kokemus on saman kaltainen kuin ChatGPT:llä ja vastaukset tuntuvat arkisessa käytössä yhtä lailla laadukkailta. Bardin merkittävänä etuna on ajankohtaisuus, sillä se on ChatGPT:stä poiketen yhteydessä Internetiin. Toisin kuin ChatGPT se ei vastaa suomenkielisiin kysymyksiin.

Olin lomalla Liverpoolissa ja halusin ymmärtää, kuinka kaupunki vertautuu Helsinkiin. Bard kaivoi dataa helposti silmäiltävään muotoon.

Sittemmin myös ChatGPT:n puolella on tapahtunut kehitystä. Maksullisen version käyttäjät voivat yhdistää sen Internetiin. Lisäksi tarjolle on tullut ensimmäinen erä laajennuksia, joilla sen voi kytkeä erilaisiin palveluihin ja suorittaa loppuun saakka erilaisia asioita kuten matkavarauksia. Ilmassa on vähän samaa tunnelmaa kuin App Storen ensimmäisinä hetkinä.

Täällä kerrotaan, miksi ChatGPT kannattaa hylätä ja ottaa Bard käyttöön, täällä taas neuvotaan, mitä kannattaa tehdä nyt kun ChatGPT:lläkin pääsee nettiin.

Screenshot of a list of ChatGPT plugins

ChatGPT:n lisäosien äärellä on samaa tunnelmaa kuin varhaisessa App Storessa.

ChatGPT julkaistiin hiljattain myös mobiilisovelluksena. Ensimmäisessä vaiheessa se on saatavilla vain iOS:lle ja vain Yhdysvalloissa. Esittelysivulla esitellyistä ominaisuuksista ainoastaan puheentunnistus vaikuttaa erottavan sen selainversiosta.

Twitterissä sovelluksen designia on jo ehditty ruotia sieluttomaksi, mutta se seuraa pitkältä päätuotteen pelkistettyä linjaa.

Tässä vielä Pete Huangin tekemä hyvä vertailu eri chatboteista. Paljon kohuttu GPT:n versio 4 on taitava, mutta vastaavasti hitaampi.

Comparing different chatbots by Pete Huang

Mitä välittömiä vaikutuksia tällä kaikella on?

Puheenvuoro pidettiin digikonsultointiyhtiö Qvikin tapahtumassa, joten ajattelin seurauksia erityisesti tällaisen toiminnan näkökulmasta. AI-kehitys vaikuttaa sekä siihen, millaisia palveluita rakennetaan että siihen, kuinka se tehdään.

A slide saying there are two things that will change: what we are building and how we are building it.

Tuntuu luontevalta ajatella, että mitä-puoli muuttuu hitaammin. Monessa organisaatiossa on yhä niin paljon digitalisaatiovelkaa, että ne eivät pysty itse luomaan täysin uusia AI-pohjaisia palveluita. Toki joissain rajoissa voi olla mahdollista oikaista hieman ja siirtyä suoraan AI-ratkaisuihin vähän kuin yllä pohdittiin kehitystä käyttöliittymien kannalta.

Kuinka-puoli taas on jo muuttunut. Moni ohjelmistokehittäjä kertoo ottaneensa AI-avustimet kuten GitHub Copilotin käyttöönsä eikä hevillä aio vaihtaa takaisin. MS:n ja Googlen julkistukset tarkoittavat, että uudet toiminnot ovat kohta jokaisen toimistotyöläisen käsissä.

Tällainen työn tehostuminen herättää intuitiivisesti huolta yrityksissä, joiden liiketoiminta perustuu laskutettavien työtuntien maksimointiin. Jos tuottavuus tehostuu vaikkapa kolmanneksella, putoaako liikevaihto samassa suhteessa?

A text asking What about "time and materials" based billing and an image created with the prompt "time and materials"

En usko, että asia on ihan näin yksioikoinen. Yleensä ottaen ole olemassa mitään tiettyä määrää työtä, joka pitää saada tehdyksi mahdollisimman edullisella hinnalla. En muista, että olisin koskaan nähnyt tyhjää työjonoa eli backlogia.

A text asking When was the last time you saw and empty backlog and an image created with the prompt "empty backlog"

Niin kauan kuin asiakkaat katsovat saavansa investoinnillaan arvoa takaisin, investointeja tehdään eikä syntynyttä tehokkuushyötyä automaattisesti käytetä säästöihin. Toki tämä tarkoittaa, että toimittajafirmojen täytyy omaksua tehokkuutta parantavat työkalut käyttöön, sillä ulkopuolelle ei ole varaa jäädä.

Siinä missä kehitystyölle on ominaista, että tekemistä on aina enemmän kuin ehditään tehdä, designtyölle muutos saattaa tuoda uusia paineita. Kun 2010-luvun alussa myimme suunnittelua, oli vaikeaa perustella täysipäiväisiä suunnittelijoita mobiilisovellusten pieniin kehitystiimeihin. Suunnittelija palveli siksi tyypillisesti yhtä aikaa useampaa projektia.

Vuosikymmenen puoliväliin mennessä työnkulut olivat kehittyneet niin, että täysipäiväisten suunnittelijoiden perusteleminen oli helpompaa. Tehtiin ja ylläpidettiin erilaisia prototyyppejä ja designsysteemeitä ja tämä vaati aikansa. Täysiaikaisten suunnittelijoiden myyminen kehittäjien tapaan irtosilpun sijaan oli kaupallisesti suuri muutos.

Uusien työkalujen voi olettaa tehostavan näitä työnkulkuja niin, että suunnittelijoille vapautuu jälleen aikaa. Riippuu tilanteesta, mitä tällä ajalla tehdään.

  • Suunnitellaanko enemmän? Jos myös kehittäjien tuottavuus on noussut, voisi olla mahdollista saada enemmän asioita tehdyksi, jos vain työjonossa riittää mielekästä tekemistä.
  • Suunnitellaanko paremmin? Jos ei ole mahdollista edetä nopeammin, voidaan lisääntynyt tehokkuus käyttää useampien iteraatioiden luomiseen ja kattavampaan käyttäjätutkimukseen yms. ja tuottaa parempaa laatua.
  • Vähennetäänkö resursseja? Tämäkin on mahdollinen seuraus, jolleivat suunnittelijat kykene perustelemaan tuottamaansa arvoa.

Ennen puheenvuoroani tapaamani Design.ai:ssa vaikuttava Israin sanoi kuvaavasti, että suunnittelijan rooli muuttuu. Luojasta tulee kuratoija (creators become curators). Oma kysymyksensä on, haluvatko kaikki tätä. Tämä meemikuva saattaa sisältää ripauksen totuutta.

A meme image describing the difference about how developers and designers approach AI tools stealing and remixing their work.

Missä arjen tekoälyapuri viipyy?

Entä se mitä-puoli? Fokus on viime aikoina ollut erilaisissa työkaluissa, mutta miltä näyttävät AI:n mahdollisuuksia käyttävät uuden ajan palvelut?

Tällä saralla Humane on herättänyt viime aikoina paljon pöhinää. Kyseessä on yli 200 miljoonaa dollaria rahoitusta kerännyt entisten Apple-suunnittelijoiden yritys kehittää jotain mullistavaa. Viimeisimpien tietojen perusteella jonkinlaista inhimillisempää vaihtoehtoa älypuhelimelle. TED-puheenvuorosta vuodetussa leikkeessä näkyi kohta, jossa rintataskussa Her-elokuvan tapaan pidettävän laitteen projektori heijastaa viestin käyttäjän kämmelle.

Humane demo with a phone-like screen projected on a man's hand

Kuka haluaisikaan katsoa huippuluokan teräväpiirtovärikuvaa kädessä olevan puhelimen ruudulta, jos voi yhtä hyvin heijastaa kämmenensä uurteisiin suttuisen yksivärikuvan? Sittemmin koko esittelyvideo on julkaistu. Vaikka ratkaisu ei vielä vakuuttaisi, ongelmista on helppoa olla samaa mieltä.

Voi olla, että tämä näyttöpuoli vaatii vielä tekemistä, mutta toimivan audioavustajan luulisi olevan jo hyvin lähellä. Turhauttaa kulkea kuulokkeet korvilla ja saada äänimerkki uudesta viestistä ilman mahdollisuutta kuulla, mistä on kysymys ja reagoida puhutulla komennolla. Seuraava askel olisi kaikkitietävä korvanappi, joka osaisi antaa ohjeita myös proaktiivisesti.

A classical image of Kari Hietalahti from Ihmebantu Korvanappi sketch

Oispa korvanappi.

Uusi kylmä sota, kuukilpa, ydinase

Uusien AI-teknologioiden merkitystä pidetään kauaskantoisena. On puhuttu, että kyseessä on vastaava kilpajuoksu Yhdysvaltojen ja Kiinan välillä kuin kylmän sodan aikaan Neuvostoliiton kanssa.

Eurooppa ei muutenkaan oikein onnistu pysymään mukana digikilpailussa eikä AI-kilpailu tunnu tekevän tähän poikkeusta. Petteri Järvinen kirjoitti tuoreimmassa Tivissä, että GDPR-lainsäädäntö aiheuttaa esteitä tämän kaltaisen teknologian kehitykselle. Qvikin tapahtumassa puheenvuoronkin pitänyt Ahti Ahde toisaalta kommentoi tätä, että GDPR:n suoma oikeus omien tietojen poistamisen vaatimiseen on myös mahdollistaja. Yhdysvalloissa tällaista suojaa ei ole.

A photo of an AI-related column by Petteri Järvinen in Tivi magazine

Supersijoittaja Warren Buffet lausui hiljattain AI:sta painokkaasti vuotuisessa sijoittajatapaamisessaan.

Buffet ei ole välttämättä merkittävin auktoriteetti arvioimaan tietyn teknologian vaikutuksia, mutta on osuva huomio, että kerran keksitty teknologia on aina läsnä, vaikka päättäisimme olla käyttämättä sitä.

Tästäkö ne Bushin artikkelin tiedemiehen huolestuneet silmät kertoivat?

Weary eyes of the scientiest, taken from the article As we may think

Mitäpä tässä voi pieni ihminen muuta kuin panna sormet ristiin ja pitää peukkuja.

Seurattavaa ähkyyn asti

Vielä vähän linkkejä loppun. Olen koonnut tälle Twitter-listalle erilaisia aktiivisesti ja käytännönläheisesti AI-aiheesta kirjoittavia henkilöitä.

Erityisestä tämän tyylisiä koosteita saa nähdäkseen jatkuvasti. Loputtomat listat erilaisia kokeiltavia palveluita voi sitten tallentaa vaikka Pockettiin ja hylätä sinne.

Jos haluat seurata vain yhtä tiliä, suosittelisin Aakash Guptaa. Hänkin kirjoittaa pitkiä ketjuja niin kuin kaikki muut, mutta pelkkien linkkien sijaan hän vetää asioita yhteen ja luo merkityksiää.

Myös AItoolkit on mainitsemisen arvoinen sivusto. Se on kategorisoitu kokoelma AI-työkaluja eri tarkoituksiin.

Jätä kommentti