Piilotettu aarre: Testissä netin tekoälykuvageneraattorit

Viime aikoina olen leikkinyt netistä löytyvillä tekoälyä hyödyntävillä kuvageneraattoreilla. Jotta niitä voisi verrata keskenään, käytin samaa kuvausta eri palveluissa.

Flatlay. Movie tickets, bus tickets, a Notebook, pencils, pens, needlecraft items, dollhouse miniatures, books, yarn, beads, buttons, Teddy bear, toys, newspaper, bracelet, crayons. Blue, pink, yellow, orange. Audrey Hepburn. Poems.

Kuvat valitsin ns. ensimmäiseltä kierrokselta, eli vaikka kehittyneemmän palvelut sallivat kuvien parantelun, en tässä testissä sitä hyödynnä, vaan käytin kaikilta vertailuun ns. raakakuvia.

1. Canva.com / Text to Image

Canva on monipuolinen graafinen selain- ja sovelluspohjainen ohjelmisto. Sen vahvuus on se, että se tekee grafiikan tekemisestä hyvin simppeliä, niin, että aloittelijakin pärjää sen kanssa, ja ilmaisellakin Canvalla voi tehdä todella paljon asioita. En huomannut Text to Image -toiminnossa itse rajoituksia, mutta sittemmin olen kuullut, että kuvia(/tai kuvasettejä?) saa tehdä sata päivässä.

Kokeneempi käyttäjä saattaa välillä tuskastua siihen, ettei voi tehdä Canvassa asioita, joihin on kuvankäsittelyohjelmissa tottunut. Itse olen kyllä siihen varsin tyytyväinen.

Varmaan siksi myös Canvan tekoälytoiminnallisuus on hyvin simppeli: saat neljä kuvaa ja jos ne eivät innosta, voit pyytää neljä kuvaa lisää. Esittelen ohessa ensimmäiset saamani kuvat ylläolevalta sanarimpsulta.

Kuvista puuttuu paljon elementtejä, joita olin toivonut:

Flatlay. ~~Movie tickets, bus tickets,~~ a Notebook, pencils, pens, needlecraft items, ~~dollhouse miniatures~~, ~~books~~, yarn, beads, buttons (yhdessä kuvassa 1 nappi), ~~Teddy bear, toys, newspaper, bracelet,~~ crayons. Blue, pink, yellow, orange. ~~Audrey Hepburn. Poems.~~

Puuttuvia asioita: yhteensä 10

Jos toivoo liikaa, ei saa kaikkea, mutta kun poistin hausta sanoja, sain näkyviin myös toivomani nallen.

Annan Canvalle pointsit siitä, että se on nopeasti tuonut AI-toiminnot peruspalveluunsa. Kuvat myös tallennetaan automaattisesti latauksien joukkoon, joten niitä ei tarvitse erikseen tallentaa, vaan kuvat on heti siellä, missä niitä käytetäänkin.

Kuvissa on jonkin verran virheitä, mutta ei niin pahoja kuin mitä bongasin nallekuvia tehdessäni: esimerkiksi kolmejalkaisia ja -silmäisiä nalleja tai nalleja, joilla oli pelkkä pää.

2. Dall-E 2 / OpenAI

OpenAI on keskittynyt tekoälyn hyödyntämiseen ja Microsoft on tukenut sitä siinä avokätisesti. Koska Dall-E 2 ei tee mitään muuta (?), on sen palvelulta lupa odottaa enemmän kuin yleistyökalu-Canvalta.

Dall-E 2 -palvelua voi käyttää ilmaiseksi. Ensimmäisenä kuukautena käyttäjä saa 200 creditiä, joita käyttämällä hän oppii käyttämään työkalua. Seuraavina kuukausina credittejä saa ilmaiseksi vain 60, mutta halutessaan niitä saa ostaa myös lisää.

Dall-E 2:n tekoälykuvissa onkin jo huomattavasti enemmän elementtejä, joita toivoin:

Flatlay. Movie tickets, bus tickets, ~~a Notebook~~ (aika yllättävää että tämä puuttui), pencils, pens, ~~needlecraft items~~, dollhouse miniatures (no onhan noissa nukkehahmot), books (yhdessä kuvassa), yarn (yhdessä kuvassa), beads, ~~buttons~~, Teddy bear, toys, ~~newspaper~~, bracelet (yhdessä kuvassa), crayons. Blue, pink, yellow, orange. Audrey Hepburn (tulkitsen, että noi nukkejen mekot voisi olla Audbey-insprisoituja). Poems (ehkä tuo käsin kirjoitettu teksti?).

Puuttuvia asioita: yhteensä 4

Dall-E 2 pärjää Canvaa paremmin siinä, että se tuo kuviin enemmän asioita, joita toivoin.

Kuvissa olevat siansaksaksi kirjoitetut tekstit herättivät hieman hämmennystä, mutta voihan se olla parempi, että ettei tekstejä, jotka tarkoittavat oikeasti jotain?

Ihmettelin myös nukkejen kummallisia kasvoja, mutta sain siitä syyn tuunata kasvoja itse. Kuvat tuunasin Canvassa, katso esimerkit 1, jossa hyödynsin Canvan valmiita kasvoelementtejä ja 2, johon liimasin omat kasvoni.

3. Stable Diffusion

Stable Diffusion -työkalua käytin vasta ensimmäistä kertaa tätä blogipostausta varten. Testiin se päätyi, koska Tuukka Hastrup vinkkasi siitä minulle somessa.

"Stable Diffusion -tekoäly on avointa lähdekoodia, jota voi myös ajaa omalla koneella, jos siinä vain on tarpeeksi hyvä näytönohjain. Verkossa se on tarjolla erilaisissa ilmaispalveluissa, kokeilin https://stablediffusionweb.com/."

Käytettyäni jo kahta muuta tekoälykuvageneraattoria, tämän työkalun kuvat hämmensivät. Kuvissa näyttää olevan huomattavasti enemmän kummallisia elementtejä kuin Canva- tai Dall-E 2-kuvissa: siansaksaa ja epämuodostuneita esineitä, kuten sulaneita nappeja ja täysin tunnistamattomia leluja(?) tai muita möykkyjä.

Mitkä toivomani elementit sitten löydän kuvista:

Flatlay. Movie tickets, bus tickets (siansaksan vuosi en erota näitä kyllä toisistaan), a Notebook, pencils, pens, needlecraft items, ~~dollhouse miniatures~~, ~~books~~, yarn (yhdessä kuvassa), ~~beads~~, buttons, ~~Teddy bear~~, toys, ~~newspaper, bracelet~~, crayons. Blue, pink, yellow, orange. ~~Audrey Hepburn. Poems.~~

Puuttuvia asioita: yhteensä 8

Stable Diffusion pärjäsi tässä testissä huonoiten, sillä se jätti pois paljon asioita ja tuotti kuvia, joita en voisi edes kuvitella käyttäväni.

Stable Diffusion -palvelun edistyneitä asetuksia en päässyt käyttämään, sillä ne oli tilapäisesti poissa käytöstä.

Luulen, että tämän pikatestini tulokset ovat vähän epäreiluja Stable Diffusionille, sillä ihmiset ovat luoneet huikeita teoksia sen avulla. Harjoittelulla pääsee pitkälle.

En ole vielä tutustunut Stable Diffusionin hinnoitteluun, mutta ilmaiseksi pääsee testaamaan.

Muoks 27.2.2023: vertailuun lisätty vielä kaksi muuta palvelua.

4. Midjouney bot (Discord)

En ole itse käyttänyt Midjourney botia, joka toimii Discordissa, mutta kaverini lähetti minulle sanalistani mukaisen tuotoksen. Midjourneyta saa käyttää aluksi ilmaiseksi, mutta pidemmän päälle siihen tarvitaan maksullinen tili. Kaverini on perustanut Midjourneyn kanssa oman chatkanavan, joten hänen luomiaan kuvia eivät näe muut kuin hän itse. Olen nähnyt myös demoja, joissa botin kanssa keskustellaan yleisessä chatissa, jossa on paljon muitakin käyttäjiä, jolloin näkee myös sen, millaisia kuvia he tekevät.

No mitenkäs tämä palvelu sitten pärjäsi sanojeni kanssa?

Flatlay. Movie tickets, bus tickets (en kyllä erota kumpia ne ovat), a Notebook, pencils, pens, needlecraft items, ~~dollhouse miniatures~~, ~~books~~, yarn, beads, buttons, Teddy bear, toys (ihanat lelut: nallepuhelin ja lelukamera, ehkä jotain soittimia), ~~newspaper~~, bracelet, crayons. Blue, pink, yellow, orange. Audrey Hepburn (oho, ensimmäinen hahmo, joka oikeasti näyttää häneltä). Poems (mahdollisesti).

Puuttuvia asioita: vain 2. Tosin en kyllä tällä resoluutiolla saanut selvää olivatko jotkut jutut helmiä vai ei, mutta tulkitsin että olivat. Ensimmäisen kuvan sininen nalle on suloinen, samoin Audreyn kuva, joten kyllä on pakko julistaa Midjourney tämän kisan voittajaksi. Ja jos näitä kuvia lähtisi varioimaan, tulokset paranisivat vielä.

Midjourneyn basic-versio maksaa 10 dollaria kuukaudessa ja se sisältää tuon henkilökohtaisen chatin, jota kaverinikin hyödyntää.

5. Wombot (Discord)

Kaverini käyttää Discordissa myös toista bottia, Wombotia. Se eroaa tämän sarjan muista työkaluista siinä, että se tuottaa sanalistalla vain yhden kuvan kerrallaan. Siksi en saisi arvioida sen tulosta samalla tavalla kuin aiempia palveluita, se ei ole reilua. No teen sen silti.

Flatlay. Movie tickets, bus tickets (en kyllä erota kumpia ne ovat), a ~~Notebook~~, pencils, pens, needlecraft items, dollhouse miniatures (kuvassa näkyy pinkki kassakone, kyllä sen voisi nukkekotiin laittaa), ~~books~~, yarn, beads, ~~buttons~~, ~~Teddy bear~~, toys, ~~newspaper~~, ~~bracelet~~, crayons. Blue, pink, yellow, orange. ~~Audrey Hepburn~~. ~~Poems~~.

Puuttuvia asioita: yhteensä 8 eli tosi hyvin, kun ottaa huomioon, että tässä on vain yksi kuva. Palvelun hinta on 200 dollaria kuukaudessa tai 1000 dollaria vuodessa.

Muoks. 28.2.2023

6. Craiyon (aiemmin Dall-E mini)

Facebook-kaverini vinkkasi minulle uudesta AI-palvelusta. craiyon.com -palvelua on mahdollista käyttää ilman kirjautumista, jes! Se erosi muista testaamistani palveluista myös siinä, että se tuotti ensimmäisellä kerralla peräti 9 kuvaa. Kuvien tekemiseen meni suhteellisen pitkä aika, muutama minuutti, kun muissa aikaa on mennyt ehkä korkeintaan puoli minuuttia. Kuvaa odottaessa sai katsella mainoksia.

Mutta rahalla saa ja hevosella pääsee: maksullisella versiolla Craiyon lupaa tehdä kuvia nopeammin, sen hinta on tällä hetkellä 5 dollaria kuukaudessa.

No tsekataanpa taas, miten hyvin palvelu pärjää sanalistani kanssa:

Flatlay. Movie tickets, bus tickets (no eihän näitä taaskaan erota toisistaan), a Notebook, pencils, pens, needlecraft items, dollhouse miniatures (olen näkevinäni nukkekotikokoisia ruoka-annoksia!), ~~books~~, yarn, beads, buttons, Teddy bear, toys (muovailuvahaa), newspaper, bracelet (hyvin epäselvä), crayons. Blue, pink,yellow, orange. ~~Audrey Hepburn.~~ ~~Poems~~.

Puuttuvia asioita: 3

Vaikka palvelu onnistui hienosti tuottamaan toivomiani asioita, kuvat itsessään ovat aika käyttökelvottomia, sillä ne ovat täynnä epämuodostuneita asioita, kuten viereisestä kuvasta näet. Palvelun hinnoittelu näyttää olevan tällä hetkellä 5 dollaria kuukaudessa.

Ehkä tämä palvelu toimii paremmin toisenlaisilla sanoilla, mutta minua se ei nyt tässä testissä vakuuttanut.

Ja tadaa, löysin bloggauksen, jossa oli kokeiltu aika montaa tekstikomentoa ja osa kuvista olikin ihan jees.

Olisi hauskaa jatkaa vieläkin tätä testiä. Jos löydän lisää ilmaiseksi (ja ilman jonotusta) käytössä olevia kuvageneraattoreita, saatan lisätä jonon jatkoksi lisää kuvia. Ja jos haluat auttaa minua testissäni, niin voit lähettää minulle kuvasarjan jostain kuvageneraattorista, jota tässä ei ole vielä testattu.

Muoks 26.5.2023

Jatkoin testiäni, sillä tekoäly kehittyy niin vauhdikkaasti. Tästä näet, millaisia kuvia tällä kertaa sain samalla pyynnöllä.

View this post on Instagram

A post shared by Piilotettu aarre (@piilotettuaarre)

Pages

Friday, February 17, 2023

Testissä netin tekoälykuvageneraattorit