Friday, October 17, 2025

Wikidatasta vauhtia GEO- eli tekoälyoptimointiin?

Viime syksynä osallistuin viiden tunnin Wikidata-koulutukseen, jonka Wikimedia UK tarjosi kouluttajilleen. Kiitos siitä! ❤️ 

Koulutuksen jälkeen olin aivan liekeissä: tätä tietoa haluan välittää Suomessa. Koulutuksen näkökulma oli muistiorganisaatiot, GLAM-organisaatiot, ja siksi lähdin itsekin tarjoamaan Wikidata-osaamistani siihen suuntaan. 

Wikidataa ei ole suunnattu tavallisille ihmisille, sen tutkiminen ei ole kovin mielekästä lauseita kaipaaville ihmisille. Wikidatasta saa kuiten SPARQL-hakukyselyillä valtavan määrän tietoa, jota ei löydy mistään muualta. Wikidata yhdistää tiedot niin erikielisistä Wikipedia-artikkeleista kuin myös monista muistakin Wikimedia-projekteista. Wikidataan voi linkittää esimerkiksi Wikimedia Commonsin kuvia. Wikidata sopisi siis hyvin esimerkiksi tutkijoiden työkaluksi. Ymmärrettävistä syistä (lue: pienet resurssit) yhteydenottoni eivät johtaneet mihinkään. Harmi.

Viime aikoina olen kuitenkin löytänyt enemmän vastakaikua Wikidatalle, kun olen kertonut asiasta muutamille yrityksissä ja julkisissa organisaatioissa työskenteleville asiakkailleni. Wikidatan kautta tieto päätyy tekoälyn jauhettavaksi, se ei välitä alustan teknisyydestä, päinvastoin. 😁 

Luulen, ettei missään vielä kouluteta yrityksille sitä, miten ne voisivat tehdä tekoälyoptimointia Wikidatan avulla. Valmista koulutuspakettia minullakaan ei ole, mutta sen sijaan on intoa opetella asiaa yhä useamman tahon kanssa. Näin nimittäin viime viikolla yhden silmiä avaavan esimerkin: Wikidataa osataan jo hyödyntää, kun tarve on suuri. Toivon siis löytäväni muutaman pilottiasiakkaan, jotka kertovat minulle näkyvyystarpeistaan.

Wikidataan on vähän helpompi päästä sisään kuin Wikipediaan, sillä merkittävyyskynnys on siellä pienempi. Esimerkiksi minulla on siellä oma item eli kohde:

Johanna Janhonen kuuluu ihmisten (Q5) porukkaan.

Lisäsin itseni Wikidataan alunperin päästäkseni vierailevien wikipedistien eli residenssiwikipedistien listalle. Koska meitä on maailmassa niin vähän, ollaan Wikidatassa automaattisesti merkittäviä. :)

Tutkiessani millaista tietoa Wikidatan ja tekoälyn yhteiselosta löytyy, törmäsin tuoreeseen uutiseen

Tämän kuun alussa Wikimedia Deutschland, Wikidatan luoja ja yksi Wikimedia-liikkeen suurimmista toimijoista Wikimedia-liikkeessä, teki uuden avauksen. Wikidata Embedding Project käyttää vektoripohjaista semanttista hakua, joka auttaa tietokoneita ymmärtämään sanojen välisiä suhteita. Uuden MCP-protokollan avulla LLM-palveluiden on entistä helpompi hyödyntää Wikidataa. Protokolla on kehitetty yhteistyössä neuraalihakuihin keskittyneen Jina.AI:n ja IBM:n omistaman DataStax-yhtiön kanssa.

Wikidatassa on yli 136 miljoonaa kohdetta. Uusin niistä oli äsken

Wikidata-kehittäjien huumorintajusta kertoo, että 

kohde Q1 on universumi, 
Q2 maa, 
Q3 elämä, 
Q4 kuolema, 
Q5 ihminen, 
Q6, Q7, Q9 ja Q10 ovat tyhjiä, 
mutta Q8 merkitsee onnellisuutta. 

Arvaatko, mitä Q42 tarkoittaa tai mikä on Suomen kohteen tunnus?

Otapa siis yhteyttä, jos haluat miettiä kanssani sitä, miten voisimme kehittää teidän näkyvyyttänne Wikidatassa. 

Tässä vielä esimerkki Wikidata-kohteesta, josta jo äsken mainitsin: 

Datamodel in Wikidata fi

Wednesday, October 15, 2025

Onko pakko olla Metan palveluiden varassa?

Magdalena Hai kirjoitti LinkedInissä siitä, että yhdistykset ja kansalaisjärjestöt ovat hädissään, kun Meta ei anna niiden enää ostaa sponsoroituja päivityksiä ja ilman niitä näkyvyys on heikkoa. Hän ihmetteli, eikö nyt olisi hyvä aika ottaa Fedi korporaatiosomejen rinnalle (ei tilalle, tästähän minäkin kesäkuussa kirjoitin).


Pakkohan minun oli tähän avaukseen tarttua. Jotta ränttini ei jäisi vain linkkarilaisten nähtäväksi, otan sen talteen tänne bloginkin puolelle. Äänensävyssäni saattaa kuulua pientä turhautumista. Se johtuu siitä, että lobbasin Fediversumia keväällä huolella monille tärkeille tahoille. Suurin osa ei vastannut mitään, mutta osalta kuulin myös selityksiä.

***

Innostuin tammikuussa Fediversumista, etenkin Mastodonista. Pääsin vanhan kunnon someen, jossa juteltiin vieraiden ihmisten kanssa ja jossa häsät vielä toimivat. Postaukset näkyvät kokonaan ja kaikenkarvaiset algoritmitemppuilut sai unohtaa. Ihmiset jakoivat mun juttuja enemmän kuin missään somessa ja useimmiten sain postauksiini myös kommentteja. 


Suosittelin paikkaa kai-kil-le: tulkaa tänne, täällä on hyvä pöhinä. 


- Ääh, ei voida, kun tilastot näyttää, että siellä on niin vähän porukkaa, eikä me todellakaan haluta olla ensimmäisinä jossain somealustalla. Niin tai Metassa kyllä haluttiin, ja Blueskyssä, mutta muualla ei. 


- Ääh, ollaan jo niin monessa somepalvelussa, että yhtään uutta ei mahdu rinnalle. Juuri mentiin yhden korporaation perustamaan someen, meillä riittää opettelua siellä. Katos, kun ne algoritmitkin on niin hankalat, pitää kikkailla, että saa näkyvyyttä. 


- Ei epäkaupallisesti toimivat somet voi pärjätä. Ai Wikipedia? No eihän sitä lasketa, se on ihan eri juttu, 25 vuotta sitten tällainen järjestäytyminen vielä onnistui, mutta ei se ole nykyaikaa. 


Niin, vaikeeta on. Mutta minä nautin samaan aikaan sekä korporaatiosomejen että Fedin algoritmittomista syötteistä. Ajatella, että jollain YKSIN yrittävällä voi olla resursseja pyöriä päivittäin seitsemällä alustalla. Niin tai kahdeksalla, jos sen Wikipediankin laskee. Ja kiitos somesiivouksen, aikaa jää vielä lehdille ja paperikirjoillekin.


Jos sinulla on vielä neljä minuuttia, katso tämä pikaopastus Fediversumista:


Friday, October 3, 2025

Saako Wikipediaan kirjoittaa omasta työstä?

Eilisen luetuimmat Wikipedia-
artikkelit
Juttelin tällä viikolla monen uuden ihmisen kanssa työstäni Wikipedian päivittäjänä ja totesin, että työhön liittyvä Wikipedian päivittäminen on yhä hyvin vierasta viestijöillekin.

15 vuoden aikana olen muokannut toimeksiannosta tuhansia Wikipedia-artikkeleita. Suomessa on toki muitakin Wikipediaa työnsä puolesta päivittäviä (joista osaa olen kouluttanut), mutta volyymien perusteella arvelen olevani suurin tekijä. 

Olen luullakseni myös kokenein työhön liittyvän Wikipedia-päivittämisen kouluttaja. Tänä ja viime vuonna Koneen Säätiön rahoittama Marginaalimerkintöjä-hanke on kasvattanut koulutusmääriäni merkittävästi. 

Olen kertonut itse muotoilemastani työstä paitsi somessa myös monissa haastatteluissa, mutta silti työni on yhä vierasta niin suurelle yleisölle kuin viestijöillekin. 

Seuraavaksi muutamia yleisimpiä reaktioita.


Mitä ihmettä, en ole tällaisesta koskaan kuullutkaan!
Nyt menee aivot solmuun, onko tämä yleistäkin? 

Miina Sillanpään artikkelia luettiin
paljon kansalaisvaikuttamisen päivänä

Niin, jos suomenkielisessä Wikipediassa on kuukausitasolla vain 500 aktiivista muokkaajaa, niin työnsä puolesta muokkaavia on yleensä alle kymmenen. Joten ei ole mikään ihme, jos et ole koskaan wikipedisteihin törmännyt, saati sitten ihmisiin, jotka tekevät sitä osana työtään.

Yritin miettiä, miten kuvailisin aktiivisten määrää, sillä prosenttiluku 500/6000 000 on niin pieni, ettei sitä ymmärrä.

Helpointa olisi kai kuvitella, että esimerkiksi Lieksassa on todennäköisesti vain yksi aktiiviporukkaan kuuluva, Naantalissa kaksi, Savonlinnassa kolme, Kotkassa viisi, Jyväskylässä 15, Turussa 21, Tampereella 26 ja Helsingissä 69. Emme tietenkään tiedä, missä aktiivit oikeasti asuvat, mutta heitä on siis noin yksi 10 000 suomalaista kohden.

Kaikki yritykset eivät Wikipediaan pääse, mutta esimerkiksi monille pörssiyrityksille se on tärkeä vaikuttamisen väline. Toimittajat hyödyntävät Wikipediaa juttuja kirjoittaessaan, joten olisi hyvä, että siellä on faktat kunnossa. 

Kuka sinulle maksaa muokkaamisesta? 

Asiakkaat. Moni erehtyy kuvittelemaan, että esimerkiksi Wikimedia-säätiö maksaisi sisällöistä, mutta näin ei suinkaan ole.

Onkohan tuo eettisesti ihan oikein? 

Noudatan Wikipedian vakiintuneita käytäntöjä ja ilmoitan myös toimeksiantajani, en siis syyllisty piilomainontaan.

Vapaaehtoiset wikipedistit kirjoittavat asioista, joista ovat kiinnostuneita vapaa-ajalla, joten Wikipediassa on aukkoja. Minusta on reilua, että merkittävistä aiheista kirjoitetaan, eikä kaikkea sisällöntuotantoa jätetä vapaaehtoisten varaan. 

Miksi palkkaisin ulkopuolisen, kun voin tehdä tuon itse, pistää harkkarimme hommiin tai tuottaa sisällön tekoälyn avulla? 

Wikipedian mobiilisovelluksesta tuli
nopeasti yksi suosikkisovelluksistani
Wikipediassa on paljon lukijoille tuntemattomia prosesseja ja toimintatapoja. Jos yritys rikkoo sääntöjä vahingossa tai tahallaan, siitä voi pahimmillaan syntyä pitkäaikainen mainehaitta. 

Olisi kiva, jos Wikipediassa olisi enemmän asiantuntevia muokkaajia, mutta harvat malttavat perehtyä alustaan syvällisesti ennen kuin alkavat sitä päivittää. 

Hämmästelen välillä sitä, että osa ihmisistä pitää Wikipediaa julkaisualustana, jonka sisällöt ja äänensävyn organisaatio voisi itse määritellä.



Tämän postauksen kuvituksessa näkyvät viimeisten kolmen päivän luetuimmat Wikipedia-artikkelit. Seuraan listaa nykyisin Wikipedian mobiilisovelluksesta, jonka otin käyttöön elokuussa. Se auttaa minua pysymään ns. pulssilla, näen, mitkä asiat suomalaisia kiinnostavat. Tämä on ylellisyys, jota monessa maassa ei ole - maakohtaiset erot häviävät, jos jotain kieltä puhutaan useassa maassa.