Friday, October 17, 2025

Wikidatasta vauhtia GEO- eli tekoälyoptimointiin?

Viime syksynä osallistuin viiden tunnin Wikidata-koulutukseen, jonka Wikimedia UK tarjosi kouluttajilleen. Kiitos siitä! ❤️ 

Koulutuksen jälkeen olin aivan liekeissä: tätä tietoa haluan välittää Suomessa. Koulutuksen näkökulma oli muistiorganisaatiot, GLAM-organisaatiot, ja siksi lähdin itsekin tarjoamaan Wikidata-osaamistani siihen suuntaan. 

Wikidataa ei ole suunnattu tavallisille ihmisille, sen tutkiminen ei ole kovin mielekästä lauseita kaipaaville ihmisille. Wikidatasta saa kuiten SPARQL-hakukyselyillä valtavan määrän tietoa, jota ei löydy mistään muualta. Wikidata yhdistää tiedot niin erikielisistä Wikipedia-artikkeleista kuin myös monista muistakin Wikimedia-projekteista. Wikidataan voi linkittää esimerkiksi Wikimedia Commonsin kuvia. Wikidata sopisi siis hyvin esimerkiksi tutkijoiden työkaluksi. Ymmärrettävistä syistä (lue: pienet resurssit) yhteydenottoni eivät johtaneet mihinkään. Harmi.

Viime aikoina olen kuitenkin löytänyt enemmän vastakaikua Wikidatalle, kun olen kertonut asiasta muutamille yrityksissä ja julkisissa organisaatioissa työskenteleville asiakkailleni. Wikidatan kautta tieto päätyy tekoälyn jauhettavaksi, se ei välitä alustan teknisyydestä, päinvastoin. 😁 

Luulen, ettei missään vielä kouluteta yrityksille sitä, miten ne voisivat tehdä tekoälyoptimointia Wikidatan avulla. Valmista koulutuspakettia minullakaan ei ole, mutta sen sijaan on intoa opetella asiaa yhä useamman tahon kanssa. Näin nimittäin viime viikolla yhden silmiä avaavan esimerkin: Wikidataa osataan jo hyödyntää, kun tarve on suuri. Toivon siis löytäväni muutaman pilottiasiakkaan, jotka kertovat minulle näkyvyystarpeistaan.

Wikidataan on vähän helpompi päästä sisään kuin Wikipediaan, sillä merkittävyyskynnys on siellä pienempi. Esimerkiksi minulla on siellä oma item eli kohde:

Johanna Janhonen kuuluu ihmisten (Q5) porukkaan.

Lisäsin itseni Wikidataan alunperin päästäkseni vierailevien wikipedistien eli residenssiwikipedistien listalle. Koska meitä on maailmassa niin vähän, ollaan Wikidatassa automaattisesti merkittäviä. :)

Tutkiessani millaista tietoa Wikidatan ja tekoälyn yhteiselosta löytyy, törmäsin tuoreeseen uutiseen

Tämän kuun alussa Wikimedia Deutschland, Wikidatan luoja ja yksi Wikimedia-liikkeen suurimmista toimijoista Wikimedia-liikkeessä, teki uuden avauksen. Wikidata Embedding Project käyttää vektoripohjaista semanttista hakua, joka auttaa tietokoneita ymmärtämään sanojen välisiä suhteita. Uuden MCP-protokollan avulla LLM-palveluiden on entistä helpompi hyödyntää Wikidataa. Protokolla on kehitetty yhteistyössä neuraalihakuihin keskittyneen Jina.AI:n ja IBM:n omistaman DataStax-yhtiön kanssa.

Wikidatassa on yli 136 miljoonaa kohdetta. Uusin niistä oli äsken

Wikidata-kehittäjien huumorintajusta kertoo, että 

kohde Q1 on universumi, 
Q2 maa, 
Q3 elämä, 
Q4 kuolema, 
Q5 ihminen, 
Q6, Q7, Q9 ja Q10 ovat tyhjiä, 
mutta Q8 merkitsee onnellisuutta. 

Arvaatko, mitä Q42 tarkoittaa tai mikä on Suomen kohteen tunnus?

Otapa siis yhteyttä, jos haluat miettiä kanssani sitä, miten voisimme kehittää teidän näkyvyyttänne Wikidatassa. 

Tässä vielä esimerkki Wikidata-kohteesta, josta jo äsken mainitsin: 

Datamodel in Wikidata fi

No comments:

Post a Comment

Kiva kun kommentoit! Voit kommentoida myös anonyymisti, mutta spammikommentit poistetaan heti kun ehditään.