Thursday, November 13, 2025

Mitä hyötyä Wikidatasta on


Kirjoittelin tänään someen Wikidatasta, joten ajattelin pistää samoja juttuja talteen tännekin.

Viime viikkoina olen jutellut Wikidatasta monen ihmisen kanssa, esimerkiksi alumnipäivillä. 

"En ole siitä koskaan kuullutkaan" 

on tyypillinen reaktio. 

Se ei ole mikään ihme, sillä Wikidataa ei ole oikeastaan suunniteltu ihmisille, vaan se palvelee ja yhdistää Wikimedia-projekteja (esim. Wikipedia ja Wikimedia Commons), nykyään myös tekoälypalveluita.

Tämän vuoden elokuusta lähtien Wikidata on ollut maailman suurin tietokanta, johon on avoin pääsy.

Yksinkertaistaen Wikidataa voisi verrata joukkoon Excel-tiedostoja. Tiedostoilla on uniikit nimet ja ne sisältävät vaihtelevan määrän rivejä, sarakkeita ja arvoja.

Harva kuitenkin viihdyttää itseään taulukoita tutkien. No, jotkut  voivat toki opetella ulkoa joukkoliikenteen aikatauluja, mutta yleensä ihmiset lukevat mieluummin tekstejä: lehtiä, kirjoja ja erilaisia nettisivuja.


Wikidatassa vierailee enemmän botteja kuin ihmisiä

Siksi ei olekaan yllätys, että ihmiset ovat Wikidatassa vähemmistössä. Oheisesta kuvasta näet, että ihmisten (punainen user-viiva) vierailujen määrä on pysynyt Wikidatassa viimeisten kahden vuoden aikana varsin vakaana. Sen sijaan spider- ja automated-liikenteessä vaihtelua on enemmän.


Mikä niiden ero sitten on? Tutkin asiaa ja sain selville, että

spider viittaa liikenteeseen, jota itsensä boteiksi luokitellut kävijät tuottavat. Tähän kuuluu esimerkiksi hakukonebottien vierailut.

automated on liikennettä, jota tulee koneilta, jotka eivät ole tunnustaneet olevansa botteja, mutta jotka tunnistetaan sellaisiksi käytöksensä perusteella. 

Halutessasi voit tutkia lukuja tarkemmin täältä.  

Viime kuussa Wikidatan spider-vierailut nousivat siis ihan uudelle tasolle. 

Wikidata on hyvä työkalu hakukone- ja tekoälyoptimointiin.

Koska hakukoneet ja AI-botit ovat näköjään villiintyneet Wikidatasta, voisi olla hyvä hetki tutkia, millaista tietoa Wikidataan teidän organisaatiostanne on syötetty. Ja jotta saat vähän perspektiiviä, vertaa teidän kohteeseen laitettuja tietoja muihin saman alan toimijoihin.

Wikidataa hyödynnetään myös Google Knowledge Graphissa. Se hakee tietoja useista tietokannoista ja Wikipediasta. Sen perusteella tietoja näytetään vaikkapa etusivujen tietolaatikoissa. Myös Applen Siri ja Amazonin Alexa hyödyntävät Wikidatan tietoja. (Lähde: Wikipedia)

 

Onko Wikidatasta jotain hyötyä ihmisille, joita SEO ja GEO eivät kiinnosta? 

No ainakin siellä on sellaista tietoa, jota esimerkiksi Wikipediasta ei löydy ja siitä voisi olla paljon iloa kääntäjille, toimittajille, opiskelijoille ja tutkijoille.


Esimerkki 1. Mitä voit oppia yksittäistä Wikidata-kohdetta tutkimalla?


Wikidatasta löytyy tietoja aiheista, joista
esimerkiksi englanninkielinen Wikipedia
ei kerro.
Jutellessamme Am... Meksikonlahdesta aloin miettiä miten Suomenlahti kääntyy eri kielille. Suomenlahdesta on kirjoitettu Wikipedia-artikkeli 98 kielellä. Wikidatassa alueen nimi on määritelty 153 kielellä. Kaikkia kieliä en tietenkään osaa lukea, mutta löysin muutaman poikkeavan tavan nimetä lahti:

Skolt Sami: Lääʹddluhtt
Võro: Viro meri
Icelandic: Kirjálabotn (viittaa Karjalaan)


Wikidatasta löytyy vähän vastaavanlaista tietoa 120 miljoonasta asiasta. Suurimmasta eli englanninkielisestä Wikipediasta artikkeleita löytyy vain 7 miljoonasta aiheesta. Koska suhdetta voi olla vaikea hahmottaa, piirsin siitä viereisen kuvan. :)


Esimerkit 2. Mitä voit oppia Wikidata-kyselyillä?


Yksittäisten Wikidata-kohteiden tutkiminen ei ole aina paras tapa hyödyntää Wikidataa. 

Jos jatkan äskeistä Excel-esimerkkiä, niin tiedät ehkä ihmisiä, jotka osaavat muuttaa taulukot grafiikoiksi tai yhdistellä useiden tiedostojen (tai välilehtien) tietoja. 

Myös Wikidan tietomassoista voi tehdä kyselyjä. Kun osaat tehdä niitä, voit löytää kohteita yhdistäviä asioita ja parhaassa tapauksessa tietoja, joita voisi muuten olla vaikea löytää. 

Seuraavaksi muutama esimerkki.

Käynnistä kysely painamalla sinistä nappulaa.
Jos haluat keskeyttää kyselyn ajamisen,
klikkaa sen alla olevaa nappulaa.

Maailman miljardöörit - Wikidatan kysely löysi heitä hetkessä 654 kappaletta. 

Ihmiset, jotka ovat voittaneet sekä Nobelin että Oscarin (2 kpl)

Elokuvat, jotka on julkaistu vuonna 2017 (6847 kpl).

Kun vaihdoin kyselyn päivämäärät, sain selville, että tässä kuussa tulee kuluneeksi 25 vuotta 99 Wikidatassa mainitun elokuvan julkaisusta. Niihin kuuluvat esimerkiksi X-Men, 102 Dalmatians ja Billy Elliot.

Muusikoita, jotka ovat kuolleet 27-vuotiaana löytyi 215 kpl, esimerkiksi Amy Winehouse, Jim Morrison, Jimi Hendrix, Greta Pitkänen ja Kurt Cobain.

Kun vaihdoin kyselyyn ammatiksi kirjailija, kuolleita löytyi 282, esimerkiksi Jim Morrison, Jouko Luosto, Olavi Malmberg, Kalle Toivola ja Antti Räty.

Seuraavaksi tutkin, ketkä kirjailijat kuolivat 99-vuotiaana. Heitä löytyi 433 kpl, esimerkiksi Eeva Heikkilä, Aino-Marja Räsänen ja Ilma Ikonen.


Esimerkki 3. Wikidata ei ole valmis

Seuraava esimerkki havainnollistaa, että Wikidatassa on välillä aukkoja Wikipediaan verrattuna.
Tämän Wikidata-kyselyn mukaan Vuoden bändi Emman ovat saaneet 22-Pistepirkko, Blind Channel, Dingo, Egotrippi, Haloo Helsinki!, HIM, Leningrad Cowboys, Lordi, Nightwish, Michael Monroe, PMMP, The Rasmus, Stam1na, Timo Rautiainen & Trio Niskalaukaus ja Ultra Bra.

Wikipedian Emma-gaala-artikkelin tiedot ovat kattavammat. Se kertoo, että vuoden bändi -palkinto on jaettu 39 vuonna. Wikipediasta löysin koko joukon edellisestä listasta puuttuvia bändejä: Aikakone, Don Huonot, Eppu Normaali, Gasellit, JVG, Kolmas Nainen, Kuumaa, Leevi and the Leavings, Mamba,  Maustetytöt, Neljä Ruusua, Nylon Beat ja Yö. 

Huom. Monet bändit ovat voittaneet Emman useampana vuonna.

Koska Wikidatassa on vielä aukkoja, 

toivoisin, että entistä useampi innostuisi tuottamaan tietoa myös Wikidataan. Tähän mennessä olen syöttänyt tiedot Wikidataan käsin. Jos tietoa olisi valtavasti, kannattaisi harkita massalatausta (batch upload).

Lue myös aiempi Wikidata-bloggaukseni.

No comments:

Post a Comment

Kiva kun kommentoit! Voit kommentoida myös anonyymisti, mutta spammikommentit poistetaan heti kun ehditään.