![]() |
Viime viikkoina olen jutellut Wikidatasta monen ihmisen kanssa, esimerkiksi alumnipäivillä.
"En ole siitä koskaan kuullutkaan"
on tyypillinen reaktio.
Se ei ole mikään ihme, sillä Wikidataa ei ole oikeastaan suunniteltu ihmisille, vaan se palvelee ja yhdistää Wikimedia-projekteja (esim. Wikipedia ja Wikimedia Commons), nykyään myös tekoälypalveluita.
Tämän vuoden elokuusta lähtien Wikidata on ollut maailman suurin tietokanta, johon on avoin pääsy.
Yksinkertaistaen Wikidataa voisi verrata joukkoon Excel-tiedostoja. Tiedostoilla on uniikit nimet ja ne sisältävät vaihtelevan määrän rivejä, sarakkeita ja arvoja.
Harva kuitenkin viihdyttää itseään taulukoita tutkien. No, jotkut voivat toki opetella ulkoa joukkoliikenteen aikatauluja, mutta yleensä ihmiset lukevat mieluummin tekstejä: lehtiä, kirjoja ja erilaisia nettisivuja.
![]() |
| Wikidatassa vierailee enemmän botteja kuin ihmisiä |
Siksi ei olekaan yllätys, että ihmiset ovat Wikidatassa vähemmistössä. Oheisesta kuvasta näet, että ihmisten (punainen user-viiva) vierailujen määrä on pysynyt Wikidatassa viimeisten kahden vuoden aikana varsin vakaana. Sen sijaan spider- ja automated-liikenteessä vaihtelua on enemmän.
Mikä niiden ero sitten on? Tutkin asiaa ja sain selville, että
spider viittaa liikenteeseen, jota itsensä boteiksi luokitellut kävijät tuottavat. Tähän kuuluu esimerkiksi hakukonebottien vierailut.
automated on liikennettä, jota tulee koneilta, jotka eivät ole tunnustaneet olevansa botteja, mutta jotka tunnistetaan sellaisiksi käytöksensä perusteella.
Halutessasi voit tutkia lukuja tarkemmin täältä.
Viime kuussa Wikidatan spider-vierailut nousivat siis ihan uudelle tasolle.
Wikidata on hyvä työkalu hakukone- ja tekoälyoptimointiin.
Koska hakukoneet ja AI-botit ovat näköjään villiintyneet Wikidatasta, voisi olla hyvä hetki tutkia, millaista tietoa Wikidataan teidän organisaatiostanne on syötetty. Ja jotta saat vähän perspektiiviä, vertaa teidän kohteeseen laitettuja tietoja muihin saman alan toimijoihin.
Wikidataa hyödynnetään myös Google Knowledge Graphissa. Se hakee tietoja useista tietokannoista ja Wikipediasta. Sen perusteella tietoja näytetään vaikkapa etusivujen tietolaatikoissa. Myös Applen Siri ja Amazonin Alexa hyödyntävät Wikidatan tietoja. (Lähde: Wikipedia)
Onko Wikidatasta jotain hyötyä ihmisille, joita SEO ja GEO eivät kiinnosta?
No ainakin siellä on sellaista tietoa, jota esimerkiksi Wikipediasta ei löydy ja siitä voisi olla paljon iloa kääntäjille, toimittajille, opiskelijoille ja tutkijoille.
Esimerkki 1. Mitä voit oppia yksittäistä Wikidata-kohdetta tutkimalla?
![]() |
Wikidatasta löytyy tietoja aiheista, joista esimerkiksi englanninkielinen Wikipedia ei kerro. |
Skolt Sami: Lääʹddluhtt
Võro: Viro meri
Icelandic: Kirjálabotn (viittaa Karjalaan)
Esimerkit 2. Mitä voit oppia Wikidata-kyselyillä?
Jos jatkan äskeistä Excel-esimerkkiä, niin tiedät ehkä ihmisiä, jotka osaavat muuttaa taulukot grafiikoiksi tai yhdistellä useiden tiedostojen (tai välilehtien) tietoja.
![]() |
| Käynnistä kysely painamalla sinistä nappulaa. Jos haluat keskeyttää kyselyn ajamisen, klikkaa sen alla olevaa nappulaa. |
Maailman miljardöörit - Wikidatan kysely löysi heitä hetkessä 654 kappaletta.
Ihmiset, jotka ovat voittaneet sekä Nobelin että Oscarin (2 kpl)
Elokuvat, jotka on julkaistu vuonna 2017 (6847 kpl).
Kun vaihdoin kyselyn päivämäärät, sain selville, että tässä kuussa tulee kuluneeksi 25 vuotta 99 Wikidatassa mainitun elokuvan julkaisusta. Niihin kuuluvat esimerkiksi X-Men, 102 Dalmatians ja Billy Elliot.
Muusikoita, jotka ovat kuolleet 27-vuotiaana löytyi 215 kpl, esimerkiksi Amy Winehouse, Jim Morrison, Jimi Hendrix, Greta Pitkänen ja Kurt Cobain.
Kun vaihdoin kyselyyn ammatiksi kirjailija, kuolleita löytyi 282, esimerkiksi Jim Morrison, Jouko Luosto, Olavi Malmberg, Kalle Toivola ja Antti Räty.
Seuraavaksi tutkin, ketkä kirjailijat kuolivat 99-vuotiaana. Heitä löytyi 433 kpl, esimerkiksi Eeva Heikkilä, Aino-Marja Räsänen ja Ilma Ikonen.
Esimerkki 3. Wikidata ei ole valmis
Tämän Wikidata-kyselyn mukaan Vuoden bändi Emman ovat saaneet 22-Pistepirkko, Blind Channel, Dingo, Egotrippi, Haloo Helsinki!, HIM, Leningrad Cowboys, Lordi, Nightwish, Michael Monroe, PMMP, The Rasmus, Stam1na, Timo Rautiainen & Trio Niskalaukaus ja Ultra Bra.
Wikipedian Emma-gaala-artikkelin tiedot ovat kattavammat. Se kertoo, että vuoden bändi -palkinto on jaettu 39 vuonna. Wikipediasta löysin koko joukon edellisestä listasta puuttuvia bändejä: Aikakone, Don Huonot, Eppu Normaali, Gasellit, JVG, Kolmas Nainen, Kuumaa, Leevi and the Leavings, Mamba, Maustetytöt, Neljä Ruusua, Nylon Beat ja Yö.
Huom. Monet bändit ovat voittaneet Emman useampana vuonna.
Koska Wikidatassa on vielä aukkoja,
toivoisin, että entistä useampi innostuisi tuottamaan tietoa myös Wikidataan. Tähän mennessä olen syöttänyt tiedot Wikidataan käsin. Jos tietoa olisi valtavasti, kannattaisi harkita massalatausta (batch upload).
Lue myös aiempi Wikidata-bloggaukseni.
.png)

.png)

No comments:
Post a Comment
Kiva kun kommentoit! Voit kommentoida myös anonyymisti, mutta spammikommentit poistetaan heti kun ehditään.