Wednesday, November 19, 2025

Wikipedia haku- ja tekoälyoptimoinnin työkaluna

Viime viikkoina olen intoillut enemmän Wikidatasta kuin Wikipediasta. Nyt aloin kuitenkin miettiä, olenko koskaan sanonut blogissani suoraan, että myös (ja etenkin!) 

Wikipedia on tekoälyoptimoinnin työkalu. 

Pari vuotta sitten opin Wikimaniassa, että Wikipedia on suurin yksittäinen opetusaineisto, jota ChatGPT käyttää. Muistaakseni se edusti noin 15 prosenttia koko aineiston koosta.

Erikielisiä Wikipedioita on satoja ja niiden artikkelit ovat yleensä itsenäisiä, eli niiden sisällöt eroavat toisistaan.

Eilen Andrew Lih kertoi  residenssiwikipedistien kuukausittaisessa WIR-miitissä uudesta tutkimuksesta. 

Singaporelainen Ahrefs on kehittänyt yrityksille suunnatun Brand Radar -nimisen työkalun, joka näyttää, miten LLM-pohjaiset tekoälypalvelut hyödyntävät yritysten tietoja. Työkalua mainostaessaan yhtiön sisältömanageri Louise Linehan analysoi työkalun avulla saatua listaa tuhannesta ChatGPT:n eniten siteeramasta nettisivusta. Aineisto muodostui syyskuussa 2025 käytetyistä sitaateista, joten selvitys on varsin tuore.


Hän luokitteli sivustot Clauden avulla. Sen mukaan

1000 ChatGPT:n eniten siteeramman nettisivun joukossa oli:

  • 297 Wikipedia-artikkelia
  • 238 nettisivua tai lasketumissivua
  • 194 opetussivustoa 
  • 66 app store -linkkiä
  • 58 arvostelua
  • 52 medialinkkiä (uutisia)
  • 40 kieleen tai kielioppiin liittyvää sivustoa
  • 22 tietosanakirjaa tai vastavaa
  • 19 blogikirjoitusta tai kolumnia
  • 9 Q&A/yhteistö/forum-sivua
  • 5 korporaatiosivua (about us, contact us, yritysprofiilisivu)
Medioiden pienestä osuudesta ei kannata hämääntyä, ovathan monet mediat rajoittaneet tekoälybottien vierailuja. 

Asiakkailleni sanon, että hyvät mediaosumat kannattaa ottaa talteen Wikipediaan, jossa medialähteitä arvostetaan paljon enemmän kuin yhtiön tekemiä lehdistötiedotteita.

Louisen esimies Ryan Law sanoo kuulemma, että 

Wikipedia, homepages, app store pages are “dead” citations

– you can’t easily influence them.


No, Wikipediaan voi kyllä vaikuttaa, mutta ei sitä ihan helpoksi ole tehty.

Afrefs on jakanut blogissaan myös ChatGPT:n sata siteeratuinta sivustoa. Esittelen tässä top-kympit, ja kehotan sinua katsomaan loput heidän blogistaan. Saat sieltä myös vinkkejä siihen, miten pääsee ChatGPT:n siteeraamaksi!

ChatGPT:n eniten käyttämät lähteet Yhdysvalloissa top-10 syyskuussa 2025:
(# Domain Mentions)

  1. www.reddit.com 847.338
  2. en.wikipedia.org 431.710
  3. www.amazon.com 97.457 
  4. www.forbes.com 48.052 
  5. www.businessinsider.com 37.712 
  6. www.thespruce.com 36.195 
  7. nypost.com 29.927 
  8. www.bhg.com 28.897 
  9. www.wired.com 28.611 
  10. people.com 28.515 

ChatGPT:n siteeratuimmat sivustot koko maailmassa syyskuussa 2025, top-10:

  1. www.reddit.com 4.389.496 
  2. en.wikipedia.org 2.715.125 
  3. es.wikipedia.org 364.361 
  4. de.wikipedia.org 252.761 
  5. www.amazon.com 214.993 
  6. www.techradar.com 210.698 
  7. www.thesun.co.uk 201.622 
  8. timesofindia.indiatimes.com 198.100 
  9. fr.wikipedia.org 191.494 
  10. www.forbes.com 184.479 
Globaalille top-100-listalle pääsivät myös nämä Wikipediat:
18. portugali
32. italia
78. venäjä

Kielien järjestys lienee yhteydessä puhujien määrään.

Wikipedia vaikuttaa myös hakukoneoptimointiin.

Otan esimerkiksi Helsingin.

Googlen etusivulla Helsingin oma sivu on ykkösenä, Wikipedia toisena.
Osa tietolaatikon tiedoista on peräisin Wikipediasta.


Kun googlasin Helsinkiä, ensimmäinen osuma oli kaupungin oma sivusto. Toisena tuli suomenkielinen Wikipedia-artikkeli. Huomioni kiinnittyi  myös tietolaatikkoon. Siinä luki lähes sanasta sanaan sama teksti kuin Wikipediassa

Helsinki (ruots. Helsingfors) on Suomen pääkaupunki ja Uudenmaan maakuntakeskus, joka sijaitsee Etelä-Suomessa Suomenlahden pohjoisrannalla. Helsingin kaupungissa asuu noin 690 000 henkilöä ja laajemmin koko seudulla asuu noin 1 617 000 henkilöä. Asukasluvultaan Helsinki on Suomen suurin kunta ja lähikuntineen suurin kaupunkialue.


En tiedä, mistä Google pinta-alan nappaa, se on ainakin erilainen kuin Wikipedian ja Wikidatan ilmoittamat luvut (jotka nekin eroavat toisistaan). Myös väkiluku eroaa Wikimedia-projekteissa ilmoitetusta. Tietolaatikon ikäjakauma näyttää olevan sama kuin Wikipedia-artikkelin tietolaatikossa, samoin kuin puolueiden paikat kaupunginvaltuustossa.

(Ihmettelen muuten kovasti, mistä Google päättelee Helsingin kaupunkinosat. Maalaiselle Tali ja Aurinkolahti ovat ihan vieraita paikkoja.)

Ensimmäisten Googlen kuvahakutulosten joukossa on
kaksi Wikipediassa käytettyä kuvaa


Jos taas valitsee käyttöön Googlen tekoälytilan, saa näkyviin kolme linkkiä. 

Google käyttää tekoälytilassa lähteenä englanninkielistä Wikipediaa.




Ensimmäinen lähde on englanninkielinen Wikipedia, josta on saatu tekstiä vastauksen introon.

Seuraavaksi näytän, mitä ChatGPT Helsingistä kertoo. 


ChatGPT hyödyntää Wikipedian tietoja ja kuvia.

Tämäkin kuvausteksti näyttää perustuvan englanninkieliseen Wikipediaan. 

Helsinki[a] (Swedish: Helsingfors)[b] is the capital and most populous city in Finland. It is on the shore of the Gulf of Finland and is the seat of southern Finland's Uusimaa region. About 690,000 people live in the municipality, with 1.3 million in the capital region and 1.6 million in the metropolitan area. As the most populous urban area in Finland, it is the country's most significant centre for politics, education, finance, culture, and research. Helsinki is 80 kilometres (50 mi) north of Tallinn, Estonia, 400 kilometres (250 mi) east of Stockholm, Sweden, and 300 kilometres (190 mi) west of Saint Petersburg, Russia. Together with the cities of Espoo, Vantaa and Kauniainenand surrounding commuter towns,[12] including the neighbouring municipality of Sipoo to the east[13]Helsinki forms a metropolitan area.



Kuvista kaksi on Wikimediasta, ilmakuva Wikimedia Commonsista ja tuomiokirkko englanninkielisestä Wikipediasta. 

Kurkataan vielä Perplexityyn.

Perplexity käyttää lähteenä muun muassa suomenkielistä Wikipediaa.




Tutkin tarkemmin Perplexityn käyttämiä kuvia.

Lähes kaikki Perplexityn ensimmäisten joukossa käyttämät kuvat ovat
erikielisistä Wikipedioista, yksi Wikimediaan kuuluvasta Wikivoyage-palvelusta.


----------------

Toiseksi esimerkiksi otin Myssyfarmi-yrityksen. Valitsin tarkoituksella esimerkin, jolla on vain suomenkielinen Wikipedia-artikkeli. Läpinäkyvyyden nimissä kerron, ettei Myssyfarmi ole minun asiakkaani, enkä ole sen (tai Helsingin) Wikipedia-artikkelia muokannut.


Perushaussa Google nosti Myssyfarmin Wikipedia-artikkelin ykköseksi. Sivulla näkyvässä tekoälyvastauksessa hallusinoidaan myssymummasta (po. myssymummo).



Googlen tekoälytila käytti vastauksessaan 10 sivustoa, ei kuitenkaan Wikipediaa.



ChatGPT hyödynsi vastauksessaan suomenkielistä Wikipediaa.


Perplexity ilmoittaa  käyttäneensä yhdeksää lähdettä, ensimmäinen niistä on Wikipedia.


----

Jos haluat apua teidän Wikipedia/Wikimedia-sisältöjen kanssa, ota yhteyttä! Viimeksi kun katsoin, olin tehnyt 35 000 muokkausta erilaisiin Wikimedia-projekteihin. Verkkokaupastani löydät muun muassa avoimia koulutuksiani, jotka pidän vielä kertaalleen tänä vuonna. 


Thursday, November 13, 2025

Mitä hyötyä Wikidatasta on


Kirjoittelin tänään someen Wikidatasta, joten ajattelin pistää samoja juttuja talteen tännekin.

Viime viikkoina olen jutellut Wikidatasta monen ihmisen kanssa, esimerkiksi alumnipäivillä. 

"En ole siitä koskaan kuullutkaan" 

on tyypillinen reaktio. 

Se ei ole mikään ihme, sillä Wikidataa ei ole oikeastaan suunniteltu ihmisille, vaan se palvelee ja yhdistää Wikimedia-projekteja (esim. Wikipedia ja Wikimedia Commons), nykyään myös tekoälypalveluita.

Tämän vuoden elokuusta lähtien Wikidata on ollut maailman suurin tietokanta, johon on avoin pääsy.

Yksinkertaistaen Wikidataa voisi verrata joukkoon Excel-tiedostoja. Tiedostoilla on uniikit nimet ja ne sisältävät vaihtelevan määrän rivejä, sarakkeita ja arvoja.

Harva kuitenkin viihdyttää itseään taulukoita tutkien. No, jotkut  voivat toki opetella ulkoa joukkoliikenteen aikatauluja, mutta yleensä ihmiset lukevat mieluummin tekstejä: lehtiä, kirjoja ja erilaisia nettisivuja.


Wikidatassa vierailee enemmän botteja kuin ihmisiä

Siksi ei olekaan yllätys, että ihmiset ovat Wikidatassa vähemmistössä. Oheisesta kuvasta näet, että ihmisten (punainen user-viiva) vierailujen määrä on pysynyt Wikidatassa viimeisten kahden vuoden aikana varsin vakaana. Sen sijaan spider- ja automated-liikenteessä vaihtelua on enemmän.


Mikä niiden ero sitten on? Tutkin asiaa ja sain selville, että

spider viittaa liikenteeseen, jota itsensä boteiksi luokitellut kävijät tuottavat. Tähän kuuluu esimerkiksi hakukonebottien vierailut.

automated on liikennettä, jota tulee koneilta, jotka eivät ole tunnustaneet olevansa botteja, mutta jotka tunnistetaan sellaisiksi käytöksensä perusteella. 

Halutessasi voit tutkia lukuja tarkemmin täältä.  

Viime kuussa Wikidatan spider-vierailut nousivat siis ihan uudelle tasolle. 

Wikidata on hyvä työkalu hakukone- ja tekoälyoptimointiin.

Koska hakukoneet ja AI-botit ovat näköjään villiintyneet Wikidatasta, voisi olla hyvä hetki tutkia, millaista tietoa Wikidataan teidän organisaatiostanne on syötetty. Ja jotta saat vähän perspektiiviä, vertaa teidän kohteeseen laitettuja tietoja muihin saman alan toimijoihin.

Wikidataa hyödynnetään myös Google Knowledge Graphissa. Se hakee tietoja useista tietokannoista ja Wikipediasta. Sen perusteella tietoja näytetään vaikkapa etusivujen tietolaatikoissa. Myös Applen Siri ja Amazonin Alexa hyödyntävät Wikidatan tietoja. (Lähde: Wikipedia)

 

Onko Wikidatasta jotain hyötyä ihmisille, joita SEO ja GEO eivät kiinnosta? 

No ainakin siellä on sellaista tietoa, jota esimerkiksi Wikipediasta ei löydy ja siitä voisi olla paljon iloa kääntäjille, toimittajille, opiskelijoille ja tutkijoille.


Esimerkki 1. Mitä voit oppia yksittäistä Wikidata-kohdetta tutkimalla?


Wikidatasta löytyy tietoja aiheista, joista
esimerkiksi englanninkielinen Wikipedia
ei kerro.
Jutellessamme Am... Meksikonlahdesta aloin miettiä miten Suomenlahti kääntyy eri kielille. Suomenlahdesta on kirjoitettu Wikipedia-artikkeli 98 kielellä. Wikidatassa alueen nimi on määritelty 153 kielellä. Kaikkia kieliä en tietenkään osaa lukea, mutta löysin muutaman poikkeavan tavan nimetä lahti:

Skolt Sami: Lääʹddluhtt
Võro: Viro meri
Icelandic: Kirjálabotn (viittaa Karjalaan)


Wikidatasta löytyy vähän vastaavanlaista tietoa 120 miljoonasta asiasta. Suurimmasta eli englanninkielisestä Wikipediasta artikkeleita löytyy vain 7 miljoonasta aiheesta. Koska suhdetta voi olla vaikea hahmottaa, piirsin siitä viereisen kuvan. :)


Esimerkit 2. Mitä voit oppia Wikidata-kyselyillä?


Yksittäisten Wikidata-kohteiden tutkiminen ei ole aina paras tapa hyödyntää Wikidataa. 

Jos jatkan äskeistä Excel-esimerkkiä, niin tiedät ehkä ihmisiä, jotka osaavat muuttaa taulukot grafiikoiksi tai yhdistellä useiden tiedostojen (tai välilehtien) tietoja. 

Myös Wikidan tietomassoista voi tehdä kyselyjä. Kun osaat tehdä niitä, voit löytää kohteita yhdistäviä asioita ja parhaassa tapauksessa tietoja, joita voisi muuten olla vaikea löytää. 

Seuraavaksi muutama esimerkki.

Käynnistä kysely painamalla sinistä nappulaa.
Jos haluat keskeyttää kyselyn ajamisen,
klikkaa sen alla olevaa nappulaa.

Maailman miljardöörit - Wikidatan kysely löysi heitä hetkessä 654 kappaletta. 

Ihmiset, jotka ovat voittaneet sekä Nobelin että Oscarin (2 kpl)

Elokuvat, jotka on julkaistu vuonna 2017 (6847 kpl).

Kun vaihdoin kyselyn päivämäärät, sain selville, että tässä kuussa tulee kuluneeksi 25 vuotta 99 Wikidatassa mainitun elokuvan julkaisusta. Niihin kuuluvat esimerkiksi X-Men, 102 Dalmatians ja Billy Elliot.

Muusikoita, jotka ovat kuolleet 27-vuotiaana löytyi 215 kpl, esimerkiksi Amy Winehouse, Jim Morrison, Jimi Hendrix, Greta Pitkänen ja Kurt Cobain.

Kun vaihdoin kyselyyn ammatiksi kirjailija, kuolleita löytyi 282, esimerkiksi Jim Morrison, Jouko Luosto, Olavi Malmberg, Kalle Toivola ja Antti Räty.

Seuraavaksi tutkin, ketkä kirjailijat kuolivat 99-vuotiaana. Heitä löytyi 433 kpl, esimerkiksi Eeva Heikkilä, Aino-Marja Räsänen ja Ilma Ikonen.


Esimerkki 3. Wikidata ei ole valmis

Seuraava esimerkki havainnollistaa, että Wikidatassa on välillä aukkoja Wikipediaan verrattuna.
Tämän Wikidata-kyselyn mukaan Vuoden bändi Emman ovat saaneet 22-Pistepirkko, Blind Channel, Dingo, Egotrippi, Haloo Helsinki!, HIM, Leningrad Cowboys, Lordi, Nightwish, Michael Monroe, PMMP, The Rasmus, Stam1na, Timo Rautiainen & Trio Niskalaukaus ja Ultra Bra.

Wikipedian Emma-gaala-artikkelin tiedot ovat kattavammat. Se kertoo, että vuoden bändi -palkinto on jaettu 39 vuonna. Wikipediasta löysin koko joukon edellisestä listasta puuttuvia bändejä: Aikakone, Don Huonot, Eppu Normaali, Gasellit, JVG, Kolmas Nainen, Kuumaa, Leevi and the Leavings, Mamba,  Maustetytöt, Neljä Ruusua, Nylon Beat ja Yö. 

Huom. Monet bändit ovat voittaneet Emman useampana vuonna.

Koska Wikidatassa on vielä aukkoja, 

toivoisin, että entistä useampi innostuisi tuottamaan tietoa myös Wikidataan. Tähän mennessä olen syöttänyt tiedot Wikidataan käsin. Jos tietoa olisi valtavasti, kannattaisi harkita massalatausta (batch upload).

Lue myös aiempi Wikidata-bloggaukseni.

Wednesday, November 12, 2025

Vierailulla suomalaisissa, japanilaisissa ja ranskalaisissa perheissä

Viime aikoina olen vieraillut erilaisissa perheissä kirjojen kautta. Olen tutustunut Edouard Louis'n ranskalaiseen perheeseen ja Minna Eväsojan matkassa japanilaisiin perheisiin. Viimeksi Katriina Järvisen tutustutti minut suomalaisiin perheisiin. 

Olen kirjoittanut näistä kirjoista Instagram-tililleni, mutta päätin pistää tarinat nyt blogiin, vähän parempaan talteen. Toivon myös, että blogiin tulisi enemmän kommentteja kuin mihin Instassa olen saanut tottua. No, aina saa haaveilla. :)

Katriina Järvinen kertoi varsin tarkasti oman tarinansa, joka alkaa hänen uskovaisesta lapsuudenperheestään, joka ei hyväksynyt hänen valintojaan. Paetessaan perhättään hän perusti ensimmäisen oman perheensä ikäänkuin vahingossa ja suri sen rikkoutumista. Nykyisin hän viettää rikasta elämää uusperheensä kanssa. 

Kirjaa varten hän oli lukenut paljon perheitä käsitteleviä kirjoja ja haastatteluja, mutta etsi mielenkiintoisia haastateltavia myös itse. 

Perheet ovat erilaisia niin kooltaan kuin kulttuureiltaan. Joku kokee olevansa yhden hengen perhe, joku laskee perheeseensä myös työkaverit. Toisissa perheissä puhutaan, toisissa toimitaan. 

Vaikka lapsuus oli varsin traumaattinen, Katriina sai omilta vanhemmiltaan arvokkaan tarinoiden lahjan. Kirjan tarinat herättivät paljon ajatuksia, perheiden moninaisuus on hyvin suuri, eikä toisten elämää ole helppo ymmärtää. 

Olin esimerkiksi varsin ällistynyt kuullessani lestadiolaisen suvun nimijärjestelmästä - kuka nyt voisi muistaa kaikkien nimet? Niinpä esimerkiksi 

"2.7.3.1 on syntynyt, paljon onnea 2.7.3 ja 2.7.3.0" 

tarkoittaa, että
sisarussarjan toisen lapsen (2)
seitsemännen lapsen (2.7)
kolmas lapsi (2.7.3) ja hänen puolisonsa (2.7.3.0)
ovat saaneet ensimmäisen lapsensa (2.7.3.1.).

Huikean kätevää. Ehkä voin tässä kohtaa paljastaa, että puhun välillä vitsimielessä omista lapsistani numeroilla. :D

Sisaruksilla on erilaiset vanhemmat, johtuen niin ikäeroista kuin lasten luonteista, jotka herättävät vanhemmissa erilaista vastakaikua. Minun oli välillä vaikea muistaa kuka on Iivari tai Saara, sillä haastateltujen tarinoihin palattiin pitkin kirjaa. Siksi neuvon lukijoita tekemään heistä itselleen pienet muistiinpanot. Jos kirjasta tulee uusi painos, kuvaukset voisi lisätä siihen.    


Helsingin Kirjamessuilla kävin kuuntelemassa Minna Eväsojaa, joka hän kertoi uudesta Rakkauden merkit-kirjastaan. Olen lukenut monta niin monta hänen kirjaansa, että tiesin esimerkiksi, että papumies tarkoittaa tirkistelijää. 

Minnasta tuntui, että hänestä tuli moderni papumies, kun hän tutki uutta kirjaansa varten japanilaisia parisuhteita. Oikeastaan hän ei tehnyt taustatyötään kirjaa varten, vaan se on ollut osa hänen ystävyyssuhteitaan jo pitkään. Japanilaisten naisten on ollut helppoa avautua parisuhteistaan ulkomaalaiselle, jonka tiedetään pian lähtevän maasta, ihmiselle, joka ei voi kertoa parisuhteista eteenpäin (no, unohdetaan nyt tämän kirjan lukijat, emmehän me enää tiedä, keitä esikuvat olivat).

Messukeskuksessa minulla nousi ihokarvat pystyyn, kun kuulin hänen kertovan yli 90-vuotiaasta naisesta, joka oli saanut nauttia pitkästä rakkausavioliitosta, toisin kuin monet hänen kanssasisaristaan, jotka olivat päätyneet ongelmiin isojen roskien kanssa. 

Kirja oli mielenkiintoinen ja nopealukuinen (luin yhtä Minnan kirjaa noin 1,5 vuotta). Se sisältää tarinoiden lomassa myös faktoja japanilaisesta yhteiskunnasta. Kirja kertoo 11 naisen tarinat 6 hahmon kautta. Tätä minun oli hankala ymmärtää. Kirja on siis autofiktiota eli Minna yhdistelee oman elämänsä tapahtumia varsin luovasti. 

Etukäteen eniten odottamani tarina yli 90-vuotiaan rouvan rakkausavioliitosta osoittautui vähän pettymykseksi, sillä tarinasta puuttui draama, jota muissa tarinoissa oli sitten senkin edestä. Pari tutustui toisiinsa hyvin nuorena, sai luvan mennä naimisiin,  ja viihtyi yhdessä alusta asti toisiaan kunnioittaen. Olikohan tämä tarina totta vai kudelma useamman naisen tarinoista? 

En siis päässyt irti siitä, että yritin miettiä kunkin tarinan kohdalla niiden todellisuuspohjaa. Jos kertoo 2-3 naisen parisuhteista yhden hahmon kautta, niin eihän se enää totuutta vastaa. Fiktiivisiin tarinoihin on tietysti myös nivottu aineksia erilaisista tapauksista, mutta silloin tiedän fiktiivisyyden alusta asti, enkä jää miettimään tarinan taustoja. 

Tämä oli neljäs Minnan kirja, jonka luin ja se sai minut miettimään, olenko ymmärtänyt aiemmat kirjat väärin. Olen pitänyt niitä totena ja ihmetellyt sitä yksityiskohtien määrää, jonka Minna muistaa vuosistaan Japanissa. Minä olin Japanissa 2,5 kuukautta, enkä osaisi esimerkiksi kertoa, miltä työpisteeni näytti, miltä puistoissa tuoksui tai miten täynnä metrot olivat. Siksi neuvon muita lukijoita nauttimaan tarinoista puhtaasti fiktiivisestä näkökulmasta. 

Pidin siitä, millaisia erilaisia onnellisia loppuja tarinoissa oli, niissä hurjissakin. Ja taas opin jotain uutta Japanistakin. 🥰

Luin kesän aikana kirjastomme kaikki Ernaux't (4 kpl) ja halusin lukea lisää ranskalaisia teoksia. Minulle suositeltiin Ei enää Eddy -kirjaa. Ja tosiaan, kirja muistutti tyyliltään kovasti Ernaux'ta, onhan Edouard Louis kertonut saaneensa häneltä inspiraatiota. 

Louis'n 21-vuotiaana julkaisema esikoisteos oli kotimaassaan menestys, muualla myös, ja kun tiesi tämän, kirjaa oli jotenkin levollista lukea sen synkistä teemoista huolimatta. Vaikka pieni Eddy sai kärsiä köyhyydestä, homofobiasta, näköalattomuudesta ja koulukiusaamisesta, saatoin luottaa, että vielä onni kääntyy. 

Mutta paljon jäi kertomatta, kuten vaikka se, miten Eddystä tulee Edouard. Kirja huokui vihaa perhettä kohtaan ja pisti miettimään, mitä perhe on siitä ajatellut.


Ahmaisin melkein heti perään Louis'n kolmannen kirjan, Kuka tappoi isäni. Nimensä mukaisesti se kertoo hänen isänsä varsin karun tarinan. 

Kirjassa on varsin poliittinen vire, ja se kertoo "pienten" päätösten vaikutuksesta alistettujen elämään. Harva kai haluaa tieten tahtoen työkyvyttömäksi tai tuottaa työkyvyttömiä ihmisiä...

Tähän kirjaan mennessä isän ja pojan tunteet olivat lämmenneet. 

Kirjan nimi on kyllä hieman harhaanjohtava, ei Louis'n isää suinkaan tapettu.
Kolmantena lukuun tuli Louis'n neljäs kirja, Naisen taistelut ja muodonmuutokset. Kirja oli lyhyt mutta toivoa antava, ihanaa, että Edouardin äiti onnistui muuttamaan elämäänsä ja vaikean alun jälkeen myös äiti ja poika löysivät toisensa. 

Hurmaava yksityiskohta kirjassa liittyy Catherine Deneuveen. ❤️ Koska tiesin tässä vaiheessa jo kuudennen kirjan teeman, tiesin, ettei äidin elämä vielä lopullisesti muuttunut.

Seuraavia kirjoja jouduinkin hieman jonottamaan. 

Aloitin ensin toiseksi vanhimman kirjan Väkivallan historia, mutta koin sen niin kamalaksi, että luin sen vain harppomalla.

Viides kirja Muutos: metodi kertoo siitä, mihin Ei enää Eddy päättyy ja paljastaa, miten niin kurjasta lapsuudesta noustaan niin nopeasti menestyskirjailijaksi. 

Lyhyt vastaus: 
kovalla työllä, sattumalta ja muiden ihmisten avulla. 

Ja että kirjoittamaan oppii lukemalla, mutta myös elämällä ja varsin hurjaa on Louis'n elämä ollutkin. Mitä enemmän Louis'n kirjoja luen, sitä enemmän niiden todenperäisyys mietityttää. Voiko joku oikeasti lukea kuukausitolkulla kirjaklassikko / päivä -tahdilla?

Kirja antoi kuitenkin voimaa palata Väkivallan historian pariin. Avaintieto minulle oli se, että sain kuulla keitä kirjassa esiintyneet Didier ja Geoffrey olivat ja miksi he olivat Edouardin tukena. 

Väkivallan historia on siis Louis'n kirjoista toinen ja kertoo siitä, mitä tapahtui vain kuukausi sen jälkeen, kun hän oli saanut valmiiksi esikoisteoksensa. 

Louis kertoo öisestä kohtaamisesta, joka päättyy raiskaukseen ja väkivaltaan ja josta seuraa kohtaamisia terveydenhuollon, poliisin, ystävien ja perheen kanssa. 

Ensimmäisellä lukukerralla se, että hän päätyi kertomaan kotikylänsä juoruista silloin, kun odotin, että vääjäämätön pahuus tapahtuu, tuntui sietämättömältä. Toisella kerralla kirja ei ollut yhtä ahdistava. 

Olen miettinyt, miksi olen niin koukuttunut Louis'n ja hänen esikuvansa Annie Ernaux'n tapaan kirjoittaa. Monet pitävät tyylejä liian suorasukaisina, töks-töks, mutta minua mutkat suoriksi -tyyli viehättää. Väkivallan historian soisin kaikkien raiskattuja ammattinsa puolesta kohtaavien lukevan. Ehkä se avaisi vähän silmiä siihen, millaisessa mielentilassa ihmiset ovat, ja miten paljon heiltä voidaan odottaa. Se, että joutuu muistelemaan järkyttävää tapahtumaa kerta toisensa perään käy varmasti kidutuksesta. 

Kirjasta jäi mieleen esimerkiksi kohtaus, jossa kerrotaan, että äärimmäisen väkivallan uhri ikäänkuin ulkoistaa itsensä tilanteesta, joka on liian vaikea kohdata.

Louis'n uusin kirja ilmestyi tänä syksynä. Monique pakenee on hänen äitinsä "tilaama" teos. Kirja kertoo Louis'n äidin paosta kolmannen miehensä luota, jota seurasin lähes henkeä pidättäen, odottaen koko ajan mutkia matkaan. 

Kirja avasi myös uusia näkökulmia aiempiin teoksiin paljastaen, miten äiti ja sisko näihin autofiktiivisiin kirjoihin, etenkin siihen ensimmäiseen suhtautuivat. (Joo, arvaat varmasti oikein.) 

Tästä kirjasta jäi oikein hyvä mieli, ihanaa, ihanaa, ihanaa! Sen verran arvaan, että seuraava kirja on taas rankempaa settiä, kertoohan se Louis'n velisuhteesta, mutta kiva, että tämä kirja kiilasi kirjoittamisvuorossa sen eteen.

Tuntui etuoikeutetulta saada kokea tällainen lukumaraton, kuusi Louis'n kirjaa alle 2 kuukaudessa. Se, että minulla oli varsin tuoreessa muistissa kirjojen tapahtumat vaikutti lukukokemukseen, samoin kuin se, että tiesin millaisia kirjoja seuraavaksi on luvassa.

15 vuotta piilotettuja aarteita - lahja itselleni ja lukijoille

Terveisiä juhlahumusta! 

Pääsin viikonloppuna juhlimaan Tampereen yliopiston ensimmäiseen alumnitapahtumaan sataan vuoteen. Sata vuotta lasketaan ilmeisesti lehtimieskoulutuksen alkamisesta. Sitä sopii minunkin juhlia, kahdestakin syystä:

  • isotätini sai tuon koulutuksen
  • minäkin opiskelin tiedotusoppia, jota nykyisin journalistiikaksi kutsutaan 

Juhlat olivat todella onnistuneet, harmittelin ainoastaan sitä, etten nähnyt juurikaan tuttuja. Kuvittelin, että juhliin olisi tullut esim. vanhoja työkavereitani Nokialta ja opiskeluaikaisia tuttujani. 1500 henkilön joukosta bongasin vain neljä tuttuani, joista kolmeen olen tutustunut vasta yrittäjäaikoinani. 

Jotta ensi kerralla kävisi parempi tuuri, suosittelenkin Tampereen korkeakouluista valmistuneita ilmoittautumaan alumnirekisteriin.

Toisaalta tapahtumassa oli niin vapautunut tunnelma, että vieraidenkin kanssa oli helppo jutella, joten ihan hyvin tässäkin kävi.

Alumnitapahtuma osui erittäin sattuvaan saumaan, sillä sunnuntaina tuli täyteen 25 vuotta omasta valmistumisestani. Olen koulutukseltani filosofian maisteri, pääaineeni oli tilastotiede. Joku kysyi, miten olen sitä työssäni hyödyntänyt. No, olen hyvä tulkitsemaan tilastoja ja visualisoimaan niitä. Hiljattain hyödynsin osaamistani kommentoidessani Wikipedian uutta charts-ominaisuutta, ja saatiin muutettua sen esitystapaa. 

Asioilla on tapana ruuhkautua ja sattuman kaupasta myös yritykselläni on merkkipäivä 9. marraskuuta. 15 vuotta sitten sain nimittäin soiton PRH:sta ja yritykseni sai nimen. Sitä ei muuten moni tiedäkään, virallinen nimi on nimittäin Hidden treasure – Piilotettu aarre. Onneksi se on keksitty kauan ennen tekoälyn yleistymistä. :D Arjessa pärjään nimellä Piilotettu aarre ja tänään sain taas nimikehuja. Viisi vuotta sitten tein projektin eräälle firmalle. Tilaaja oli sittemmin vaihtanut työpaikkaa, ja miettiessään miten hän minut taas löytäisi, hän ei muistanut minusta muuta kuin sanan aarre. Sen avulla hän löysi minut uudelleen. :)

Minulla on ollut tapana juhlia yritykseni synttäreitä verkostoni kanssa muun muassa arvonnoilla. Koska sunnuntai oli isänpäivä ja eilen yksinyrittäjiä juhlistava päivä, viivyttelin tarkoituksella oman merkkipäiväviestintäni kanssa. 

Tällä kertaa juhlin merkkipäivää antamalla 

blogini lukijoille lisää luettavaa ja 

itselleni aikaa kirjoittaa. 

Tein Magdalena Hain postauksesta
noston mm. Threadsiin.
Löysin bloggaamisen riemut samalla kun menin tammikuussa Fediversumiin, opin valtavasti uutta ja pistin Fedi-asioita tänne talteen.

Hiljattain Magdalena Hai kertoi Fedissä, että 

paras tapa auttaa lempikirjailijoita on kirjoittaa heidän kirjoistaan arvioita blogiin. 


Somenäkyvyys ei siis ole hänen mukaansa riittävää, ja kulttuurijournalismin määrä on laskenut vuosi vuodelta. 

Kommentti pysäytti, olenhan ajatellut tekeväni hyvää kulttuurinedistämistyötä tekemällä postauksia Instagramiin (ja myös Pixelfediin). 

Jos siis oikeasti haluan auttaa, minun kannattaisi kopioida samat asiat myös blogiini. Ehkä bloginäkyvyys auttaisi myös minua, sillä kaipaan nykyistä enemmän keskustelua esim. lukemistani kirjoista.

Olen tehnyt vastaavaa sisällönkierrätystä osittain jo muiden pitkien somepostausteni kohdalla. Siinä missä Instagramissa, Facebookissa, LinkedInissä ja Mastodonissa (ainakin minun instanssissani) on varaa kirjoittaa pitkiä postauksia, Threadsia ja Blueskytä varten jutut pitää ketjuttaa, eikä minulla aina riitä kärsivällisyys siihen. Siksi on ollut helpompi postata asiat tänne ja lähettää mikroblogipalveluihin vain linkki.

Merkkipäivän myötä aion siis tuottaa aiempaa enemmän ns. ajatonta sisältöä. Somen lisäksi aiheisiin kuuluu siis jatkossa myös kirja- ja ehkä myös elokuvajuttuja, uuden blogin lanseeraaminen olisi mielestäni ihan liian työlästä. Ajattelin laittaa tänne talteen myös Suur-Jyväskylän lehteen kirjoittamani kolumnit, joita olen kirjoittanut lähemmäs 15 vuotta. Jutut piilotan arkistoon, eli linkitän ne alkuperäiseen ilmestymisaikaan. Ja jotta itselleni jäisi talteen tieto siitä, kuinka paljon bloggauksia ennen tätä temppua oli, laitan tiedon tähän.

Haluatko sinä koukuttaa seuraajasi
häviävän sisällön avulla? 

Tämä tempaukseni liittyy osittain lukemaani Facebook-keskusteluun, jossa valitettiin Instagramin stoorikeskusteluista. Paljon hyvää sisältöä menee Instagramissa ohi, eikä niihin voi enää palata. 

24h-sisällöillä luodaan aktiivisesti fomoa: ihmisten on pakko päivystää jatkuvasti somessa, ettei mitään tärkeää mene ohi. Se on surullista, sillä me

voisimme myös muuttaa omia tapojamme kestävämpään suuntaan.

Kesällä kauhistuin, kun tajusin, että Snapchat on kaupallistanut striikit. Jos jokin kauan varjeltu striikki katkeaa, sen saa elvytettyä maksamalla. 

Nyt myös Threads on esitellyt vuorokaudessa häviävät sisällöt, joita se kutsuu aavejulkaisuiksi.




Haluan omalta osaltani edistää kestävää somea, ja siksi 

  1. olen kirjoittanut kirjoista ja leffoista stoorien sijasta postauksiin, jotta ne tavoittavat ihmiset pidempään. Jatkossa alan koota näitä juttuja myös blogiini. En ehkä välittömästi, enkä ehkä ihan samassa formaatissa kuin somessa. Kenties parempi tapa on niputtaa saman tyylin sisältöjä yhteen.

  2. otan talteen kaikki omat Instagram-stoorini kohokohtiin: minun sisältöjäni et missaa, vaikka olisit viikonlopun poissa somesta. Kesällä olin viikon poissa somesta ja koska se oli niin ihanaa, suosittelen sitä vilpittömästi sinullekin. Taukoni ansiosta minun oli hyvin helppoa olla poissa somesta myös alumipäivässä. Odotellessani ystävääni minulla oli kyllä suuri kiusaus tarttua someen, mutta koska vein puhelimeni infopisteeseen lataukseen, päädyinkin keskustelemaan livenä naisen kanssa, jonka kanssa löysimme yllättävän paljon yhdistäviä tekijöitä. Tämän olisin taatusti missannut kännykän kanssa seurustellessani.

  3. kulutan enemmän postauksia kuin stooreja ja tutkin esim. Facebook-fiidini ilman algoritmia

  4. ilahdun someista, jotka antavat näkyvyyttä myös vanhemmille postauksille tai joissa häsät yhä toimivat. On ihan tosi ok palata vanhoihin päivityksiin ja keskustella niistä.

  5. aion nyt tuottaa entistä enemmän blogisisältöä. Pidän kirjoittamisesta, joten miksen antaisi sille aikaani?

Kiva, kun luit tänne asti. Toivottavasti jaksat lukea piilotettuja kirjoituksiani myös jatkossa. :) 

Ensitöikseni pistin tänne tänä vuonna julkaistut kolumnini. Koska olin viitannut kahdessa niistä lukemiini kirjoihin, niin pistin kolumnien perään myös kirja-arviot. Sen jälkeen keräsin yhteen kasaan viime aikoina lukemani kahdeksan(!) perheistä kertovaa kirjaa. Kirjoitin tänään siis yhteensä 5 blogipostausta - siinäpä lahjaa kerrakseen. Toivon, että intoni jatkuu. :)


Wednesday, October 29, 2025

Grokipedia - Muskin vastine Wikipedialle

Tänä aamuna kävin läpi sekä LinkedIn-fiidini että Mastodonin/Fedin #Grokipedia-fiidin. Linkkari-verkostoni ainoa Grokipedia-avaus oli italiaksi, Mastodonissa en nähnyt suomenkielistä keskustelua. 

Grokipedia on siis Elon Muskin maanantaina julkaisema verkkomedia, joka on luotu Wikipediaa ja tekoälyä hyödyntämällä. Lukijat eivät sitä voi muokata, mutta he voivat pyytää Grokilta muokkauksia, jotka se sitten tekee tai jättää tekemättä. 

Wikipedistin kannalta tämä on tietysti vähän kumottavaa. 

1. Ihmiset ovat tottuneempia AI-keskusteluihin kuin Wikipedian muokkaamiseen. 

Voi siis olla, että Grokipedian sisältöihin vaikuttamaan pyrkiviä ihmisiä on hyvin pian moninkertainen määrä wikipedisteihin verrattuna. Tieto on alunperin tekoälyn luomaa, osittain huttua, mutta jos ihmiset saadaan tarkistamaan ja täydentämään tietoa, niin sillä on potentiaalia tulla luotettavaksi ja hyödylliseksi. Tämä riippuu siitä, miten hyvin ihmisten pyynnöt käsitellään ja miten paljon laadukkaita pyyntöjä tulee.

Wikipedistejä on varsin vähän. Jos Grokipediasta tulisi suomenkielinen versio (ja miksei tulisi, onhan "kääntäminen" tekoälylle varsin helppoa), niin "päivityspyyntöjen esittäjiä" saattaisi hyvinkin löytyä tuhansittain. Suomenkielisiä aktiivisia muokkaajia on kuukausitasolla vain noin 500. Vuosikymmenten varrella tuhannet muutkin ovat kyllä yrittäneet muokata Wikipediaa, mutta sääntöjen vaikeus ja ilmapiirin suoruus ovat karkoittaneet heidät. Tekoälybotit juttelevat käyttäjille mukavia ja ne osaisivat opettaa kärsivällisesti ihmiset muotoilemaan pyyntönsä niin, että ne menisivät läpi.

Ihmisiä, jotka ovat kyllästyneet Wikipediaan voisi kiinnostaa myös tietynlainen anonyymisyys. He voisivat ehkä esittää pyyntöjään ilman, että kanssamuokkaajat näkevät pyynnön tekijän. Wikipediassahan kaikki on läpinäkyvää ja siksi ihmisille voidaan valittaa vaikka vääristä välimerkeistä. Tämä on kurjaa ilmapiirin huonontamista, kun voisimme pistää botit hommiin ja jättää ihmisille enemmän aikaa sisältöjen miettimiseen. (Paljon botteja Wikipediassa jo onkin, mutta kaikki eivät osaa niitä tehdä.)


2. Mitä tapahtuu, jos Grokipedia onnistuu luomaan sisältöjä ihmisiä kiinnostavista aiheista, jotka puuttuvat Wikipediasta kokonaan?

Alkavatko ihmiset, mukaanlukien toimittajat, käyttää sitä lähteenään?  (No, jotain ehkä kertoo se, että toimittajat viittaavat usein siihen, mitä X:ssä kirjoitetaan.)

Surullista kyllä, en luota kovin paljon ihmisten lähdekritiikkiin. Tuoreen esimerkin lähdekritiikin puutteista kertoi Tivin uutinen. Aalto yliopiston tekemässä tutkimuksessa puolet testatuista teki loogisen päättelyn tehtäviä itse, puolet tekoälyn avulla. Tutkijat huomasivat, ettei ChatGPT:n kanssa käyty keskustelua, vaan annetut kysymykset kopioitiin sellaisinaan ja ihmiset tyytyivät ensimmäiseen saamaansa vastaukseen. "Havaitsimme, että useimmat käyttäjät luottivat tekoälyyn sokeasti." 

Wikipediaan pääsy on  tehty  tarkoituksella varsin hankalaksi, siihen vaaditaan esimerkiksi paljon medianäkyvyyttä, eivätkä yritykset voi käyttää sitä mainosalustana, eli kirjoittaa markkinointihenkisiä yritysesittelyjä. Jos Grokipediassa ei ole tällaisia esteitä, ja alusta saa sekä paljon lukijoita että näkyvyyttä esimerkiksi Google-hauissa tai muiden AI-palveluiden lähteenä, siitä tulee houkutteleva vaihtoehto yrityksille ja vaikuttajille, jotka eivät ole saaneet toivomaansa näkyvyyttä Wikipediassa.

Huomasin jo vaikutteita tästä, kun tutkin Grokipedian artikkeleita Jyväskylästä ja Tampereesta. Kumpikin mainitsee kuuluisien asukkaiden joukossa yrittäjiä, joita ei suomenkielisessä tai englanninkielisessä Wikipediassa mainita. Ehkä Musk haluaa yrittäjänä antaa enemmän näkyvyyttä yrityksille ja yrittäjille kuin mihin Wikipediassa ollaan totuttu?

Mitä tapahtuu, jos yrittäjät, tutkijat ja artistit, jotka ovat saaneet Wikipediassa kylmää vettä niskaansa innostuvat helpommasta tavasta saada työlleen näkyvyyttä?


3. Grokipedia jää tuskin ainoaksi, luultavasti myös muut AI-firmat tulevat apajille. 

Wikipedialla ei ole ollut vakavasti otettavia kilpailijoita, mutta Wikipedian näkyvyys on pitkälti Googlen varassa. Mitä jos Google tekee oman Gpedian ja alkaa suosia hauissaan sitä? Entä mitkä olisivat OpenAI:n, Perplexityn tai Metapedian valtit? 

Wikimedia-säätiö yritti ottaa tekoälyä käyttöön keväällä, jotta sen avulla olisi luotu tiivistelmiä Wikipedia-artikkeleista. Yhteisö tyrmäsi idean ja siitä luovuttiin. Tekoälyä käytetään kyllä joissain muissa tehtävissä, mutta sitä voitaisiin käyttää paljon enemmän. 


Millaisia ajatuksia Grokipedia sinussa herättää? Luin aiheesta Forbesista.

Friday, October 17, 2025

Wikidatasta vauhtia GEO- eli tekoälyoptimointiin?

Viime syksynä osallistuin viiden tunnin Wikidata-koulutukseen, jonka Wikimedia UK tarjosi Wikipedia-kouluttajaringilleen. Kiitos siitä! ❤️ 

Koulutuksen jälkeen olin aivan liekeissä: tätä tietoa haluan välittää Suomessa. Koulutuksen näkökulma oli muistiorganisaatiot, GLAM-organisaatiot, ja siksi lähdin itsekin tarjoamaan Wikidata-osaamistani siihen suuntaan. 

Wikidataa ei ole suunnattu tavallisille ihmisille, sen tutkiminen ei ole kovin mielekästä lauseita kaipaaville ihmisille. Harvempi kai lukee taulukoita huvikseen?

Wikidatasta saa kuitenkin SPARQL-hakukyselyillä valtavan määrän tietoa, jota ei löydy mistään muualta. Wikidata yhdistää tiedot niin erikielisistä Wikipedia-artikkeleista kuin myös monista muistakin Wikimedia-projekteista. Wikidataan voi linkittää esimerkiksi Wikimedia Commonsin kuvia. Wikidata sopisi siis hyvin esimerkiksi tutkijoiden työkaluksi. Ymmärrettävistä syistä (lue: pienet resurssit) yhteydenottoni GLAMiin eivät johtaneet mihinkään. Harmi.

Viime aikoina olen kuitenkin löytänyt enemmän vastakaikua Wikidatalle, kun olen kertonut asiasta muutamille yrityksissä ja julkisissa organisaatioissa työskenteleville asiakkailleni. Wikidatan kautta tieto päätyy tekoälyn jauhettavaksi, eikä AI välitä alustan teknisyydestä, päinvastoin. 😁 

Luulen, ettei missään vielä kouluteta yrityksille sitä, miten ne voisivat tehdä tekoälyoptimointia Wikidatan avulla. Valmista koulutuspakettia minullakaan ei ole, mutta sen sijaan on intoa opetella asiaa yhä useamman tahon kanssa. 

Näin nimittäin viime viikolla yhden silmiä avaavan esimerkin: Wikidataa osataan jo hyödyntää, kun tarve on suuri. Toivon siis löytäväni muutaman pilottiasiakkaan, jotka kertovat minulle näkyvyystarpeistaan.

Wikidataan on vähän helpompi* luoda sisältöjä kuin Wikipediaan, sillä merkittävyyskynnys on siellä pienempi. (*Teknisesti se on kyllä haastavampaa.)

Esimerkiksi minulla on siellä oma item eli kohde:

Johanna Janhonen kuuluu ihmisten (Q5) porukkaan.

Lisäsin itseni Wikidataan alunperin päästäkseni Metaan (älä sekoita Zuckerbergin Metaan, myös Wikimedialla on Meta eli Meta wiki) vierailevien wikipedistien eli residenssiwikipedistien listalle. Koska meitä on maailmassa niin vähän, olemme Wikidatassa automaattisesti merkittäviä, eli voimme tehdä itsellemme kohteen. :)

Tutkiessani millaista tietoa Wikidatan ja tekoälyn yhteiselosta löytyy, törmäsin tuoreeseen uutiseen

Tämän kuun alussa Wikimedia Deutschland, Wikidatan luoja ja yksi Wikimedia-liikkeen suurimmista toimijoista Wikimedia-liikkeessä, teki uuden avauksen. Wikidata Embedding Project käyttää vektoripohjaista semanttista hakua, joka auttaa tietokoneita ymmärtämään sanojen välisiä suhteita. Uuden MCP-protokollan avulla LLM-palveluiden on entistä helpompi hyödyntää Wikidataa. Protokolla on kehitetty yhteistyössä neuraalihakuihin keskittyneen Jina.AI:n ja IBM:n omistaman DataStax-yhtiön kanssa.

Wikidatassa on noin 120 miljoonaa kohdetta. Uusin niistä oli äsken

Wikidata-kehittäjien huumorintajusta kertoo, että 

kohde Q1 on universumi, 
Q2 maa, 
Q3 elämä, 
Q4 kuolema, 
Q5 ihminen, 
Q6, Q7, Q9 ja Q10 ovat tyhjiä, 
mutta Q8 merkitsee onnellisuutta. 

Arvaatko, mitä Q42 tarkoittaa tai mikä on Suomen kohteen tunnus?

Otapa siis yhteyttä, jos haluat miettiä kanssani sitä, miten voisimme kehittää teidän näkyvyyttänne Wikidatassa. 

Alla vielä esimerkki Wikidata-kohteesta, josta jo äsken mainitsin. 

Kohteiden mahdollisia ominaisuuksia on todella suuri määrä, arvoja ja tarkenteita vielä enemmän. Niiden kanssa saa päänsä helposti sekaisin, siksi arvelen, että pääset helpommin kärryille, kun opetan sinulle alkeet tai teen teidän organisaatiolle alustavan muokkauskierroksen, jota voimme ideoida ja iteroida myös yhdessä.


Datamodel in Wikidata fi

Kuunvaihteessa pääsen muuten opiskelemaan lisää Wikidatasta seminaarissa, joka järjestetään kahden vuoden välein. Jes!


Jos sinä haluat oppia lisää Wikidatasta, niin voit

1. Tutkia, mitä Wikipedia siitä kertoo
2. Kysyä, mitä käyttämäsi tekoäly aiheesta kertoo.

Minä kysyin ChatGPT:ltä käyttävätkö tekoälypalvelut Wikidataa. :) Näin se vastasi:

Hyvä kysymys — vastaus on kyllä, mutta epäsuorasti ja vaihtelevasti. Selvennän tarkemmin:

 1. Wikidatan käyttö avoimena tietolähteenä

Monet tekoälypalvelut (erityisesti kielimallit, kuten ChatGPT, Google Gemini, Claude, yms.) ovat saattaneet hyödyntää Wikidataa epäsuorasti, koska Wikidata on avoimen lisenssin (CC0) tietokanta. Tämä tarkoittaa, että kuka tahansa voi käyttää sen tietoja vapaasti, myös tekoälyn koulutukseen.

Käyttö tapahtuu tyypillisesti kahdella tavalla:

  • Koulutusaineistona: Wikidatan rakenne (kuten faktat henkilöistä, paikoista, organisaatioista jne.) voidaan sisällyttää mallin koulutusvaiheessa.

  • Taustatietolähteenä reaaliajassa: Joissain palveluissa (esim. Googlen ja Wikipedian hakujärjestelmissä) tekoäly voi hakea ajantasaisia faktoja suoraan Wikidatasta kyselyn aikana.

 2. Esimerkkejä Wikidataa käyttävistä järjestelmistä

  • Wikimedia-projektit (kuten Wikipedia ja Wiktionary) käyttävät Wikidataa suoraan tietolähteenä.

  • Google Knowledge Graph ja Bing Knowledge Graph hyödyntävät ainakin osittain Wikidatan tietoja.

  • OpenAI:n GPT-mallit (kuten ChatGPT) ovat voineet saada osan tiedoistaan Wikidatan kautta, mutta eivät käytä sitä reaaliajassa — eli tieto on voinut tulla mukaan koulutusvaiheessa, ei dynaamisesti kyselyn aikana.

  • Assistant-palvelut (kuten Siri ja Alexa) voivat hyödyntää Wikidataa epäsuorasti muiden tietolähteiden kautta.

 3. Miksi käyttö on "epäsuoraa"

Useimmat tekoälypalvelut eivät ilmoita tarkasti, mitä julkisia tietokantoja ne ovat käyttäneet koulutukseen. Kuitenkin avoimen lisenssin lähteet, kuten Wikipedia ja Wikidata, ovat todennäköisiä lähteitä, koska ne tarjoavat laajaa ja luotettavaa strukturoitua tietoa ilman lisenssimaksuja.

Lue myös uudempi bloggaukseni: Mitä hyötyä Wikidatasta on

Wednesday, October 15, 2025

Onko pakko olla Metan palveluiden varassa?

Magdalena Hai kirjoitti LinkedInissä siitä, että yhdistykset ja kansalaisjärjestöt ovat hädissään, kun Meta ei anna niiden enää ostaa sponsoroituja päivityksiä ja ilman niitä näkyvyys on heikkoa. Hän ihmetteli, eikö nyt olisi hyvä aika ottaa Fedi korporaatiosomejen rinnalle (ei tilalle, tästähän minäkin kesäkuussa kirjoitin).


Pakkohan minun oli tähän avaukseen tarttua. Jotta ränttini ei jäisi vain linkkarilaisten nähtäväksi, otan sen talteen tänne bloginkin puolelle. Äänensävyssäni saattaa kuulua pientä turhautumista. Se johtuu siitä, että lobbasin Fediversumia keväällä huolella monille tärkeille tahoille. Suurin osa ei vastannut mitään, mutta osalta kuulin myös selityksiä.

***

Innostuin tammikuussa Fediversumista, etenkin Mastodonista. Pääsin vanhan kunnon someen, jossa juteltiin vieraiden ihmisten kanssa ja jossa häsät vielä toimivat. Postaukset näkyvät kokonaan ja kaikenkarvaiset algoritmitemppuilut sai unohtaa. Ihmiset jakoivat mun juttuja enemmän kuin missään somessa ja useimmiten sain postauksiini myös kommentteja. 


Suosittelin paikkaa kai-kil-le: tulkaa tänne, täällä on hyvä pöhinä. 


- Ääh, ei voida, kun tilastot näyttää, että siellä on niin vähän porukkaa, eikä me todellakaan haluta olla ensimmäisinä jossain somealustalla. Niin tai Metassa kyllä haluttiin, ja Blueskyssä, mutta muualla ei. 


- Ääh, ollaan jo niin monessa somepalvelussa, että yhtään uutta ei mahdu rinnalle. Juuri mentiin yhden korporaation perustamaan someen, meillä riittää opettelua siellä. Katos, kun ne algoritmitkin on niin hankalat, pitää kikkailla, että saa näkyvyyttä. 


- Ei epäkaupallisesti toimivat somet voi pärjätä. Ai Wikipedia? No eihän sitä lasketa, se on ihan eri juttu, 25 vuotta sitten tällainen järjestäytyminen vielä onnistui, mutta ei se ole nykyaikaa. 


Niin, vaikeeta on. Mutta minä nautin samaan aikaan sekä korporaatiosomejen että Fedin algoritmittomista syötteistä. Ajatella, että jollain YKSIN yrittävällä voi olla resursseja pyöriä päivittäin seitsemällä alustalla. Niin tai kahdeksalla, jos sen Wikipediankin laskee. Ja kiitos somesiivouksen, aikaa jää vielä lehdille ja paperikirjoillekin.


Jos sinulla on vielä neljä minuuttia, katso tämä pikaopastus Fediversumista: