Wikipedia on tekoälyoptimoinnin työkalu.
Pari vuotta sitten opin Wikimaniassa, että Wikipedia on suurin yksittäinen opetusaineisto, jota ChatGPT käyttää. Muistaakseni se edusti noin 15 prosenttia koko aineiston koosta.
Erikielisiä Wikipedioita on satoja ja niiden artikkelit ovat yleensä itsenäisiä, eli niiden sisällöt eroavat toisistaan.
Eilen Andrew Lih kertoi residenssiwikipedistien kuukausittaisessa WIR-miitissä uudesta tutkimuksesta.
Singaporelainen Ahrefs on kehittänyt yrityksille suunnatun Brand Radar -nimisen työkalun, joka näyttää, miten LLM-pohjaiset tekoälypalvelut hyödyntävät yritysten tietoja. Työkalua mainostaessaan yhtiön sisältömanageri Louise Linehan analysoi työkalun avulla saatua listaa tuhannesta ChatGPT:n eniten siteeramasta nettisivusta. Aineisto muodostui syyskuussa 2025 käytetyistä sitaateista, joten selvitys on varsin tuore.
Hän luokitteli sivustot Clauden avulla. Sen mukaan
1000 ChatGPT:n eniten siteeramman nettisivun joukossa oli:
- 297 Wikipedia-artikkelia
- 238 nettisivua tai lasketumissivua
- 194 opetussivustoa
- 66 app store -linkkiä
- 58 arvostelua
- 52 medialinkkiä (uutisia)
- 40 kieleen tai kielioppiin liittyvää sivustoa
- 22 tietosanakirjaa tai vastavaa
- 19 blogikirjoitusta tai kolumnia
- 9 Q&A/yhteistö/forum-sivua
- 5 korporaatiosivua (about us, contact us, yritysprofiilisivu)
Wikipedia, homepages, app store pages are “dead” citations
– you can’t easily influence them.
No, Wikipediaan voi kyllä vaikuttaa, mutta ei sitä ihan helpoksi ole tehty.
Afrefs on jakanut blogissaan myös ChatGPT:n sata siteeratuinta sivustoa. Esittelen tässä top-kympit, ja kehotan sinua katsomaan loput heidän blogistaan. Saat sieltä myös vinkkejä siihen, miten pääsee ChatGPT:n siteeraamaksi!
ChatGPT:n eniten käyttämät lähteet Yhdysvalloissa top-10 syyskuussa 2025:
(# Domain Mentions)
- www.reddit.com 847.338
- en.wikipedia.org 431.710
- www.amazon.com 97.457
- www.forbes.com 48.052
- www.businessinsider.com 37.712
- www.thespruce.com 36.195
- nypost.com 29.927
- www.bhg.com 28.897
- www.wired.com 28.611
- people.com 28.515
ChatGPT:n siteeratuimmat sivustot koko maailmassa syyskuussa 2025, top-10:
- www.reddit.com 4.389.496
- en.wikipedia.org 2.715.125
- es.wikipedia.org 364.361
- de.wikipedia.org 252.761
- www.amazon.com 214.993
- www.techradar.com 210.698
- www.thesun.co.uk 201.622
- timesofindia.indiatimes.com 198.100
- fr.wikipedia.org 191.494
- www.forbes.com 184.479
18. portugali
32. italia
78. venäjä
Otan esimerkiksi Helsingin.
![]() |
Googlen etusivulla Helsingin oma sivu on ykkösenä, Wikipedia toisena. Osa tietolaatikon tiedoista on peräisin Wikipediasta. |
Helsinki(ruots. Helsingfors)on Suomen pääkaupunki ja Uudenmaan maakuntakeskus, joka sijaitsee Etelä-Suomessa Suomenlahden pohjoisrannalla. Helsingin kaupungissa asuu noin 690 000 henkilöä ja laajemmin koko seudulla asuu noin 1 617 000 henkilöä. Asukasluvultaan Helsinki on Suomen suurin kunta ja lähikuntineen suurin kaupunkialue.
En tiedä, mistä Google pinta-alan nappaa, se on ainakin erilainen kuin Wikipedian ja Wikidatan ilmoittamat luvut (jotka nekin eroavat toisistaan). Myös väkiluku eroaa Wikimedia-projekteissa ilmoitetusta. Tietolaatikon ikäjakauma näyttää olevan sama kuin Wikipedia-artikkelin tietolaatikossa, samoin kuin puolueiden paikat kaupunginvaltuustossa.
(Ihmettelen muuten kovasti, mistä Google päättelee Helsingin kaupunkinosat. Maalaiselle Tali ja Aurinkolahti ovat ihan vieraita paikkoja.)
![]() |
Ensimmäisten Googlen kuvahakutulosten joukossa on kaksi Wikipediassa käytettyä kuvaa |
Jos taas valitsee käyttöön Googlen tekoälytilan, saa näkyviin kolme linkkiä.
![]() |
| Google käyttää tekoälytilassa lähteenä englanninkielistä Wikipediaa. |
![]() |
| ChatGPT hyödyntää Wikipedian tietoja ja kuvia. |
![]() |
| Perplexity käyttää lähteenä muun muassa suomenkielistä Wikipediaa. |
![]() |
Lähes kaikki Perplexityn ensimmäisten joukossa käyttämät kuvat ovat erikielisistä Wikipedioista, yksi Wikimediaan kuuluvasta Wikivoyage-palvelusta. |
![]() |
| Perushaussa Google nosti Myssyfarmin Wikipedia-artikkelin ykköseksi. Sivulla näkyvässä tekoälyvastauksessa hallusinoidaan myssymummasta (po. myssymummo). |
![]() |
Googlen tekoälytila käytti vastauksessaan 10 sivustoa, ei kuitenkaan Wikipediaa. |
![]() |
| ChatGPT hyödynsi vastauksessaan suomenkielistä Wikipediaa. |
![]() |
| Perplexity ilmoittaa käyttäneensä yhdeksää lähdettä, ensimmäinen niistä on Wikipedia. |











No comments:
Post a Comment
Kiva kun kommentoit! Voit kommentoida myös anonyymisti, mutta spammikommentit poistetaan heti kun ehditään.