Tarvitsin huomiseen tekoälykoulutukseeni esimerkkiä datan analysoinnista, joten katsotaanpa mitä ChatGPT pro saa irti lokakuun luetuimmista artikkeleista.Top-99-lista:
Israel, Facebook, Palestiina (valtio), Hamas, Martti Ahtisaari, Gazan kaista, Palestiina (alue), Aira Samulin, Israelin–Palestiinan konflikti, Suomen presidentinvaali 2024, Gaza (kaupunki), Luettelo Suomen kaupungeista, Suomi, Stefan Lindfors, Halloween, Länsiranta, Janna Hurmerinta, Luettelo hätäkeskuksen tehtäväluokista, Carles Puigdemont, David Beckham, Amazing Race Suomi, Aleksis Kivi, Tom Pöysti, Jouni Hynynen, Linda Lampenius, Yeboyah, Estonian uppoaminen, Eeva Ahtisaari, Kikka, Luettelo suomalaisten opiskelijahaalarien väreistä, Marko Ahtisaari, Suomen kunnanvaakunat, Rosso (elokuva), Lilli Paasikivi, M/S Estonia, A. W. Yrjänä, Alexander Stubb, Hätä-Miikka, Teemu Keskisarja, Luettelo vuonna 2023 kuolleista henkilöistä, Vicky Rosti, Marianne Heikkilä, Harri Hyttinen, Matthew Perry (näyttelijä), Petolliset, Kuuden päivän sota, Helsinki, Tarja Halonen, Taivaan tulet (televisiosarja), Nato, Ensimmäinen maailmansota, Ylilauta, Sauli Niinistö, Miina Sillanpää, Vain elämää (14. tuotantokausi), Tove Jansson, Poromafia, Kalle Rovanperä, Hamasin hyökkäys Israeliin 2023, Jom kippur -sota, Pekka Haavisto, Gasellit (yhtye), Kekri, Raakel Kuukka, Pyhäinpäivä, Emma Kimiläinen, Mauno Koivisto, Luettelo televisiosarjan Salatut elämät henkilöistä, Hizbollah, Simo Rantalainen, Diandra Flores, Puuilo, Juutalaisuus, Suppilovahvero, Severi Lahtinen, Jarkko Niemi (näyttelijä), Toinen maailmansota, Libanon, Israelin puolustusvoimat, Laura Kolbe, Suomen tasavallan presidentti, Tuomas Holopainen, RMS Titanic, Jari Sarasvuo, Urho Kekkonen, Eeva Kontu, Esko Kovero, Yhdysvallat, Peter Vesterbacka, Jerusalem, Masked Singer Suomi (5. tuotantokausi), Aliisa Syrjä, Saara Kotkaniemi, Jorma Uotinen, Kotiteollisuus (yhtye), Jukka Rasila, Luettelo Suomen kunnista, Marcus Grönholm, Hannu Karpo, Suomen maakunnat.
Poistin listalta Carles Puidgemontin, joka on virheellisesti kaikkien kielien luetuimpien artikkelien joukossa päivästä toiseen, ja jota ei ole saatu poistettu listalta useasta pyynnöstä huolimatta.
Näin ChatGPT analysoi listaa:
Tämä tilasto näyttää olevan Wikipedian sivujen muokkauksien, muokkaajien määrän ja sivukatselujen tilastoa. Tässä on muutama huomio:
1.Israelin ja Palestiinan aiheiset sivut: Näyttää siltä, että Israelin, Palestiinan, Hamasin ja Gazan kaistaan liittyvät sivut ovat saaneet merkittäviä sivukatseluja ja muokkauksia. Tämä voi heijastella alueen poliittista ja historiallista merkitystä sekä jatkuvaa kiinnostusta näihin aiheisiin.
2. Suomalaiset henkilöt ja tapahtumat: Tilastossa on useita Suomeen liittyviä aiheita, kuten Martti Ahtisaari, Suomen presidentinvaali 2024 ja Aira Samulin, mikä kertoo näiden aiheiden suosiosta tai ajankohtaisuudesta Suomen Wikipedian käyttäjien keskuudessa.
3. Kulttuuri ja viihde: Listalla on myös kulttuurillisia ja viihteellisiä aiheita, kuten "Amazing Race Suomi", "Halloween" ja televisiosarjat. Tämä osoittaa, että tällaiset aiheet ovat suosittuja ja niitä päivitetään aktiivisesti.
4. Historialliset ja globaalit aiheet: Aiheet kuten Ensimmäinen ja Toinen maailmansota, RMS Titanic ja Yhdysvallat osoittavat, että historialliset ja globaalit aiheet kiinnostavat laajasti.
5. Muokkausten ja sivukatselujen suhde: Joillakin sivuilla, kuten "Israel" ja "Martti Ahtisaari", on huomattavasti enemmän muokkauksia suhteessa sivukatseluihin, mikä voi viitata aiheiden kiistanalaisuuteen tai aktiiviseen keskusteluun.
Tämä tilasto tarjoaa kiehtovan näkökulman siihen, mitkä aiheet ovat aktiivisessa tarkastelussa ja keskustelussa Wikipedian suomalaisessa osiossa.
--------------------------------------
On yleisesti tunnettua, että suomenkielisen Wikipedian henkilöartikkeleista noin viidennes kertoo naisista. Heijastuuko suhde myös luetuimpien listalle? Kyselin ChatGPT:ltä analyysia aiheesta.
Tilasto ei tarjoa suoraa tietoa artikkeleiden sukupuolijakaumasta, mutta voimme tehdä joitakin havaintoja perustuen mainittuihin henkilöihin:
Henkilöihin liittyvät artikkelit: Luettelossa on useita artikkeleita, jotka käsittelevät sekä miehiä että naisia. Kuitenkin nopealla silmäyksellä näyttää siltä, että miesten (esim. Martti Ahtisaari, Stefan Lindfors, David Beckham) artikkelit ovat hieman yleisempiä kuin naisten (esim. Aira Samulin, Eeva Ahtisaari, Linda Lampenius).
Poliittiset ja historialliset hahmot: Monet mainituista henkilöistä ovat poliittisia tai historiallisia hahmoja. Politiikan ja historian alueilla miehet ovat perinteisesti olleet enemmän esillä, mikä saattaa selittää miesten korkeamman esiintymisen listalla.
Viihde ja kulttuuri: Viihteen ja kulttuurin alueilla naiset näyttävät olevan paremmin edustettuina. Esimerkiksi Aira Samulin ja Linda Lampenius ovat tunnettuja kulttuurialan henkilöitä.
Ajankohtaisuus: Jotkut henkilöt saattavat olla listalla siksi, että he ovat olleet äskettäin uutisissa tai ajankohtaisissa tapahtumissa, mikä ei välttämättä heijasta yleistä sukupuolijakaumaa artikkeleissa.
Koska tilastossa ei ole eritelty sukupuolta artikkelikohtaisesti, on vaikeaa tehdä tarkkoja päätelmiä sukupuolijakaumasta. Lisäksi Wikipedia-artikkelien määrä ja suosio vaihtelevat jatkuvasti, joten tämä tilasto tarjoaa vain hetkellisen kuvan tilanteesta.
-------------------------------
Halusin tietää, tunnistaako ChatGPT ihmisten sukupuolen nimen perusteella. Koska ChatGPT kertoi, että listalla on enemmän miehiä, aloitin heistä.
Tilastosta voidaan erottaa seuraavat artikkelit, jotka keskittyvät miehiin:
- Martti Ahtisaari - Entinen Suomen presidentti ja Nobelin rauhanpalkinnon saaja.
- Stefan Lindfors - Suomalainen muotoilija ja taiteilija.
- David Beckham - Englantilainen jalkapalloilija.
- Alexander Stubb - Suomalainen poliitikko ja entinen pääministeri.
- A. W. Yrjänä - Suomalainen muusikko, CMX-yhtyeen laulaja.
- Sauli Niinistö - Suomen tasavallan presidentti.
- Kalle Rovanperä - Suomalainen ralliautoilija.
- Mauno Koivisto - Edesmennyt Suomen presidentti.
- Urho Kekkonen - Pitkäaikainen Suomen presidentti.
- Esko Kovero - Suomalainen näyttelijä.
- Peter Vesterbacka - Suomalainen yrittäjä, tunnettu Angry Birds -pelin markkinoinnista.
- Marcus Grönholm - Entinen ralliautoilija.
- Hannu Karpo - Suomalainen toimittaja ja tv-persoona.
- Jari Sarasvuo - Suomalainen yrittäjä ja entinen radio- ja televisiojuontaja.
Nämä henkilöt ovat eri alojen edustajia, ja heidän artikkelinsa ilmentävät laajaa kiinnostusta eri aihealueisiin, kuten politiikkaan, urheiluun, taiteeseen ja viihteeseen.
Ja jatkoin sitten kyselemällä naisista.
Tilastosta voidaan tunnistaa seuraavat artikkelit, jotka keskittyvät naisiin:
- Aira Samulin - Suomalainen tanssija, yrittäjä ja hyväntekeväisyystyön tekijä.
- Eeva Ahtisaari - Martti Ahtisaaren vaimo, tunnettu julkisuuden henkilö.
- Linda Lampenius - Suomalainen viulisti ja mediapersoona.
- Emma Kimiläinen - Suomalainen autourheilija.
- Diandra Flores - Suomalainen laulaja.
- Emma Kimiläinen - Suomalainen autourheilija.
- Diandra Flores - Suomalainen laulaja.
- Raakel Kuukka - Suomalainen näyttelijä.
- Miina Sillanpää - Suomalainen poliitikko ja ensimmäinen naisministeri Suomessa.
- Tove Jansson - Tunnettu suomalainen kirjailija ja taiteilija, muumien luoja.
- Tarja Halonen - Entinen Suomen presidentti.
- Lilli Paasikivi - Suomalainen oopperalaulaja.
- Eeva Kontu - Suomalainen muusikko.
- Aliisa Syrjä - Suomalainen näyttelijä.
- Saara Kotkaniemi - Suomalainen näyttelijä.
Nämä artikkelit kattavat monenlaisia aloja, kuten politiikan, musiikin, urheilun ja taiteen, osoittaen näiden naisten vaikutusta ja merkitystä eri osa-alueilla suomalaisessa kulttuurissa ja historiassa.
---------------------------
On hieman erikoista, että vaikka ChatGPT sanoi, että listalla näytti olevan enemmän miehiä kuin naisia, se kuitenkin löysi enemmän naisten nimiä.
Huomasin myös, ettei ChatGPT ottanut listoilleen suinkaan kaikkia henkilöartikkeleita, joten kysyin voisiko se vielä listata artikkelit henkilöistä, joiden sukupuolesta se ei ole varma. Tähän listaan se nosti myös elokuvia ja muita teoksia, jotka poistin itse listalta.
Hämmentävästi se listasi myös henkilöitä, joiden sukupuolen se oli jo kerran tunnistanut. Heitä olivat Jari Sarasvuo, Peter Vesterbacka, Esko Kovero ja Marcus Grönholm sekä naisista Eeva Kontu.
Henkilöartikkeleiksi se ei tunnistanut Aleksis Kiveä tai Simo Rantalaista.
Järjestelin listat itse sukupuolen mukaan.
Tilastosta löytyy useita henkilöartikkeleita, joiden sukupuolta ei voi päätellä pelkästään nimen perusteella ilman lisätietoa. Tällaisia artikkeleita ovat:
- 1. Tom Pöysti - Nimi ei itsessään kerro sukupuolta.
- 2. Jouni Hynynen - Nimi ei paljasta sukupuolta suoraan.
- 3. Marko Ahtisaari - Nimi ei paljasta sukupuolta ilman lisätietoa.
- 4. Hätä-Miikka - Nimi ei yksiselitteisesti kerro sukupuolta.
- 5. Teemu Keskisarja - Nimi ei itsessään indikoi sukupuolta.
- 6. Harri Hyttinen - Nimi ei ole selkeästi sukupuolittunut ilman taustatietoa.
- 7. Matthew Perry (näyttelijä) - Nimestä ei voi päätellä sukupuolta ilman lisätietoa.
- 8. Severi Lahtinen - Nimi ei suoraan paljasta sukupuolta.
- 9. Jarkko Niemi (näyttelijä) - Nimi ei kerro sukupuolta ilman lisätietoa.
- 10. Tuomas Holopainen - Nimi ei suoraan indikoi sukupuolta.
- 11. Jorma Uotinen - Nimi ei suoraan kerro sukupuolta.
- 12. Jukka Rasila - Nimi ei paljasta sukupuolta ilman lisätietoa.
- 1. Janna Hurmerinta - Henkilön sukupuoli ei ole ilmeinen nimestä.
2. Yeboyah - Nimi ei ole selkeästi sukupuolittunut.
- 3. Kikka - Taiteilijanimi, joka ei itsessään kerro sukupuolta.
4. Vicky Rosti - Taiteilijanimi, joka ei suoraan kerro sukupuolta.
5. Marianne Heikkilä - Nimi ei itsessään kerro sukupuolta.
6. Laura Kolbe - Nimi ei yksiselitteisesti kerro sukupuolta.
Jotkut nimistä voivat olla tunnettuja Suomessa, mutta ilman tietoa henkilöiden taustasta tai kansallisesta tunnettavuudesta, niiden sukupuolta ei voi päätellä pelkästään nimen perusteella.
---------------------------------
-
Loppupäätelmä:
-
ChatGPT oli siis oikeassa siitä, että listalla on enemmän miehiä kuin naisia.
Miehistä kertovia artikkeleita on 28, joista se tunnisti miehiksi puolet, 14.
Naisia on listalla 21, joista ChatGPT tunnisti naisiksi 15.
Ei liene ihme, ettei ChatGPT tunnista suomalaisten nimien sukupuolta, mutta sitä ihmettelen, että se sekoitti kansainväliset nimet Tom, Matthew ja Laura.
- Tekoäly on kätevä apuväline tiedon analysointiin. Mutta sen analysoinnit pitää kuitenkin itse tarkistaa. Ehkä on siis parasta, että analysoi vain itselle tuttuja aiheita. Vaikka tiedoissa olikin virheitä, analysointiapulainen nopeuttaa itse työtä.