Skip to main content

Gaussin käyrä eli normaalijakauma sekä tilastojen harha


Normaalijaukauman kuva
(Lähde: Internet)

Kimmo Huosionmaa

Jokainen maailman poliitikko haluaa saada mahdollisimman paljon ääniä. Paras tapa hankkia noita poliittisessa elämässä tärkeitä kannattajia, jotka laittavat noiden poliitikkojen ehdokas numeroita on tietenkin luvata ihmisille jotain konkreettista, ja tuon takia tietenkin olisi mukavaa tietää ihmisten saama keskipalkka, jotta heiltä ei sitten lähdetä liikaa leikkaamaan, mutta jostain syystä nuo leikkaukset eivät useinkaan osu oikeaan kohtaan. Gaussin käyrä eli normaalijakaumaa esittelevä funktio on varuste, millä matemaatikot tutkivat kohtaa, missä luku-ryhmän keskikohta sijaitsee. Se on kuuluisa “kamelin kyttyrä”, jonka mukaan moni valtio säätää opetussuunnitelmassa esitettyjä asioita.

https://fi.wikipedia.org/wiki/Normaalijakauma
Tuo funktio on tietenkin myös väline, jolla etsitään “suurta keskinkertaisuutta”. Suuri enemmistö on joukko ihmisiä, joita on mukava palvella ainakin jos sattuu olemaan vaalivuosi. Syy miksi suurta enemmistöä kutsutaan joskus “suureksi keskinkertaisuudeksi” johtuu siitä, että jos poliittikko saa tuon ihmisryhmän puolelleen, niin hän saa siitä sitten kuitata todella suuren määrän ääniä. Tuo käyrä on ikään kuin tilastotieteiden “pyhä lehmä”. Sen nimeen voidaan aina vannoa, ja se on tietenkin todella raskaan sarjan väline niiden käsissä, jotka haluavat tietää sen, mitä keskiverto ihminen saa palkkaa tai muuta vastaavaa.


Mutta tällöin unohdetaan sellainen asia, että Gaussin käyrään liittyy harha, mikä saattaa tehdä tuosta välineestä käyttökelvottoman. Tuo harha johtuu siitä, että esimerkiksi lukujoukon äärimmäiset luvut voivat antaa tuon käyrän kohdalla täysin väärän arvon. Eli äärimmäisen suuri luku ikään kuin hinaa tuota “kamelin kyttyrää” pitkin lukusuoraa. Jos otetaan esimerkiksi keskipalkkaa koskeva lukujoukko, ja siihen otetaan vaikka 10 000 ihmistä, joista jokainen saa noin 1400 euroa bruttopalkkaa, minkä jälkeen tähän ryhmään lisätään vaikka NHL-joukkueen jäsenten tai jonkun maailman suuryrityksen johtajan saamat tulot, niin silloin tuo “kamelin kyttyrä” siirtyy aivan jonnekin muualle, mitä sen pitäisi olla. Ja siksi nuo leikkaukset saattavat kohdistua juuri sinne, mihin niitä ei varmasti ainakaan populistin kannalta kannata kohdistaa.


Myös kaiken maailman miljonäärit sekä miljonäärien sukujen jäsenet vääristävät esimerkiksi sellaisia tilastoja, jotka kertovat siitä, käyttääkö tavallinen ihminen esimerkiksi julkisia lääkäripalveluita. Varakkaat ihmiset tietenkin varmasti käyttävät ainakin osittain enemmän yksityisiä lääkäreitä kuin tavalliset palkansaajat, ja varmaan NHL-pelaajilla on tietenkin myös omat yksityiset lääkärinsä käytössä. Joten tällaisten ihmisten ottaminen tilastoon saattaa myös aiheuttaa väärän tiedon kulkeutumisen tietokantaan. Myös se kuka näihin tiedonkeruussa mahdollisesti käytettyihin lomakkeisiin vastaa voi sitten vääristää saatua tietoa.


Juuri tällainen muusta ryhmästä poikkeava luku saattaa muuttaa koko käyrän välineeksi, joka on täysin hyödytön. Samoin jos tilastomatematiikan tai tilastojen avulla yritetään oikeasti etsiä ihmisten keskiluokan tuloja, niin sama tilasto ei kuitenkaan näytä oikeastaan muuta kuin hyödytöntä tietoa. Nimittäin noissa tilastoissa sitten on sellainen huomioitava asia, että ne kertovat vain sen, miten suuria palkkoja vaikkapa Suomessa maksetaan, jos lähteenä käytetään teollisuuden ja muiden yritysten maksamia palkkoja.


Se mikä tuosta tilastosta tekee politiikan kannalta hyödyttömän on sitten sellainen, että siitä ei suoraan näy, että onko tuo palkansaajien ryhmä äänioikeutettuja eli esimerkiksi siitä, että ovatko he sitten maamme kansalaisia ei ole tietoa. Ja sen takia poliittisten ohjelmien teko pelkästään palkkatilastojen avulla on hiukan hankalaa, vaikka tietenkin populistien malli politiikasta  on sellainen, että enemmistölle luvataan paljon, mutta muilta sitten otetaan kaikki pois. Kun puhutaan normaalijakaumaa kuvaavan  funktion antamasta harhasta sekä muista tilastojen ominaisuuksista, niin silloin tietenkin pitää muistaa sellainenkin asia, että maailman 200 rikkainta ihmistä saa muistaakseni saman verran tuloja, kuin loppu maailma yhteensä.



Vaikka noilla ihmisillä tietenkin on käytössään voimakas media-ase, niin silti heidän oma antamansa äänimäärä vaaleissa on todella pieni, mutta heidän saamansa palkka varmasti hinaa gaussin käyrää pitkin lukusuoraa. Jos taas puhutaan siitä, että kouluttamaton ihminen voi saada todella hyvää palkkaa, niin silloin voidaan palkanlaskentaan lisätä vaikka juuri NHL-joukkueiden pelaajien sekä lottomiljonäärien sen vuoden tulot, niin varmasti alkaa tilasto näyttää lupaavalta. Mutta muuten tuo tilasto ei aivan niin oikeita tuloksia näytä, kuin sen toivoisi näyttävän. Kuitenkin myös inhimillinen tekijä sitten kun lähdetään puhumaan vaikka siitä, kuinka paljon työllisyyttä on nyt saatu vähennettyä.


Eli tietenkin jokainen äänestäjä tekee itse sen äänestyspäätöksen, ja siinä hän voi miettiä sitä, että onko juuri hän saanut sen työpaikan. Jos työpaikka ei osu omalle kohdalle, niin miten tuo äänestäjä sitten käyttäytyy voi olla hiukan toista, kuin mitä hänen toivotaan käyttäytyvän. Tuollaisessa tilanteessa hän saattaa kääntää selkänsä entiselle puolueelleen. Toisaalta jos työttömyyttä hoidetaan sillä, että ihmisiä siirretään valtion palvelukseen, niin silloin tuosta henkilöstä ei valtiolle tule mitään muuta kuin menoja valtion taloutta ajatellen, joten tämänkaltainen työllisyyden hoitaminen ei mitään kovin järkevää ole.

https://avoimenkoodinmaailma.blogspot.fi/

Comments

Popular posts from this blog

New AI-based operating systems revolutionize drone technology.

"University of Missouri researchers are advancing drone autonomy using AI, focusing on navigation and environmental interaction without GPS reliance. Credit: SciTechDaily.com" (ScitechDaily, AI Unleashed: Revolutionizing Autonomous Drone Navigation) The GPS is an effective navigation system. But the problem is, how to operate that system when somebody jams it? The GPS is a problematic system. Its signal is quite easy to cut. And otherwise, if the enemy gets the GPS systems in their hands, they can get GPS frequencies. That helps to make the jammer algorithms against those drones. The simple GPS is a very vulnerable thing.  Done swarms are effective tools when researchers want to control large areas. The drone swarm's power base is in a non-centralized calculation methodology. In that model, drones share their CPU power with other swarm members. This structure allows us to drive complicated AI-based solutions. And in drone swarms, the swarm operates as an entirety. That ca...

Hydrogen is one of the most promising aircraft fuels.

Aircraft can use hydrogen in fuel cells. Fuel cells can give electricity to the electric engines that rotate propellers. Or they can give electricity to electric jet engines. In electric jet engines. Electric arcs heat air, and the expansion of air or some propellant pushes aircraft forward. Or, the aircraft can use hydrogen in its turbines or some more exotic engines like ramjets. Aircraft companies like Airbus and some other aircraft manufacturers test hydrogen as the turbine fuel.  Hydrogen is one of the most interesting fuels for next-generation aircraft that travel faster than ever. Hydrogen fuel is the key element in the new scramjet and ramjet-driven aircraft. Futuristic hypersonic systems can reach speeds over Mach 20.  Today the safe top speed of those aircraft that use air-breathe hypersonic aircraft is about Mach 5-6.   Hydrogen is easy to get, and the way to produce hydrogen determines how ecological that fuel can be. The electrolytic systems require elec...

The neuroscientists get a new tool, the 1400 terabyte model of human brains.

"Six layers of excitatory neurons color-coded by depth. Credit: Google Research and Lichtman Lab" (SciteechDaily, Harvard and Google Neuroscience Breakthrough: Intricately Detailed 1,400 Terabyte 3D Brain Map) Harvard and Google created the first comprehensive model of human brains. The new computer model consists of 1400 terabytes of data. That thing would be the model. That consists comprehensive dataset about axons and their connections. And that model is the path to the new models or the human brain's digital twins.  The digital twin of human brains can mean the AI-based digital model. That consists of data about the blood vessels and neural connections. However, the more advanced models can simulate electric and chemical interactions in the human brain.  This project was impossible without AI. That can collect the dataset for that model. The human brain is one of the most complicated structures and interactions between neurotransmitters, axons, and the electrochemica...