Hyppää sisältöön

Sijoittaja ja Bayesiläinen tilastotiede

Nykyään todennäköisyyslaskenta on mukana yrityksissä ennustaa tai ymmärtää osakemarkkinoiden hyörinää. Niin sanotut oppivat ohjelmat pyrkivät löytämään yhtäläisyyksiä aineistoista, mutta ne jäävät vielä kauas ohjelmistoista, jotka yrittävä päätellä tilastojen avulla, mitä voisi tapahtua. Bayesiläinen tilastotiede on menetelmä, jolla todennäköisyys ja ehdolliset mahdollisuudet tuodaan mukaan tilastotieteeseen. Eli kysymys on siis tilastotieteen menetelmien hyödyntämisestä rakennettaessa ennustusmalleja tulevaisuudesta.

Bayesiläinen tilastotieteessä on kysymys siitä, että voi tuoda tilastojen mukanat tiedon siitä, millaisissa olosuhteissa tilasto on syntynyt ja miten tilasto saattaisi muuttua toisenlaiseksi toisenlaisissa olosuhteissa. Kysymys on siis tavallaan jossiteelusta. Eli jos tilanne olisi tällainen, saattaisi tapahtua näin. Mutta jos tilanne olisi tälläinen, niin tulos voisi olla tällainen. Ja tällainen jossiteluhan on helppo rakentaa tietokoneohjelman sisään.

Lähdetään matkalle tilastotieteeseen. Aloitetaan tutustumalla kevyesti ensin Bayesiläiseen ajattelutapaan. Tämän jälkeen aletaan syventymään blogissan joksikin aikaa tilastojen ymmärtämisen ihmeelliseen maailmaan. Ja käyttämään tilastoja hyväksi osinkosijoittajan kuhmuraista tietä kuljettaessa. Tämä lyhyt bloggaus olkoon alku sukellus siihen maailmaan, joka löytyy tilastomatematiikan verhojen takaa. Ja tämä on alku retkelle toivon mukaan erillaisiin ajatuksiin osingon ja osakkeiden arvojen maailmaan. Mutta ei vielä. Vilkaistaan ensin tilastomatematiikan mielenkiintoisinta suuntausta kevyesti.

Mitä tilastotiede merkitsee sijoittajalle.

Tilastotiede on olemassa, jotta empiiristä tietoa voisi analysoida. Tilastotiede on siis aputiede. Useimmille sijoittajille se on tuttu esimerkiksi kurssin keskihajonnan laskemisen tai liikkuvan keskiarvon laskennan kautta. Harvempi viitsii tutkia kurssien keskinäisiä sidosvaikutuksia saati tutkia kurssien ja yrityksen toimintaan liittyvien tietojen suhdetta toisiinsa. Tiedon tutkiminen, joka voisi antaa jotain lisäarvoa sijoittamiseen, on monelle tilastotieteen kautta joko liian työlästä tai täysin vieras käsite.

On myös totta, että tiedon mahdollinen analysointi vie oman aikansa, paitsi jos on nähnyt vaivaa ja rakentanut sitä varten omat työkalunsa. Omien työkalujen rakentaminen ei oikeasti ole kovin vaikea asia ja nopeuttaa ihmeesti tiedon käsittelyä - jopa siinä määrin, että nykyään puhutaan jo ns. tekoälystä, kun käytetään tällaisia analysointityökaluja, jotka periaatteessa ovat melko yksinkertaisia algoritmejä.

Tilastojen kautta sijoittaja kuitenkin pystyy halutessaan ymmärtämään paremmin niitä markkinoita, joissa toimii. Ymmärtäminen auttaa toimimaan paremmin - vaikka ei antaisikaan, mitään varsinaista ennakkotietoa tulevista tapahtumista. Se antaa valmiuden toimia tehokkaasti muuttuvissa olosuhteissa.

Bayesiläinen tapa toimia.

Bayesiläinen tilastotiede on yksi haara laajasta tilastotieteen maailmasta. Todennäköisyyslaskenta on aina kuulunut osana tilastotiedettä, sillä tilastotiede nimenomaan on rakennettu,jotta satunnaisuudesta voitaisiin löytää säännönmukaisuuksia.

Bayesin kaava, joka on Bayensiläisen tilastotieteen ydin, käsittelee kokonaistodennäköisyyttä ns. siirtymätodennäköisyyden kautta. Kaava antaa mahdollisuuden ehdollisiin laskuihin, joissa tietty lähtökohdasta saavutetaan tietynlaisia vastauksia riippuen millaisten siirtymäehtojen läpi kohti ratkaisua kuljetaan. Nerokkuus tässä on se, että todennäköisyyttä voidaan kehittää eteenpäin sen mukaan, miten myöhemmin saadaan lisäinformaatiota. Eli kaavassa voi olla käytössä tuntematon muuttujasuure, jota ei olla vielä mitattu, mutta jota voidaan mitata mahdollisesti myöhemmin.

Bayesin kaava näyttää tältä:

\begin{equation*} P(B|A) = \frac{P(A|B)P(B)}{P(A)} \end{equation*}

Kaavassa:

  • P(A) on tapahtuman oletettu todennäköisyys etukäteen.

  • P(A|B) on tapahtuman A jälkikäteinen todennäköisyys eli tapahtuman A todennäköisyys, kun tapahtuman B ehdolla katsottaessa.

  • P(B|A) on kuten edellä tapahtuman B todennäköisyys tapahtuman A ehdolla katsottaen.

  • P(B) on tapahtuman B todennäköisyys etukäteen katsottuna.

Jotta tätä ymmärtää, niin voisi väittää B väitteenä, että "Osakeiden hinnat nousevat aina kun yhtiökokous lähestyy." Väite A voisi olla, " Kun lähestytään yhtiökokousta, niin sekä osakkeen A hinta laskee, mutta Osakkeen B hinta nousee". Nyt voidaan laskea todennäköisyys onko väite B miten todennäköinen, kun väiteestä A tehdään havainto. Eli ajatuksena on, että ensin tehdään havainto ja tämän jälkeen havaintoa mitataan sitä seuraavalla väitteellä. Jos väite B onkin " Joidenkin osakkeiden hinnat aina nousevat kun yhtiökokous lähestyy", niin lopputulos on aivan erillainen. Ideana on siis tehdä havainto, jolle voidaan jopa laskea todennäköisyys - tämän jälkeä voidaan tarkastella havaintoa uudella parametrillä ja tarkistaa, mikä oli lopullinen todennäköisyys.

Tätä voi kuvata myös seuraavalla hyvin yksinkertaisella esimerkillä:

On kolme laatikkoa, joihin on laitettu osaketta A ja Osaketta B. 1. Laatikossa on yksi Osake A ja kaksi Osaketta B. 2. laatikossa on kaksi Osaketta A ja yksi Osake B. 3. laatikossa on kolme Osaketta A ja kolme Osaketta B. Otetaan satunnaisesti jostain laatikosta paperi. Asetaan ehto B, joka on 'Paperi on Osake B'

Ensimmäinen vaihe on laatikon valinta. Kaikilla laatikoilla on yhtä todenäköinen vaihtoehto tulla valituksi, eli kullakin laatikoilla todennäköisyys on 1/3. Tällöin P(B) toteuttaa seuraavan todennäköisyyden:

\begin{equation*} P(B) = \frac{1}{3}*\frac{2}{3} + \frac{1}{3}*\frac{1}{3} + \frac{1}{3}*\frac{3}{6} = \frac{1}{2} \end{equation*}

Eli Osake B tulee valituksi 50% todennäköisyydellä.

Nyt Bayesin kaavalla voidaan laittaa havainto, mikä oli todennäköisyys sille, että paperi otettiin laatikosta 2.

Todennäköisyydet ovat tällöin seuraava:

\begin{equation*} P(A_2|B)= = \frac{P(A_2)P(B|A_2)}{P(B)} = \frac{\frac{1}{3} * \frac{1}{3}}{\frac{1}{2}} = \frac{2}{9} \end{equation*}

Eli laskenta tapa mahdollistaa jo saadulle todennäköisyydelle uuden ehdon lisäämisen. Vaikka esimerkissä laskenta näyttää melko trivaalilta, niin todellisuudessa kaavan hyödyntäminen finanssipuolen ennusteiden tekemisessä on tietotekniikan kehityksen myötä vahvistunut, sillä nimenomaan ehtojen lisääminen jo saatuun todennäköisyyteen tuo aivan uusia mahdollisuuksia tilanteiden todennäköisyyksien ennustamiseen. En tässä yritäkään selittää, niin matemaattisia mahdollisuuksia, jotka ajattelutapa tuo tullessaan. Mutta huomattakoon, että Bayesilainen ajatelutapa eroaa ns. klassisesta frekvenssipohjaisesta ajattelutavasta - siinä määrin että klassinen ajattelutapa on asettanut joitakin Bayesilaisen ajattelutavan perusideologioista kyseenalaisiksi.

Oli miten oli, tietojenkäsittelyn maailmassa Bayesilaisesta ajattelusta on hyötyä. Kaavassa nimittäin voidaan käyttää tuntemattomia aineistoja, joita esimerkissä ei ollut käytössä niiden ymmärtämisen vaikeuden takia. Tämä blogikirjoituksen tarkoitus oli vain tutustutaa lukija, mitä Bayesiläinen ajattelutapa tarkoittaa, mutta ei sukeltaa suoraan miettimään, mitä tarkoittaa priorijakauma, posterijakauma tai prediktiivinen jakauma.

Loppu toteamus.

Ajattelin blogissani perehtyä rahastoihin enemmän, mutta tajusin tilastomatemaatiikan mahdollisuuksien ymmärtämisen osinkosijoittajalle olevan mielenkiintoisempi aihe kuin samojen vanhojen rahastoihin liittyvien yksityiskohtien toistaminen, joita netti on jo niin täynnä. Katsotaan mitä tilastojen maailma voi tarjota kaikkea tilastolaskennan hyödyntämisessä. Bayesiläinen tilastotiede on yksi vaikemmin sisään päästävistä osista tilastomatematiikkaa, joten minusta oli mukava liipaista sitä kevyesti esille tässä ensimmäisessä tilastotiedetekstissäni.

Kommentit

Comments powered by Disqus