Nykymaailmassa Pienimmän neliösumman menetelmä:stä on tullut erittäin tärkeä aihe miljoonille ihmisille ympäri maailmaa. Kiinnostus Pienimmän neliösumman menetelmä:tä kohtaan on lisääntynyt merkittävästi viime vuosina, koska sillä on suora vaikutus ihmisten jokapäiväiseen elämään. Olipa kyse sosiaalisesta, poliittisesta, taloudellisesta tai henkilökohtaisesta tasolla, Pienimmän neliösumman menetelmä on kiinnittänyt asiantuntijoiden, johtajien ja tavallisten kansalaisten huomion. On selvää, että Pienimmän neliösumman menetelmä on synnyttänyt intensiivistä ja intohimoista keskustelua, jossa on jakautunut mielipiteitä ja tiukkoja kantoja. Tässä artikkelissa tutkimme Pienimmän neliösumman menetelmä:n aihetta perusteellisesti analysoimalla erilaisia näkökulmia, tutkimuksia ja todistuksia, joiden avulla voimme paremmin ymmärtää sen merkitystä ja vaikutusta nykypäivän yhteiskuntaan.
Pienimmän neliösumman menetelmä (PNS-menetelmä, engl. ordinary least squares, OLS) on matemaattisen optimoinnin menetelmä, jolla pyritään löytämään aineistolle paras sovite. Pienimmän neliösumman menetelmässä regressiokertoimien estimaattorit määrätään minimoimalla jäännös- eli virhetermien neliösumma[1]. Saaduilla estimaateilla voidaan siten muodostaa estimoitu regressiosuora eli malli kuvaamaan selitettävän muuttujan vaihtelua. Visuaalisesti tarkasteltuna PNS-menetelmällä saadaan laskettua havaintopisteiden pystysuuntainen etäisyys regressiosuorasta. Mitä pienempi etäisyys PNS-menetelmällä saadaan, sitä paremmin regressiosuora mallintaa havaintopisteiden käytöstä ja sitä parempi selittävyysaste mallilla on.
PNS-menetelmä on käytettävyytensä takia suosittu menetelmä, jonka sovelluskohteita ovat muun muassa ekonometria, aikasarja-analyysi, sähkötekniikka sekä monet muut empiirisen tutkimuksen alat.
Lineaarisen mallin tapauksessa pienimmän neliösumman menetelmä tuottaa tehokkaimman harhattoman estimaattorin, jos Gauss—Markov-oletukset ovat voimassa.
Olkoon
Nimitystä yleinen lineaarinen malli käytetään, sillä sen erikoistapauksina saadaan monia erilaisia tilastollisia malleja. PNS-menetelmää voidaan käyttää sellaisenaan yleiseen lineaariseen malliin, joka toteuttaa standardioletukset.
Yleistä lineaarista mallia koskee tyypillisesti kuusi oletusta, joita kutsutaan standardioletuksiksi. Näiden oletusten ehtojen täyttyessä malliin voidaan soveltaa tilastollisen analyysin tavanomaisia estimointi- ja testausmenetelmiä mukaan lukien pienimmän neliösumman menetelmää.
Selittävät muuttujat saattavat saada satunnaisia, ei-kiinteitä arvoja. Näin käy esimerkiksi stokastisissa prosesseissa. Jos selittäjistä muodostuva matriisi X on satunnainen, PNS-menetelmä saattaa tuottaa harhaisia tai epätarkentuvia estimaattoreita regressiokertoimille. Tällöin voidaan testata, mikäli kiinteille selittäjille esitetty teoria toteutuu ehdollisesti.
Lineaarisen mallin regressiokertoimien β PNS-estimaattori on
Jos matriisi on satunnainen, mutta standardioletuksen iii. mukaan virhetermin ε odotusarvo on nolla, estimaattorin ehdolliselle odotusarvolle pätee
Vastaava ehdollinen korjaus muihin (iii-vi) yleisen lineaarisen mallin standardioletuksiin mahdollistaa oletusten yleistämisen myös satunnaisille selittäjille. Siitä huolimatta modifioidut ehdot ovat rajoittavia ja mahdollisesti epäpäteviä eri aineistoille, esimerkiksi aikasarjoille. Mikäli näin on, tällaisissa tilanteissa ei pidä käyttää PNS-menetelmää parametrien estimointiin, vaan hyödyntää dynaamisia regressiomalleja. Dynaamisilla regressiomalleilla on mahdollista huomioida paitsi havaitun prosessin (tyypillisesti jonkin aikasarjan) oma historia, myös muiden tunnettujen prosessin käyttäytymismallit ja näiden keskinäiset riippuvuudet.
Neliösumman minimointi tapahtuu osittaisderivoimalla regressiokertoimien suhteen ja merkitsemällä derivaatat nolliksi. Tämän tuloksena saadaan lineaarinen yhtälöryhmä regressiokertoimien suhteen. Yhtälöryhmässä on yhtälöä (, sillä mukana on myös vakiokerroin ), ja yhtälöryhmällä on yksikäsitteinen ratkaisu mikäli ylempänä esitetty standardioletus ii. pätee.
Yhtälöryhmän ratkaisuna saadaan regressiokertoimien PNS-estimaattorit. Estimaattorit voidaan merkitä vastaavilla latinalaisilla kirjaimilla , siten että on regressiokertoimen PNS-estimaattori ja niin edelleen.
Olkoon standardioletuksen ii. täyttävä yleinen lineaarinen malli.