Regressio Excelissä on tapa automatisoida tilastollinen prosessi, jossa verrataan useita tietojoukkoja, jotta nähdään, kuinka riippumattomien muuttujien muutokset vaikuttavat riippuvien muuttujien muutoksiin. Jos olet koskaan halunnut löytää korrelaation kahden asian välillä, regressioanalyysin käyttäminen Excelissä on yksi parhaista tavoista tehdä se.
Tämän artikkelin ohjeet koskevat Excel 2019, Excel 2016, Excel 2013, Excel 2010.
Mitä regressio tarkoittaa?
Regressio on tilastollinen mallinnusmenetelmä, jota analyytikot käyttävät useiden muuttujien välisten suhteiden määrittämiseen.
Regressioanalyysi alkaa yhdestä muuttujasta, jota yrität analysoida, ja riippumattomilla muuttujilla, joita testaat nähdäksesi, vaikuttavatko ne kyseiseen yksittäiseen muuttujaan. Analyysi tarkastelee muutoksia riippumattomissa muuttujissa ja yrittää korreloida nämä muutokset yksittäisen (riippuvaisen) muuttujan seurauksena syntyviin muutoksiin.
Tämä saattaa kuulostaa edistyneiltä tilastoilta, mutta Excel tarjoaa tämän monimutkaisen analyysin kaikkien saataville.
Lineaarisen regression suorittaminen Excelissä
Regressioanalyysin yksinkertaisin muoto on lineaarinen regressio. Yksinkertainen lineaarinen regressio tarkastelee vain kahden muuttujan välistä suhdetta.
Esimerkiksi seuraava laskentataulukko näyttää tiedot, jotka sisältävät ihmisen päivittäin syömien kalorien määrän ja painonsa kyseisenä päivänä.
Koska tämä laskentataulukko sisältää kaksi tietosaraketta ja yksi muuttuja voi mahdollisesti vaikuttaa toiseen, voit suorittaa näille tiedoille regressioanalyysin Excelillä.
Analysis ToolPak -lisäosan käyttöönotto
Ennen kuin voit käyttää Excelin regressioanalyysiominaisuutta, sinun on otettava Analysis ToolPak -lisäosa käyttöön Excelin asetukset -näytössä.
-
Valitse Excelissä Tiedosto-valikko ja valitse Options.
-
Valitse Lisäosat vasemmasta navigointivalikosta. Varmista sitten, että Excel-apuohjelmat on valittuna Manage-kentässä.
-
Valitse lopuksi Go-painike.
-
Apuohjelmat-ponnahdusikkunassa. Ota Analysis ToolPack käyttöön napsauttamalla sen edessä olevaa ruutua lisätäksesi valintamerkin ja valitsemalla OK.
Nyt kun Analysis ToolPak on käytössä, olet valmis aloittamaan regressioanalyysin Excelissä.
Yksinkertaisen lineaarisen regression suorittaminen Excelissä
Käyttäen paino- ja kalorilaskentataulukkoa esimerkkinä voit suorittaa lineaarisen regressioanalyysin Excelissä seuraavasti.
-
Valitse Data-valikko. Valitse sitten Analysis-ryhmästä Data Analysis.
-
Valitse Data Analysis-ikkunassa Regression ja napsauta OK.
-
Syötteen Y-alue on solualue, joka sisältää riippuvan muuttujan. Tässä esimerkissä se on paino. Input X Range on solualue, joka sisältää riippumattoman muuttujan. Tässä esimerkissä se on kalorisarake.
-
Valitse otsikkosoluille Labels ja valitse sitten New Worksheet lähettääksesi tulokset uuteen laskentataulukkoon. Valitse OK, jotta Excel suorittaa analyysin ja lähettää tulokset uuteen taulukkoon.
-
Tarkista uusi laskentataulukko. Analyysituloksessa on useita arvoja, jotka sinun on ymmärrettävä tulosten tulkitsemiseksi.
Jokaisella näistä numeroista on seuraavat merkitykset:
- Multiple R: Korrelaatiokerroin. 1 tarkoittaa vahvaa korrelaatiota kahden muuttujan välillä, kun taas -1 tarkoittaa vahvaa negatiivista suhdetta. 0 tarkoittaa, että korrelaatiota ei ole.
- R Neliö: Determinaatiokerroin, joka näyttää kuinka monta pistettä kahden muuttujan välillä osuu regressioviivalle. Tilastollisesti tämä on keskiarvon neliöityjen poikkeamien summa.
- Säädetty R-neliö: Tilastollinen arvo nimeltä R-neliö, joka on säädetty valitsemiesi riippumattomien muuttujien lukumäärän mukaan.
- Standard Error: Kuinka tarkkoja regressioanalyysin tulokset ovat. Jos tämä virhe on pieni, regressiotulokset ovat tarkempia.
- Havainnot: Regressiomallisi havaintojen määrä.
Regressiotulosteen jäljellä olevat arvot antavat sinulle tietoja regressioanalyysin pienemmistä komponenteista.
- df: Tilastollinen arvo, joka tunnetaan varianssin lähteisiin liittyvinä vapausasteina.
- SS: Neliöiden summa. Neliöiden jäännössumman ja kokonais-SS:n välisen suhteen tulisi olla pienempi, jos suurin osa tiedoistasi sopii regressioviivalle.
- MS: Regressiotietojen keskineliö.
- F: F-tilasto (F-testi) nollahypoteesille. Tämä antaa regressiomallin merkityksen.
- Merkitys F: Tilastollinen arvo, joka tunnetaan nimellä F.
Ellet ymmärrä tilastoja ja regressiomallien laskemista, yhteenvedon alareunassa olevilla arvoilla ei ole paljon merkitystä. Useat R- ja R-neliöt ovat kuitenkin kaksi tärkeintä.
Kuten näet, tässä esimerkissä kaloreilla on vahva korrelaatio kokonaispainoon.
Useita lineaarisia regressioanalyysiä Excelissä
Jos haluat suorittaa saman lineaarisen regression, mutta useilla riippumattomilla muuttujilla, valitse koko alue (useita sarakkeita ja rivejä) Input X Range.
Kun valitset useita riippumattomia muuttujia, on vähemmän todennäköistä, että löydät yhtä vahvan korrelaation, koska muuttujia on niin monia.
Regressioanalyysi Excelissä voi kuitenkin auttaa sinua löytämään korrelaatioita yhden tai useamman muuttujan kanssa, joiden olemassaoloa et ehkä ymmärrä vain tarkastelemalla tietoja manuaalisesti.