T-testi on tapa päättää, onko aineistojen välillä tilastollisesti merkittäviä eroja Studentin t-jakauman avulla. Excelin T-testi on kahden otoksen T-testi, jossa verrataan kahden näytteen keskiarvoja. Tässä artikkelissa selitetään, mitä tilastollinen merkitsevyys tarkoittaa ja kuinka T-testi tehdään Excelissä.
Tämän artikkelin ohjeet koskevat Excel 2019, 2016, 2013, 2010, 2007; Excel Microsoft 365:lle ja Excel Onlinelle.
Mikä on tilastollinen merkitsevyys?
Kuvittele, että haluat tietää, kumpi kahdesta nopasta antaa paremman tuloksen. Heität ensimmäisen noppaa ja saat 2; Heität toista noppaa ja saat 6. Kertooko tämä sinulle, että toinen kuoppa antaa yleensä korkeammat pisteet? Jos vastasit "Ei tietenkään", sinulla on jo jonkinlainen käsitys tilastollisesta merkityksestä. Ymmärrät, että ero johtui satunnaisesta muutoksesta tuloksessa joka kerta kun noppaa heitetään. Koska näyte oli hyvin pieni (vain yksi rulla), se ei osoittanut mitään merkittävää.
Kuvittele nyt heittäväsi jokaista noppaa 6 kertaa:
- Ensimmäinen noppa heittää 3, 6, 6, 4, 3, 3; Keskiarvo=4,17
- Toinen noppa heittää 5, 6, 2, 5, 2, 4; Keskiarvo=4,00
Todistaako tämä nyt, että ensimmäinen noppa antaa korkeammat pisteet kuin toinen? Luultavasti ei. Pieni otos, jossa on suhteellisen pieni ero keskiarvojen välillä, tekee todennäköiseksi, että ero johtuu edelleen satunnaisista vaihteluista. Kun lisäämme nopanheittojen määrää, tulee vaikeaksi antaa tervejärkistä vastausta kysymykseen - onko tulosten välinen ero satunnaisvaihtelun tulos vai antaako toinen todennäköisemmin korkeammat pisteet kuin toinen?
Signifianssi on todennäköisyys, että havaittu ero näytteiden välillä johtuu satunnaisista vaihteluista. Merkitystä kutsutaan usein alfatasoksi tai yksinkertaisesti 'α:ksi. Luottamustaso tai yksinkertaisesti 'c' on todennäköisyys, että näytteiden välinen ero ei johdu satunnaisesta vaihtelusta; toisin sanoen, että taustalla olevien populaatioiden välillä on ero. Siksi: c=1 – α
Voimme asettaa "α" mille tahansa tasolle, jotta voimme olla varmoja siitä, että olemme osoittaneet merkityksensä. Hyvin usein käytetään arvoa α=5 % (95 %:n luottamus), mutta jos haluamme olla todella varmoja siitä, että erot eivät johdu satunnaisvaihtelusta, voimme soveltaa korkeampaa luottamustasoa käyttämällä α=1 % tai jopa α=0,1. %.
Erilaisia tilastollisia testejä käytetään merkitsevyyden laskemiseen eri tilanteissa. T-testeillä määritetään, ovatko kahden populaation keskiarvot erilaiset, ja F-testeillä määritetään, ovatko varianssit erilaisia.
Miksi testata tilastollista merkitsevyyttä?
Kun vertaamme eri asioita, meidän on käytettävä merkitsevyystestausta määrittääksemme, onko toinen parempi kuin toinen. Tämä koskee monia kenttiä, esimerkiksi:
- Yrityksissä ihmisten on verrattava erilaisia tuotteita ja markkinointimenetelmiä.
- Urheilussa ihmisten on verrattava erilaisia laitteita, tekniikoita ja kilpailijoita.
- Insinöörityössä ihmisten on verrattava erilaisia malleja ja parametriasetuksia.
Jos haluat testata, toimiiko jokin jollakin alalla paremmin kuin jokin muu, sinun on testattava tilastollinen merkitsevyys.
Mikä on opiskelijan T-jakelu?
A Studentin t-jakauma on samanlainen kuin normaali (tai Gaussin) jakauma. Nämä ovat molemmat kellonmuotoisia jakaumia, joissa useimmat tulokset ovat lähellä keskiarvoa, mutta jotkin harvinaiset tapahtumat ovat melko kaukana keskiarvosta molempiin suuntiin, joita kutsutaan jakauman hännäksi.
Studentin t-jakauman tarkka muoto riippuu otoksen koosta. Yli 30 näytteille se on hyvin samanlainen kuin normaalijakauma. Kun otoskoko pienenee, hännät suurenevat, mikä edustaa lisääntynyttä epävarmuutta, joka johtuu pieneen otokseen perustuvien päätelmien tekemisestä.
Kuinka tehdä T-testi Excelissä
Ennen kuin voit käyttää T-testiä määrittääksesi, onko kahden näytteen keskiarvojen välillä tilastollisesti merkitsevää eroa, sinun on ensin suoritettava F-testi. Tämä johtuu siitä, että T-testille suoritetaan erilaisia laskelmia sen mukaan, onko varianssien välillä merkittävää eroa.
Tarvitset Analysis Toolpak -apuohjelman käytössä tämän analyysin suorittamiseksi.
Analyysityökalupaketin lisäosan tarkistaminen ja lataaminen
Tarkista ja aktivoi analyysityökalupaketti seuraavasti:
- Valitse FILE-välilehti >valitse Options.
- Valitse Asetukset-valintaikkunassa Add-Ins vasemman reunan välilehdistä.
-
Valitse ikkunan alareunassa avattava Manage-valikko ja valitse sitten Excel-apuohjelmat. Valitse Mene.
-
Varmista, että kohdan Analysis Toolpak vieressä oleva valintaruutu on valittuna, ja valitse sitten OK.
- Analyysityökalupaketti on nyt aktiivinen ja olet valmis käyttämään F-testejä ja T-testejä.
F-testin ja T-testin suorittaminen Excelissä
-
Syötä kaksi tietojoukkoa laskentataulukkoon. Tässä tapauksessa harkitsemme kahden tuotteen myyntiä viikon aikana. Jokaiselle tuotteelle lasketaan myös keskimääräinen päivittäinen myyntiarvo yhdessä sen keskihajonnan kanssa.
-
Valitse Data-välilehti > Data Analysis
-
Valitse F-Test Two-Sample for Variances luettelosta ja valitse sitten OK.
F-testi on erittäin herkkä epänormaalisuudelle. Siksi voi olla turvallisempaa käyttää Welch-testiä, mutta se on vaikeampaa Excelissä.
-
Valitse Variable 1 Range ja Variable 2 Range; aseta Alfa (0,05 antaa 95 %:n varmuuden); Valitse solu tulosteen vasemmasta yläkulmasta, sillä tämä täyttää 3 saraketta ja 10 riviä. Valitse OK.
Muuttujan 1 aluetta varten on valittava otos, jolla on suurin standardipoikkeama (tai varianssi).
-
Tarkastele F-testin tuloksia määrittääksesi, onko varianssien välillä merkittävää eroa. Tulokset antavat kolme tärkeää arvoa:
- F: varianssien välinen suhde.
- P(F<=f) one-tail: Todennäköisyys, että muuttujalla 1 ei itse asiassa ole suurempaa varianssia kuin muuttujalla 2. Jos tämä on suurempi kuin alfa, mikä on yleensä 0,05, silloin varianssien välillä ei ole merkittävää eroa.
- F Kriittinen yksihäntä: F:n arvo, joka vaadittaisiin, jotta P(F<=f)=α. Jos tämä arvo on suurempi kuin F, tämä osoittaa myös, että varianssien välillä ei ole merkittävää eroa.
P(F<=f) voidaan myös laskea käyttämällä FDIST-funktiota F ja kunkin näytteen vapausasteet syötteinä. Vapausasteet on yksinkertaisesti näytteen havaintojen lukumäärä miinus yksi.
-
Nyt kun tiedät, onko varianssien välillä eroa, voit valita sopivan T-testin. Valitse Data-välilehti > Data Analysis ja valitse sitten joko t-Test: Two-Sample Assuming Equal Variancestai t-testi: Kahden otoksen olettaen epäyhtenäiset varianssit
-
Riippumatta siitä, minkä vaihtoehdon valitsit edellisessä vaiheessa, sinulle näytetään sama valintaikkuna, jossa voit syöttää analyysin tiedot. Aloita valitsemalla alueet, jotka sisältävät näytteet kohteille Variable 1 Range ja Variable 2 Range.
- Jos haluat testata, ettei keskiarvojen välillä ole eroa, aseta Hypotesized Mean Difference nollaan.
- Aseta merkitsevyystaso Alpha (0,05 antaa 95 %:n varmuuden) ja valitse solu tulosteen vasempaan yläkulmaan ottaen huomioon, että tämä täyttää 3 saraketta ja 14 riviä. Valitse OK.
-
Tarkista tulokset ja päätä, onko keskiarvojen välillä merkittävää eroa.
Aivan kuten F-testissä, jos p-arvo, tässä tapauksessa P(T<=t), on suurempi kuin alfa, ei ole merkittävää eroa. Tässä tapauksessa on kuitenkin annettu kaksi p-arvoa, yksi yhden pyrstön testille ja toinen kahden pyrstön testille. Käytä tässä tapauksessa kaksisuuntaista arvoa, koska kumpi tahansa muuttuja, jolla on suurempi keskiarvo, olisi merkittävä ero.