Skip to content
Calculator Collection

Ettstegs t-test-kalkylator

Beräkna t-statistikan för ett ettstegs t-test och avgör om ditt stickprovsmedelvärde skiljer sig signifikant från ett känt eller hypotetiskt populationsmedelvärde. Det första inferentiella testet de flesta studenter lär sig — används vid enkätanalys, kvalitetskontroll och jämförelser av en enskild grupp mot ett referensvärde.

Last updated: May 2026

Jämför med liknande

Om denna räknare

Ettstegs t-statistikan mäter hur många standardfel ditt stickprovsmedelvärde befinner sig från ett hypotetiskt populationsmedelvärde: t = (x̄ − μ₀) / (s / √n), där x̄ är stickprovsmedelvärdet, μ₀ är populationsmedelvärdet under H₀, s är stickprovets standardavvikelse och n är stickprovsstorleken. Nämnaren s/√n är medelvärdesfelets standardfel — standardavvikelsen för stickprovsfördelningens medelvärde. Ett stort |t| innebär att stickprovsmedelvärdet ligger långt från μ₀ i standardfelenheter, vilket ger bevis mot H₀. Under nollhypotesen följer t-statistikan en Students t-fördelning med n − 1 frihetsgrader, vars svansar är tyngre än standardnormalfördelningens för små stickprov — det är detta som skiljer t-testet från ett z-test. För stickprovsstorlekar ≥ 30 konvergerar t-fördelningen mot normalfördelningen och de två testen ger nästan identiska p-värden; för mindre stickprov är t-testet mer lämpligt. Fältet 'testType' (ensidig vs tvåsidig) avgör hur p-värdet beräknas från t-statistikan men påverkar inte t-statistikan i sig. Variabler: x̄ är det observerade stickprovsmedelvärdet, μ₀ är ditt referensvärde, s är stickprovets standardavvikelse (använd Bessels korrigerade formel med n − 1), n är antalet observationer. Gränsfall: kräver n ≥ 2 (en enskild observation ger odefinierad s). Förutsätter att data är approximativt normalfördelat — vid kraftig snedfördelning, använd det icke-parametriska Wilcoxon-rangräkningstestet istället. Förutsätter oberoende observationer — parade/upprepade mätningar kräver ett parat t-test på differenserna. För jämförelser av två grupper, använd ett tvåstegs t-test (Welchs eller Students) istället.

Hur du använder den

Exempel 1 — Kvalitetskontroll: uppfyller produkterna specifikationen? Specifikationen kräver en medelvikt på 100 g (μ₀). Du samplar n = 25 produkter och finner x̄ = 98,5 g med s = 3,0 g. t = (98,5 − 100) / (3,0 / √25) = (−1,5) / (3,0/5) = (−1,5)/0,6 = −2,5. ✓ För ett tvåsidigt test vid α = 0,05 med df = 24 är kritiskt t = ±2,064. Eftersom |t| = 2,5 > 2,064 förkastas H₀ — produkterna är signifikant underviktiga på 5%-nivån. P-värdet är ungefär 0,0196. Exempel 2 — Enkät: är genomsnittsbetyget över neutralt? På en 1–10-skala är neutralt 5,5. Du enkätfrågar n = 100 kunder och finner x̄ = 6,2 med s = 1,8. t = (6,2 − 5,5) / (1,8 / √100) = 0,7 / 0,18 ≈ 3,89. ✓ För ett ensidigt test (testar om medelvärdet är större än 5,5) vid α = 0,05 med df = 99 är kritiskt t ≈ 1,660. Eftersom t = 3,89 > 1,660 förkastas H₀ — kundbetyget är signifikant över neutralt. P-värdet är ungefär 0,0001 — starkt bevis för att den genomsnittlige kunden betygsätter produkten positivt.

Vanliga frågor

När ska jag använda ett t-test istället för ett z-test?

Använd t-testet när populationens standardavvikelse σ är okänd och du skattar den från stickprovet (s); använd z-testet när σ är genuint känd (sällsynt i praktiken) eller när stickprovsstorleken är mycket stor (n ≥ 30+) så att s ≈ σ. T-fördelningen har tyngre svansar än normalfördelningen för att kompensera för den extra osäkerheten i skattningen av σ. För små stickprov spelar skillnaden roll: vid n = 5 (df = 4) ger en t-statistika på 2,0 p ≈ 0,116 (tvåsidigt), medan motsvarande z ger p ≈ 0,046 — kvalitativt olika slutsatser. När n ökar närmar sig t-fördelningen normalfördelningen: vid n = 30 sammanfaller de nästan, och vid n = 100 är skillnaden försumbar. I modern praxis rekommenderas att alltid använda t-testet, även vid stora stickprov — det är konservativt och undviker behovet av att verifiera om σ verkligen är känd.

Vad är skillnaden mellan ensidiga och tvåsidiga t-test?

Ett tvåsidigt test frågar om stickprovsmedelvärdet skiljer sig från μ₀ i någon riktning; ett ensidigt test frågar om det skiljer sig i en specifik riktning. Det tvåsidiga testet förkastar H₀ när |t| överstiger ett kritiskt värde, medan det ensidiga enbart förkastar när t är extremt i den förangivna riktningen. Det ensidiga testet har högre statistisk styrka i den riktningen (halverar i praktiken p-värdet) men kan inte detektera avvikelser i motsatt riktning. Använd ensidigt test ENDAST när en riktningshypotes formulerades innan data samlades in, OCH när ett utfall i motsatt riktning inte är av intresse eller ändå räknas som 'ingen effekt'. Att välja riktning efter att ha sett data är en form av p-hacking och fördubblar den verkliga sannolikheten för typ I-fel. Vid osäkerhet, använd tvåsidigt test — det är det konservativa standardvalet och vad de flesta tidskrifter förväntar sig.

Vilka antaganden gäller för ettstegs t-testet?

Fyra antaganden: (1) slumpmässigt urval från populationen av intresse — snedvridna urval ogiltigförklarar alla slutledningar; (2) oberoende observationer — varje datapunkt bidrar oberoende till medelvärdet; (3) approximativ normalfördelning i den underliggande fördelningen, ELLER ett tillräckligt stort stickprov (n ≥ 30) för att centrala gränsvärdessatsen ska göra stickprovsmedelvärdet approximativt normalfördelat oavsett datans fördelning; (4) populationens standardavvikelse är okänd (annars, använd z-test). Brott mot normalitetsantagandet spelar större roll för små stickprov; med n < 15, använd ett normalkvantil-diagram för kontroll, och om data tydligt avviker från normalfördelningen, använd Wilcoxons rangräkningstest som ett robust alternativ. Kraftiga avvikande värden kan blåsa upp s och dra x̄, vilket snedvrider t; identifiera och undersök avvikande värden innan testet körs. Parade data (mätningar före/efter på samma individer) kräver ett parat t-test på differenserna, inte ett ettstegs t-test på varje grupp.

Vilka är de vanligaste misstagen vid t-test?

Det första är att använda stickprovets standardavvikelse utan Bessels korrektion (dividering med n istället för n − 1), vilket något underskattar spridningen och blåser upp t. Det andra är att använda t-testet på kraftigt snedfördelad data utan att kontrollera normalitetsantagandet; för starkt icke-normalfördelad data med små stickprov är Wilcoxons test mer tillförlitligt. Det tredje är att tolka ett icke-signifikant resultat som bevis för att medelvärdena är lika; statistisk icke-signifikans är avsaknad av bevis för en skillnad, inte bevis för avsaknad av skillnad. Det fjärde är att använda ettstegs t-test på data som borde vara parade (före/efter, tvillingspar, upprepade mätningar); parade data kräver ett parat t-test. Det femte är att rapportera p utan effektstorlek eller konfidensintervall; t-statistika och p döljer storleken på skillnaden. Det sjätte är att använda ett ensidigt test i efterhand efter att ha sett riktningen på data — en klassisk form av p-hacking. Det sjunde är att blanda ihop statistisk signifikans med praktisk betydelse; med mycket stora stickprov blir även små skillnader statistiskt signifikanta.

När ska jag inte använda den här kalkylatorn?

Hoppa över den för tvågruppsjämförelser (oberoende stickprov) — använd ett oberoende t-test eller Welchs t-test istället. Undvik den för parade data (samma individer mätta två gånger) — använd ett parat t-test på differenserna, som har andra formler och högre statistisk styrka än att behandla data som oberoende. Det är fel verktyg för icke-parametriska jämförelser av kraftigt snedfördelad data eller ordinaldata — använd Wilcoxons rangräkningstest eller teckentestet istället. Använd den inte när n = 1 (ingen standardavvikelse kan beräknas) eller när normalitetsantagandet är grovt brutet och n är litet. Hoppa över den för jämförelser av flera grupper (använd ANOVA), kategoriska utfall (använd chi-två-test) eller proportioner (använd proportionstest eller binomialtest). Slutligen, för industriell kvalitetskontroll med etablerade kontrolldiagram integrerar Shewhart- och CUSUM-diagram t-testets logik med sekventiella beslutsregler som tar hänsyn till upprepad testning — ett enstaka t-test är inte rätt ramverk där.

Källor och referenser