Skip to content
Calculator Collection

Variansräknare

Beräkna populations- eller stickprovsvarians utifrån summan av kvadratavvikelser och stickprovsstorleken. Variansen är det grundläggande måttet på hur spritt ett datamaterial är kring sitt medelvärde, och utgör grunden för standardavvikelse, ANOVA och de flesta parametriska slutledningsmetoder.

Last updated: May 2026

Jämför med liknande

Om denna räknare

Variansen mäter den genomsnittliga kvadratavvikelsen från medelvärdet. Formlerna är: populationsvarians σ² = Σ(xᵢ − μ)² / N, och stickprovsvarians s² = Σ(xᵢ − x̄)² / (n − 1), där Σ(xᵢ − μ)² är summan av kvadratavvikelserna (ingångsvärdet 'sum_squares'), N respektive n är antalet observationer, och μ respektive x̄ är medelvärdet. Nämnaren skiljer sig åt: populationsvariansen dividerar med N, medan stickprovsvariansen dividerar med (n − 1) — Bessels korrektion. Bessels korrektion behövs eftersom stickprovsmedelvärdet (i stället för det sanna populationsmedelvärdet) används för att beräkna avvikelserna, vilket något underskattar den faktiska spridningen. Att dividera med (n − 1) i stället för n kompenserar exakt för detta och ger en väntevärdesriktig skattning av populationsvariansen. Variansen har enheten av data i kvadrat (kg² för kg, $² för dollar), vilket är anledningen till att standardavvikelsen — roten ur variansen — föredras vid rapportering i de ursprungliga enheterna. Gränsfall: variansen är alltid icke-negativ och är noll enbart när alla observationer är identiska. Stickprovsstorleken n = 1 gör stickprovsvariansen odefinierad (division med noll); n = 0 gör båda formlerna odefinierade. För mycket små stickprov (n < 10) är variansestimaterna osäkra och konfidensintervallen vida. Extremvärden blåser upp variansen kraftigt eftersom avvikelserna kvadreras — en enda extrem observation kan dominera resultatet, vilket är ett skäl till att robust statistik i stället använder medianabsolutavvikelse (MAD) för data med tunga svansar.

Hur du använder den

Exempel 1 — Stickprovsvarians för provresultat. Fem elever får 70, 80, 90, 85 och 75 poäng. Medelvärde = (70+80+90+85+75)/5 = 80. Kvadratavvikelser: (70−80)² = 100, (80−80)² = 0, (90−80)² = 100, (85−80)² = 25, (75−80)² = 25. Kvadratsumma = 250. Ange n = 5, sum_squares = 250, variance_type = sample. s² = 250/(5−1) = 62,5. ✓ Standardavvikelsen är √62,5 ≈ 7,91, vilket innebär att ett typiskt resultat ligger ungefär 7,9 poäng från medelvärdet. Exempel 2 — Populationsvarians med samma data. Om dessa fem elever utgör hela populationen används populationsformeln i stället. σ² = 250/5 = 50. ✓ Resultatet är lägre än stickprovsvariansen (62,5) — Bessels korrektion i praktiken. Med ökande n minskar skillnaden: vid n = 30 skiljer sig stickprovs- och populationsvariansen med mindre än 4 %, och vid n = 100 med ungefär 1 %.

Vanliga frågor

Vad är skillnaden mellan stickprovsvarians och populationsvarians?

Populationsvariansen σ² beskriver spridningen i en hel population — om du har mätningar för samtliga medlemmar dividerar du med N. Stickprovsvariansen s² beskriver spridningen i ett delmaterial draget från en större population — dividera med (n − 1) för att kompensera för att stickprovsmedelvärdet används i stället för det okända populationsmedelvärdet. Nämnaren n − 1 (Bessels korrektion) gör stickprovsvariansen till en väntevärdesriktig skattning av populationsvariansen; att använda n i stället skulle systematiskt underskatta den verkliga spridningen. För små stickprov (n < 30) spelar skillnaden roll; för stora stickprov är den försumbar. I praktiken är nästan all verklig data ett stickprov från en större population (du mäter 100 kunder, inte hela kundbasen), så stickprovsformeln är rätt standardval om du inte verkligen har tillgång till hela populationen.

Varför är variansen alltid icke-negativ?

Eftersom avvikelserna kvadreras innan summering är varje term i täljaren ≥ 0, vilket innebär att summan (och därmed variansen) inte kan bli negativ. Variansen är exakt noll enbart i det degenererade fallet då alla observationer är identiska — ingen spridning, ingen variabilitet. Denna icke-negativitetsegenskap är matematiskt bekväm och gör det möjligt att aggregera och dekomponera varians rent i ANOVA och regression: total varians = förklarad varians + residualvarians, med alla tre storheterna icke-negativa. Kvadreringen har också en nackdel: variansen har enheten av data i kvadrat (kg² för vikter, $² för dollar), vilket är svårt att tolka direkt. Det är därför standardavvikelsen — roten ur variansen — oftare rapporteras, eftersom den har samma enhet som ursprungsdata.

Varför använder variansen kvadratavvikelser i stället för absolutavvikelser?

Kvadrering har flera matematiska fördelar jämfört med att ta absolutvärden. För det första är kvadratavvikelserna deriverbara överallt, vilket underlättar optimering (medelvärdet minimerar summan av kvadratavvikelser exakt, medan medianen minimerar summan av absolutavvikelser). För det andra dekomponeras kvadratsummor naturligt i ortogonala komponenter i ANOVA och regression, vilket möjliggör eleganta analyser. För det tredje följer kvadratsummor ki-kvadratfördelningar under normalitet, vilket möjliggör F-test och konfidensintervall. Medelabsolutavvikelsen (MAD) är ett alternativ som är mer robust mot extremvärden och lättare att tolka, men saknar de rena matematiska egenskaper som gör variansen så central inom inferensstatistik. I modern robust statistik föredras MAD när extremvärden är ett bekymmer; inom klassisk parametrisk statistik dominerar variansen eftersom matematiken fungerar smidigt.

Vilka är de vanligaste misstagen vid beräkning av varians?

Det första är att använda n i stället för (n − 1) för stickprovsvarians — det underskattar något den verkliga spridningen, särskilt för små stickprov. Det andra är att försöka beräkna variansen direkt från datalistan när man bara har sammanfattningsstatistik; den här räknaren kräver summan av kvadratavvikelser, som beräknas genom att först hitta medelvärdet, subtrahera det från varje värde, kvadrera och summera. Det tredje är att blanda ihop varians med standardavvikelse: variansen är i kvadrerade enheter (m² för meter), standardavvikelsen i ursprungliga enheter (m). Det fjärde är att beräkna kvadratsumman med xᵢ² i stället för (xᵢ − x̄)² — råkvadratsummeformeln är Σxᵢ² − (Σxᵢ)²/n, men att stoppa in Σxᵢ² direkt i en (n−1)-divisor ger ett kraftigt felaktigt svar. Det femte är att behandla variansen som om den vore meningsfull vid mycket litet n (n = 2 eller 3); variansestimat är mycket instabila för mycket små stickprov och kräver konfidensintervall för att vara ärliga.

När bör jag inte använda den här räknaren?

Hoppa över den om du bara har rådata och inte summan av kvadratavvikelser — använd en medelvärdes- och standardavvikelseräknare som hanterar avvikelseberäkningen åt dig, eller klistra in data i ett kalkylblads VAR.S / VAR.P. Undvik den för kraftigt skeva eller tungsvansade data där kvadratavvikelserna domineras av extremvärden; rapportera medianabsolutavvikelse (MAD), interkvartilsavstånd eller robusta spridningsmått i stället. Den är fel verktyg för kategoriska data där begreppet varians inte är tillämpligt. Använd den inte för tidsserier med autokorrelation, där den grundläggande variansformeln underskattar den verkliga spridningen eftersom på varandra följande observationer inte är oberoende. Och för mycket små stickprov (n ≤ 3) är variansestimatet så opålitligt att det bär lite information; samla mer data innan du försöker sammanfatta spridningen.

Källor och referenser