Kji-kvadrat-kalkylator
Beräkna kji-kvadratstatistikens bidrag för ett observerat-mot-förväntat kategoripar med hjälp av χ² = (observerat − förväntat)² / förväntat. Summera bidragen för alla kategorier för att få den totala χ²-statistiken vid anpassningstest eller oberoendtest.
Last updated: May 2026
Jämför med liknande
Om denna räknare
Kji-kvadratstatistiken mäter hur mycket de observerade kategorifrekvenserna avviker från vad man förväntar sig under nollhypotesen. Formeln per cell är (Oᵢ − Eᵢ)² / Eᵢ, där Oᵢ är det observerade antalet i kategori i och Eᵢ är det förväntade antalet under H₀. Den totala kji-kvadratstatistiken är summan av cellbidragen: χ² = Σ (Oᵢ − Eᵢ)² / Eᵢ. Den här kalkylatorn beräknar en cells bidrag i taget — kör den för varje cell och summera resultaten för att få det fullständiga värdet. När du har χ², jämför det med kji-kvadratfördelningen med lämpliga frihetsgrader: df = k − 1 vid anpassningstest med k kategorier, eller df = (rader − 1)(kolumner − 1) för korstabeller (oberoendtest). Fältet 'kategorier' är enbart informativt — det dokumenterar hur många kategorier testet omfattar men ingår inte i cellformeln. Variabler: O är den observerade frekvensen från dina data, E är den förväntade frekvensen under H₀. Båda måste vara icke-negativa tal. Specialfall: när E = 0 är formeln odefinierad (division med noll); när O = E är bidraget noll (perfekt överensstämmelse); en tumregel kräver att varje förväntat cellvärde är ≥ 5 för att kji-kvadratapproximationen ska vara giltig — för glesa tabeller, använd Fishers exakta test istället. Approximationen är bristfällig för mycket små stickprov eller korstabeller med många nollceller; använd i sådana fall simuleringsbaserade p-värden eller exakta test.
Hur du använder den
Exempel 1 — Anpassningstest, en cell. Ett mynt kastas 100 gånger och landar på kron 60 gånger. Under H₀ (rättvist mynt) är förväntat = 50 kron. Ange observerat = 60, förväntat = 50, kategorier = 2. Bidrag = (60 − 50)² / 50 = 100/50 = 2. ✓ Beräkna cellen för klave på samma sätt: observerat = 40, förväntat = 50 → (40 − 50)² / 50 = 100/50 = 2. Totalt χ² = 2 + 2 = 4,0. Jämför med χ²(df=1) kritiskt värde vid α = 0,05 = 3,84. Eftersom 4,0 > 3,84 förkastas H₀ om rättvisa — myntet uppvisar tecken på skevhet. Exempel 2 — Oberoendtest, en cell i en 2×2-korstabell. I en enkät föredrar 60 av 100 män Märke A; under H₀ (oberoende) är förväntat = 50. Ange observerat = 60, förväntat = 50, kategorier = 4. Bidrag = (60 − 50)² / 50 = 2. ✓ Beräkna på samma sätt för de övriga tre cellerna och summera. Med df = (2−1)(2−1) = 1 jämförs det totala χ² mot kritiska värden för χ²(df=1). I ett typiskt korstabellsproblem ligger alla fyra bidrag i intervallet 0–10, beroende på hur tydligt det observerade mönstret är.
Vanliga frågor
Vad mäter egentligen kji-kvadratstatistiken?
Kji-kvadrat mäter skillnaden mellan observerade och förväntade frekvenser under en nollhypotes, viktat så att varje cells bidrag är proportionellt mot den kvadrerade avvikelsen relativt det förväntade värdet. Ett större kji-kvadratvärde innebär att de observerade data avviker mer från H₀ — vilket ger starkare bevis mot nollhypotesen. Statistikan omvandlas till ett p-värde med kji-kvadratfördelningen och lämpliga frihetsgrader: låga p-värden leder till att H₀ förkastas, vilket tyder på att det observerade mönstret är osannolikt under nollhypotesen. Viktningen med 1/E innebär att celler med låga förväntade värden får oproportionerligt stort inflytande — en cell med E = 2 och O = 5 bidrar med (3)²/2 = 4,5, medan en cell med E = 100 och O = 110 bidrar med bara (10)²/100 = 1,0. Det är därför tumregeln 'förväntade frekvenser ≥ 5' gäller för kji-kvadratets giltighet — mindre förväntade värden gör testet känsligt för små absoluta avvikelser som kanske inte är meningsfulla.
Vad är skillnaden mellan anpassningstest och oberoendtest?
Anpassningstest (goodness-of-fit) undersöker om observerade kategorifrekvenser stämmer överens med en förväntad fördelning — till exempel om en tärning är rättvis (förväntat 1/6 per sida), om färgpreferenser matchar en marknadsförares hypotes, eller om utfall vid genetisk korsning stämmer med Mendels lagar. Frihetsgrader = (antal kategorier) − 1 − (antal parametrar skattade från data). Oberoendtest undersöker om två kategoriska variabler i en korstabell är relaterade — om rökning är kopplat till lungcancer, eller om produktpreferens hänger ihop med åldersgrupp. Frihetsgrader = (rader − 1) × (kolumner − 1). Båda testerna använder samma cellformel och samma kji-kvadratfördelning, men frihetsgraderna och beräkningen av förväntade frekvenser skiljer sig åt. Anpassningstestet utgår från en förhandsgiven fördelning; oberoendetestet använder rad- och kolumnmarginalerna.
Vilka antaganden gäller för kji-kvadrattestet?
Tre huvudantaganden: (1) observationerna är oberoende — varje individ bidrar till exakt en cell, inte flera; (2) förväntade frekvenser är tillräckligt stora — vanligtvis Eᵢ ≥ 5 i varje cell för att den asymptotiska kji-kvadratfördelningen ska gälla (vissa läroböcker tillåter upp till 20 % av cellerna med E mellan 1 och 5, men ingen cell med E < 1); (3) data utgörs av slumpmässiga stickprov från populationen, inte snedvridna eller självselekterade urval. Vid brott mot antagandena: parade eller upprepade mätningar kräver McNemars test, inte kji-kvadrat. Glesa korstabeller med många låga förväntade frekvenser kräver Fishers exakta test. Kontinuitetskorrektion (Yates korrektion) tillämpas ibland för 2×2-tabeller för att förbättra approximationen, men modern praxis hoppar ofta över den eftersom den är alltför konservativ. Vid mycket små stickprov (totalt n < 20) bör exakta test föredras; kji-kvadratapproximationen fungerar tillfredsställande först kring n ≥ 30–50.
Vilka är de vanligaste misstagen vid kji-kvadrattester?
Det första är att använda kji-kvadrat på kontinuerliga data — kji-kvadrat är avsett för kategoriska data/frekvenser; för kontinuerliga variabler används t-test, ANOVA eller korrelationer. Det andra är att använda frekvenser under tumregelsgränsen (E ≥ 5), vilket höjer risken för falskt positiva resultat eller ger missvisande p-värden; använd Fishers exakta test i sådana fall. Det tredje är att använda kji-kvadrat på parade data (samma individ mätt två gånger) istället för McNemars test. Det fjärde är att rapportera Σ(O − E)² utan att dividera med det förväntade värdet — det är inte kji-kvadrat. Det femte är att glömma att signifikansen beror på frihetsgraderna: ett χ² på 5 är signifikant vid df = 1 men inte vid df = 5. Det sjätte är att tolka ett signifikant χ² som bevis för vilka specifika celler som skiljer sig — för det krävs post-hoc-analys (standardiserade residualer eller parvisa jämförelser med korrektion för multipla test). Det sjunde är att betrakta kji-kvadrat som ett effektstorlemått — det är det inte; använd Cramérs V eller Cohens w för effektstorlek i korstabeller.
När bör jag inte använda den här kalkylatorn?
Använd den inte för kontinuerliga data — kji-kvadrat är enbart avsett för frekvenser av kategoriska observationer. Undvik den när något förväntat cellvärde understiger 5 — använd Fishers exakta test eller simuleringsbaserade p-värden istället. Det är fel verktyg för parade eller upprepade kategoriska mätningar; använd McNemars test för 2×2-parade data, eller Cochran-Mantel-Haenszel-testet för stratifierade designer. Använd det inte för att testa skillnader i medelvärden eller varianser — det kräver t-test, ANOVA eller Levenes test. Undvik det för mycket små stickprov (n < 20) där exakta test ger mer tillförlitliga resultat. Och använd det inte som enda verktyg för att bedöma sambandet mellan två kategoriska variabler — komplettera med ett effektstorlemått (Cramérs V, Cohens w) och en visualisering (mosaikdiagram, staplat stapeldiagram) så att läsarna kan bedöma både signifikans och styrka.