Räknare för linjär regressionsriktningskoefficient
Beräkna riktningskoefficienten för en minsta-kvadrat-regressionslinje utifrån sammanfattningsstatistik för parade x- och y-data. Riktningskoefficienten visar hur mycket y förändras per enhet förändring i x — central för prognoser, regressionsanalys och alla uppgifter som kvantifierar ett linjärt samband mellan två variabler.
Last updated: May 2026
Jämför med liknande
Om denna räknare
Regressionslinjens riktningskoefficient enligt minsta kvadratmetoden beräknas från sammanfattningsstatistik: b = (n · Σxy − Σx · Σy) / (n · Σx² − (Σx)²), där n är antalet (x, y)-par, Σxy är summan av produkterna av parade observationer, Σx är summan av x-värdena, Σy är summan av y-värdena och Σx² är summan av kvadrerade x-värden. Täljaren är proportionell mot kovariansen mellan x och y; nämnaren är proportionell mot variansen för x. Riktningskoefficienten minimerar summan av kvadrerade residualer — det totala kvadrerade lodräta avståndet mellan observerade y-värden och den anpassade linjen. Variabler: b är riktningskoefficienten (stigning per enhet löpning), positiv när y ökar med x och negativ när den minskar. Riktningskoefficienten har enheten y per enhet x. Gränsfall: om alla x-värden är identiska blir nämnaren noll och riktningskoefficienten är odefinierad (ingen variation i x innebär inget sätt att skatta ett samband). Om x och y saknar linjärt samband kan riktningskoefficienten fortfarande beräknas men är nära noll — kontrollera alltid korrelationskoefficienten r eller determinationskoefficienten r² innan du tolkar resultatet. Minsta kvadrat-riktningskoefficienten är känslig för extremvärden eftersom avvikelserna kvadreras; en enda extrem punkt kan förskjuta linjen avsevärt. För robust regression vid extremvärden används Theil-Sen-skattare eller RANSAC i stället.
Hur du använder den
Exempel 1 — Studietimmar kontra provresultat. Fem elever: timmar = (1, 2, 3, 4, 5), poäng = (50, 60, 70, 80, 90). n = 5, Σx = 1+2+3+4+5 = 15, Σy = 50+60+70+80+90 = 350, Σxy = 1·50 + 2·60 + 3·70 + 4·80 + 5·90 = 50+120+210+320+450 = 1150, Σx² = 1+4+9+16+25 = 55. b = (5·1150 − 15·350) / (5·55 − 15²) = (5750 − 5250) / (275 − 225) = 500/50 = 10. ✓ Varje extra studietimme är förknippad med 10 poäng högre provresultat — ett fullständigt linjärt samband i det här läroboksexemplet. Exempel 2 — Erfarenhetsår kontra lön. Fyra anställda: år = (1, 3, 5, 7), lön i $k = (40, 50, 65, 80). n = 4, Σx = 16, Σy = 235, Σxy = 1·40 + 3·50 + 5·65 + 7·80 = 40+150+325+560 = 1075, Σx² = 1+9+25+49 = 84. b = (4·1075 − 16·235) / (4·84 − 16²) = (4300 − 3760) / (336 − 256) = 540/80 = 6,75. ✓ Varje extra erfarenhetsår är förknippat med $6 750 högre lön. Tillsammans med interceptet (a = ȳ − b·x̄ = 235/4 − 6,75·16/4 = 58,75 − 27 = 31,75) blir den fullständiga regressionslinjen lön($k) = 31,75 + 6,75·år.
Vanliga frågor
Vad betyder regressionsriktningskoefficienten egentligen?
Riktningskoefficienten är den förväntade förändringen i y för varje enhetsökning av x, baserat på den bäst anpassade räta linjen genom data. Om du anpassar y = a + b·x till dina data och får b = 10, ökar y i genomsnitt med 10 enheter när x ökar med 1 enhet. Riktningskoefficienten är en sammanfattning på populationsnivå, inte en deterministisk prediktion: enskilda observationer varierar kring linjen med residualvariansen. Riktningskoefficienten har enheten y per enhet x — för lön kontra erfarenhetsår är det $/år; för längd kontra ålder, cm/år; för energi kontra tid, watt. Riktningskoefficienten ensam berättar inte hur väl linjen passar data; för det behöver du r² (determinationskoefficienten), som anger andelen varians i y som förklaras av x. En perfekt linje har r² = 1; okorrelerade data har r² nära 0.
Hur hänger regressionsriktningskoefficienten ihop med korrelationskoefficienten?
Riktningskoefficienten och korrelationskoefficienten r är nära kopplade: b = r × (sᵧ / sₓ), där sᵧ och sₓ är standardavvikelserna för y respektive x. Korrelationen r är dimensionslös och begränsad till intervallet −1 till +1, medan riktningskoefficienten b har enheter och kan anta vilket värde som helst. Om r = 0 är b = 0 (inget linjärt samband), och tecknet på r stämmer överens med tecknet på b. Korrelationen sammanfattar styrkan och riktningen på det linjära sambandet; riktningskoefficienten sammanfattar förändringshastigheten. r² = b² · (sₓ²/sᵧ²) ger andelen varians i y som förklaras av x — för en regression med riktningskoefficient 10 för data med sₓ = 1 och sᵧ = 11 är r² = 100/121 ≈ 0,83, vilket innebär att ungefär 83 % av variationen i y förklaras av x. Rapportera alltid både riktningskoefficienten (för tolkning) och r² (för modellens anpassning).
Vad innebär det om regressionsriktningskoefficienten är noll?
En riktningskoefficient på noll innebär att y inte förändras linjärt med x — den bäst anpassade linjen är horisontell. Det brukar indikera ett av tre saker: (1) x och y är genuint orelaterade; (2) det finns ett icke-linjärt samband (paraboliskt, exponentiellt, periodiskt) som en linjär modell inte kan fånga — plotta alltid data för att kontrollera; (3) det finns ett samband men du saknar en modererande variabel som bryter mönstret inom undergrupper (Simpsons paradox). Statistiska test för riktningskoefficienten (t-test eller F-test) kan avgöra om den observerade riktningskoefficienten är signifikant skild från noll givet din stickprovsstorlek. Med små stickprov kan ett verkligt linjärt samband misslyckas att nå signifikanströskeln; med mycket stora stickprov kan till och med en försumbar riktningskoefficient bli 'statistiskt signifikant'. Komplettera riktningskoefficienten med ett effektstorleksmått (r eller r²) och en visualisering för en ärlig tolkning.
Vilka är de vanligaste misstagen vid arbete med regressionsriktningskoefficienter?
Det första är att tolka riktningskoefficienten som kausalitet — en riktningskoefficient på 10 säger att y ökar med 10 enheter per enhet x i de observerade data, inte att en ökning av x orsakar att y stiger. Störvariabler, omvänd kausalitet och selektionsbias ger alla starka riktningskoefficienter utan något kausalt samband. Det andra är att extrapolera utanför det observerade x-intervallet; en riktningskoefficient skattad för x mellan 1 och 5 kanske inte gäller när x = 100. Det tredje är att ignorera extremvärden, som kan vända tecken eller magnitude på riktningskoefficienten dramatiskt — inspektera alltid ett punktdiagram innan du litar på siffran. Det fjärde är att anpassa en linjär modell till icke-linjära data; ett paraboliskt samband kan ge en nära-noll riktningskoefficient trots tydlig krökning. Det femte är att rapportera riktningskoefficienten utan standardfel eller konfidensintervall, vilket döljer osäkerheten i skattningen. Det sjätte är att anpassa en regression på sammanfattningsstatistik beräknad från grupperade data när det underliggande sambandet inom grupper är annorlunda — Simpsons paradox kan vända den uppenbara riktningen på riktningskoefficienten.
När bör jag inte använda den här räknaren?
Hoppa över den för icke-linjära samband — om dina data uppvisar krökning, använd polynomregression, logaritmiska transformationer eller icke-linjära modeller. Undvik den för små stickprov (n < 5) där riktningskoefficientsestimatet är mycket instabilt och konfidensintervallen vida. Den är fel verktyg när antagandena för vanliga minsta kvadratmetoden är brutna: heteroskedastiska residualer (variansen varierar med x), autokorrelerade residualer (tidsserier) eller icke-normala fel med tunga svansar — dessa kräver viktad minsta kvadratmetod, ARIMA eller robust regression. Använd den inte för kategoriska prediktorer utan att dummy-koda dem korrekt först. Hoppa över den för högdimensionell regression (många prediktorer), där du behöver multipel regression med eventuell regularisering (ridge, lasso). Och för prediktioner utanför det observerade x-intervallet, använd den med stor försiktighet: linjär extrapolation kan vara kraftigt felaktig långt från data.