Linjär Regressionsanalys – Kalkylator
Anpassa en minsta-kvadrat-regressionslinje y = a + b·x till parade x- och y-värden och läs av lutningen, skärningspunkten eller determinationskoefficienten (r²). Används för prognoser, trendanalys och i alla sammanhang där du vill kvantifiera hur mycket y förändras med x.
Last updated: May 2026
Jämför med liknande
Om denna räknare
Linjär regression anpassar linjen y = a + b·x som minimerar summan av kvadrerade vertikala residualer (minsta-kvadrat-kriteriet, OLS) för parade data {(x₁, y₁), ..., (xₙ, yₙ)}. Lutningen b och skärningspunkten a har slutna lösningar: b = (n·Σxy − Σx·Σy) / (n·Σx² − (Σx)²) och a = (Σy − b·Σx) / n = ȳ − b·x̄. Lutningen visar hur mycket y förändras per enhetökning av x; skärningspunkten är det predikterade y-värdet när x = 0 (ofta utanför dataområdet och inte alltid fysikaliskt meningsfullt). r², determinationskoefficienten, är andelen av variansen i y som förklaras av den linjära anpassningen: r² = 1 − SSE/SST, där SSE är summan av kvadrerade residualer och SST är den totala kvadratsumman. Ekvivalent är r² kvadraten av Pearsons korrelation r – samma tal uttryckt på olika sätt. r² varierar från 0 (inget linjärt samband förklarar någon varians) till 1 (linjen passar perfekt). Variabler: ange dina x-värden och y-värden som kommaseparerade listor av samma längd och välj vilken sammanfattning du vill ha. Specialfall: n måste vara ≥ 2 för att anpassa en linje; om alla x-värden är identiska (noll varians i x) är lutningen odefinierad (vertikal linje, oändlig lutning) och kalkylatorn returnerar NaN; om alla y-värden är identiska (noll varians i y) är lutningen 0, skärningspunkten lika med det konstanta y, och r² är odefinierat/0. Kritiska OLS-antaganden för inferens (inte bara anpassning): linearitet i det verkliga sambandet, oberoende observationer, konstant residualvarians (homoskedasticitet) och approximativt normalfördelade residualer – brott mot något av dessa förstör inte lutningsestimaten men ogiltigförklarar p-värden och konfidensintervall. Extremvärden kan dra linjen dramatiskt (minsta kvadrat är inte robust); plotta alltid data och residualer innan du litar på anpassningen.
Hur du använder den
Exempel 1 – Perfekt linjära data, utdata = lutning. Ange X = 1, 2, 3, 4, 5 och Y = 3, 5, 7, 9, 11. Välj Utdata = lutning. Beräkning: n = 5, Σx = 15, Σy = 35, Σxy = 1·3 + 2·5 + 3·7 + 4·9 + 5·11 = 3 + 10 + 21 + 36 + 55 = 125, Σx² = 1 + 4 + 9 + 16 + 25 = 55. Lutning b = (5·125 − 15·35) / (5·55 − 15²) = (625 − 525) / (275 − 225) = 100 / 50 = 2. ✓ Skärningspunkt a = ȳ − b·x̄ = 7 − 2·3 = 1, så den anpassade linjen är y = 1 + 2x – exakt den linje som genererade data. Byt Utdata till r²: data är perfekt linjär, så r² = 1,00. Exempel 2 – Brusiga data, utdata = r². Studietimmar mot tentaresultat för 5 studenter: X = 2, 3, 5, 6, 8 och Y = 65, 70, 78, 80, 92. Beräkning: n = 5, Σx = 24, Σy = 385, Σxy = 2·65 + 3·70 + 5·78 + 6·80 + 8·92 = 130 + 210 + 390 + 480 + 736 = 1946, Σx² = 4 + 9 + 25 + 36 + 64 = 138, Σy² = 4225 + 4900 + 6084 + 6400 + 8464 = 30073. Lutning b = (5·1946 − 24·385) / (5·138 − 24²) = (9730 − 9240) / (690 − 576) = 490 / 114 ≈ 4,30. Skärningspunkt a = (385 − 4,30·24)/5 = (385 − 103,2)/5 ≈ 56,36. Predikterat resultat ≈ 56,36 + 4,30·timmar. r² = (5·1946 − 24·385)² / [(5·138 − 576)·(5·30073 − 385²)] = 490² / (114·1140) = 240100 / 129960 ≈ 0,985. ✓ Ungefär 98,5% av variansen i resultaten förklaras av studietimmar – ett starkt linjärt samband.
Vanliga frågor
Vad säger egentligen lutning, skärningspunkt och r²?
Lutningen b är förändringshastigheten: hur mycket y förändras per enhetökning av x. En lutning på 2 innebär att y ökar med 2 för varje enhetökning av x. Skärningspunkten a är det predikterade y-värdet när x = 0; det är linjens startpunkt på y-axeln. Ofta ligger x = 0 utanför dataområdet och skärningspunkten har ingen verklig betydelse i sig – det är helt okej, den förankrar ändå linjen. r² är andelen av variationen i y som linjen "förklarar" relativt den totala variationen; r² = 0,80 innebär att 80% av variabiliteten i y fångas av den linjära modellen på x, och 20% är oförklarad av modellen. r² varierar från 0 (inget linjärt samband) till 1 (perfekt anpassning). Högt r² innebär inte att modellen är korrekt – det betyder bara att linjen passar dessa datapunkter väl – och lågt r² betyder inte alltid att variablerna är orelaterade, bara att sambandet inte är linjärt.
Vad är skillnaden mellan linjär regression och korrelation?
Korrelation (Pearsons r) mäter styrkan och riktningen av det linjära sambandet mellan X och Y på en skala från −1 till +1 – den är symmetrisk i X och Y och dimensionslös. Linjär regression anpassar en riktningsmodell y = a + b·x där x är prediktorn och y är utfallet; att byta roller ger en annan linje (linjen y-på-x är inte samma som x-på-y). Lutning och r är relaterade men inte identiska: b = r · (sy / sx), så de delar tecken men har olika skalor. r² = korrelation² ger den variansförklarande tolkning som regressionen bryr sig om. Använd korrelation när du helt enkelt vill kvantifiera samband; använd regression när du vill prediktera y från x, kvantifiera hur mycket y förändras per enhet x, eller bygga en modell för vidare analys.
Vilka antaganden bygger OLS-regression på, och vad händer om de bryts?
OLS-regression gör fyra klassiska antaganden för inferens (lutningsestimering fungerar utan dem, men p-värden och konfidensintervall gör det inte): (1) Linearitet – det verkliga sambandet mellan X och Y är linjärt; kontrollera med ett spridningsdiagram och ett residual-mot-anpassat-diagram. (2) Oberoende – observationerna är inte korrelerade med varandra; tidsseriedata bryter rutinmässigt mot detta. (3) Homoskedasticitet – residualvariansen är konstant längs X; "trattformade" residualdiagram indikerar brott. (4) Normalfördelade residualer – krävs för inferens i små stickprov; kontrollera med ett Q-Q-diagram. Extremvärden och inflytelserika punkter är ett separat problem: en enda punkt med hög hävstångskraft kan dra linjen dramatiskt. När antaganden brister finns alternativ: transformera X eller Y (log, kvadratrot), använd robust regression (Huber, LAD), generaliserade minsta kvadrat för heteroskedasticitet eller tidsseriemodeller för autokorrelation. Estimaten förblir väntevärdesriktiga även när antaganden brister; det som fallerar är osäkerheten kring dem.
Vilka är de vanligaste misstagen med linjär regression?
Det första är att extrapolera utanför dataområdet – modellen beskriver bara beteende där du har observationer; prediktioner långt utanför det är spekulation. Det andra är att behandla r² som ett giltighetsbevis; r² nära 1 innebär inte att linjen är rätt modell (det betyder bara att den passar dessa data väl), och r² nära 0 kan dölja ett starkt icke-linjärt samband. Det tredje är att ignorera extremvärden och inflytelserika punkter; OLS är inte robust, och en enda felaktig punkt kan vända lutningen från positiv till negativ. Det fjärde är att förväxla korrelation med kausalitet: "körd sträcka" och "motorslitage" ökar båda med fordonets ålder, men att köra mer orsakar inte nödvändigtvis slitage om motorkvaliteten är den verkliga drivande faktorn. Det femte är att anpassa en linje till data som uppenbarligen är krökt – det ger en meningslös lutning och ett oanvändbart r²; visualisera först och anpassa sedan. Slutligen bör du aldrig rapportera lutning utan standardfel; en lutning på 2 ± 0,1 är väldigt annorlunda jämfört med en lutning på 2 ± 5.
När ska jag inte använda den här kalkylatorn?
Hoppa över den när dina data är tydligt icke-linjära (titta på spridningsdiagrammet först); använd polynomregression, log-transformationer eller icke-linjära anpassningar istället. Använd den inte för multipel regression (mer än en prediktor) – den här kalkylatorn hanterar enkel linjär regression; för multivariata modeller behövs ett statistikprogram. Det är fel verktyg för tidsseriedata utan att först kontrollera och korrigera för autokorrelation; ARIMA, exponentiell utjämning eller andra tidsseriemodeller är mer lämpliga. Undvik den för dataset med extrema extremvärden om du inte först undersökt om de bör tas bort eller nedviktas; robust regression (Theil-Sen, RANSAC) är bättre i sådana fall. Använd den inte när du behöver konfidensintervall, prediktionsintervall eller hypotestester för lutningen – det kräver ytterligare formler och programvara (eller som minimum residualstandardfelet). Slutligen bör du inte tolka lutning och skärningspunkt kausalt utan rätt studiedesign; regression beskriver samband, inte kausalitet.