Rasmus Borup Hansen
I de fleste former for naturvidenskab optræder der ofte lineære
sammenhænge, dvs. sammenhænge mellem x og y på formen y=ax+b.
En gymnasieformelsamling for fysik byder på adskillige af slagsen
(hvor endda flere af dem er endnu simplere, idet b=0), og de dukker
også op i fag som økonomi, datalogi, biologi, kemi og psykologi --
alle steder hvor der er noget, der kan måles. Man er tit interesseret
i at undersøge sådan et lineært fænomen (eller undersøge, om det
overhovedet er lineært), og man laver derfor en række målinger
. Udfra disse k talpar er
man så interesseret i at finde de ukendte koefficienter a og b. Da
målinger som regel er behæftet med en vis usikkerhed, kan man ikke
gøre sig forhåbninger om at finde en løsning, der passer perfekt --
det eneste man kan gøre, er at forsøge at finde den ``bedst mulige''
løsning. Sagt geometrisk er problemet altså at finde den rette linje,
der i en eller anden forstand kommer tættest på de k observerede
punkter.

Figur 1: Linje fundet ved de mindste kvadraters metode
Problemet blev diskuteret af flere matematikere i det 18. århundrede,
primært i forbindelse med astronomiske observationer. Den metode, som
vi i dag anser for at være den bedste, er de mindste kvadraters
metode, som blev udviklet af Legendre (1752-1833) i 1805. Metoden
går ud på at finde den linje, hvor kvadratet på den lodrette afstand
mellem punkterne og linjen er mindst mulig. Der er to ting, der kan
forekomme en smule mærkværdigt ved denne metode. Hvorfor betragter man
den lodrette afstand i stedet for blot afstanden, og hvorfor tager man
kvadratet på den lodrette afstand i stedet for blot den lodrette
afstand? Svaret er simpelt: Udregningerne bliver simplest, og man når
frem til den pæneste formel ved at gøre netop sådan. Hvis man vælger
at arbejde med afstanden frem for den lodrette afstand, bliver de
ligninger, man skal løse, ganske uoverskuelige, og hvis man ikke tager
kvadratet, løber man ind i problemer, fordi
er
differentiabel mht. x, mens
ikke er differentiabel i
. Endelig får løsningen nogle pæne statistiske egenskaber, hvis
man betragter summen af kvadraterne på de lodrette afstande. Figur
2 viser et eksempel på en linje fundet vha. de mindste
kvadraters metode.
Kort tid efter at Legendres opdagelse i 1805 blev metoden brugt i stort omfang til at løse astronomiske og geodætiske problemer. Specielt blev den brugt af Gauss (1777-1855) i 1809, der ikke citerede Legendre for opdagelsen men i stedet hævdede, at han selv havde brugt metoden lige siden 1795. Legendre følte sig krænket og holdt fast ved, at det må være den person, der først publicerer et videnskabeligt resultat, der må krediteres for dets opdagelse. Skænderiet varede ved i nogle år, og så sent som i 1827 bebrejdede Legendre stadig Gauss for at tilegne sig hæder for andres opdagelser.
Lad os et øjeblik kaste os over matematikken bag de mindste kvadraters
metode. Hvis vi har en mistanke om, at punkterne
er observationer af det lineære fænomen y=ax+b, kan vi
finde estimater for a og b ved at minimere summen af
afstandskvadraterne (i alle summer løber i fra 1 til k)
der differentieret mht. til a hhv. b giver
Idet de to sidste størrelser er minimal, når summen af afstandskvadraterne er nul, kan vi finde a og b ved at løse to ligninger med to ubekendte. Af den sidste fås let, at
og af den første fås, at
der ved indsættelse af udtrykket for b og lidt omrokkering giver, at
Hvis man har haft (eller har) Statistik 0, vil man muligvis kunne genkende disse udtryk; det er nemlig også dem, man når frem til ved at anvende maksimaliseringsestimatorteori.
De mindste kvadraters metode virker fortrinligt, når der rent faktisk
er tale om en lineær sammenhæng, hvilket figur 2 og
2 illustrerer, og hvis man skal undersøge sammenhænge på
formen
eller
, kan man udnytte, at der gælder
og henholdsvis
, ligesom når
man anvender logaritmisk eller dobbelt-logaritmisk papir.

(a) y afhænger ikke af x.

(b) y=x.

(c) Metoden virker ikke for
.

(d) Der er ingen lineær sammenhæng.
Figur 2:Eksempler på anvendelser af mindste kvadraters metode til empirisk undersøgelse af lineære sammenhænge.
Der er intet i vejen for at anvende samme metode på andre sammenhænge
end netop de lineære. En umiddelbar generalisering er til polynomier
af grad n,
, og her bliver man nødt til at
løse n ligninger med n ubekendte:
Det var sådan nogle problemer, der fik Gauss til at udvikle metoden ``Gauss-elimination'', som man lærer om på Matematik 1.
Man kan nemt komme ud for, at man ikke kan lave udregningerne i de
mindste kvadraters metode eksakt. Man kan f.eks. betragte den
harmoniske svingning
. Den giver anledning
til tre ikke-lineære ligninger med tre ubekendte, der bestemt ikke
lader sig finde nemt. Men når vi nu alligevel arbejder med data, der
er behæftet med måleusikkerhed, er der intet i vejen for at anvende
numeriske metoder til at løse ligningerne. F.eks. kan man anvende
Newton-Raphsons iterationsformel
,
der er kendt fra Gymnasiet. Men når vi arbejder i flere dimensioner,
er vi imidlertid nødt til at skrive den på formen
Hvis
er
afstandskvadratsummen, er
og F' er jacobianden (differentialkvotienten) for F. Da allerde F er temmelig omstændig at skrive ned, når man udregner de tre differentialkvotienter, bliver jacobianden endnu værre. Med lidt hjælp fra f.eks. computerprogrammet Maple kan den imidlertid udregnes til
hvor
,
og
(af pladshensyn er argumenterne A,
og
udeladt).
Hvis
,
og
er det første gæt på
en løsning, kan man udregne korrektionsvektoren
udfra
ligningen
Da
er en
-matrix, og
er en
-matrix, er der her tale om tre lineære ligninger
med tre ubekendte, der kan løses vha. Gauss-elimination. Når man har
fundet
kan man udregne det næste løsningsgæt
og gentage hele proceduren indtil
f.eks. længden af korrektionsvektoren bliver tilstrækkelig lille. I
modsætning til tilfældet med polynomier skal man være opmærksom på, at
der ikke er nogen entydig løsning, da f.eks.
Desuden kan man -- pga. sinus's periodiske natur -- komme
ud for, at man kun finder et lokalt minimum (eller, hvis man er
uheldig, et maksimum) vha. den ovenfor skitserede metode. Det er
derfor en god idé at tegne grafen for den fundne funktion sammen med
måledata, så man kan finde et godt start-gæt og vurdere, om løsningen
er fornuftig. Figur 2 viser nogle målinger (med
usikkerhed) fra en harmonisk svingning med parametre A=1,5,
og
. Ud fra start-gættet A=1,
og
fandt et computer-program, der anvendte de mindste kvadraters
metode og Newton-Raphson-metoden, frem til parametrene A=1,496,
og
. Kurven på figur 2 er
grafen for en harmonisk svingning med disse parametre.

Figur 3: Målinger fra harmonisk svingning samt grafen for en
harmonisk svingning fundet vha. de mindste kvadraters metode.