Aproksimacija eksperimentalnih podataka. Metoda najmanjih kvadrata. Aproksimacija funkcije metodom najmanjih kvadrata Aproksimacija funkcije metodom najmanjih kvadrata

NASTAVNI RAD

Aproksimacija funkcije metodom najmanjih kvadrata


Uvod

empirijska mathcad aproksimacija

Svrha nastavnog rada je produbljivanje znanja iz računarstva, razvijanje i konsolidacija vještina u radu sa Microsoft Excel i MathCAD procesorom tabela. Koristeći ih za rješavanje problema korištenjem računara iz predmetne oblasti vezane za istraživanje.

U svakom zadatku su formulisani uslovi problema, početni podaci, obrazac za izdavanje rezultata, naznačene su glavne matematičke zavisnosti za rešavanje problema.

Koncept aproksimacije je približan izraz bilo kojeg matematički objekti(na primjer, brojevi ili funkcije) preko drugih koji su jednostavniji, praktičniji za korištenje ili jednostavno poznatiji. U naučnim istraživanjima, aproksimacija se koristi za opisivanje, analizu, generalizaciju i dalju upotrebu empirijski rezultati.

Kao što je poznato, može postojati egzaktna (funkcionalna) veza između veličina, kada jedna određena vrijednost odgovara jednoj vrijednosti argumenta, i manje precizna (korelacija) veza, kada jedna specifična vrijednost argumenta odgovara približnoj vrijednosti ili određeni skup vrijednosti funkcije, u jednoj ili drugoj mjeri bliske jedna drugoj. Prilikom dirigovanja naučna istraživanja Prilikom obrade rezultata promatranja ili eksperimenta, obično se mora pozabaviti drugom opcijom. Prilikom proučavanja kvantitativnih ovisnosti različitih pokazatelja, čije se vrijednosti određuju empirijski, u pravilu postoji određena varijabilnost. Djelomično je određena heterogenošću proučavanih objekata nežive, a posebno žive prirode, a dijelom je određena greškom opažanja i kvantitativne obrade materijala. Posljednja komponenta se ne može uvijek potpuno eliminirati; jedino se pažljivim odabirom adekvatne metode istraživanja i pažljivim radom može svesti na minimum.

Stručnjaci iz oblasti automatizacije tehnoloških procesa i proizvodnje bave se velikom količinom eksperimentalnih podataka za čiju obradu se koristi kompjuter. Izvorni podaci i dobijeni rezultati proračuna mogu se prikazati u tabelarnom obliku pomoću procesora za proračunske tablice (proračunske tablice) i, posebno, Excel-a. Predmetni rad iz računarstva omogućava studentu da konsoliduje i razvije veštine korišćenja osnovnih računarskih tehnologija pri rešavanju zadataka iz oblasti profesionalne delatnosti - sistema računarske algebre iz klase sistema računarskog projektovanja, usmerenog na izradu interaktivnih dokumenata sa. proračune i vizualnu podršku, jednostavan je za korištenje i primjenu za timski rad.


1. Opće informacije


Vrlo često, posebno kada se analiziraju empirijski podaci, postoji potreba da se eksplicitno pronađe funkcionalni odnos između veličina xI at, koji se dobijaju kao rezultat merenja.

U analitičkoj studiji odnosa između dvije veličine x i y, napravljen je niz zapažanja i rezultat je tabela vrijednosti:


xx1 x1 xiXnyy1 y1 yiYn

Ova tabela se obično dobija kao rezultat nekih eksperimenata u kojima x,(nezavisnu vrijednost) postavlja eksperimentator, i y,dobijene kao rezultat iskustva. Stoga ove vrijednosti y,nazvat ćemo ih empirijskim ili eksperimentalnim vrijednostima.

Postoji funkcionalni odnos između veličina x i y, ali je njegov analitički oblik obično nepoznat, pa se javlja praktično važan zadatak - pronaći empirijsku formulu


y =f (x; a 1, a 2,…, am ), (1)


(Gdje a1 , a2 ,…,am- parametri), čije su vrijednosti pri x = x,vjerovatno bi se malo razlikovalo od eksperimentalnih vrijednosti y, (i = 1,2,…, p).

Obično označavaju klasu funkcija (na primjer, skup linearnih, potencijskih, eksponencijalnih, itd.) iz kojih je funkcija odabrana f(x), a zatim se određuju najbolje vrijednosti parametara.

Ako zamijenimo original x,tada dobijamo teorijske vrednosti

YTi= f (xi; a 1, a 2……am) , Gdje i = 1,2,…, n.


Razlike yiT- yi, nazivaju se devijacijama i predstavljaju vertikalne udaljenosti od tačaka Mina graf empirijske funkcije.

Prema metodi najmanjih kvadrata, najbolji koeficijenti a1 , a2 ,…,amoni za koje se uzima u obzir zbir kvadrata odstupanja pronađene empirijske funkcije od datih vrijednosti funkcije



biće minimalan.

Hajde da objasnimo geometrijsko značenje metoda najmanjih kvadrata.

Svaki par brojeva ( xi, yi) iz izvorne tabele određuje tačku Miu avionu XOY.Koristeći formulu (1) sa različita značenja koeficijenti a1 , a2 ,…,ammožete konstruisati niz krivulja koje su grafovi funkcije (1). Zadatak je odrediti koeficijente a1 , a2 ,…,amna način da je zbir kvadrata vertikalnih udaljenosti od tačaka Mi (xi, yi) prije nego što je graf funkcije (1) bio najmanji (slika 1).



Konstrukcija empirijske formule sastoji se od dvije faze: pojašnjavanja općeg oblika ove formule i određivanja njenih najboljih parametara.

Ako je priroda odnosa između ovih veličina x i y, tada je tip empirijske zavisnosti proizvoljan. Prednost se daje jednostavnim formulama sa dobrom preciznošću. Uspješan izbor empirijske formule u velikoj mjeri ovisi o istraživačkom znanju u predmetnoj oblasti, pomoću kojih može ukazati na klasu funkcija iz teorijskih razmatranja. Velika vrijednost ima sliku primljenih podataka u kartezijanskim ili posebnim koordinatnim sistemima (polulogaritamskim, logaritamskim, itd.). Iz položaja tačaka možete približno pogoditi opšti oblik zavisnosti utvrđivanjem sličnosti između konstruisanog grafa i uzoraka poznatih krivulja.

Određivanje najboljih kvota a1 , a2,…, amuključene u empirijsku formulu proizvedene su dobro poznatim analitičkim metodama.

Da bi se pronašao skup koeficijenata a1 , a2 …..am, koji daju minimum funkcije S definirane formulom (2), koristimo neophodno stanje ekstrem funkcije nekoliko varijabli - jednakost parcijalnih izvoda nuli.

Kao rezultat, dobijamo normalan sistem za određivanje koeficijenata ai(i = 1,2,…, m):



Dakle, pronalaženje koeficijenata aisvodi na sistem rješavanja (3). Ovaj sistem je pojednostavljen ako je empirijska formula (1) linearna u odnosu na parametre ai, tada će sistem (3) biti linearan.


1.1 Linearna zavisnost


Specifičan oblik sistema (3) zavisi od toga iz koje klase empirijskih formula tražimo zavisnost (1). U slučaju linearna zavisnosty = a1 +a2 xsistem (3) će imati oblik:


Ovaj linearni sistem se može riješiti bilo kojom poznatom metodom (Gaussova metoda, jednostavne iteracije, Cramerove formule).


1.2 Kvadratna zavisnost


U slučaju kvadratne zavisnosti y = a1 +a2 x+a3x 2sistem (3) će imati oblik:



1.3 Eksponencijalna zavisnost


U nekim slučajevima, funkcija u koju nesigurni koeficijenti ulaze nelinearno uzima se kao empirijska formula. U ovom slučaju, ponekad se problem može linearizirati, tj. svesti na linearno. Takve zavisnosti uključuju eksponencijalnu zavisnost


y = a1 *ea2x (6)


gdje a 1I a 2, neizvjesni koeficijenti.

Linearizacija se postiže uzimanjem logaritma jednakosti (6), nakon čega dobijamo relaciju

ln y = ln a 1+a 2x (7)


Označimo ln ati ln axshodno tome kroz tI c, tada se zavisnost (6) može zapisati u obliku t = a1 +a2 X, što nam omogućava da primijenimo formule (4) sa zamjenom a1 on cI ati on ti


1.4 Elementi teorije korelacije


Vraćen raspored funkcionalna zavisnosty(x)prema rezultatima mjerenja (x i, ati),i = 1,2, K, nnazvana regresijska kriva. Za provjeru slaganja izgrađene krivulje regresije sa eksperimentalnim rezultatima obično se uvode sljedeće numeričke karakteristike: koeficijent korelacije (linearna ovisnost), korelacijski omjer i koeficijent determinacije. U ovom slučaju, rezultati se obično grupišu i prikazuju u obliku korelacione tabele. Svaka ćelija ove tabele prikazuje brojeve niJ - ti parovi (x, y), čije komponente spadaju u odgovarajuće intervale grupisanja za svaku varijablu. Uz pretpostavku da su dužine intervala grupisanja (za svaku varijablu) jednake jedna drugoj, odaberite centre x i(odnosno ati) ovih intervala i brojeva niJ- kao osnova za proračune.

Koeficijent korelacije je mjera linearne veze između zavisnih slučajnih varijabli: pokazuje koliko dobro, u prosjeku, jedna od varijabli može biti predstavljena kao linearna funkcija od drugog.

Koeficijent korelacije se izračunava pomoću formule:


gdje su i aritmetička sredina, respektivno X I at.

Koeficijent korelacije između slučajnih varijabli u apsolutnoj vrijednosti ne prelazi 1. Što je bliže |p| do 1, što je bliži linearni odnos između x i u.

U slučaju nelinearne korelacije, uslovne prosječne vrijednosti nalaze se blizu krive linije. U ovom slučaju preporučuje se korištenje korelacijskog omjera kao karakteristike snage veze, čija interpretacija ne ovisi o vrsti ovisnosti koja se proučava.

Omjer korelacije se izračunava pomoću formule:



Gdje ni = , nf= , a brojilac karakterizira disperziju uvjetnih srednjih vrijednosti y, o apsolutnoj sredini y.

Uvijek. Jednakost = 0 odgovara nekoreliranim slučajnim varijablama; = 1 ako i samo ako postoji tačna funkcionalna veza između y i x. U slučaju linearne zavisnosti y od x, korelacijski odnos se poklapa sa kvadratom koeficijenta korelacije. Magnituda - ? 2 se koristi kao indikator odstupanja regresije od linearne.

Odnos korelacije je mjera korelacionog odnosa y With x u bilo kojem obliku, ali ne može dati ideju o stepenu bliskosti empirijskih podataka posebnom obliku. Da bismo saznali koliko tačno konstruisana kriva odražava empirijske podatke, uvodi se još jedna karakteristika - koeficijent determinacije.

Da biste to opisali, razmotrite sljedeće količine. - ukupan zbir kvadrata, gdje je prosječna vrijednost.

Možemo dokazati sljedeću jednakost

Prvi član je jednak Sres = i naziva se rezidualni zbir kvadrata. Karakterizira odstupanje eksperimentalnog od teorijskog.

Drugi član je jednak Sreg = 2 i naziva se regresioni zbir kvadrata i karakteriše širenje podataka.

Očigledno je tačna sljedeća jednakost: S puna = S ost + S reg.

Koeficijent determinizma određuje se formulom:



Što je preostali zbir kvadrata manji u odnosu na ukupni zbir kvadrata, to je veća vrijednost koeficijenta determinizma r2 , što pokazuje koliko dobro jednačina proizvedena regresionom analizom objašnjava odnose između varijabli. Ako je jednak 1, onda postoji potpuna korelacija sa modelom, tj. nema razlike između stvarne i procijenjene vrijednosti y. U suprotnom slučaju, ako je koeficijent determinizma 0, tada je jednadžba regresije neuspješna u predviđanju vrijednosti y

Koeficijent determinizma uvijek ne prelazi korelacijski odnos. U slučaju kada je jednakost zadovoljena r 2 = tada možemo pretpostaviti da konstruisana empirijska formula najpreciznije odražava empirijske podatke.


2. Izjava o problemu


1. Koristeći metodu najmanjih kvadrata, aproksimiramo funkciju datu u tabeli

a) polinom prvog stepena;

b) polinom drugog stepena;

c) eksponencijalna zavisnost.

Za svaku zavisnost izračunajte koeficijent determinizma.

Izračunajte koeficijent korelacije (samo u slučaju a).

Za svaku zavisnost nacrtajte liniju trenda.

Pomoću funkcije LINEST izračunajte numeričke karakteristike ovisnosti o.

Usporedite svoje proračune s rezultatima dobivenim korištenjem funkcije LINEST.

Zaključite koja od rezultirajućih formula najbolje aproksimira funkciju.

Napišite program na jednom od programskih jezika i usporedite rezultate proračuna s onima dobivenim iznad.


3. Početni podaci


Funkcija je data na slici 1.



4. Proračun aproksimacija u Excel procesoru proračunskih tablica


Za izvođenje proračuna preporučljivo je koristiti Microsoft Excel procesor tabela. I rasporedite podatke kao što je prikazano na slici 2.



Da bismo to uradili unosimo:

· u ćelije A6:A30 unosimo vrijednosti xi .

· u ćelije B6:B30 unosimo vrijednosti ui .

· u ćeliju C6 unesite formulu =A6^ 2.

· Ova formula se kopira u ćelije C7:C30.

· u ćeliju D6 unesite formulu =A6*B6.

· Ova formula se kopira u ćelije D7:D30.

· U ćeliju F6 unosimo formulu =A6^4.

· Ova formula se kopira u ćelije F7:F30.

· U ćeliju G6 unosimo formulu =A6^2*B6.

· Ova formula se kopira u ćelije G7:G30.

· U ćeliju H6 unesite formulu =LN(B6).

· Ova formula se kopira u ćelije H7:H30.

· u ćeliju I6 unesite formulu =A6*LN(B6).

· Ova formula se kopira u ćelije I7:I30. Sljedeće korake izvodimo koristeći automatsko zbrajanje

· u ćeliju A33 unesite formulu =SUM (A6:A30).

· u ćeliju B33 unesite formulu =SUM (B6:B30).

· u ćeliju C33 unesite formulu =SUM (C6:C30).

· u ćeliju D33 unesite formulu =SUM (D6:D30).

· u ćeliju E33 unesite formulu =SUM (E6:E30).

· u ćeliju F33 unesite formulu =SUM (F6:F30).

· U ćeliju G33 unesite formulu =SUM (G6:G30).

· U ćeliju H33 unesite formulu =SUM (H6:H30).

· u ćeliju I33 unesite formulu =SUM (I6:I30).

Hajde da aproksimiramo funkciju y = f(x) linearna funkcija y = a1 +a2x. Za određivanje koeficijenata a 1i a 2Koristimo sistem (4). Koristeći zbrojeve iz Tabele 2, smještene u ćelijama A33, B33, C33 i D33, zapisujemo sistem (4) u obliku



rješavanjem koje dobijamo a 1= -24,7164 i a2 = 11,63183

Dakle, linearna aproksimacija ima oblik y= -24,7164 + 11,63183x (12)

Sistem (11) je riješen korištenjem Microsoft Excel-a. Rezultati su prikazani na slici 3:



U tabeli u ćelijama A38:B39 upisana je formula (=MOBR (A35:B36)). Ćelije E38:E39 sadrže formulu (=VIŠE (A38:B39, C35:C36)).


Zatim aproksimiramo funkciju y = f(x) kvadratna funkcijay = a1 +a2 x+a3 x2. Za određivanje koeficijenata a 1, a 2i a 3Koristimo sistem (5). Koristeći zbrojeve iz Tabele 2, smještene u ćelijama A33, B33, C33, D33, E33, F33 i G33, zapisujemo sistem (5) u obliku:



Rešivši koje, dobijamo a 1= 1,580946,a 2= -0,60819 i a3 = 0,954171 (14)

Dakle, kvadratna aproksimacija ima oblik:

y = 1,580946 -0,60819x +0,954171 x2

Sistem (13) je riješen korištenjem Microsoft Excel-a. Rezultati su prikazani na slici 4.



U tabeli u ćelijama A46:C48 upisana je formula (=MOBR (A41:C43)). Ćelije F46:F48 sadrže formulu (=VIŠE (A41:C43, D46:D48)).

Hajdemo sada da aproksimiramo funkciju y = f(x) eksponencijalna funkcija y = a1 ea2x. Za određivanje koeficijenata a1 I a2 hajde da logaritam vrednosti yii koristeći zbrojeve iz Tabele 2, koja se nalazi u ćelijama A26, C26, H26 i I26, dobijamo sistem:



Gdje s = ln(a1 ).

Nakon što smo riješili sistem (10) nalazimo c =0,506435, a2 = 0.409819.

Nakon potenciranja dobijamo a1 = 1,659365.

Dakle, eksponencijalna aproksimacija ima oblik y = 1,659365*e0,4098194x

Sistem (15) je riješen korištenjem Microsoft Excel-a. Rezultati su prikazani na slici 5.


U tabeli u ćelijama A55:B56 upisana je formula (=MOBR (A51:B52)). U ćelijama E54:E56 upisuje se formula (=VIŠE (A51:B52, C51:C52)). Ćelija E56 sadrži formulu =EXP(E54).

Izračunajmo aritmetičku sredinu za x i y koristeći formule:



Rezultati proračuna x i ykoristeći Microsoft Excel prikazani su na slici 6.



Ćelija B58 sadrži formulu =A33/25. Ćelija B59 sadrži formulu =B33/25.

Tabela 2


Objasnimo kako se sastavlja tabela na slici 7.

Ćelije A6:A33 i B6:B33 su već popunjene (vidi sliku 2).

· u ćeliju J6 unesite formulu =(A6-$B$58)*(B6-$B$59).

· Ova formula se kopira u ćelije J7:J30.

· u ćeliju K6 unesite formulu =(A6-$B$58)^ 2.

· Ova formula se kopira u ćelije K7:K30.

· U ćeliju L6 unosimo formulu =(B1-$B$59)^2.

· Ova formula se kopira u ćelije L7:L30.

· u ćeliju M6 unosimo formulu =($E$38+$E$39*A6-B6)^2.

· Ova formula se kopira u ćelije M7:M30.

· u ćeliju N6 unosimo formulu =($F$46 +$F$47*A6 +$F$48*A6 L6-B6)^2.

· Ova formula se kopira u ćelije N7:N30.

· u ćeliju O6 unesite formulu =($E$56*EXP ($E$55*A6) - B6)^2.

· Ova formula se kopira u ćelije O7:O30.

Sljedeće korake izvodimo pomoću automatskog zbrajanja.

· u ćeliju J33 unesite formulu =CYMM (J6:J30).

· U ćeliju K33 unosimo formulu =SUM (K6:K30).

· u ćeliju L33 unesite formulu =CYMM (L6:L30).

· U ćeliju M33 unosimo formulu =SUM (M6:M30).

· u ćeliju N33 unesite formulu =SUM (N6:N30).

· u ćeliju O33 unesite formulu =SUM (06:030).

Sada izračunajmo koeficijent korelacije koristeći formulu (8) (samo za linearnu aproksimaciju) i koeficijent determinacije koristeći formulu (10). Rezultati proračuna pomoću Microsoft Excel-a prikazani su na slici 7.



U tabeli 8, u ćeliji B61 formula je upisana =J33/(K33*L33^(1/2). U ćeliji B62 formula je upisana =1 - M33/L33. U ćeliji B63 formula je upisana =1 - N33 /L33 U ćeliji B64 upisuje se formula =1 - O33/L33.

Analiza rezultata proračuna pokazuje da kvadratna aproksimacija najbolje opisuje eksperimentalne podatke.


4.1 Iscrtavanje grafikona u Excel-u


Odaberite ćelije A1:A25, a zatim idite na Čarobnjak za grafikone. Odaberimo dijagram raspršivanja. Nakon što je grafikon napravljen, kliknite desnim tasterom miša na liniju grafikona i izaberite dodaj liniju trenda (linearnu, eksponencijalnu, stepen i polinom drugog stepena, respektivno).

Grafikon linearne aproksimacije


Kvadratna aproksimacija


Eksponencijalni graf uklapanja.


5. Aproksimacija funkcije pomoću MathCAD-a


Aproksimacija podataka uzimajući u obzir njihove statističke parametre spada u probleme regresije. Obično nastaju prilikom obrade eksperimentalnih podataka dobijenih mjerenjem procesa ili fizičkih pojava statističke prirode (kao što su mjerenja u radiometriji i nuklearnoj geofizici), ili na visokom nivou interferencije (šuma). Zadatak regresione analize je odabrati matematičke formule koje najbolje opisuju eksperimentalne podatke.


.1 Linearna regresija


Linearna regresija u Mathcad sistemu se izvodi pomoću vektora argumenata Xi čitanja Y funkcije:

presjeći (x, y)- izračunava parametar A1 , vertikalni pomak linije regresije (vidi sliku)

nagib (x, y)- izračunava parametar a2 , nagib linije regresije (vidi sliku)

y(x) = a1+a2*x


Funkcija ispravan (y, y(x))izračunava Pearsonov koeficijent korelacije.Što je on bliže 1, što preciznije obrađeni podaci odgovaraju linearnom odnosu (vidi sliku)

.2 Polinomska regresija


Univarijantna polinomna regresija sa proizvoljan stepen n polinom i sa proizvoljnim koordinatama uzoraka u Mathcadu obavljaju funkcije:

regres (x, y, n)- izračunava vektor S,koji sadrži koeficijente aipolinom n th stepen;

Vrijednosti koeficijenata aimože se izdvojiti iz vektora Sfunkcija podmatrica(S, 3, dužina(S) - 1, 0, 0).

Dobivene vrijednosti koeficijenta koristimo u jednadžbi regresije


y(x) = a1+a2*x+a3*x2 (vidi sliku)

.3 Nelinearna regresija


Za jednostavne standardne aproksimacijske formule dat je niz funkcija nelinearne regresije u kojima se parametri funkcije biraju pomoću Mathcad programa.

To uključuje funkciju expfit (x, y, s),koji vraća vektor koji sadrži koeficijente a1, a2I a3eksponencijalna funkcija

y(x) = a1 ^exp (a2x) + a3.V vektor Sunose se početne vrijednosti koeficijenata a1, a2I a3prva aproksimacija.


Zaključak


Analiza rezultata proračuna pokazuje da linearna aproksimacija najbolje opisuje eksperimentalne podatke.

Rezultati dobiveni korištenjem MathCAD programa u potpunosti se poklapaju sa vrijednostima ​​dobijenim korištenjem Excela. Ovo ukazuje na tačnost proračuna.


Spisak korišćene literature

  1. Računarstvo: Udžbenik / Ed. prof. N.V. Makarova. M.: Finansije i statistika 2007
  2. Informatika: Radionica o računarskoj tehnologiji / Ed. Ed. prof. N.V. Makarova. M finansije i statistika, 2011.
  3. N.S. Piskunov. Diferencijalni i integralni račun, 2010.
  4. Računarstvo, Aproksimacija metodom najmanjih kvadrata, smjernice, Sankt Peterburg, 2009.
Tutoring

Trebate pomoć u proučavanju teme?

Naši stručnjaci će savjetovati ili pružiti usluge podučavanja o temama koje vas zanimaju.
Pošaljite svoju prijavu naznačivši temu upravo sada kako biste saznali o mogućnosti dobivanja konsultacija.

Metoda najmanjih kvadrata

U završnoj lekciji teme upoznaćemo se sa najpoznatijom aplikacijom FNP, koji nalazi najširu primjenu u različitim oblastima nauke i praktične djelatnosti. To može biti fizika, hemija, biologija, ekonomija, sociologija, psihologija i tako dalje, tako dalje. Voljom sudbine, često moram da se bavim ekonomijom, i zato ću danas za vas organizovati putovanje u neverovatnu zemlju tzv. Ekonometrija=) ...Kako to ne želiš?! Tamo je jako dobro - samo treba da se odlučite! ...Ali ono što sigurno želite je naučiti kako rješavati probleme metoda najmanjih kvadrata. A posebno marljivi čitaoci naučiće da ih rešavaju ne samo precizno, već i VEOMA BRZO ;-) Ali prvo opšta izjava o problemu + prateći primjer:

Pretpostavimo da se u određenoj predmetnoj oblasti proučavaju indikatori koji imaju kvantitativni izraz. Istovremeno, postoje svi razlozi za vjerovanje da indikator ovisi o indikatoru. Ova pretpostavka može biti ili naučna hipoteza ili bazirana na elementarnoj osnovi zdrav razum. Ostavimo, međutim, nauku po strani i istražimo privlačnija područja – naime, trgovine prehrambenim proizvodima. Označimo sa:

– maloprodajni prostor trgovine, m2,
– godišnji promet prehrambene prodavnice, milion rubalja.

Apsolutno je jasno da što je veća površina prodavnice, to će u većini slučajeva biti veći njen promet.

Pretpostavimo da nakon izvođenja zapažanja/eksperimenata/proračunavanja/plesa uz tamburu imamo na raspolaganju numeričke podatke:

Sa prehrambenim prodavnicama mislim da je sve jasno: - ovo je površina 1. prodavnice, - njen godišnji promet, - površina 2. prodavnice, - njen godišnji promet itd. Uzgred, uopšte nije potrebno imati pristup klasifikovanim materijalima - prilično tačna procena trgovinskog prometa može se dobiti pomoću matematičke statistike. Međutim, nemojmo se ometati, kurs komercijalne špijunaže je već plaćen =)

Tabelarni podaci se također mogu napisati u obliku tačaka i prikazati u poznatom obliku Kartezijanski sistem .

Odgovorimo na jedno važno pitanje: Koliko bodova je potrebno za kvalitativnu studiju?

Više to bolje. Minimalni prihvatljivi set se sastoji od 5-6 bodova. Osim toga, kada mala količina podaci, “anomalni” rezultati ne mogu biti uključeni u uzorak. Tako, na primjer, mala elitna radnja može zaraditi redove veličine više od "njenih kolega", čime se iskrivljuje opći obrazac koji trebate pronaći!



Vrlo jednostavno rečeno, moramo odabrati funkciju, raspored koji prolazi što bliže tačkama . Ova funkcija se zove aproksimativno (aproksimacija - aproksimacija) ili teorijska funkcija . Uopšteno govoreći, ovdje se odmah pojavljuje očigledan "konkurent" - polinom visokog stupnja, čiji graf prolazi kroz SVE tačke. Ali ova opcija je komplikovana i često jednostavno netočna. (pošto će se grafikon stalno "petljati" i loše odražavati glavni trend).

Dakle, tražena funkcija mora biti prilično jednostavna i istovremeno adekvatno odražavati ovisnost. Kao što možete pretpostaviti, jedna od metoda za pronalaženje takvih funkcija se zove metoda najmanjih kvadrata. Prvo, pogledajmo njegovu suštinu u opšti pogled. Neka neka funkcija aproksimira eksperimentalne podatke:


Kako ocijeniti tačnost ove aproksimacije? Izračunajmo i razlike (odstupanja) između eksperimentalne i funkcionalne vrijednosti (učimo crtež). Prva misao koja vam pada na pamet je procijeniti koliki je zbroj, ali problem je što razlike mogu biti negativne (Na primjer, ) a odstupanja kao rezultat takvog zbrajanja će se poništiti. Stoga, kao procjenu tačnosti aproksimacije, treba uzeti zbir moduli odstupanja:

ili srušeno: (u slučaju da neko ne zna: je ikona zbira, i – pomoćna varijabla „counter“, koja uzima vrijednosti od 1 do ) .

Aproksimacijom eksperimentalnih tačaka različitim funkcijama dobićemo različita značenja, i očito, gdje je ovaj iznos manji, ta funkcija je tačnija.

Takav metod postoji i zove se metoda najmanjeg modula. Međutim, u praksi je postao mnogo rašireniji metoda najmanjih kvadrata, u kojem se moguće negativne vrijednosti eliminiraju ne modulom, već kvadriranjem odstupanja:



, nakon čega se radi na odabiru funkcije takve da je zbir kvadrata odstupanja bio što manji. Zapravo, odatle potiče naziv metode.

A sada se vraćamo na nešto drugo važna tačka: kao što je gore navedeno, odabrana funkcija bi trebala biti prilično jednostavna - ali postoji i mnogo takvih funkcija: linearno , hiperbolično , eksponencijalna , logaritamski , kvadratni itd. I, naravno, ovdje bih odmah htio „smanjiti polje djelovanja“. Koju klasu funkcija trebam odabrati za istraživanje? Primitivno, ali efektivna tehnika:

– Najlakši način je da prikažete tačke na crtežu i analizirati njihovu lokaciju. Ako imaju tendenciju da trče u pravoj liniji, onda biste trebali potražiti jednačina prave sa optimalnim vrijednostima i . Drugim riječima, zadatak je pronaći TAKVE koeficijente tako da zbir kvadrata odstupanja bude najmanji.

Ako se tačke nalaze, na primjer, duž hiperbola, onda je očito jasno da će linearna funkcija dati lošu aproksimaciju. U ovom slučaju tražimo najpovoljnije koeficijente za jednadžbu hiperbole – oni koji daju minimalni zbir kvadrata .

Sada imajte na umu da u oba slučaja govorimo funkcije dvije varijable, čiji su argumenti pretraživali parametre zavisnosti:

A u suštini moramo riješiti standardni problem - pronaći minimalna funkcija dvije varijable.

Prisjetimo se našeg primjera: pretpostavimo da se tačke "prodavnice" obično nalaze u pravoj liniji i postoji svaki razlog vjerovati da linearna zavisnost promet od maloprodajnog prostora. Nađimo TAKVE koeficijente “a” i “be” takve da je zbir kvadrata odstupanja bio najmanji. Sve je kao i obično - prvo Parcijalni derivati ​​1. reda. Prema pravilo linearnosti Možete razlikovati odmah ispod ikone sume:

Ako želite da iskoristite ove informacije za esej ili seminarski rad, bit ću vam veoma zahvalan na linku na listi izvora, na nekoliko mjesta ćete naći ovako detaljne proračune:

Kreirajmo standardni sistem:

Svaku jednačinu smanjujemo za "dva" i, pored toga, "razbijamo" zbrojeve:

Napomena : nezavisno analizirati zašto se “a” i “be” mogu izdvojiti izvan ikone zbira. Inače, formalno se to može učiniti sa sumom

Prepišimo sistem u "primijenjenom" obliku:

nakon čega počinje da se pojavljuje algoritam za rješavanje našeg problema:

Znamo li koordinate tačaka? Znamo. Iznosi možemo li ga naći? Lako. Hajde da napravimo najjednostavnije sistem od dvoje linearne jednačine sa dve nepoznate(“a” i “biti”). Rešavamo sistem, npr. Cramerova metoda, kao rezultat toga dobijamo stacionarnu tačku. Provjeravam dovoljno stanje ekstrem, možemo potvrditi da je u ovom trenutku funkcija dostiže tačno minimum. Provjera uključuje dodatne proračune i stoga ćemo je ostaviti iza scene (ako je potrebno, okvir koji nedostaje može se vidjetiEvo ) . Izvlačimo konačan zaključak:

Funkcija na najbolji mogući način (barem u usporedbi s bilo kojom drugom linearnom funkcijom) približava eksperimentalne tačke . Grubo govoreći, njegov graf prolazi što je moguće bliže ovim tačkama. U tradiciji ekonometrija rezultirajuća aproksimirajuća funkcija se također poziva uparena jednačina linearne regresije .

Problem koji se razmatra ima veliki praktični značaj. U našem primjeru, jednadžba. omogućava vam da predvidite koji trgovinski promet ("Igrek") trgovina će imati jednu ili drugu vrijednost prodajnog prostora (jedno ili drugo značenje "x"). Da, rezultirajuća prognoza će biti samo prognoza, ali će se u mnogim slučajevima pokazati prilično tačnom.

Analiziraću samo jedan problem sa „stvarnim“ brojevima, jer u tome nema poteškoća - svi proračuni su na nivou nastavnog plana i programa 7.-8. U 95 posto slučajeva od vas će se tražiti da pronađete samo linearnu funkciju, ali na samom kraju članka pokazaću da nije teže pronaći jednadžbe optimalne hiperbole, eksponencijalne i nekih drugih funkcija.

U stvari, ostaje samo distribuirati obećane dobrote - tako da možete naučiti rješavati takve primjere ne samo precizno, već i brzo. Pažljivo proučavamo standard:

Zadatak

Kao rezultat proučavanja odnosa između dva indikatora, dobijeni su sljedeći parovi brojeva:

Koristeći metodu najmanjih kvadrata, pronađite linearnu funkciju koja najbolje aproksimira empirijsku (iskusan) podaci. Napravi crtež u kartezijanskom jeziku pravougaoni sistem koordinate, konstruirati eksperimentalne točke i graf aproksimirajuće funkcije . Pronađite zbroj kvadrata odstupanja između empirijske i teorijske vrijednosti. Saznajte da li bi ova funkcija bila bolja (sa stanovišta metode najmanjih kvadrata) približiti eksperimentalne tačke.

Imajte na umu da su značenja “x” prirodna, a ovo ima karakteristično smisleno značenje, o kojem ću govoriti malo kasnije; ali oni, naravno, mogu biti i razlomci. Osim toga, ovisno o sadržaju određenog zadatka, vrijednosti "X" i "igra" mogu biti potpuno ili djelomično negativne. Pa, dobili smo zadatak „bez lica“ i počinjemo ga rješenje:

Nalazimo koeficijente optimalne funkcije kao rješenje sistema:

U svrhu kompaktnijeg snimanja, varijabla “counter” može se izostaviti, jer je već jasno da se zbrajanje vrši od 1 do .

Pogodnije je izračunati potrebne količine u obliku tabele:


Izračuni se mogu izvršiti na mikrokalkulatoru, ali je mnogo bolje koristiti Excel - i brže i bez grešaka; pogledajte kratak video:

Tako dobijamo sledeće sistem:

Ovdje možete pomnožiti drugu jednačinu sa 3 i oduzmite 2. od 1. jednačine član po član. Ali to je sreća - u praksi sistemi često nisu dar, au takvim slučajevima štedi Cramerova metoda:
, što znači da sistem ima jedinstveno rješenje.

Hajde da proverimo. Razumijem da ne želite, ali zašto preskakati greške tamo gdje se apsolutno ne mogu propustiti? Zamenimo pronađeno rešenje u levu stranu svake jednačine sistema:

Dobijene su desne strane odgovarajućih jednačina, što znači da je sistem ispravno riješen.

Dakle, željena aproksimirajuća funkcija: – od sve linearne funkcije Ona je ta koja najbolje aproksimira eksperimentalne podatke.

Za razliku od direktno zavisnost prometa prodavnice od njene površine, pronađena zavisnost je obrnuto (princip "što više, to manje"), a ovu činjenicu odmah otkriva negativac nagib . Funkcija nam govori da povećanjem određenog indikatora za 1 jedinicu, vrijednost zavisnog indikatora opada u prosjeku za 0,65 jedinica. Kako kažu, što je veća cijena heljde, to se manje prodaje.

Da bismo nacrtali graf aproksimirajuće funkcije, nalazimo njene dvije vrijednosti:

i izvedite crtež:

Konstruisana prava linija se zove linija trenda (naime, linearna linija trenda, tj. u opštem slučaju, trend nije nužno ravna linija). Svima je poznat izraz „biti u trendu“ i mislim da ovaj termin ne treba dodatno komentarisati.

Izračunajmo zbir kvadrata odstupanja između empirijskih i teorijskih vrijednosti. Geometrijski, ovo je zbir kvadrata dužina segmenata "maline" (od kojih su dva toliko mala da se ni ne vide).

Sumiramo proračune u tabeli:


Opet, mogu se raditi ručno za svaki slučaj, dat ću primjer za 1. točku:

ali mnogo je efikasnije to učiniti na već poznati način:

Ponavljamo još jednom: Šta znači dobijeni rezultat? Od sve linearne funkcije y funkcija indikator je najmanji, odnosno u svojoj porodici je najbolja aproksimacija. I ovdje, usput, konačno pitanje problema nije slučajno: šta ako je predložena eksponencijalna funkcija da li bi bilo bolje približiti eksperimentalne tačke?

Nađimo odgovarajući zbir kvadrata odstupanja - da bismo ih razlikovali, označit ću ih slovom "epsilon". Tehnika je potpuno ista:


I opet, za svaki slučaj, kalkulacije za 1. tačku:

U Excelu koristimo standardnu ​​funkciju EXP (sintaksu možete pronaći u Excel pomoći).

Zaključak: , što znači da eksponencijalna funkcija aproksimira eksperimentalne tačke lošije od prave linije .

Ali ovdje treba napomenuti da je „gore“. ne znači još, što je loše. Sada sam napravio graf ove eksponencijalne funkcije - i on takođe prolazi blizu tačaka - toliko da je bez analitičkog istraživanja teško reći koja je funkcija preciznija.

Ovim je rješenje završeno i vraćam se na pitanje prirodne vrednosti argument. U različitim studijama, obično ekonomskim ili sociološkim, prirodni "X" se koriste za brojenje mjeseci, godina ili drugih jednakih vremenskih intervala. Razmotrite, na primjer, sljedeći problem:

Dostupni su sljedeći podaci o prometu trgovine na malo za prvu polovicu godine:

Koristeći analitičko pravolinijsko poravnanje, odredite obim prometa za jul.

Da, nema problema: numerišemo mjesece 1, 2, 3, 4, 5, 6 i koristimo uobičajeni algoritam, kao rezultat toga dobijamo jednačinu - jedino što se, kada je vrijeme u pitanju, obično koriste slovo "te" (iako ovo nije kritično). Rezultirajuća jednačina pokazuje da je u prvoj polovini godine trgovinski promet porastao u prosjeku za 27,74 jedinice. mjesečno. Hajde da dobijemo prognozu za jul (mjesec br. 7): d.e.

A ovakvih zadataka je bezbroj. Oni koji žele mogu koristiti dodatnu uslugu i to moju Excel kalkulator (demo verzija), koji rješava analizirani problem gotovo trenutno! Dostupna je radna verzija programa na razmjeni ili za simbolična naknada.

Na kraju lekcije kratke informacije o pronalaženje zavisnosti nekih drugih tipova. Zapravo, nema puno toga za reći, budući da osnovni pristup i algoritam rješenja ostaju isti.

Pretpostavimo da raspored eksperimentalnih tačaka liči na hiperbolu. Zatim, da biste pronašli koeficijente najbolje hiperbole, morate pronaći minimum funkcije - svako može izvršiti detaljne proračune i doći do sličnog sistema:

Sa formalno-tehničke tačke gledišta, dobija se iz “linearnog” sistema (označimo ga zvjezdicom) zamjenjujući "x" sa . Pa, šta je sa iznosima? izračunati, nakon čega do optimalnih koeficijenata “a” i “be” pri ruci.

Ako postoje svi razlozi za vjerovanje da su bodovi nalaze se duž logaritamske krivulje, a zatim za pronalaženje optimalnih vrijednosti nalazimo minimum funkcije . Formalno, u sistemu (*) treba zamijeniti sa:

Kada obavljate proračune u Excelu, koristite funkciju LN. Priznajem da mi ne bi bilo posebno teško napraviti kalkulatore za svaki od razmatranih slučajeva, ali bi ipak bilo bolje da sami „programirate“ proračune. Video zapisi lekcija za pomoć.

Sa eksponencijalnom zavisnošću situacija je malo komplikovanija. Da bismo stvar sveli na linearni slučaj, uzimamo funkciju logaritam i koristimo svojstva logaritma:

Sada, upoređujući rezultujuću funkciju sa linearnom funkcijom, dolazimo do zaključka da u sistemu (*) mora biti zamenjeno sa , i – sa . Radi praktičnosti, označimo:

Imajte na umu da je sistem riješen u odnosu na i, stoga, nakon pronalaženja korijena, ne smijete zaboraviti pronaći sam koeficijent.

Da približim eksperimentalne tačke optimalna parabola , trebalo bi da se nađe minimalna funkcija tri varijable . Nakon izvođenja standardnih radnji, dobijamo sljedeće "radi" sistem:

Da, naravno, ovdje ima više iznosa, ali nema nikakvih poteškoća pri korištenju vaše omiljene aplikacije. I na kraju, reći ću vam kako brzo izvršiti provjeru koristeći Excel i izgraditi željenu liniju trenda: kreirajte dijagram raspršenja, odaberite bilo koju od tačaka mišem i desnim klikom odaberite opciju "Dodaj liniju trenda". Zatim odaberite vrstu grafikona i na kartici "Opcije" aktivirati opciju "Prikaži jednačinu na dijagramu". OK

Kao i uvijek, želio bih završiti članak s nekim u prekrasnoj frazi, i skoro sam otkucao "Budi trendi!" Ali na vrijeme se predomislio. I ne zato što je to stereotipno. Ne znam kako je nikome, ali ne želim baš da pratim promovirani američki, a pogotovo evropski trend =) Zato želim da se svako od vas drži svoje linije!

http://www.grandars.ru/student/vysshaya-matematika/metod-naimenshih-kvadratov.html

Metoda najmanjih kvadrata jedna je od najčešćih i najrazvijenijih zbog svoje jednostavnost i efikasnost metoda za procjenu parametara linearnih ekonometrijskih modela. Istovremeno, kada se koristi, treba biti oprezan, jer modeli konstruirani pomoću njega možda neće zadovoljiti niz zahtjeva za kvalitetom svojih parametara i, kao rezultat toga, ne „dobro“ odražavaju obrasce razvoja procesa. .

Razmotrimo detaljnije postupak za procjenu parametara linearnog ekonometrijskog modela metodom najmanjih kvadrata. Takav model općenito se može predstaviti jednadžbom (1.2):

y t = a 0 + a 1 x 1t +...+ a n x nt + ε t.

Početni podaci pri procjeni parametara a 0 , a 1 ,..., a n je vektor vrijednosti zavisne varijable y= (y 1 , y 2 , ... , y T)" i matrica vrijednosti nezavisnih varijabli

u kojoj prva kolona, ​​koja se sastoji od jedinica, odgovara koeficijentu modela.

Metoda najmanjih kvadrata dobila je ime na osnovu osnovnog principa da procjene parametara dobijene na njenoj osnovi moraju zadovoljiti: zbir kvadrata greške modela treba biti minimalan.

Primjeri rješavanja zadataka metodom najmanjih kvadrata

Primjer 2.1. Trgovačko preduzeće ima mrežu od 12 prodavnica, informacije o aktivnostima koje su predstavljene u tabeli. 2.1.

Menadžment preduzeća želi da zna kako veličina godišnjeg prometa zavisi od maloprodajnog prostora prodavnice.

Tabela 2.1

Broj prodavnice Godišnji promet, milion rubalja. Maloprodajna površina, hiljada m2
19,76 0,24
38,09 0,31
40,95 0,55
41,08 0,48
56,29 0,78
68,51 0,98
75,01 0,94
89,05 1,21
91,13 1,29
91,26 1,12
99,84 1,29
108,55 1,49

Rješenje najmanjih kvadrata. Označimo godišnji promet te prodavnice, miliona rubalja; - maloprodajna površina te radnje, hiljada m2.

Sl.2.1. Dijagram raspršenosti za primjer 2.1

Da bismo odredili oblik funkcionalnog odnosa između varijabli i konstruisaćemo dijagram raspršenja (slika 2.1).

Na osnovu dijagrama raspršenosti možemo zaključiti da godišnji promet pozitivno ovisi o maloprodajnom prostoru (tj. y će rasti s povećanjem). Najprikladniji oblik funkcionalna veza - linearno.

Informacije za dalje proračune prikazane su u tabeli. 2.2. Koristeći metodu najmanjih kvadrata, procjenjujemo parametre linearnog jednofaktorskog ekonometrijskog modela

Tabela 2.2

t y t x 1t y t 2 x 1t 2 x 1t y t
19,76 0,24 390,4576 0,0576 4,7424
38,09 0,31 1450,8481 0,0961 11,8079
40,95 0,55 1676,9025 0,3025 22,5225
41,08 0,48 1687,5664 0,2304 19,7184
56,29 0,78 3168,5641 0,6084 43,9062
68,51 0,98 4693,6201 0,9604 67,1398
75,01 0,94 5626,5001 0,8836 70,5094
89,05 1,21 7929,9025 1,4641 107,7505
91,13 1,29 8304,6769 1,6641 117,5577
91,26 1,12 8328,3876 1,2544 102,2112
99,84 1,29 9968,0256 1,6641 128,7936
108,55 1,49 11783,1025 2,2201 161,7395
S 819,52 10,68 65008,554 11,4058 858,3991
Prosjek 68,29 0,89

dakle,

Dakle, sa povećanjem maloprodajnog prostora za 1 hiljadu m2, pod jednakim uslovima, prosječni godišnji promet raste za 67,8871 miliona rubalja.

Primjer 2.2. Menadžment kompanije je primetio da godišnji promet zavisi ne samo od prodajnog prostora prodavnice (vidi primer 2.1), već i od prosečnog broja posetilaca. Relevantne informacije su prikazane u tabeli. 2.3.

Tabela 2.3

Rješenje. Označimo - prosječan broj posjetilaca te prodavnice dnevno, hiljada ljudi.

Da bismo odredili oblik funkcionalnog odnosa između varijabli i konstruisaćemo dijagram raspršenja (slika 2.2).

Na osnovu dijagrama raspršenosti možemo zaključiti da godišnji promet pozitivno zavisi od prosječnog broja posjetitelja dnevno (tj. y će rasti s povećanjem). Oblik funkcionalne zavisnosti je linearan.

Rice. 2.2. Dijagram raspršenosti za primjer 2.2

Tabela 2.4

t x 2t x 2t 2 y t x 2t x 1t x 2t
8,25 68,0625 163,02 1,98
10,24 104,8575 390,0416 3,1744
9,31 86,6761 381,2445 5,1205
11,01 121,2201 452,2908 5,2848
8,54 72,9316 480,7166 6,6612
7,51 56,4001 514,5101 7,3598
12,36 152,7696 927,1236 11,6184
10,81 116,8561 962,6305 13,0801
9,89 97,8121 901,2757 12,7581
13,72 188,2384 1252,0872 15,3664
12,27 150,5529 1225,0368 15,8283
13,92 193,7664 1511,016 20,7408
S 127,83 1410,44 9160,9934 118,9728
Prosjek 10,65

Općenito, potrebno je odrediti parametre dvofaktorskog ekonometrijskog modela

y t = a 0 + a 1 x 1t + a 2 x 2t + ε t

Informacije potrebne za dalje proračune prikazane su u tabeli. 2.4.

Procijenimo parametre linearnog dvofaktorskog ekonometrijskog modela koristeći metodu najmanjih kvadrata.

dakle,

Procjena koeficijenta =61,6583 pokazuje da će, pod istim uvjetima, povećanjem maloprodajnog prostora za 1 hiljadu m 2, godišnji promet porasti u prosjeku za 61,6583 miliona rubalja.

Procjena koeficijenta = 2,2748 to pokazuje, pod jednakim uslovima, uz povećanje prosječnog broja posjetilaca na hiljadu stanovnika. dnevno, godišnji promet će se povećati u prosjeku za 2,2748 miliona rubalja.

Primjer 2.3. Koristeći informacije predstavljene u tabeli. 2.2 i 2.4, procijenite parametar jednofaktorskog ekonometrijskog modela

gdje je centrirana vrijednost godišnjeg prometa te prodavnice, miliona rubalja; - centrirana vrijednost prosječnog dnevnog broja posjetilaca t-te prodavnice, hiljada ljudi. (vidi primjere 2.1-2.2).

Rješenje. Dodatne informacije, neophodna za proračune, prikazana je u tabeli. 2.5.

Tabela 2.5

-48,53 -2,40 5,7720 116,6013
-30,20 -0,41 0,1702 12,4589
-27,34 -1,34 1,8023 36,7084
-27,21 0,36 0,1278 -9,7288
-12,00 -2,11 4,4627 25,3570
0,22 -3,14 9,8753 -0,6809
6,72 1,71 2,9156 11,4687
20,76 0,16 0,0348 3,2992
22,84 -0,76 0,5814 -17,413
22,97 3,07 9,4096 70,4503
31,55 1,62 2,6163 51,0267
40,26 3,27 10,6766 131,5387
Iznos 48,4344 431,0566

Koristeći formulu (2.35), dobijamo

dakle,

http://www.cleverstudents.ru/articles/mnk.html

Primjer.

Eksperimentalni podaci o vrijednostima varijabli X I at date su u tabeli.

Kao rezultat njihovog poravnanja, dobija se funkcija

Koristeći metoda najmanjih kvadrata, aproksimira ove podatke linearnom zavisnošću y=ax+b(pronaći parametre A I b). Saznajte koja od dvije linije bolje (u smislu metode najmanjih kvadrata) poravnava eksperimentalne podatke. Napravite crtež.

Rješenje.

U našem primjeru n=5. Ispunjavamo tablicu radi praktičnosti izračunavanja iznosa koji su uključeni u formule potrebnih koeficijenata.

Vrijednosti u četvrtom redu tabele dobijaju se množenjem vrijednosti 2. retka sa vrijednostima 3. reda za svaki broj i.

Vrijednosti u petom redu tabele dobijaju se kvadriranjem vrijednosti u 2. redu za svaki broj i.

Vrijednosti u posljednjoj koloni tabele su zbroji vrijednosti u redovima.

Za pronalaženje koeficijenata koristimo formule metode najmanjih kvadrata A I b. U njih zamjenjujemo odgovarajuće vrijednosti iz posljednje kolone tabele:

dakle, y = 0,165x+2,184- željena aproksimirajuća prava linija.

Ostaje da saznamo koja od linija y = 0,165x+2,184 ili bolje aproksimira originalne podatke, odnosno procjenjuje metodom najmanjih kvadrata.

Dokaz.

Tako da kada se nađe A I b preuzeo funkciju najmanju vrijednost, potrebno je da se u ovom trenutku matrica kvadratnog oblika diferencijala drugog reda za funkciju bilo pozitivno određeno. Hajde da to pokažemo.

Diferencijal drugog reda ima oblik:

To je

Prema tome, matrica kvadratnog oblika ima oblik

a vrijednosti elemenata ne ovise o A I b.

Pokažimo da je matrica pozitivno određena. Da biste to učinili, ugaoni minori moraju biti pozitivni.

Ugaoni minor prvog reda . Nejednakost je stroga, budući da su tačke

Koja nalazi najširu primenu u raznim oblastima nauke i praktične delatnosti. To može biti fizika, hemija, biologija, ekonomija, sociologija, psihologija i tako dalje, tako dalje. Voljom sudbine, često moram da se bavim ekonomijom, i zato ću danas za vas organizovati putovanje u neverovatnu zemlju tzv. Ekonometrija=) ...Kako to ne želiš?! Tamo je jako dobro - samo treba da se odlučite! ...Ali ono što sigurno želite je naučiti kako rješavati probleme metoda najmanjih kvadrata. A posebno marljivi čitaoci naučiće da ih rešavaju ne samo precizno, već i VEOMA BRZO ;-) Ali prvo opšta izjava o problemu+ prateći primjer:

Pretpostavimo da se u određenoj predmetnoj oblasti proučavaju indikatori koji imaju kvantitativni izraz. Istovremeno, postoje svi razlozi za vjerovanje da indikator ovisi o indikatoru. Ova pretpostavka može biti ili naučna hipoteza ili zasnovana na osnovnom zdravom razumu. Ostavimo, međutim, nauku po strani i istražimo privlačnija područja – naime, trgovine prehrambenim proizvodima. Označimo sa:

– maloprodajni prostor trgovine, m2,
– godišnji promet prehrambene prodavnice, milion rubalja.

Apsolutno je jasno da što je veća površina prodavnice, to će u većini slučajeva biti veći njen promet.

Pretpostavimo da nakon izvođenja zapažanja/eksperimenata/proračunavanja/plesa uz tamburu imamo na raspolaganju numeričke podatke:

Sa prehrambenim prodavnicama mislim da je sve jasno: - ovo je površina 1. prodavnice, - njen godišnji promet, - površina 2. prodavnice, - njen godišnji promet itd. Uzgred, uopšte nije potrebno imati pristup klasifikovanim materijalima - prilično tačna procena trgovinskog prometa može se dobiti pomoću matematičke statistike. Međutim, nemojmo se ometati, kurs komercijalne špijunaže je već plaćen =)

Tabelarni podaci se također mogu napisati u obliku tačaka i prikazati u poznatom obliku Kartezijanski sistem .

Odgovorimo na jedno važno pitanje: Koliko bodova je potrebno za kvalitativnu studiju?

Više to bolje. Minimalni prihvatljivi set se sastoji od 5-6 bodova. Osim toga, kada je količina podataka mala, “anomalni” rezultati se ne mogu uključiti u uzorak. Tako, na primjer, mala elitna radnja može zaraditi redove veličine više od "njenih kolega", čime se iskrivljuje opći obrazac koji trebate pronaći!

Vrlo jednostavno rečeno, moramo odabrati funkciju, raspored koji prolazi što bliže tačkama . Ova funkcija se zove aproksimativno (aproksimacija - aproksimacija) ili teorijska funkcija . Uopšteno govoreći, ovdje se odmah pojavljuje očigledan "konkurent" - polinom visokog stupnja, čiji graf prolazi kroz SVE tačke. Ali ova opcija je komplikovana i često jednostavno netočna. (pošto će se grafikon stalno "petljati" i loše odražavati glavni trend).

Dakle, tražena funkcija mora biti prilično jednostavna i istovremeno adekvatno odražavati ovisnost. Kao što možete pretpostaviti, jedna od metoda za pronalaženje takvih funkcija se zove metoda najmanjih kvadrata. Prvo, pogledajmo njegovu suštinu općenito. Neka neka funkcija aproksimira eksperimentalne podatke:


Kako ocijeniti tačnost ove aproksimacije? Izračunajmo i razlike (odstupanja) između eksperimentalne i funkcionalne vrijednosti (učimo crtež). Prva misao koja vam pada na pamet je procijeniti koliki je zbroj, ali problem je što razlike mogu biti negativne (Na primjer, ) a odstupanja kao rezultat takvog zbrajanja će se poništiti. Stoga, kao procjenu tačnosti aproksimacije, treba uzeti zbir moduli odstupanja:

ili srušeno: (u slučaju da neko ne zna: – ovo je ikona sume, i – pomoćna varijabla – „brojač“, koji uzima vrijednosti od 1 do ).

Aproksimacijom eksperimentalnih tačaka sa različitim funkcijama dobićemo različite vrednosti, a očigledno, tamo gde je ovaj zbir manji, ta funkcija je tačnija.

Takav metod postoji i zove se metoda najmanjeg modula. Međutim, u praksi je postao mnogo rašireniji metoda najmanjih kvadrata, u kojem se moguće negativne vrijednosti eliminiraju ne modulom, već kvadriranjem odstupanja:

, nakon čega se radi na odabiru funkcije takve da je zbir kvadrata odstupanja bio što manji. Zapravo, odatle potiče naziv metode.

A sada se vraćamo na još jednu važnu točku: kao što je gore navedeno, odabrana funkcija bi trebala biti prilično jednostavna - ali postoji i mnogo takvih funkcija: linearno , hiperbolično, eksponencijalna, logaritamski, kvadratni itd. I, naravno, ovdje bih odmah želio „smanjiti polje aktivnosti“. Koju klasu funkcija trebam odabrati za istraživanje? Primitivna, ali efikasna tehnika:

– Najlakši način je da prikažete tačke na crtežu i analizirati njihovu lokaciju. Ako imaju tendenciju da trče u pravoj liniji, onda biste trebali potražiti jednačina prave sa optimalnim vrijednostima i . Drugim riječima, zadatak je pronaći TAKVE koeficijente tako da zbir kvadrata odstupanja bude najmanji.

Ako se tačke nalaze, na primjer, duž hiperbola, onda je očito jasno da će linearna funkcija dati lošu aproksimaciju. U ovom slučaju tražimo najpovoljnije koeficijente za jednadžbu hiperbole – oni koji daju minimalni zbir kvadrata .

Sada imajte na umu da u oba slučaja govorimo funkcije dvije varijable, čiji su argumenti pretraživali parametre zavisnosti:

A u suštini moramo riješiti standardni problem - pronaći minimalna funkcija dvije varijable.

Prisjetimo se našeg primjera: pretpostavimo da se tačke "prodavnice" obično nalaze u pravoj liniji i postoji svaki razlog vjerovati da linearna zavisnost promet od maloprodajnog prostora. Nađimo TAKVE koeficijente “a” i “be” takve da je zbir kvadrata odstupanja bio najmanji. Sve je kao i obično - prvo Parcijalni derivati ​​1. reda. Prema pravilo linearnosti Možete razlikovati odmah ispod ikone sume:

Ako želite da iskoristite ove informacije za esej ili seminarski rad, bit ću vam veoma zahvalan na linku na listi izvora, na nekoliko mjesta ćete naći ovako detaljne proračune:

Kreirajmo standardni sistem:

Svaku jednačinu smanjujemo za "dva" i, pored toga, "razbijamo" zbrojeve:

Napomena : nezavisno analizirati zašto se “a” i “be” mogu izdvojiti izvan ikone zbira. Inače, formalno se to može učiniti sa sumom

Prepišimo sistem u "primijenjenom" obliku:

nakon čega počinje da se pojavljuje algoritam za rješavanje našeg problema:

Znamo li koordinate tačaka? Znamo. Iznosi možemo li ga naći? Lako. Hajde da napravimo najjednostavnije sistem dvije linearne jednadžbe u dvije nepoznate(“a” i “biti”). Rešavamo sistem, npr. Cramerova metoda, kao rezultat toga dobijamo stacionarnu tačku. Provjeravam dovoljan uslov za ekstrem, možemo potvrditi da je u ovom trenutku funkcija dostiže tačno minimum. Provjera uključuje dodatne proračune i stoga ćemo je ostaviti iza scene (ako je potrebno, okvir koji nedostaje može se vidjeti). Izvlačimo konačan zaključak:

Funkcija na najbolji mogući način (barem u usporedbi s bilo kojom drugom linearnom funkcijom) približava eksperimentalne tačke . Grubo govoreći, njegov graf prolazi što je moguće bliže ovim tačkama. U tradiciji ekonometrija rezultirajuća aproksimirajuća funkcija se također poziva uparena jednačina linearne regresije .

Problem koji se razmatra je od velike praktične važnosti. U našem primjeru, jednadžba. omogućava vam da predvidite koji trgovinski promet ("Igrek") trgovina će imati jednu ili drugu vrijednost prodajnog prostora (jedno ili drugo značenje "x"). Da, rezultirajuća prognoza će biti samo prognoza, ali će se u mnogim slučajevima pokazati prilično tačnom.

Analiziraću samo jedan problem sa „stvarnim“ brojevima, jer u tome nema poteškoća - svi proračuni su na nivou nastavnog plana i programa 7.-8. U 95 posto slučajeva od vas će se tražiti da pronađete samo linearnu funkciju, ali na samom kraju članka pokazaću da nije teže pronaći jednadžbe optimalne hiperbole, eksponencijalne i nekih drugih funkcija.

U stvari, ostaje samo distribuirati obećane dobrote - tako da možete naučiti rješavati takve primjere ne samo precizno, već i brzo. Pažljivo proučavamo standard:

Zadatak

Kao rezultat proučavanja odnosa između dva indikatora, dobijeni su sljedeći parovi brojeva:

Koristeći metodu najmanjih kvadrata, pronađite linearnu funkciju koja najbolje aproksimira empirijsku (iskusan) podaci. Napravite crtež na kojem ćete konstruirati eksperimentalne točke i graf aproksimirajuće funkcije u kartezijanskom pravokutnom koordinatnom sistemu . Pronađite zbroj kvadrata odstupanja između empirijske i teorijske vrijednosti. Saznajte da li bi ova funkcija bila bolja (sa stanovišta metode najmanjih kvadrata) približiti eksperimentalne tačke.

Imajte na umu da su značenja “x” prirodna, a ovo ima karakteristično smisleno značenje, o kojem ću govoriti malo kasnije; ali oni, naravno, mogu biti i razlomci. Osim toga, ovisno o sadržaju određenog zadatka, vrijednosti "X" i "igra" mogu biti potpuno ili djelomično negativne. Pa, dobili smo zadatak „bez lica“ i počinjemo ga rješenje:

Nalazimo koeficijente optimalne funkcije kao rješenje sistema:

U svrhu kompaktnijeg snimanja, varijabla “counter” može se izostaviti, jer je već jasno da se zbrajanje vrši od 1 do .

Pogodnije je izračunati potrebne količine u obliku tabele:


Izračuni se mogu izvršiti na mikrokalkulatoru, ali je mnogo bolje koristiti Excel - i brže i bez grešaka; pogledajte kratak video:

Tako dobijamo sledeće sistem:

Ovdje možete pomnožiti drugu jednačinu sa 3 i oduzmite 2. od 1. jednačine član po član. Ali to je sreća - u praksi sistemi često nisu dar, au takvim slučajevima štedi Cramerova metoda:
, što znači da sistem ima jedinstveno rješenje.

Hajde da proverimo. Razumijem da ne želite, ali zašto preskakati greške tamo gdje se apsolutno ne mogu propustiti? Zamenimo pronađeno rešenje u levu stranu svake jednačine sistema:

Dobijene su desne strane odgovarajućih jednačina, što znači da je sistem ispravno riješen.

Dakle, željena aproksimirajuća funkcija: – od sve linearne funkcije Ona je ta koja najbolje aproksimira eksperimentalne podatke.

Za razliku od direktno zavisnost prometa prodavnice od njene površine, pronađena zavisnost je obrnuto (princip "što više, to manje"), a ovu činjenicu odmah otkriva negativac nagib. Funkcija nam govori da povećanjem određenog indikatora za 1 jedinicu, vrijednost zavisnog indikatora opada u prosjeku za 0,65 jedinica. Kako kažu, što je veća cijena heljde, to se manje prodaje.

Da bismo nacrtali graf aproksimirajuće funkcije, nalazimo njene dvije vrijednosti:

i izvedite crtež:


Konstruisana prava linija se zove linija trenda (naime, linearna linija trenda, tj. u opštem slučaju, trend nije nužno ravna linija). Svima je poznat izraz „biti u trendu“ i mislim da ovaj termin ne treba dodatno komentarisati.

Izračunajmo zbir kvadrata odstupanja između empirijskih i teorijskih vrijednosti. Geometrijski, ovo je zbir kvadrata dužina segmenata "maline" (od kojih su dva toliko mala da se ni ne vide).

Sumiramo proračune u tabeli:


Opet, mogu se raditi ručno za svaki slučaj, dat ću primjer za 1. točku:

ali mnogo je efikasnije to učiniti na već poznati način:

Ponavljamo još jednom: Šta znači dobijeni rezultat? Od sve linearne funkcije y funkcija indikator je najmanji, odnosno u svojoj porodici je najbolja aproksimacija. I ovdje, usput, konačno pitanje problema nije slučajno: šta ako je predložena eksponencijalna funkcija da li bi bilo bolje približiti eksperimentalne tačke?

Nađimo odgovarajući zbir kvadrata odstupanja - da bismo ih razlikovali, označit ću ih slovom "epsilon". Tehnika je potpuno ista:


I opet, za svaki slučaj, kalkulacije za 1. tačku:

U Excelu koristimo standardnu ​​funkciju EXP (sintaksu možete pronaći u Excel pomoći).

Zaključak: , što znači da eksponencijalna funkcija aproksimira eksperimentalne tačke lošije od prave linije .

Ali ovdje treba napomenuti da je „gore“. ne znači još, što je loše. Sada sam napravio graf ove eksponencijalne funkcije - i on takođe prolazi blizu tačaka - toliko da je bez analitičkog istraživanja teško reći koja je funkcija preciznija.

Ovim je rješenje završeno i vraćam se na pitanje prirodnih vrijednosti argumenta. U različitim studijama, obično ekonomskim ili sociološkim, prirodni "X" se koriste za brojenje mjeseci, godina ili drugih jednakih vremenskih intervala. Razmotrite, na primjer, sljedeći problem.

Široko se koristi u ekonometriji u obliku jasne ekonomske interpretacije njenih parametara.

Linearna regresija se svodi na pronalaženje jednačine oblika

ili

Jednačina oblika dozvoljava na osnovu specificiranih vrijednosti parametara X imaju teorijske vrijednosti rezultantne karakteristike, zamjenjujući stvarne vrijednosti faktora u nju X.

Konstrukcija linearne regresije svodi se na procjenu njenih parametara - A I V. Procjene parametara linearne regresije mogu se pronaći korištenjem različitih metoda.

Klasičan pristup procjeni parametara linearne regresije temelji se na metoda najmanjih kvadrata(MNC).

Metoda najmanjih kvadrata nam omogućava da dobijemo takve procjene parametara A I V, pri čemu je zbir kvadrata odstupanja stvarnih vrijednosti rezultantne karakteristike (y) od izračunatog (teorijskog) minimum:

Da biste pronašli minimum funkcije, morate izračunati parcijalne izvode za svaki od parametara A I b i postavite ih jednakima nuli.

Označimo kroz S, onda:

Transformacijom formule dobijamo sledeći sistem normalnih jednačina za procenu parametara A I V:

Rješavajući sistem normalnih jednačina (3.5) bilo metodom sekvencijalne eliminacije varijabli ili metodom determinanti, nalazimo tražene procjene parametara A I V.

Parametar V nazvan koeficijent regresije. Njegova vrijednost pokazuje prosječnu promjenu rezultata sa promjenom faktora za jednu jedinicu.

Jednačina regresije je uvijek dopunjena indikatorom bliskosti veze. Kada se koristi linearna regresija, takav pokazatelj je koeficijent linearne korelacije. Postoje različite modifikacije formule koeficijenta linearne korelacije. Neki od njih su dati u nastavku:

Kao što je poznato, koeficijent linearne korelacije je u granicama: -1 1.

Za procjenu kvaliteta odabira linearne funkcije izračunava se kvadrat

Koeficijent linearne korelacije tzv koeficijent determinacije. Koeficijent determinacije karakterizira udio varijanse rezultirajuće karakteristike y, objašnjeno regresijom u ukupnoj varijansi rezultirajuće osobine:

Shodno tome, vrijednost 1 karakterizira udio varijanse y, uzrokovane uticajem drugih faktora koji nisu uzeti u obzir u modelu.

Pitanja za samokontrolu

1. Suština metode najmanjih kvadrata?

2. Koliko varijabli pruža parna regresija?

3. Koji koeficijent određuje bliskost veze između promjena?

4. U kojim granicama se utvrđuje koeficijent determinacije?

5. Procjena parametra b u korelaciono-regresionoj analizi?

1. Christopher Dougherty. Uvod u ekonometriju. - M.: INFRA - M, 2001 - 402 str.

2. S.A. Borodich. Ekonometrija. Minsk DOO “Novo znanje” 2001.


3. R.U. Rakhmetova Kratki kurs iz ekonometrije. Tutorial. Almaty. 2004. -78p.

4. I.I. Eliseeva Econometrics. - M.: “Finansije i statistika”, 2002

5. Mjesečni informativno-analitički časopis.

Nelinearni ekonomski modeli. Modeli nelinearne regresije. Transformacija varijabli.

Nelinearno ekonomski modeli..

Transformacija varijabli.

Koeficijent elastičnosti.

Ako postoje nelinearni odnosi između ekonomskih fenomena, onda se oni izražavaju pomoću odgovarajućih nelinearnih funkcija: na primjer, jednakostranična hiperbola , parabole drugog stepena i sl.

Postoje dvije klase nelinearnih regresija:

1. Regresije koje su nelinearne u odnosu na objašnjavajuće varijable uključene u analizu, ali linearne u odnosu na procijenjene parametre, na primjer:

Polinomi različitih stepeni - , ;

Jednakostranična hiperbola - ;

Semilogaritamska funkcija - .

2. Regresije koje su nelinearne u parametrima koji se procjenjuju, na primjer:

Snaga - ;

Demonstrativna - ;

Eksponencijalno - .

Ukupan zbroj kvadrata odstupanja individualne vrednosti rezultantni znak at od prosječne vrijednosti uzrokovano je uticajem mnogih razloga. Uvjetno podijelimo cijeli niz razloga u dvije grupe: faktor koji se proučava x I drugi faktori.

Ako faktor ne utječe na rezultat, tada je linija regresije na grafu paralelna s osom Oh I

Tada je cijela varijansa rezultirajuće karakteristike posljedica utjecaja drugih faktora i ukupni zbir kvadrata odstupanja će se poklopiti sa ostatkom. Ako drugi faktori ne utiču na rezultat, onda y tied With X funkcionalno i rezidualni zbir kvadrata je nula. U ovom slučaju, zbir kvadrata odstupanja objašnjenih regresijom je isti kao i ukupni zbir kvadrata.

Kako sve tačke korelacionog polja ne leže na regresijskoj liniji, njihovo rasipanje se uvek javlja kao rezultat uticaja faktora X, odnosno regresija at By X, i uzrokovane drugim uzrocima (neobjašnjive varijacije). Pogodnost linije regresije za predviđanje zavisi od toga koji deo ukupne varijacije osobine at objašnjava objašnjenu varijaciju

Očigledno, ako je zbir kvadrata odstupanja zbog regresije veći od preostalog zbira kvadrata, tada je jednadžba regresije statistički značajna i faktor X ima značajan uticaj na rezultat u.

, tj. sa brojem slobode nezavisne varijacije karakteristike. Broj stepeni slobode povezan je sa brojem jedinica populacije n i brojem konstanti koje su određene iz njega. U odnosu na problem koji se proučava, broj stepeni slobode treba da pokaže koliko je nezavisnih odstupanja od n

Procjena značaja regresione jednačine u cjelini data je korištenjem F-Fišerov kriterijum. U ovom slučaju se postavlja nulta hipoteza da je koeficijent regresije jednak nuli, tj. b = 0, a samim tim i faktor X ne utiče na rezultat u.

Neposrednom izračunavanju F-testa prethodi analiza varijanse. Centralno mjesto u njemu zauzima dekompozicija ukupnog zbira kvadrata odstupanja varijable at od prosječne vrijednosti at na dva dijela - "objašnjeno" i "neobjašnjeno":

- ukupan zbir kvadrata odstupanja;

- zbir kvadrata odstupanja objašnjenih regresijom;

- rezidualni zbir kvadrata odstupanja.

Svaki zbir odstupanja na kvadrat povezan je sa brojem stepeni slobode , tj. sa brojem slobode nezavisne varijacije karakteristike. Broj stepena slobode povezan je sa brojem populacijskih jedinica n i sa brojem konstanti određenim iz njega. U odnosu na problem koji se proučava, broj stepeni slobode treba da pokaže koliko je nezavisnih odstupanja od n moguće potrebno za formiranje date sume kvadrata.

Disperzija po stepenu slobodeD.

F-odnosi (F-test):

Ako je nulta hipoteza tačna, tada se faktor i preostale varijanse ne razlikuju jedna od druge. Za H 0 potrebno je opovrgavanje kako bi disperzija faktora nekoliko puta premašila disperziju ostatka. Engleski statističar Snedekor razvio je tabele kritičnih vrednosti F-relacije na različitim nivoima značaja nulte hipoteze i različitog broja stepeni slobode. Vrijednost tabele F-kriterijum je maksimalna vrijednost omjera varijansi koja se može pojaviti u slučaju slučajne divergencije za dati nivo vjerovatnoće prisustva nulte hipoteze. Izračunata vrijednost F-relacije se smatraju pouzdanim ako je o veće od tabele.

U ovom slučaju se odbacuje nulta hipoteza o nepostojanju veze između znakova i izvodi se zaključak o značaju ovog odnosa: F činjenica > F tabela H 0 je odbijen.

Ako je vrijednost manja od prikazane u tabeli F činjenica ‹, F tabela, tada je vjerovatnoća nulte hipoteze veća od određenog nivoa i ne može se odbaciti bez ozbiljnog rizika od izvođenja pogrešnog zaključka o postojanju veze. U ovom slučaju, jednačina regresije se smatra statistički beznačajnom. Ali on ne odstupa.

Standardna greška koeficijenta regresije

Da bi se procijenila značajnost koeficijenta regresije, njegova vrijednost se upoređuje sa njegovom standardnom greškom, odnosno utvrđuje se stvarna vrijednost t-Učenički test: koji se zatim poredi sa tabelarnom vrednošću na određenom nivou značajnosti i broju stepeni slobode ( n- 2).

Standardna greška parametra A:

Značajnost koeficijenta linearne korelacije se provjerava na osnovu veličine greške koeficijent korelacije t r:

Ukupna varijansa osobina X:

Višestruka linearna regresija

Izgradnja modela

Višestruka regresija predstavlja regresiju efektivne karakteristike sa dva ili više faktora, odnosno model forme

Regresija može dati dobre rezultate u modeliranju ako se zanemari uticaj drugih faktora koji utiču na predmet proučavanja. Ponašanje pojedinih ekonomskih varijabli ne može se kontrolisati, odnosno nije moguće osigurati jednakost svih ostalih uslova za procjenu uticaja jednog faktora koji se proučava. U ovom slučaju, trebali biste pokušati identificirati utjecaj drugih faktora tako što ćete ih uvesti u model, tj. konstruirati jednadžbu višestruke regresije: y = a+b 1 x 1 +b 2 +…+b p x p + .

Osnovni cilj višestruke regresije je da se izgradi model sa velikim brojem faktora, pri čemu se utvrđuje uticaj svakog od njih posebno, kao i njihov kombinovani uticaj na modelirani indikator. Specifikacija modela uključuje dva niza pitanja: izbor faktora i izbor vrste regresijske jednačine

Metoda najmanjih kvadrata koristi se za procjenu parametara regresione jednadžbe.

Jedna od metoda za proučavanje stohastičkih odnosa između karakteristika je regresiona analiza.
Regresiona analiza je izvođenje regresione jednačine, uz pomoć koje se pronalazi prosječna vrijednost slučajne varijable (atribut rezultata) ako je poznata vrijednost druge (ili druge) varijabli (faktor-atributa). Uključuje sljedeće korake:

  1. izbor oblika veze (vrsta analitičke regresione jednačine);
  2. procjena parametara jednadžbe;
  3. procjena kvaliteta analitičke regresione jednačine.
Najčešće se linearni oblik koristi za opisivanje statističkog odnosa karakteristika. Fokus na linearnim odnosima objašnjava se jasnim ekonomskim tumačenjem njegovih parametara, ograničenom varijacijom varijabli i činjenicom da se u većini slučajeva nelinearni oblici odnosa pretvaraju (logaritmom ili zamjenom varijabli) u linearni oblik za obavljanje proračuna. .
U slučaju linearne parne veze, jednačina regresije će imati oblik: y i =a+b·x i +u i . Parametri a i b ove jednačine su procijenjeni iz statističkih podataka posmatranja x i y. Rezultat takve procjene je jednadžba: , gdje su procjene parametara a i b, vrijednost rezultirajućeg atributa (varijable) dobivene iz jednačine regresije (izračunata vrijednost).

Najčešće se koristi za procjenu parametara metoda najmanjih kvadrata (LSM).
Metoda najmanjih kvadrata daje najbolje (dosljedne, efikasne i nepristrasne) procjene parametara regresione jednačine. Ali samo ako su ispunjene određene pretpostavke u vezi sa slučajnim članom (u) i nezavisnom varijablom (x) (vidi OLS pretpostavke).

Problem procjene parametara jednadžbe linearnog para metodom najmanjih kvadrata je kako slijedi: da se dobiju takve procjene parametara , , kod kojih je zbroj kvadrata odstupanja stvarnih vrijednosti rezultujuće karakteristike - y i od izračunatih vrijednosti - minimalan.
Formalno OLS kriterijum može se napisati ovako: .

Klasifikacija metoda najmanjih kvadrata

  1. Metoda najmanjih kvadrata.
  2. Metoda maksimalne vjerovatnoće (za normalan klasični model linearne regresije, postulira se normalnost reziduala regresije).
  3. Generalizirana metoda najmanjih kvadrata OLS se koristi u slučaju autokorelacije grešaka iu slučaju heteroskedastičnosti.
  4. Metoda ponderiranih najmanjih kvadrata ( poseban slučaj OLS sa heteroskedastičnim rezidualima).

Hajde da ilustrujemo poentu klasična metoda najmanjih kvadrata grafički. Da bismo to uradili, konstruisaćemo dijagram raspršenja na osnovu podataka posmatranja (x i, y i, i=1; n) u pravougaonom koordinatnom sistemu (takav dijagram raspršenja naziva se korelaciono polje). Pokušajmo odabrati pravu liniju koja je najbliža tačkama korelacionog polja. Prema metodi najmanjih kvadrata, linija se bira tako da zbir kvadrata vertikalnih udaljenosti između tačaka korelacionog polja i ove prave bude minimalan.

Matematička notacija za ovaj problem: .
Vrijednosti y i i x i =1...n su nam poznati; U S funkciji predstavljaju konstante. Varijable u ovoj funkciji su potrebne procjene parametara - , . Da bismo pronašli minimum funkcije dvije varijable, potrebno je izračunati parcijalne izvode ove funkcije za svaki od parametara i izjednačiti ih sa nulom, tj. .
Kao rezultat, dobijamo sistem od 2 normalne linearne jednadžbe:
Rješavajući ovaj sistem, nalazimo potrebne procjene parametara:

Ispravnost proračuna parametara regresione jednačine može se provjeriti poređenjem iznosa (može doći do neslaganja zbog zaokruživanja proračuna).
Da biste izračunali procjene parametara, možete napraviti tabelu 1.
Znak koeficijenta regresije b ukazuje na smjer odnosa (ako je b >0, odnos je direktan, ako je b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Formalno, vrijednost parametra a je prosječna vrijednost y sa x jednakim nuli. Ako faktor-atribut nema i ne može imati nultu vrijednost, onda gornja interpretacija parametra a nema smisla.

Procjena bliskosti odnosa između karakteristika izvršeno korišćenjem koeficijenta linearne parne korelacije - r x,y. Može se izračunati pomoću formule: . Osim toga, koeficijent korelacije linearnog para može se odrediti preko koeficijenta regresije b: .
Raspon prihvatljivih vrijednosti koeficijenta linearne korelacije para je od –1 do +1. Znak koeficijenta korelacije ukazuje na smjer odnosa. Ako je r x, y >0, onda je veza direktna; ako je r x, y<0, то связь обратная.
Ako je ovaj koeficijent po veličini blizu jedinice, onda se odnos između karakteristika može tumačiti kao prilično blizak linearni. Ako je njegov modul jednak jednom ê r x , y ê =1, tada je odnos između karakteristika funkcionalno linearan. Ako su karakteristike x i y linearno nezavisne, tada je r x,y blizu 0.
Za izračunavanje r x,y možete koristiti i tabelu 1.

Da biste procijenili kvalitetu rezultirajuće regresione jednačine, izračunajte teoretski koeficijent determinacije - R 2 yx:

,
gdje je d 2 varijansa y objašnjena jednadžbom regresije;
e 2 - rezidualna (neobjašnjena jednadžbom regresije) varijansa y;
s 2 y - ukupna (ukupna) varijansa y.
Koeficijent determinacije karakteriše udio varijacije (disperzije) rezultujućeg atributa y objašnjen regresijom (i, posljedično, faktorom x) u ukupnoj varijaciji (disperziji) y. Koeficijent determinacije R 2 yx ima vrijednosti od 0 do 1. Shodno tome, vrijednost 1-R 2 yx karakterizira udio varijanse y uzrokovane utjecajem drugih faktora koji nisu uzeti u obzir u modelu i greškama u specifikaciji.
Sa uparenom linearnom regresijom, R 2 yx =r 2 yx.