Zavisnost, stohastička. Funkcionalne i stohastičke veze Funkcionalna veza i stohastička zavisnost

Stohastička empirijska zavisnost

Zavisnost između slučajnih varijabli naziva se stohastička zavisnost. Ona se manifestuje u promeni zakona distribucije jednog od njih (zavisne varijable) kada se drugi (argumenti) promene.

Grafički stohastička empirijska zavisnost, u koordinatnom sistemu zavisna varijabla - argumenti, je skup nasumično lociranih tačaka koji odražavaju opštu tendenciju ponašanja zavisne varijable kada se argumenti promene.

Stohastička empirijska ovisnost o jednom argumentu naziva se ovisnost o paru; Primjer parne sobe linearna zavisnost prikazano na sl. 1.()

Rice. 1.

Za razliku od uobičajene funkcionalne zavisnosti, u kojoj promjene vrijednosti argumenta (ili nekoliko argumenata) odgovaraju promjeni determinističke zavisne varijable, u stohastičkoj ovisnosti dolazi do promjene statističke distribucije slučajne zavisne varijable, posebno , matematičko očekivanje.

Problem matematičkog modeliranja (aproksimacije).

Konstrukcija stohastičke zavisnosti se drugačije naziva matematičko modeliranje(aproksimacija) ili aproksimacija i sastoji se u pronalaženju njenog matematičkog izraza (formule).

Empirijski utvrđena formula (funkcija), koja odražava ne uvijek poznat, ali objektivno postojeći istinit odnos i odgovara osnovnom, stabilnom, ponavljajućem odnosu između objekata, pojava ili njihovih svojstava, smatra se matematičkim modelom.

Stabilan odnos stvari i njihova istinska zavisnost. bez obzira da li je modeliran ili ne, on postoji objektivno, ima matematički izraz i smatra se zakonom ili njegovom posljedicom.

Ako je poznat odgovarajući zakon ili posljedica iz njega, onda ih je prirodno smatrati željenom analitičkom ovisnošću. Na primjer, empirijska ovisnost jačine struje I u naponskom kolu U i otpornost na opterećenje R proizilazi iz Ohmovog zakona:

Nažalost, prava zavisnost varijabli u velikoj većini slučajeva je a priori nepoznata, pa postoji potreba da se ona detektuje na osnovu opštih razmatranja i teorijskih koncepata, odnosno konstruisanja matematičkog modela obrasca o kome je reč. Uzima se u obzir da date varijable i njihovi priraštaji na pozadini slučajnih fluktuacija odražavaju matematička svojstvaželjenu pravu zavisnost (ponašanje tangenta, ekstrema, korijena, asimptota, itd.)

Aproksimirajuća funkcija koja je odabrana na ovaj ili onaj način izglađuje (prosječuje) slučajne fluktuacije u početnim empirijskim vrijednostima zavisne varijable i, potiskujući na taj način slučajnu komponentu, aproksimacija je regularnoj komponenti i, prema tome, željena prava zavisnost.

Matematički model empirijske zavisnosti ima teorijski i praktični značaj:

· omogućava vam da utvrdite adekvatnost eksperimentalnih podataka jednom ili drugom poznatom zakonu i identifikujete nove obrasce;

· rješava za zavisnu varijablu problem interpolacije unutar zadanog intervala vrijednosti argumenata i predviđanja (ekstrapolacije) izvan intervala.

Međutim, uprkos velikom teorijskom interesu pronalaženja matematičke formule za zavisnost veličina, u praksi je često dovoljno samo utvrditi postoji li veza između njih i kolika je njena snaga.

Zadatak korelacione analize

Metoda za proučavanje odnosa između promjenjivih veličina je analiza korelacije.

Ključni koncept korelacione analize koji opisuje odnos između varijabli je korelacija (od engleskog korelacija - koordinacija, veza, odnos, odnos, međuzavisnost).

Korelaciona analiza se koristi za otkrivanje stohastičke zavisnosti i procenu njene jačine (značajnosti) na osnovu veličine koeficijenata korelacije i korelacionog odnosa.

Ako se pronađe odnos između varijabli, onda se kaže da je korelacija prisutna ili da su varijable u korelaciji.

Indikatori bliskosti veze (koeficijent korelacije, odnos korelacije) po modulu variraju od 0 (u odsustvu veze) do 1 (u slučaju degeneracije stohastičke zavisnosti u funkcionalnu).

Stohastički odnos se smatra značajnom (stvarnom) ako je apsolutna procjena koeficijenta korelacije (korelacijski odnos) značajna, odnosno 2-3 veća od standardne devijacije procjene koeficijenta.

Imajte na umu da se u nekim slučajevima može pronaći veza između pojava koje nisu u očiglednoj uzročno-posljedičnoj vezi.

Na primjer, za neka ruralna područja utvrđena je direktna stohastička veza između broja roda koje se gnijezde i rođene djece. Proljetni broj roda omogućava predviđanje koliko će djece biti rođeno ove godine, ali ovisnost, naravno, ne dokazuje dobro poznato vjerovanje, već se objašnjava paralelnim procesima:

· rođenju djece obično prethodi formiranje i osnivanje novih porodica seoske kuće i salaši;

· širenje mogućnosti gniježđenja privlači ptice i povećava njihov broj.

Takva korelacija između karakteristika naziva se lažna (imaginarna) korelacija, iako može imati praktični značaj.

Uzimajući u obzir zavisnost između karakteristika, prvo istaknemo zavisnost između promena faktora i rezultantnih karakteristika, kada veoma specifična vrednost faktorske karakteristike odgovara mnogim mogućim vrednostima efektivne karakteristike. Drugim riječima, svaka vrijednost jedne varijable odgovara određenoj (uslovnoj) distribuciji druge varijable. Ova zavisnost se zove stohastički. Pojava koncepta stohastičke zavisnosti je posledica činjenice da je na zavisnu varijablu pod uticajem niza nekontrolisanih ili neobračunatih faktora, kao i činjenice da su promene vrednosti varijabli neizbežno praćene nekim slučajnim greškama. Primjer stohastičkog odnosa je ovisnost prinosa poljoprivrednih kultura Y od mase primenjenih đubriva X. Ne možemo precizno predvideti prinos, jer na njega utiču mnogi faktori (padavine, sastav zemljišta, itd.). Međutim, očigledno je da će se sa promenom mase đubriva promeniti i prinos.

U statistici se proučavaju uočene vrijednosti karakteristika, pa se obično naziva stohastička ovisnost statistička zavisnost.

Zbog dvosmislenosti statističkog odnosa između vrijednosti rezultantne karakteristike Y i vrijednosti faktorske karakteristike X, interesantna je shema ovisnosti prosječne po X, tj. obrazac izražen uslovnim matematičkim očekivanjem M(Y/X = x)(izračunato sa fiksnom vrijednošću faktorske karakteristike X = x). Zavisnosti ove vrste se nazivaju regresija, a funkcija sr(h) = M(Y/X = x) - funkcija regresije Y on X ili prognoza Y By X(oznaka y x= f(l)). U isto vrijeme, efektivni znak Y takođe pozvan funkcija odgovora ili objašnjeno, izlaz, rezultanta, endogena varijabla i znak faktora X - regresor ili eksplanatorna, ulazna, prediktivna, prediktorska, egzogena varijabla.

U Odjeljku 4.7 je dokazano da je uvjetno matematičko očekivanje M(Y/X) = sr(h) daje najbolju prognozu Y od X u srednjem kvadratnom smislu, tj. M(Y- f(x)) 2 M(Y-g(x)) 2, gdje je g(x) - bilo koja druga UPOH prognoza.

Dakle, regresija je jednosmjerni statistički odnos koji uspostavlja korespondenciju između karakteristika. U zavisnosti od broja faktorskih karakteristika koje opisuju pojavu, postoje parna soba I višestruko regresija. Na primjer, regresija u paru je regresija između troškova proizvodnje (faktorska karakteristika X) i obima proizvoda koje preduzeće proizvodi (rezultativna karakteristika Y). Višestruka regresija je regresija između produktivnosti rada (rezultativna karakteristika Y) i stepena mehanizacije proizvodnih procesa, radnih sati, materijalnog intenziteta i kvalifikacija radnika (faktorske karakteristike X t, X 2, X 3, X 4).

Odlikuju se oblikom linearno I nelinearni regresija, tj. regresije izražene linearnim i nelinearnim funkcijama.

Na primjer, f(X) = Oh + Kommersant - uparena linearna regresija; f(X) = aX 2 + + bx + sa - kvadratna regresija; f(X 1? X 2,..., X str) = p 0 4- fi(X(+ p 2 X 2 + ... + p„X w - višestruka linearna regresija.

Problem identifikovanja statističke zavisnosti ima dve strane: uspostavljanje nepropusnost (snaga) veze i definicija oblici komunikacije.

Posvećen uspostavljanju bliskosti (snage) komunikacije korelacione analize, čija je svrha da se na osnovu dostupnih statističkih podataka dobiju odgovori na sljedeća osnovna pitanja:

  • kako odabrati odgovarajući statistički merač veze (koeficijent korelacije, koeficijent korelacije, koeficijent korelacije ranga, itd.);
  • kako testirati hipotezu da rezultirajuća numerička vrijednost mjerača odnosa zaista ukazuje na prisustvo statističke veze.

Određuje oblik komunikacije regresiona analiza. U ovom slučaju, svrha regresione analize je rješavanje sljedećih problema na osnovu dostupnih statističkih podataka:

  • odabir vrste regresijske funkcije (izbor modela);
  • pronalaženje nepoznatih parametara odabrane regresijske funkcije;
  • analiza kvaliteta funkcije regresije i provjera adekvatnosti jednačine empirijskim podacima;
  • predviđanje nepoznatih vrijednosti rezultantne karakteristike na osnovu datih vrijednosti faktorskih karakteristika.

Na prvi pogled može izgledati da je koncept regresije sličan konceptu korelacije, budući da je u oba slučaja riječ o statističkoj zavisnosti između karakteristika koje se proučavaju. Međutim, u stvarnosti među njima postoje značajne razlike. Regresija podrazumijeva uzročnu vezu kada se promjena u uslovnoj prosječnoj vrijednosti efektivne karakteristike javlja zbog promjene faktorskih karakteristika. Korelacija ne govori ništa o uzročno-posledičnoj vezi između karakteristika, tj. ako postoji korelacija između X i Y, onda ova činjenica ne znači da se mijenjaju vrijednosti X odrediti promjenu uslovne prosječne vrijednosti Y. Korelacija jednostavno navodi činjenicu da promjene jedne vrijednosti, u prosjeku, koreliraju sa promjenama u drugoj.

Teorija vjerovatnoće se često doživljava kao grana matematike koja se bavi „računom vjerovatnoća“.

I sva ova kalkulacija zapravo se svodi na jednostavnu formulu:

« Vjerovatnoća bilo kojeg događaja jednaka je zbiru vjerovatnoća elementarnih događaja uključenih u njega" U praksi, ova formula ponavlja "čaroliju" koja nam je poznata od djetinjstva:

« Masa objekta jednaka je zbiru masa njegovih sastavnih dijelova».

Ovdje ćemo raspravljati o ne tako trivijalnim činjenicama iz teorije vjerovatnoće. Razgovaraćemo, pre svega, o zavisan I nezavisni događaji.

Važno je shvatiti da isti pojmovi u različitim granama matematike mogu imati potpuno različita značenja.

Na primjer, kada kažu da je površina kruga S zavisi od njegovog radijusa R, onda, naravno, mislimo na funkcionalnu zavisnost

Koncepti zavisnosti i nezavisnosti imaju potpuno drugačije značenje u teoriji verovatnoće.

Počnimo se upoznavati s ovim konceptima jednostavnim primjerom.

Zamislite da u ovoj prostoriji provodite eksperiment bacanja kocke, a vaš kolega u susjednoj sobi također baca novčić. Pretpostavimo da ste zainteresovani za događaj A – vaš kolega dobija “dvojku” i događaj B – vaš kolega dobija “repove”. Zdrav razum upiti: ovi događaji su nezavisni!

Iako još nismo uveli koncept zavisnosti/nezavisnosti, intuitivno je jasno da svaka razumna definicija nezavisnosti mora biti osmišljena tako da ovi događaji budu definisani kao nezavisni.

Sada se okrenimo drugom eksperimentu. Bačena je kocka, događaj A je dvojka, a događaj B je neparan broj bodova. Uz pretpostavku da je kost simetrična, možemo odmah reći da je P(A) = 1/6. Sada zamislite da vam kažu: "Kao rezultat eksperimenta, dogodio se događaj B, pao je neparan broj bodova." Šta sada možemo reći o vjerovatnoći događaja A? Jasno je da je sada ta vjerovatnoća postala nula.

Najvažnije nam je da ona promijenio.

Vraćajući se na prvi primjer, možemo reći informaciječinjenica da se događaj B dogodio u susjednoj prostoriji neće ni na koji način utjecati na vaše ideje o vjerovatnoći događaja A. Ova vjerovatnoća neće se promeniti iz činjenice da ste naučili nešto o događaju B.

Dolazimo do prirodnog i izuzetno važnog zaključka -

ako informacije da je događaj IN dogodilo mijenja vjerovatnoću događaja A , zatim događaji A I IN treba smatrati zavisnim, a ako se ne mijenja, onda nezavisnim.

Ovim razmatranjima treba dati matematički oblik, zavisnost i nezavisnost događaja treba odrediti pomoću formula.

Nastavit ćemo od sljedeće teze: „Ako su A i B zavisni događaji, onda događaj A sadrži informacije o događaju B, a događaj B sadrži informacije o događaju A.” Kako možete saznati da li je sadržano ili ne? Odgovor na ovo pitanje daje teorija informacije.

Od teorije informacija potrebna nam je samo jedna formula koja nam omogućava da izračunamo količinu međusobnih informacija I(A, B) za događaje A i B

Nećemo izračunavati količinu informacija za različite događaje niti ćemo detaljno raspravljati o ovoj formuli.

Za nas je važno da ako

tada je količina međusobnih informacija između događaja A i B jednaka nuli - događaji A i B nezavisni. Ako

tada je količina međusobnih informacija događaji A i B zavisan.

Apel na koncept informacije je ovdje pomoćne prirode i, kako nam se čini, omogućava nam da koncepte ovisnosti i nezavisnosti događaja učinimo opipljivijim.

U teoriji vjerovatnoće, zavisnost i nezavisnost događaja se opisuje formalnije.

Prije svega, potreban nam je koncept uslovna verovatnoća.

Uslovna verovatnoća događaja A, pod uslovom da se desio događaj B (P(B) ≠0), naziva se vrednost P(A|B), izračunata po formuli

.

Prateći duh našeg pristupa razumijevanju zavisnosti i nezavisnosti događaja, možemo očekivati ​​da će uslovna vjerovatnoća imati sljedeće svojstvo: ako događaji A i B nezavisni , To

To znači da informacija da se dogodio događaj B nema utjecaja na vjerovatnoću događaja A.

Tako je!

Ako su događaji A i B nezavisni, onda

Za nezavisne događaje A i B imamo

I


Osnovna ideja sa kojom se suočava istraživač društveno-ekonomskih procesa i pojava jeste razumevanje prirode odnosa između ekonomskih varijabli. Potražnja za određenim proizvodom koja se pojavljuje na tržištu smatra se funkcijom cijene, prinos na sredstva zavisi od stepena rizika ulaganja, potrošnja potrošača može biti funkcija prihoda.
U procesu statističke analize i predviđanja društveno-ekonomskih pojava potrebno je kvantitativno opisati najznačajnije odnose. Da bi se pouzdano odrazila suština i priroda pojava i procesa, treba identifikovati uzročno-posledične veze. Uzročnost je karakterizirana vremenskim slijedom uzroka i posljedice: uzrok uvijek prethodi posljedici. Međutim, radi ispravnog razumijevanja, slučajnosti događaja koji nemaju uzročno-posljedičnu vezu treba isključiti.
Mnogi društveno-ekonomski fenomeni predstavljaju rezultat istovremeno i kumulativno aktivni uzroci. U takvim slučajevima se odvajaju glavni razlozi od sporednih, nebitnih.
Postoje dvije vrste fenomena zavisnosti: funkcionalna, ili strogo deterministički, i statistički, ili stohastički deterministički. At funkcionalna zavisnost svaka vrijednost ne zavisan varijabla x jedinstveno odgovara vrlo specifičnoj vrijednosti zavisan varijabla y. Ovo zavisnost može se opisati kao jednakost y = f(x). Ovakav primjer zavisnosti mogu postojati zakoni mehanike koji važe za svaku pojedinačnu jedinicu populacije bez slučajnih odstupanja.
Statistički, ili stohastička zavisnost, manifestuje se samo u masovnim pojavama, sa veliki broj jedinice stanovništva. At stohastički nema zavisnosti za date vrednosti zavisan varijabla x može ukazivati ​​na niz vrijednosti y, nasumično raspoređenih u intervalu. Svaka fiksna vrijednost argumenta odgovara određenoj statističkoj distribuciji vrijednosti funkcije. To je zbog činjenice da zavisan na varijablu, pored odabrane varijable x, utiču i drugi nekontrolisani ili neobračunati faktori, kao i činjenica da su greške merenja superponirane. (2, str. 12). Pošto vrednosti zavisan varijable su podložne slučajnom rasipanju, ne mogu se predvideti sa dovoljnom tačnošću, već samo naznačene sa određenom verovatnoćom. Pojavne vrijednosti zavisan varijable su realizacije slučajne varijable.
Jednostrano stohastička zavisnost jedna slučajna varijabla iz druge ili nekoliko drugih slučajnih varijabli smatra se regresijom. Funkcija koja izražava jednostrano stohastička zavisnost, naziva se funkcija regresije ili jednostavno regresija.
Postoji razlika između funkcionalna zavisnost i regresija. Osim toga, varijabla x at funkcionalna zavisnost^=f(x) u potpunosti određuje vrijednost funkcije^, funkcija je invertibilna, tj. postoji inverzna funkcija x = f(y). Funkcija regresije nema ovo svojstvo. Samo u ekstremnom slučaju kada stohastička zavisnost ulazi u funkcionalna zavisnost, Možete ići od jedne regresijske jednadžbe do druge.
Formalizacija tipa regresione jednadžbe je neadekvatna za svrhe vezane za mjerenja u ekonomiji i za analizu pojedinih oblika. zavisnosti između varijabli. Rješenje ovakvih problema postaje moguće kao rezultat uvođenja u ekonomske odnose stohastičkičlan:
Prilikom studiranja zavisnosti Treba imati na umu da funkcija regresije samo formalno uspostavlja korespondenciju između varijabli, dok one možda nisu u uzročno-posledičnoj vezi. U ovom slučaju, lažne regresije mogu nastati zbog slučajnih podudarnosti u varijacijama varijabli koje nemaju smisleno značenje. Stoga je kvalitativna analiza obavezan korak prije odabira regresijske jednačine zavisnosti između ne zavisan varijabla x i zavisan varijabla y, na osnovu preliminarnih hipoteza.

Neka je potrebno proučiti zavisnost i obje veličine se mjere u istim eksperimentima. Da bi se to postiglo, provodi se niz eksperimenata na različita značenja pokušavajući da ostale eksperimentalne uslove održe nepromijenjenima.

Mjerenje svake veličine sadrži slučajne greške (ovdje nećemo razmatrati sistematske greške); stoga su ove vrijednosti nasumične.

Prirodni odnos slučajnih varijabli naziva se stohastičkim. Razmotrićemo dva problema:

a) utvrditi da li postoji (sa određenom vjerovatnoćom) zavisnost od ili da li vrijednost ne zavisi od;

b) ako zavisnost postoji, opišite je kvantitativno.

Prvi zadatak se zove analiza varijanse, a ako se razmatra funkcija mnogih varijabli, onda multivarijantna analiza varijanse. Drugi zadatak se zove regresiona analiza. Ako su slučajne greške velike, onda mogu prikriti željenu ovisnost i možda je neće biti lako identificirati.

Dakle, dovoljno je kao parametar uzeti u obzir slučajnu varijablu ovisno o njoj. Matematičko očekivanje ove vrijednosti zavisi od toga da li je ta zavisnost željena i naziva se regresijskim zakonom.

Analiza varijanse. Hajde da izvršimo mali niz merenja za svaku vrednost i odredimo Razmotrimo dva načina obrade ovih podataka, što nam omogućava da istražimo postoji li značajna (tj. sa prihvaćenom verovatnoćom poverenja) zavisnost z od

U prvoj metodi, standardi uzorkovanja jednog mjerenja izračunavaju se za svaku seriju posebno i za cijeli skup mjerenja:

gdje je ukupan broj mjerenja, i

su prosječne vrijednosti za svaku seriju i za cijeli skup mjerenja.

Uporedimo varijansu skupa mjerenja sa varijansom pojedinačnih serija. Ako se pokaže da je na odabranom nivou pouzdanosti moguće izračunati za sve i, tada postoji zavisnost z od.

Ako nema pouzdanog viška, tada se ovisnost ne može detektirati (s obzirom na točnost eksperimenta i usvojenu metodu obrade).

Odstupanja se porede korišćenjem Fišerovog testa (30). Budući da je standard s određen ukupnim brojem mjerenja N, koji je obično prilično velik, gotovo uvijek možete koristiti Fisherove koeficijente date u tabeli 25.

Druga metoda analize je upoređivanje prosjeka različitih vrijednosti jedni s drugima. Vrijednosti su nasumične i nezavisne, a njihovi vlastiti standardi uzorkovanja su jednaki

Stoga se upoređuju prema šemi nezavisnih mjerenja opisanoj u paragrafu 3. Ako su razlike značajne, odnosno prelaze interval povjerenja, tada je utvrđena činjenica zavisnosti od; ako su razlike između sva 2 beznačajne, ovisnost se ne može otkriti.

Multivarijantna analiza ima neke karakteristike. Preporučljivo je izmjeriti vrijednost u čvorovima pravokutne mreže tako da je prikladnije proučavati ovisnost o jednom argumentu, fiksirajući drugi argument. Izvođenje serije mjerenja na svakom čvoru višedimenzionalne mreže je previše radno intenzivno. Dovoljno je izvršiti seriju mjerenja na nekoliko tačaka mreže da bi se procijenila disperzija jednog mjerenja; u drugim čvorovima možemo se ograničiti na pojedinačna mjerenja. Analiza varijanse se vrši prema prvoj metodi.

Napomena 1. Ako postoji mnogo mjerenja, onda u obje metode pojedinačna mjerenja ili serije mogu, sa primjetnom vjerovatnoćom, prilično jako odstupiti od svog matematičkog očekivanja. Ovo se mora uzeti u obzir pri odabiru vjerovatnoće pouzdanosti dovoljno blizu 1 (kao što je učinjeno pri postavljanju granica koje razdvajaju dozvoljene slučajne greške od grubih).

Regresiona analiza. Neka analiza varijanse pokaže da je zavisnost z od. Kako to kvantificirati?

Da bismo to učinili, aproksimiramo željenu ovisnost nekom funkcijom. Metodom pronalazimo optimalne vrijednosti parametara najmanjih kvadrata rješavanje problema

gdje su mjerne težine, odabrane obrnuto proporcionalno kvadratu greške mjerenja u datoj tački (tj. ). Ovaj problem je analiziran u poglavlju II, § 2. Ovdje ćemo se zadržati samo na onim karakteristikama koje su uzrokovane prisustvom velikih slučajnih grešaka.

Tip se bira ili iz teorijskih razmatranja o prirodi zavisnosti ili formalno, poređenjem grafa sa grafovima poznatih funkcija. Ako je formula odabrana iz teorijskih razmatranja i ispravno (sa teorijske točke gledišta) prenosi asimptotiku, tada obično omogućava ne samo dobro aproksimaciju skupa eksperimentalnih podataka, već i ekstrapolaciju pronađene ovisnosti na druge raspone vrijednosti. Formalno odabrana funkcija može na zadovoljavajući način opisati eksperiment, ali je rijetko prikladna za ekstrapolaciju.

Najlakše je riješiti problem (34) ako se radi o algebarskom polinomu. Međutim, takav formalni izbor funkcije rijetko se pokaže zadovoljavajućim. Tipično, dobre formule nelinearno zavise od parametara (transcendentalna regresija). Najpogodnije je konstruisati transcendentalnu regresiju odabirom takve zamene varijabli tako da zavisnost bude skoro linearna (videti Poglavlje II, § 1, paragraf 8). Tada ga je lako aproksimirati algebarskim polinomom: .

Izravnavanje varijabli traži se korištenjem teorijskih razmatranja i uzimajući u obzir asimptotiku. Nadalje ćemo pretpostaviti da je takva promjena već napravljena.

Napomena 2. Prilikom prelaska na nove varijable, problem metode najmanjih kvadrata (34) poprima oblik

gdje su nove težine povezane s originalnim odnosima

Stoga, čak i da su u originalnoj formulaciji (34) sva mjerenja imala istu točnost, ponderi za nivelmanske varijable neće biti isti.

Korelaciona analiza. Potrebno je provjeriti da li je zamjena varijabli zaista bila nivelirajuća, odnosno da li je zavisnost bliska linearnoj. Ovo se može uraditi izračunavanjem koeficijenta korelacije para

Lako je pokazati da je relacija uvijek zadovoljena

Ako je ovisnost strogo linearna (i ne sadrži slučajne greške), onda ili ovisno o predznaku nagiba prave linije. Što je manja, to zavisnost manje liči na linearnu. Stoga, ako je , a broj mjerenja N dovoljno velik, tada su varijable nivelmana odabrane na zadovoljavajući način.

Takvi zaključci o prirodi zavisnosti zasnovani na koeficijentima korelacije nazivaju se korelacionom analizom.

Korelaciona analiza ne zahteva niz merenja koje treba preduzeti u svakoj tački. Dovoljno je izvršiti jedno mjerenje u svakoj tački, ali zatim uzeti više tačaka na krivulji koja se proučava, što se često radi u fizičkim eksperimentima.

Napomena 3. Postoje kriterijumi blizine koji vam omogućavaju da naznačite da li je zavisnost praktično linearna. Ne zadržavamo se na njima, budući da će izbor stepena aproksimirajućeg polinoma biti razmatran u nastavku.

Napomena 4. Omjer ukazuje na odsustvo linearne zavisnosti, ali ne znači i na odsustvo bilo kakve zavisnosti. Dakle, ako na segmentu - onda

Optimalni polinom stepena a. Zamijenimo aproksimirajući polinom stepena u problem (35):

Tada optimalne vrijednosti parametara zadovoljavaju sistem linearne jednačine (2.43):

i nije ih teško pronaći. Ali kako odabrati stepen polinoma?

Da bismo odgovorili na ovo pitanje, vratimo se na originalne varijable i izračunajmo varijansu aproksimacijske formule sa pronađenim koeficijentima. Nepristrasna procjena ove varijanse je

Očigledno, kako se stepen polinoma povećava, disperzija (40) će se smanjiti: što se više koeficijenata uzme, to se eksperimentalne tačke mogu preciznije aproksimirati.