નિર્ભરતા, સ્ટોકેસ્ટિક. કાર્યાત્મક અને સ્ટોકેસ્ટિક જોડાણો કાર્યાત્મક જોડાણ અને સ્ટોકેસ્ટિક અવલંબન

સ્ટોકેસ્ટિક પ્રયોગમૂલક અવલંબન

રેન્ડમ ચલો વચ્ચેની અવલંબનને સ્ટોકેસ્ટિક અવલંબન કહેવામાં આવે છે. જ્યારે અન્ય (દલીલો) બદલાય છે ત્યારે તે તેમાંના એક (આશ્રિત ચલ) ના વિતરણ કાયદામાં ફેરફારમાં પોતાને પ્રગટ કરે છે.

કોઓર્ડિનેટ સિસ્ટમમાં ગ્રાફિકલી સ્ટોકેસ્ટિક પ્રયોગમૂલક અવલંબન આશ્રિત ચલ - દલીલો, એ અવ્યવસ્થિત રીતે સ્થિત બિંદુઓનો સમૂહ છે જે જ્યારે દલીલો બદલાય છે ત્યારે આશ્રિત ચલના વર્તનની સામાન્ય વૃત્તિને પ્રતિબિંબિત કરે છે.

એક દલીલ પર સ્ટોકેસ્ટિક પ્રયોગમૂલક અવલંબન કહેવામાં આવે છે જો ત્યાં એક કરતાં વધુ દલીલ હોય, તો તેને બહુપરિમાણીય અવલંબન કહેવામાં આવે છે. સ્ટીમ રૂમનું ઉદાહરણ રેખીય અવલંબનફિગમાં બતાવેલ છે. 1.()

ચોખા. 1.

સામાન્ય કાર્યાત્મક અવલંબનથી વિપરીત, જેમાં દલીલના મૂલ્યમાં ફેરફાર (અથવા અનેક દલીલો) નિર્ણાયક આધારિત ચલમાં ફેરફારને અનુરૂપ હોય છે, સ્ટોકેસ્ટિક અવલંબનમાં રેન્ડમ આશ્રિત ચલના આંકડાકીય વિતરણમાં ફેરફાર થાય છે, ખાસ કરીને , ગાણિતિક અપેક્ષા.

ગાણિતિક મોડેલિંગ (અંદાજે) સમસ્યા

સ્ટોકેસ્ટિક અવલંબનનું નિર્માણ અન્યથા કહેવાય છે ગાણિતિક મોડેલિંગ(અંદાજે) અથવા અંદાજ અને તેની ગાણિતિક અભિવ્યક્તિ (સૂત્ર) શોધવામાં સમાવે છે.

પ્રાયોગિક રીતે સ્થાપિત સૂત્ર (કાર્ય), જે હંમેશા જાણીતું નથી, પરંતુ નિરપેક્ષપણે અસ્તિત્વમાં રહેલા સાચા સંબંધને પ્રતિબિંબિત કરે છે અને વસ્તુઓ, ઘટના અથવા તેમના ગુણધર્મો વચ્ચેના મૂળભૂત, સ્થિર, પુનરાવર્તિત સંબંધને અનુરૂપ છે, તેને ગાણિતિક મોડેલ તરીકે ગણવામાં આવે છે.

વસ્તુઓનો સ્થિર સંબંધ અને તેમની સાચી અવલંબન. ભલે તે મોડેલ થયેલ હોય કે ન હોય, તે ઉદ્દેશ્ય રૂપે અસ્તિત્વમાં છે, તેની ગાણિતિક અભિવ્યક્તિ છે અને તેને કાયદો અથવા તેના પરિણામ તરીકે ગણવામાં આવે છે.

જો તેમાંથી યોગ્ય કાયદો અથવા પરિણામ જાણવામાં આવે, તો તેને ઇચ્છિત વિશ્લેષણાત્મક અવલંબન તરીકે ગણવામાં આવે તે સ્વાભાવિક છે. ઉદાહરણ તરીકે, વર્તમાન તાકાતની પ્રયોગમૂલક અવલંબન આઈવોલ્ટેજ સર્કિટમાં યુઅને લોડ પ્રતિકાર આરઓહ્મના કાયદામાંથી અનુસરે છે:

કમનસીબે, મોટા ભાગના કેસોમાં ચલોની સાચી અવલંબન એ પ્રાથમિકતા અજ્ઞાત છે, તેથી સામાન્ય વિચારણાઓ અને સૈદ્ધાંતિક ખ્યાલોના આધારે તેને શોધવાની જરૂર છે, એટલે કે, પ્રશ્નમાં પેટર્નનું ગાણિતિક મોડલ બનાવવું. તે ધ્યાનમાં લેવામાં આવે છે કે રેન્ડમ વધઘટની પૃષ્ઠભૂમિ સામે આપેલ ચલો અને તેમની વૃદ્ધિ પ્રતિબિંબિત કરે છે ગાણિતિક ગુણધર્મોઇચ્છિત સાચી અવલંબન (સ્પર્શકો, આત્યંતિક, મૂળ, એસિમ્પ્ટોટ્સ, વગેરેનું વર્તન)

અંદાજિત કાર્ય કે જે એક રીતે અથવા બીજી રીતે પસંદ કરવામાં આવે છે તે આશ્રિત ચલના પ્રારંભિક પ્રયોગમૂલક મૂલ્યોમાં (સરેરાશ) રેન્ડમ વધઘટને સરળ બનાવે છે અને, ત્યાંથી રેન્ડમ ઘટકને દબાવી દે છે, તે નિયમિત ઘટકનો અંદાજ છે અને તેથી, ઇચ્છિત સાચી નિર્ભરતા.

પ્રયોગમૂલક પરાધીનતાના ગાણિતિક મોડેલમાં સૈદ્ધાંતિક અને છે વ્યવહારુ મહત્વ:

· તમને એક અથવા બીજા જાણીતા કાયદામાં પ્રાયોગિક ડેટાની પર્યાપ્તતા સ્થાપિત કરવા અને નવા દાખલાઓ ઓળખવા માટે પરવાનગી આપે છે;

· આશ્રિત ચલ માટે દલીલ મૂલ્યોના આપેલ અંતરાલમાં પ્રક્ષેપણની સમસ્યા અને અંતરાલની બહાર અનુમાન (એક્સ્ટ્રાપોલેશન) ઉકેલે છે.

જો કે, જથ્થાઓની અવલંબન માટે ગાણિતિક સૂત્ર શોધવામાં મહાન સૈદ્ધાંતિક રસ હોવા છતાં, વ્યવહારમાં તે ઘણીવાર ફક્ત તે નક્કી કરવા માટે પૂરતું છે કે શું તેમની વચ્ચે જોડાણ છે અને તેની શક્તિ શું છે.

સહસંબંધ વિશ્લેષણનું કાર્ય

બદલાતી જથ્થાઓ વચ્ચેના સંબંધનો અભ્યાસ કરવાની પદ્ધતિ સહસંબંધ વિશ્લેષણ છે.

સહસંબંધ વિશ્લેષણનો મુખ્ય ખ્યાલ જે ચલો વચ્ચેના સંબંધનું વર્ણન કરે છે તે સહસંબંધ છે (અંગ્રેજીમાંથી સહસંબંધ - સંકલન, જોડાણ, સંબંધ, સંબંધ, પરસ્પર નિર્ભરતા).

સહસંબંધ વિશ્લેષણનો ઉપયોગ સ્ટોકેસ્ટિક અવલંબન શોધવા અને સહસંબંધ ગુણાંક અને સહસંબંધ ગુણોત્તરની તીવ્રતા દ્વારા તેની શક્તિ (મહત્વ)નું મૂલ્યાંકન કરવા માટે થાય છે.

જો ચલો વચ્ચે સંબંધ જોવા મળે છે, તો સહસંબંધ હાજર હોવાનું કહેવાય છે અથવા ચલો સહસંબંધિત છે.

જોડાણની નિકટતાના સૂચકાંકો (સહસંબંધ ગુણાંક, સહસંબંધ ગુણોત્તર) મોડ્યુલો 0 (કનેક્શનની ગેરહાજરીમાં) થી 1 સુધી (સ્ટોકેસ્ટિક અવલંબનના કાર્યાત્મકમાં અધોગતિના કિસ્સામાં) બદલાય છે.

સ્ટોકેસ્ટિક સંબંધ નોંધપાત્ર (વાસ્તવિક) ગણવામાં આવે છે જો સહસંબંધ ગુણાંક (સંબંધ ગુણોત્તર) નો ચોક્કસ અંદાજ નોંધપાત્ર હોય, એટલે કે, ગુણાંક અંદાજના પ્રમાણભૂત વિચલન કરતા 2-3 વધારે હોય.

નોંધ કરો કે કેટલાક કિસ્સાઓમાં અસાધારણ ઘટના વચ્ચે જોડાણ શોધી શકાય છે જે સ્પષ્ટ કારણ-અને-અસર સંબંધોમાં નથી.

ઉદાહરણ તરીકે, કેટલાક ગ્રામીણ વિસ્તારો માટે, માળો બનાવતા સ્ટોર્ક અને જન્મેલા બાળકોની સંખ્યા વચ્ચે સીધો સ્ટોકેસ્ટિક સંબંધ ઓળખવામાં આવ્યો છે. સ્ટોર્કની વસંત ગણતરી આ વર્ષે કેટલા બાળકોનો જન્મ થશે તેની આગાહી કરવાનું શક્ય બનાવે છે, પરંતુ અવલંબન, અલબત્ત, જાણીતી માન્યતાને સાબિત કરતું નથી, અને સમાંતર પ્રક્રિયાઓ દ્વારા સમજાવવામાં આવે છે:

· બાળકોનો જન્મ સામાન્ય રીતે સ્થાપના સાથે નવા પરિવારોની રચના અને સ્થાપના દ્વારા થાય છે ગ્રામીણ ઘરોઅને ફાર્મસ્ટેડ્સ;

· માળાની તકો વિસ્તરવાથી પક્ષીઓ આકર્ષે છે અને તેમની સંખ્યામાં વધારો કરે છે.

લાક્ષણિકતાઓ વચ્ચેના આવા સહસંબંધને ખોટા (કાલ્પનિક) સહસંબંધ કહેવાય છે, જો કે તેનું વ્યવહારિક મહત્વ હોઈ શકે છે.

લાક્ષણિકતાઓ વચ્ચેની અવલંબનને ધ્યાનમાં લેતા, ચાલો આપણે પ્રથમ પરિબળ અને પરિણામી લાક્ષણિકતાઓ વચ્ચેની અવલંબનને પ્રકાશિત કરીએ, જ્યારે કારણભૂત લાક્ષણિકતાનું ખૂબ ચોક્કસ મૂલ્ય અસરકારક લાક્ષણિકતાના ઘણા સંભવિત મૂલ્યોને અનુરૂપ હોય. બીજા શબ્દોમાં કહીએ તો, એક ચલનું દરેક મૂલ્ય બીજા ચલના ચોક્કસ (શરતી) વિતરણને અનુરૂપ છે. આ અવલંબન કહેવાય છે સ્ટોકેસ્ટિકસ્ટોકેસ્ટિક અવલંબનની વિભાવનાનો ઉદભવ એ હકીકતને કારણે છે કે આશ્રિત ચલ સંખ્યાબંધ અનિયંત્રિત અથવા બિનહિસાબી પરિબળોથી પ્રભાવિત છે, તેમજ હકીકત એ છે કે ચલોના મૂલ્યોમાં ફેરફાર અનિવાર્યપણે કેટલીક રેન્ડમ ભૂલો સાથે છે. સ્ટોકેસ્ટિક સંબંધનું ઉદાહરણ એ કૃષિ પાકની ઉપજની અવલંબન છે વાયલાગુ ખાતરોના સમૂહમાંથી એક્સ.અમે ઉપજની ચોક્કસ આગાહી કરી શકતા નથી, કારણ કે તે ઘણા પરિબળો (વરસાદ, જમીનની રચના, વગેરે) દ્વારા પ્રભાવિત છે. જો કે, તે સ્વાભાવિક છે કે ખાતરોના સમૂહમાં ફેરફાર સાથે, ઉપજ પણ બદલાશે.

આંકડાઓમાં, લાક્ષણિકતાઓના અવલોકન કરેલ મૂલ્યોનો અભ્યાસ કરવામાં આવે છે, તેથી સ્ટોકેસ્ટિક અવલંબનને સામાન્ય રીતે કહેવામાં આવે છે આંકડાકીય અવલંબન.

પરિણામી લાક્ષણિકતા Y ના મૂલ્યો અને પરિબળ લાક્ષણિકતા X ના મૂલ્યો વચ્ચેના આંકડાકીય સંબંધની અસ્પષ્ટતાને લીધે, X પર સરેરાશ નિર્ભરતા યોજના વ્યાજની છે, એટલે કે. શરતી ગાણિતિક અપેક્ષા દ્વારા દર્શાવવામાં આવેલ પેટર્ન M(Y/X = x)(પરિબળ લાક્ષણિકતાના નિશ્ચિત મૂલ્ય સાથે ગણવામાં આવે છે X = x). આ પ્રકારની અવલંબન કહેવામાં આવે છે રીગ્રેશન, અને ફંક્શન ср(х) = M(Y/X = x) - રીગ્રેશન ફંક્શન Yપર એક્સઅથવા આગાહી Yદ્વારા એક્સ(હોદ્દો y x= f(l)). તે જ સમયે, અસરકારક સંકેત વાયપણ કહેવાય છે પ્રતિભાવ કાર્યઅથવા સમજાવાયેલ, આઉટપુટ, પરિણામી, અંતર્જાત ચલ, અને પરિબળ ચિહ્ન એક્સ - રીગ્રેસરઅથવા સમજૂતીત્મક, ઇનપુટ, આગાહીયુક્ત, આગાહી કરનાર, એક્ઝોજેનસ ચલ.

વિભાગ 4.7 માં તે સાબિત થયું હતું કે શરતી ગાણિતિક અપેક્ષા M(Y/X) =ср(х) રૂટ-મીન-ચોરસ અર્થમાં X થી Y ની શ્રેષ્ઠ આગાહી આપે છે, એટલે કે. M(Y- f(x)) 2 M(Y-g(x)) 2, ક્યાં g(x) -કોઈપણ અન્ય UPOH આગાહી.

તેથી, રીગ્રેસન એ એક-માર્ગીય આંકડાકીય સંબંધ છે જે લાક્ષણિકતાઓ વચ્ચે પત્રવ્યવહાર સ્થાપિત કરે છે. ઘટનાનું વર્ણન કરતી પરિબળ લાક્ષણિકતાઓની સંખ્યાના આધારે, ત્યાં છે વરાળ રૂમઅને બહુવિધરીગ્રેશન ઉદાહરણ તરીકે, પેરવાઈઝ રીગ્રેસન એ ઉત્પાદન ખર્ચ (પરિબળ લાક્ષણિકતા X) અને એન્ટરપ્રાઈઝ દ્વારા ઉત્પાદિત ઉત્પાદનોના વોલ્યુમ (પરિણામી લાક્ષણિકતા Y) વચ્ચેનું રીગ્રેસન છે. મલ્ટિપલ રીગ્રેસન એ શ્રમ ઉત્પાદકતા (પરિણામાત્મક લાક્ષણિકતા Y) અને ઉત્પાદન પ્રક્રિયાઓના યાંત્રીકરણના સ્તર, કામના કલાકો, સામગ્રીની તીવ્રતા અને કામદારોની લાયકાતો (પરિબળ લાક્ષણિકતાઓ X t, X 2, X 3, X 4) વચ્ચેનું રીગ્રેશન છે.

તેઓ આકાર દ્વારા અલગ પડે છે રેખીયઅને બિનરેખીયરીગ્રેશન, એટલે કે રેખીય અને બિનરેખીય કાર્યો દ્વારા દર્શાવવામાં આવેલ રીગ્રેસન.

ઉદાહરણ તરીકે, f(X) = ઓહ + કોમર્સન્ટ -જોડી રેખીય રીગ્રેસન; f(X) = aX 2 + + bx + સાથે -ચતુર્ભુજ રીગ્રેસન; f(X 1? X 2,..., એક્સ પી) = પી 0 4- fi(X(+ p 2 X 2 + ... + p„X w - બહુવિધ રેખીય રીગ્રેશન.

આંકડાકીય અવલંબનને ઓળખવાની સમસ્યાની બે બાજુઓ છે: સ્થાપના જોડાણની ચુસ્તતા (તાકાત).અને વ્યાખ્યા સંદેશાવ્યવહારના સ્વરૂપો.

સંચારની નિકટતા (તાકાત) સ્થાપિત કરવા માટે સમર્પિત સહસંબંધ વિશ્લેષણ, જેનો હેતુ, ઉપલબ્ધ આંકડાકીય માહિતીના આધારે, નીચેના મૂળભૂત પ્રશ્નોના જવાબો મેળવવાનો છે:

  • યોગ્ય આંકડાકીય જોડાણ મીટર કેવી રીતે પસંદ કરવું (સહસંબંધ ગુણાંક, સહસંબંધ ગુણોત્તર, ક્રમ સહસંબંધ ગુણાંક, વગેરે);
  • અનુમાનને કેવી રીતે ચકાસવું કે સંબંધ મીટરનું પરિણામી સંખ્યાત્મક મૂલ્ય ખરેખર આંકડાકીય સંબંધની હાજરી સૂચવે છે.

સંચારનું સ્વરૂપ નક્કી કરે છે રીગ્રેસન વિશ્લેષણ.આ કિસ્સામાં, રીગ્રેસન વિશ્લેષણનો હેતુ ઉપલબ્ધ આંકડાકીય માહિતીના આધારે નીચેની સમસ્યાઓ હલ કરવાનો છે:

  • રીગ્રેશન ફંક્શનનો પ્રકાર પસંદ કરી રહ્યા છીએ (મોડેલ પસંદગી);
  • પસંદ કરેલ રીગ્રેશન ફંક્શનના અજાણ્યા પરિમાણો શોધવા;
  • રીગ્રેસન કાર્યની ગુણવત્તાનું વિશ્લેષણ અને પ્રયોગમૂલક ડેટા માટે સમીકરણની પર્યાપ્તતાની ચકાસણી;
  • પરિબળ લાક્ષણિકતાઓના આપેલ મૂલ્યોના આધારે પરિણામી લાક્ષણિકતાના અજાણ્યા મૂલ્યોની આગાહી.

પ્રથમ નજરમાં, એવું લાગે છે કે રીગ્રેસનની વિભાવના સહસંબંધની વિભાવના જેવી જ છે, કારણ કે બંને કિસ્સાઓમાં આપણે અભ્યાસ કરવામાં આવતી લાક્ષણિકતાઓ વચ્ચે આંકડાકીય અવલંબન વિશે વાત કરી રહ્યા છીએ. જો કે, વાસ્તવમાં તેમની વચ્ચે નોંધપાત્ર તફાવત છે. જ્યારે પરિબળની લાક્ષણિકતાઓમાં ફેરફારને કારણે અસરકારક લાક્ષણિકતાના શરતી સરેરાશ મૂલ્યમાં ફેરફાર થાય છે ત્યારે રીગ્રેશન એક કારણભૂત સંબંધ સૂચવે છે. સહસંબંધ લક્ષણો વચ્ચેના સાધક સંબંધ વિશે કશું કહેતું નથી, એટલે કે. જો વચ્ચે સહસંબંધ હોય એક્સઅને Y, તો પછી આ હકીકતનો અર્થ એ નથી કે મૂલ્યોમાં ફેરફાર થાય છે એક્સ Y ના શરતી સરેરાશ મૂલ્યમાં ફેરફાર નક્કી કરો. સહસંબંધ એ હકીકતને સરળ રીતે જણાવે છે કે એક મૂલ્યમાં ફેરફાર, સરેરાશ, બીજામાં થતા ફેરફારો સાથે સંબંધ ધરાવે છે.

સંભાવના સિદ્ધાંતને ગણિતની એક શાખા તરીકે ગણવામાં આવે છે જે "સંભાવનાઓની ગણતરી" સાથે કામ કરે છે.

અને આ બધી ગણતરી વાસ્તવમાં એક સરળ સૂત્ર પર આવે છે:

« કોઈપણ ઘટનાની સંભાવના તેમાં સમાવિષ્ટ પ્રાથમિક ઘટનાઓની સંભાવનાઓના સરવાળા જેટલી હોય છે." વ્યવહારમાં, આ સૂત્ર "જોડણી" નું પુનરાવર્તન કરે છે જે બાળપણથી આપણને પરિચિત છે:

« પદાર્થનું દળ તેના ઘટક ભાગોના સમૂહના સરવાળા જેટલું હોય છે».

અહીં આપણે સંભાવના સિદ્ધાંતમાંથી એટલા તુચ્છ તથ્યોની ચર્ચા કરીશું નહીં. અમે વાત કરીશું, સૌ પ્રથમ, વિશે આશ્રિતઅને સ્વતંત્રઘટનાઓ

તે સમજવું અગત્યનું છે કે ગણિતની વિવિધ શાખાઓમાં સમાન શબ્દોનો અર્થ સંપૂર્ણપણે અલગ હોઈ શકે છે.

ઉદાહરણ તરીકે, જ્યારે તેઓ કહે છે કે વર્તુળનો વિસ્તાર એસતેની ત્રિજ્યા પર આધાર રાખે છે આર, તો, અલબત્ત, અમારો અર્થ કાર્યાત્મક અવલંબન છે

પરાધીનતા અને સ્વતંત્રતાની વિભાવનાઓ સંભાવના સિદ્ધાંતમાં સંપૂર્ણપણે અલગ અર્થ ધરાવે છે.

ચાલો એક સરળ ઉદાહરણ સાથે આ ખ્યાલોથી પરિચિત થવાનું શરૂ કરીએ.

કલ્પના કરો કે તમે આ રૂમમાં ડાઇસ ફેંકવાનો પ્રયોગ કરી રહ્યા છો અને બાજુના રૂમમાં તમારો સાથીદાર પણ સિક્કો ફેંકી રહ્યો છે. ધારો કે તમને ઇવેન્ટ A માં રસ છે - તમારા સાથીદારને "બે" અને ઇવેન્ટ B - તમારા સાથીદારને "પૂંછડી" મળે છે. સામાન્ય જ્ઞાનપૂછે છે: આ ઘટનાઓ સ્વતંત્ર છે!

જો કે આપણે હજુ સુધી અવલંબન/સ્વતંત્રતાનો ખ્યાલ રજૂ કર્યો નથી, તે સાહજિક રીતે સ્પષ્ટ છે કે સ્વતંત્રતાની કોઈપણ વાજબી વ્યાખ્યા એવી રીતે તૈયાર કરવી જોઈએ કે જેથી આ ઘટનાઓને સ્વતંત્ર તરીકે વ્યાખ્યાયિત કરવામાં આવે.

હવે બીજા પ્રયોગ તરફ વળીએ. એક ડાઇસ ફેંકવામાં આવે છે, ઘટના A એ બે છે અને ઘટના B એ પોઈન્ટની વિષમ સંખ્યા છે. ધારી લઈએ કે હાડકા સપ્રમાણ છે, આપણે તરત જ કહી શકીએ કે P(A) = 1/6. હવે કલ્પના કરો કે તેઓ તમને કહે છે: "પ્રયોગના પરિણામે, ઘટના B આવી, પોઈન્ટની વિચિત્ર સંખ્યા ઘટી." ઘટના A ની સંભાવના વિશે હવે આપણે શું કહી શકીએ? તે સ્પષ્ટ છે કે હવે આ સંભાવના શૂન્ય થઈ ગઈ છે.

અમારા માટે સૌથી મહત્વની બાબત એ છે કે તેણી બદલાયેલ.

પ્રથમ ઉદાહરણ પર પાછા ફરતા, આપણે કહી શકીએ માહિતીહકીકત એ છે કે આગલા રૂમમાં ઘટના B બની તે ઘટના A ની સંભાવના વિશે તમારા વિચારોને કોઈપણ રીતે અસર કરશે નહીં. આ સંભાવના બદલાશે નહીંતમે ઘટના B વિશે કંઈક શીખ્યા તે હકીકત પરથી.

અમે એક કુદરતી અને અત્યંત મહત્વપૂર્ણ નિષ્કર્ષ પર આવ્યા છીએ -

જો માહિતી કે ઘટના IN થયું ઘટનાની સંભાવનાને બદલે છે, પછી ઘટનાઓઅને IN આશ્રિત ગણવું જોઈએ, અને જો તે બદલાતું નથી, તો પછી સ્વતંત્ર.

આ વિચારણાઓને ગાણિતિક સ્વરૂપ આપવું જોઈએ, ઘટનાઓની અવલંબન અને સ્વતંત્રતા સૂત્રોનો ઉપયોગ કરીને નક્કી કરવી જોઈએ.

અમે નીચેના થીસીસથી આગળ વધીશું: "જો A અને B આશ્રિત ઘટનાઓ છે, તો ઘટના A ઘટના B વિશેની માહિતી ધરાવે છે, અને ઘટના B ઘટના A વિશેની માહિતી ધરાવે છે." તે સમાયેલ છે કે નહીં તે તમે કેવી રીતે શોધી શકો છો? દ્વારા આ પ્રશ્નનો જવાબ આપવામાં આવ્યો છે સિદ્ધાંત માહિતી.

માહિતી સિદ્ધાંતમાંથી આપણને ફક્ત એક જ સૂત્રની જરૂર છે જે અમને A અને B ની ઘટનાઓ માટે પરસ્પર માહિતી I(A, B) ની માત્રાની ગણતરી કરવાની મંજૂરી આપે છે.

અમે વિવિધ ઇવેન્ટ્સ માટે માહિતીની માત્રાની ગણતરી કરીશું નહીં અથવા આ સૂત્રની વિગતવાર ચર્ચા કરીશું નહીં.

તે આપણા માટે મહત્વપૂર્ણ છે કે જો

પછી ઘટનાઓ A અને B વચ્ચેની પરસ્પર માહિતીની માત્રા શૂન્ય સમાન છે - ઘટના A અને B સ્વતંત્ર. જો

પછી પરસ્પર માહિતીનો જથ્થો ઘટનાઓ A અને B છે આશ્રિત.

માહિતીની વિભાવના માટે અપીલ અહીં સહાયક પ્રકૃતિની છે અને તે અમને લાગે છે તેમ, અમને ઘટનાઓની અવલંબન અને સ્વતંત્રતાના ખ્યાલોને વધુ મૂર્ત બનાવવાની મંજૂરી આપે છે.

સંભાવના સિદ્ધાંતમાં, ઘટનાઓની અવલંબન અને સ્વતંત્રતા વધુ ઔપચારિક રીતે વર્ણવવામાં આવે છે.

સૌ પ્રથમ, આપણને ખ્યાલની જરૂર છે શરતી સંભાવના.

ઘટના A ની શરતી સંભાવના, જો કે ઘટના B આવી હોય (P(B) ≠0), તે મૂલ્ય P(A|B) કહેવાય છે, જે સૂત્ર દ્વારા ગણવામાં આવે છે.

.

ઘટનાઓની અવલંબન અને સ્વતંત્રતાને સમજવા માટેના અમારા અભિગમની ભાવનાને અનુસરીને, અમે અપેક્ષા રાખી શકીએ છીએ કે શરતી સંભાવનામાં નીચેની મિલકત હશે: જો ઘટનાઓ A અને B સ્વતંત્ર , તે

આનો અર્થ એ છે કે ઘટના B બની છે તે માહિતી ઘટના A ની સંભાવના પર કોઈ અસર કરતી નથી.

તે કેવી રીતે છે!

જો ઘટનાઓ A અને B સ્વતંત્ર છે, તો

સ્વતંત્ર ઘટનાઓ A અને B માટે અમારી પાસે છે

અને


સામાજિક-આર્થિક પ્રક્રિયાઓ અને અસાધારણ ઘટનાઓનો સંશોધક સામનો કરે છે તે મૂળભૂત વિચાર આર્થિક ચલો વચ્ચેના સંબંધોની પ્રકૃતિને સમજે છે. બજારમાં ઉભરતી ચોક્કસ પ્રોડક્ટની માંગને કિંમતના કાર્ય તરીકે ગણવામાં આવે છે, અસ્કયામતો પરનું વળતર રોકાણના જોખમની ડિગ્રી પર આધાર રાખે છે, ગ્રાહક ખર્ચ આવકનું કાર્ય હોઈ શકે છે.
સામાજિક-આર્થિક ઘટનાઓના આંકડાકીય વિશ્લેષણ અને આગાહીની પ્રક્રિયામાં, સૌથી મહત્વપૂર્ણ સંબંધોનું માત્રાત્મક રીતે વર્ણન કરવું જરૂરી છે. ઘટના અને પ્રક્રિયાઓના સાર અને પ્રકૃતિને વિશ્વસનીય રીતે પ્રતિબિંબિત કરવા માટે, કારણ અને અસર સંબંધોને ઓળખવા જોઈએ. કાર્યકારણ કારણ અને અસરના અસ્થાયી ક્રમ દ્વારા વર્ગીકૃત થયેલ છે: કારણ હંમેશા અસર કરતા પહેલા આવે છે. જો કે, સાચી સમજણ માટે, ઘટનાઓના સંયોગોને બાકાત રાખવું જોઈએ કે જેમાં કારણ સંબંધ નથી.
ઘણી સામાજિક-આર્થિક ઘટનાઓ પરિણામને એક સાથે અને સંચિત રીતે રજૂ કરે છે સક્રિય કારણો. આવા કિસ્સાઓમાં, મુખ્ય કારણોને ગૌણ, બિનમહત્વપૂર્ણ લોકોથી અલગ કરવામાં આવે છે.
ઘટના બે પ્રકારની હોય છે નિર્ભરતા: કાર્યાત્મક,અથવા સખત રીતે નિર્ધારિત, અને આંકડાકીય, અથવા સ્ટોકેસ્ટિકલીનિર્ધારિત મુ કાર્યાત્મક અવલંબનદરેક મૂલ્ય નથી આશ્રિતચલ x અનન્ય રીતે ખૂબ ચોક્કસ મૂલ્યને અનુલક્ષે છે આશ્રિતચલ y. આ વ્યસનસમાનતા y = f(x) તરીકે વર્ણવી શકાય છે. આના જેવું ઉદાહરણ નિર્ભરતામિકેનિક્સના કાયદાઓ હોઈ શકે છે જે રેન્ડમ વિચલનો વિના વસ્તીના દરેક વ્યક્તિગત એકમ માટે માન્ય છે.
આંકડાકીય, અથવા સ્ટોકેસ્ટિક અવલંબન, સાથે માત્ર સામૂહિક ઘટનામાં જ પ્રગટ થાય છે મોટી સંખ્યામાંવસ્તીના એકમો. મુ સ્ટોકેસ્ટિકઆપેલ મૂલ્યો માટે કોઈ નિર્ભરતા નથી આશ્રિતચલ x એ અંતરાલમાં અવ્યવસ્થિત રીતે વિખેરાયેલા y ના સંખ્યાબંધ મૂલ્યો સૂચવી શકે છે. દરેક નિશ્ચિત દલીલ મૂલ્ય ફંક્શન મૂલ્યોના ચોક્કસ આંકડાકીય વિતરણને અનુરૂપ છે. આ તે હકીકતને કારણે છે કે આશ્રિતચલ, પસંદ કરેલ ચલ x ઉપરાંત, અન્ય અનિયંત્રિત અથવા બિનહિસાબી પરિબળો દ્વારા પણ પ્રભાવિત થાય છે, અને એ પણ હકીકત દ્વારા કે માપન ભૂલો સુપરઇમ્પોઝ કરવામાં આવે છે. (2, પૃષ્ઠ 12). કિંમતો થી આશ્રિતચલો રેન્ડમ સ્કેટરિંગને આધીન છે, તેઓ પૂરતી ચોકસાઈ સાથે અનુમાન કરી શકતા નથી, પરંતુ માત્ર ચોક્કસ સંભાવના સાથે સૂચવવામાં આવે છે. દેખાતા મૂલ્યો આશ્રિતચલો એ રેન્ડમ ચલની અનુભૂતિ છે.
એકતરફી સ્ટોકેસ્ટિક અવલંબનબીજામાંથી એક રેન્ડમ ચલ અથવા અન્ય ઘણા રેન્ડમ ચલોને રીગ્રેસન તરીકે ગણવામાં આવે છે. એક કાર્ય કે જે એકતરફી વ્યક્ત કરે છે સ્ટોકેસ્ટિક અવલંબન,રીગ્રેશન ફંક્શન અથવા ફક્ત રીગ્રેશન કહેવાય છે.
વચ્ચે તફાવત છે કાર્યાત્મક અવલંબનઅને રીગ્રેશન. વધુમાં, ચલ x at કાર્યાત્મક અવલંબન^=f(x) સંપૂર્ણપણે ફંક્શનની કિંમત નક્કી કરે છે^, ફંક્શન ઇન્વર્ટિબલ છે, એટલે કે. ત્યાં એક વ્યસ્ત કાર્ય x = f(y) છે. રીગ્રેશન ફંક્શનમાં આ ગુણધર્મ નથી. માત્ર આત્યંતિક કિસ્સામાં જ્યારે સ્ટોકેસ્ટિક અવલંબનમાં જાય છે કાર્યાત્મક અવલંબન,તમે એક રીગ્રેશન સમીકરણમાંથી બીજામાં જઈ શકો છો.
રીગ્રેશન સમીકરણના પ્રકારનું ઔપચારિકકરણ અર્થશાસ્ત્રમાં માપન અને ચોક્કસ સ્વરૂપોના વિશ્લેષણ સાથે સંકળાયેલા હેતુઓ માટે અપૂરતું છે. નિર્ભરતાચલો વચ્ચે. આર્થિક સંબંધોમાં પરિચયના પરિણામે આવી સમસ્યાઓનું સમાધાન શક્ય બને છે સ્ટોકેસ્ટિકસભ્ય:
અભ્યાસ કરતી વખતે નિર્ભરતાતે ધ્યાનમાં રાખવું જોઈએ કે રીગ્રેસન કાર્ય માત્ર ઔપચારિક રીતે ચલો વચ્ચે પત્રવ્યવહાર સ્થાપિત કરે છે, જ્યારે તેઓ કારણ-અને-અસર સંબંધમાં હોઈ શકતા નથી. આ કિસ્સામાં, ચલોની ભિન્નતામાં અવ્યવસ્થિત સંયોગોને કારણે ખોટા રીગ્રેસન ઊભી થઈ શકે છે જેનો અર્થપૂર્ણ અર્થ નથી. તેથી, રીગ્રેસન સમીકરણ પસંદ કરતા પહેલા ફરજિયાત પગલું એ ગુણાત્મક વિશ્લેષણ છે નિર્ભરતાવચ્ચે નહીં આશ્રિતચલ x અને આશ્રિતચલ y, પ્રારંભિક પૂર્વધારણાઓ પર આધારિત.

અવલંબનનો અભ્યાસ કરવો જરૂરી છે અને બંને જથ્થાઓ સમાન પ્રયોગોમાં માપવામાં આવે છે. આ કરવા માટે, પ્રયોગોની શ્રેણી પર હાથ ધરવામાં આવે છે વિવિધ અર્થોઅન્ય પ્રાયોગિક પરિસ્થિતિઓને યથાવત રાખવાનો પ્રયાસ.

દરેક જથ્થાના માપમાં રેન્ડમ ભૂલો છે (અમે અહીં વ્યવસ્થિત ભૂલોને ધ્યાનમાં લઈશું નહીં); તેથી, આ મૂલ્યો રેન્ડમ છે.

રેન્ડમ ચલોના કુદરતી સંબંધને સ્ટોકેસ્ટિક કહેવામાં આવે છે. અમે બે સમસ્યાઓ ધ્યાનમાં લઈશું:

a) સ્થાપિત કરો કે શું ત્યાં (ચોક્કસ સંભાવના સાથે) નિર્ભરતા છે કે મૂલ્ય તેના પર નિર્ભર નથી;

b) જો અવલંબન અસ્તિત્વમાં છે, તો તેનું માત્રાત્મક રીતે વર્ણન કરો.

પ્રથમ કાર્યને વિભિન્નતાનું વિશ્લેષણ કહેવામાં આવે છે, અને જો ઘણા ચલોના કાર્યને ધ્યાનમાં લેવામાં આવે છે, તો વિભિન્નતાનું બહુવિધ વિશ્લેષણ. બીજા કાર્યને રીગ્રેસન વિશ્લેષણ કહેવામાં આવે છે. જો રેન્ડમ ભૂલો મોટી હોય, તો તે ઇચ્છિત અવલંબનને ઢાંકી શકે છે અને તેને ઓળખવું સરળ ન પણ હોય.

આમ, પેરામીટર તરીકેના આધારે રેન્ડમ ચલને ધ્યાનમાં લેવા માટે તે પૂરતું છે. આ મૂલ્યની ગાણિતિક અપેક્ષા આ નિર્ભરતા ઇચ્છિત હોવા પર આધાર રાખે છે અને તેને રીગ્રેસન કાયદો કહેવામાં આવે છે.

વિભિન્નતાનું વિશ્લેષણ. ચાલો દરેક મૂલ્ય માટે માપનની એક નાની શ્રેણી હાથ ધરીએ અને નિર્ધારિત કરીએ કે આ ડેટા પર પ્રક્રિયા કરવાની બે રીતો ધ્યાનમાં લઈએ, જે અમને તપાસ કરવાની મંજૂરી આપે છે કે શું ત્યાં નોંધપાત્ર (એટલે ​​​​કે, સ્વીકૃત વિશ્વાસની સંભાવના સાથે) z પર નિર્ભરતા છે કે કેમ.

પ્રથમ પદ્ધતિમાં, એક માપના નમૂનાના ધોરણોની ગણતરી દરેક શ્રેણી માટે અલગથી અને માપના સમગ્ર સમૂહ માટે કરવામાં આવે છે:

માપની કુલ સંખ્યા ક્યાં છે, અને

દરેક શ્રેણી માટે અને માપના સમગ્ર સેટ માટે અનુક્રમે સરેરાશ મૂલ્યો છે.

ચાલો માપના સમૂહના ભિન્નતાને વ્યક્તિગત શ્રેણીના ભિન્નતા સાથે સરખાવીએ. જો તે તારણ આપે છે કે પસંદ કરેલા આત્મવિશ્વાસના સ્તરે બધા i માટે ગણતરી કરવી શક્ય છે, તો z પર નિર્ભરતા છે.

જો ત્યાં કોઈ વિશ્વસનીય અતિરેક નથી, તો પછી અવલંબન શોધી શકાતું નથી (પ્રયોગની ચોકસાઈ અને અપનાવેલ પ્રક્રિયા પદ્ધતિને જોતાં).

ફિશર ટેસ્ટ (30) નો ઉપયોગ કરીને તફાવતોની સરખામણી કરવામાં આવે છે. ધોરણ s માપન N ની કુલ સંખ્યા દ્વારા નક્કી કરવામાં આવે છે, જે સામાન્ય રીતે ખૂબ મોટી હોય છે, તમે લગભગ હંમેશા કોષ્ટક 25 માં આપેલા ફિશર ગુણાંકનો ઉપયોગ કરી શકો છો.

વિશ્લેષણની બીજી પદ્ધતિ એ છે કે એકબીજા સાથે વિવિધ મૂલ્યો પર સરેરાશની તુલના કરવી. મૂલ્યો રેન્ડમ અને સ્વતંત્ર છે, અને તેમના પોતાના નમૂનાના ધોરણો સમાન છે

તેથી, ફકરા 3 માં વર્ણવેલ સ્વતંત્ર માપનની યોજના અનુસાર તેમની તુલના કરવામાં આવે છે. જો તફાવતો નોંધપાત્ર હોય, એટલે કે, વિશ્વાસ અંતરાલ કરતાં વધી જાય, તો પછી તેના પર નિર્ભરતાની હકીકત સ્થાપિત કરવામાં આવી છે; જો બધા 2 વચ્ચેના તફાવતો નજીવા હોય, તો પછી અવલંબન શોધી શકાતું નથી.

બહુવિધ વિશ્લેષણમાં કેટલીક વિશેષતાઓ છે. લંબચોરસ ગ્રીડના ગાંઠોમાં મૂલ્યને માપવાની સલાહ આપવામાં આવે છે જેથી એક દલીલ પર નિર્ભરતાનો અભ્યાસ કરવો વધુ અનુકૂળ હોય, બીજી દલીલને ઠીક કરવી. બહુપરીમાણીય ગ્રીડના દરેક નોડ પર શ્રેણીબદ્ધ માપન હાથ ધરવું ખૂબ જ શ્રમ-સઘન છે. એક માપના વિક્ષેપનો અંદાજ કાઢવા માટે ઘણા ગ્રીડ પોઈન્ટ પર માપની શ્રેણી હાથ ધરવા માટે તે પૂરતું છે; અન્ય ગાંઠોમાં આપણે આપણી જાતને એકલ માપ સુધી મર્યાદિત કરી શકીએ છીએ. વિભિન્નતાનું વિશ્લેષણ પ્રથમ પદ્ધતિ અનુસાર હાથ ધરવામાં આવે છે.

ટિપ્પણી 1. જો ત્યાં ઘણા બધા માપો હોય, તો પછી બંને પદ્ધતિઓમાં વ્યક્તિગત માપન અથવા શ્રેણી, નોંધપાત્ર સંભાવના સાથે, તેમની ગાણિતિક અપેક્ષાઓથી તદ્દન મજબૂત રીતે વિચલિત થઈ શકે છે. 1 ની નજીકની આત્મવિશ્વાસ સંભાવના પસંદ કરતી વખતે આ ધ્યાનમાં લેવું આવશ્યક છે (જેમ કે સ્થૂળ ભૂલોથી અનુમતિપાત્ર રેન્ડમ ભૂલોને અલગ કરતી મર્યાદા સેટ કરવામાં કરવામાં આવી હતી).

રીગ્રેસન વિશ્લેષણ. ભિન્નતાનું વિશ્લેષણ સૂચવે છે કે z ની અવલંબન છે. તેનું પ્રમાણ કેવી રીતે કરવું?

આ કરવા માટે, અમે અમુક કાર્ય સાથે ઇચ્છિત અવલંબનનો અંદાજ લગાવીએ છીએ, અમે પદ્ધતિનો ઉપયોગ કરીને પરિમાણોના શ્રેષ્ઠ મૂલ્યો શોધીએ છીએ ઓછામાં ઓછા ચોરસસમસ્યાનું નિરાકરણ

આપેલ બિંદુ (એટલે ​​કે) પર માપન ભૂલના ચોરસના વ્યસ્ત પ્રમાણમાં પસંદ કરેલ માપન વજન ક્યાં છે. આ સમસ્યાનું પ્રકરણ II, § 2 માં વિશ્લેષણ કરવામાં આવ્યું હતું. અમે અહીં ફક્ત તે લક્ષણો પર જ ધ્યાન આપીશું જે મોટી રેન્ડમ ભૂલોની હાજરીને કારણે થાય છે.

પરાધીનતાની પ્રકૃતિ વિશે સૈદ્ધાંતિક વિચારણાઓમાંથી અથવા ઔપચારિક રીતે, જાણીતા કાર્યોના ગ્રાફ સાથે ગ્રાફની તુલના કરીને પ્રકાર પસંદ કરવામાં આવે છે. જો ફોર્મ્યુલા સૈદ્ધાંતિક વિચારણાઓમાંથી પસંદ કરવામાં આવે છે અને યોગ્ય રીતે (સૈદ્ધાંતિક દૃષ્ટિકોણથી) એસિમ્પ્ટોટીક્સને અભિવ્યક્ત કરે છે, તો સામાન્ય રીતે તે માત્ર પ્રાયોગિક ડેટાના સમૂહને સારી રીતે અંદાજિત કરવા માટે જ નહીં, પણ મૂલ્યોની અન્ય શ્રેણીઓ પર જોવા મળેલી અવલંબનને એક્સ્ટ્રાપોલેટ કરવાની પણ મંજૂરી આપે છે. ઔપચારિક રીતે પસંદ કરેલ કાર્ય પ્રયોગનું સંતોષકારક રીતે વર્ણન કરી શકે છે, પરંતુ એક્સ્ટ્રાપોલેશન માટે ભાગ્યે જ યોગ્ય છે.

જો તે બીજગણિત બહુપદી હોય તો સમસ્યા હલ કરવી સૌથી સહેલી છે. સામાન્ય રીતે, સારા સૂત્રો બિનરેખીય રીતે પરિમાણો પર આધાર રાખે છે (ટ્રાન્સેન્ડેન્ટલ રીગ્રેસન). ચલોના આવા લેવલિંગ રિપ્લેસમેન્ટને પસંદ કરીને ટ્રાન્સસેન્ડેન્ટલ રીગ્રેસનનું નિર્માણ કરવું સૌથી અનુકૂળ છે જેથી અવલંબન લગભગ રેખીય હોય (જુઓ પ્રકરણ II, § 1, ફકરો 8). પછી બીજગણિતીય બહુપદી દ્વારા તેનું અનુમાન કરવું સરળ છે: .

સૈદ્ધાંતિક વિચારણાઓનો ઉપયોગ કરીને અને એસિમ્પ્ટોટીક્સને ધ્યાનમાં રાખીને ચલોના સ્તરીકરણની માંગ કરવામાં આવે છે.

રિમાર્ક 2. જ્યારે નવા ચલોને પસાર કરવામાં આવે છે, ત્યારે ન્યૂનતમ ચોરસ પદ્ધતિ (34) ની સમસ્યા સ્વરૂપ લે છે

જ્યાં નવા વજન મૂળ સંબંધો સાથે સંબંધિત છે

તેથી, જો મૂળ ફોર્મ્યુલેશન (34) માં તમામ માપની એકસરખી ચોકસાઈ હોય તો પણ, લેવલિંગ વેરિયેબલ્સ માટેના વજન સમાન રહેશે નહીં.

સહસંબંધ વિશ્લેષણ. તે તપાસવું જરૂરી છે કે શું ચલોનું રિપ્લેસમેન્ટ ખરેખર સ્તરીકરણ હતું, એટલે કે, નિર્ભરતા રેખીયની નજીક છે કે કેમ. આ જોડી સહસંબંધ ગુણાંકની ગણતરી કરીને કરી શકાય છે

તે બતાવવું સરળ છે કે સંબંધ હંમેશા સંતુષ્ટ છે

જો અવલંબન સખત રીતે રેખીય છે (અને તેમાં રેન્ડમ ભૂલો નથી), તો પછી અથવા સીધી રેખાના ઢોળાવના સંકેત પર આધાર રાખીને. જેટલું નાનું, તેટલું ઓછું અવલંબન રેખીય જેવું લાગે છે. તેથી, જો , અને માપન N ની સંખ્યા પૂરતી મોટી છે, તો સ્તરીકરણ ચલો સંતોષકારક રીતે પસંદ કરવામાં આવે છે.

સહસંબંધ ગુણાંક પર આધારિત અવલંબનની પ્રકૃતિ વિશેના આવા નિષ્કર્ષોને સહસંબંધ વિશ્લેષણ કહેવામાં આવે છે.

સહસંબંધ વિશ્લેષણ માટે દરેક બિંદુએ માપની શ્રેણી લેવાની જરૂર નથી. દરેક બિંદુ પર એક માપન કરવા માટે તે પૂરતું છે, પરંતુ પછી અભ્યાસ હેઠળ વળાંક પર વધુ બિંદુઓ લો, જે ઘણીવાર ભૌતિક પ્રયોગોમાં કરવામાં આવે છે.

રિમાર્ક 3. નિકટતાના માપદંડો છે જે તમને નિર્ભરતા વ્યવહારીક રીતે રેખીય છે કે કેમ તે દર્શાવવા દે છે. અમે તેમના પર ધ્યાન આપતા નથી, કારણ કે અંદાજિત બહુપદીની ડિગ્રીની પસંદગી નીચે ધ્યાનમાં લેવામાં આવશે.

રિમાર્ક 4. ગુણોત્તર રેખીય અવલંબનની ગેરહાજરી દર્શાવે છે પરંતુ તેનો અર્થ કોઈપણ અવલંબનની ગેરહાજરી નથી. તેથી, જો સેગમેન્ટ પર - પછી

શ્રેષ્ઠ ડિગ્રી બહુપદી a. ચાલો ડિગ્રીના અંદાજિત બહુપદીને સમસ્યામાં બદલીએ (35):

પછી શ્રેષ્ઠ પરિમાણ મૂલ્યો સિસ્ટમને સંતોષે છે રેખીય સમીકરણો (2.43):

અને તેઓ શોધવા મુશ્કેલ નથી. પરંતુ બહુપદીની ડિગ્રી કેવી રીતે પસંદ કરવી?

આ પ્રશ્નનો જવાબ આપવા માટે, ચાલો મૂળ ચલ પર પાછા જઈએ અને મળેલા ગુણાંક સાથે અંદાજિત સૂત્રના તફાવતની ગણતરી કરીએ. આ તફાવતનો નિષ્પક્ષ અંદાજ છે

દેખીતી રીતે, જેમ જેમ બહુપદીની ડિગ્રી વધે છે તેમ, વિક્ષેપ (40) ઘટશે: વધુ ગુણાંક લેવામાં આવશે, પ્રાયોગિક બિંદુઓ વધુ સચોટ રીતે અંદાજિત કરી શકાય છે.