Ռեգրեսիոն վերլուծության մեթոդներ. Ռեգրեսիոն վերլուծությունը վիճակագրական մեթոդ է՝ ուսումնասիրելու պատահական փոփոխականի կախվածությունը փոփոխականներից: Վիճակագրության մեջ ռեգրեսիոն վերլուծության մեթոդներ

Ռեգրեսիոն վերլուծության մեթոդներ.  Ռեգրեսիոն վերլուծությունը վիճակագրական մեթոդ է՝ ուսումնասիրելու պատահական փոփոխականի կախվածությունը փոփոխականներից: Վիճակագրության մեջ ռեգրեսիոն վերլուծության մեթոդներ

Ռեգրեսիոն վերլուծություն

Հետընթաց (գծային) վերլուծություն- կախյալ փոփոխականի վրա մեկ կամ մի քանի անկախ փոփոխականների ազդեցությունն ուսումնասիրելու վիճակագրական մեթոդ. Անկախ փոփոխականներն այլ կերպ կոչվում են ռեգրեսորներ կամ կանխատեսողներ, իսկ կախյալ փոփոխականները՝ չափանիշի փոփոխականներ։ Տերմինաբանություն կախյալԵվ անկախփոփոխականներն արտացոլում են միայն փոփոխականների մաթեմատիկական կախվածությունը ( տես Կեղծ հարաբերակցություն), այլ ոչ թե պատճառահետևանքային հարաբերություններ:

Ռեգրեսիոն վերլուծության նպատակները

  1. Չափանիշի (կախյալ) փոփոխականի տատանումների որոշման աստիճանի որոշումը կանխագուշակներով (անկախ փոփոխականներով)
  2. Կախված փոփոխականի արժեքի կանխատեսում՝ օգտագործելով անկախ փոփոխական(ներ)ը
  3. Կախված փոփոխականի փոփոխության մեջ առանձին անկախ փոփոխականների ներդրման որոշում

Ռեգրեսիոն վերլուծությունը չի կարող օգտագործվել փոփոխականների միջև կապի առկայության մասին որոշելու համար, քանի որ նման կապի առկայությունը վերլուծությունը կիրառելու նախապայման է:

Ռեգրեսիայի մաթեմատիկական սահմանում

Խիստ ռեգրեսիոն հարաբերությունը կարող է սահմանվել հետևյալ կերպ. Թող , լինեն պատահական փոփոխականներ՝ տվյալ համատեղ հավանականության բաշխմամբ: Եթե ​​արժեքների յուրաքանչյուր հավաքածուի համար սահմանվում է պայմանական մաթեմատիկական ակնկալիք

(ռեգեսիոն հավասարումը ընդհանուր ձևով),

ապա ֆունկցիան կանչվում է հետընթաց Y-ի արժեքներն ըստ արժեքների, և դրա գրաֆիկն է ռեգրեսիայի գիծկողմից, կամ ռեգրեսիայի հավասարումը.

Կախվածությունը դրսևորվում է Y-ի միջին արժեքների փոփոխությամբ՝ փոփոխությամբ: Թեև արժեքների յուրաքանչյուր ֆիքսված բազմության համար արժեքը մնում է պատահական փոփոխական՝ որոշակի ցրումով:

Հարցը պարզաբանելու համար, թե որքանով է ճշգրտորեն ռեգրեսիոն վերլուծությունը գնահատում Y-ի փոփոխությունը փոխելիս, օգտագործվում է Y-ի ցրման միջին արժեքը տարբեր արժեքների հավաքածուների համար (իրականում մենք խոսում ենք կախված փոփոխականի ցրման չափման մասին. ռեգրեսիայի գծի շուրջ):

Նվազագույն քառակուսիների մեթոդ (գործակիցների հաշվարկ)

Գործնականում ռեգրեսիոն գիծը առավել հաճախ հանդիպում է գծային ֆունկցիայի (գծային ռեգրեսիա) տեսքով, լավագույն միջոցըմոտավորելով ցանկալի կորը. Սա արվում է նվազագույն քառակուսիների մեթոդի կիրառմամբ, երբ իրականում դիտարկվածների քառակուսի շեղումների գումարը նվազագույնի է հասցվում իրենց գնահատականներից (նշանակում է գնահատումներ՝ օգտագործելով ուղիղ գիծ, ​​որը հավակնում է ներկայացնել ցանկալի ռեգրեսիոն հարաբերությունը).

(M - նմուշի չափը): Այս մոտեցումը հիմնված է հայտնի փաստ, որ վերը նշված արտահայտության մեջ հայտնված գումարը ստանում է նվազագույն արժեք հենց այն դեպքի համար, երբ .

Նվազագույն քառակուսիների մեթոդով ռեգրեսիոն վերլուծության խնդիրը լուծելու համար ներկայացվում է հայեցակարգը մնացորդային գործառույթներ:

Նվազագույն պայման մնացորդային ֆունկցիայի համար.

Ստացված համակարգը անհայտներով գծային հավասարումների համակարգ է

Եթե ​​հավասարումների ձախ մասի ազատ անդամները ներկայացնենք որպես մատրիցա

իսկ աջ կողմի անհայտների գործակիցները մատրիցն են

ապա ստանում ենք մատրիցային հավասարումը. , որը հեշտությամբ լուծվում է Գաուսի մեթոդով։ Ստացված մատրիցը կլինի մի մատրիցա, որը պարունակում է ռեգրեսիոն գծի հավասարման գործակիցները.

Լավագույն գնահատականներ ստանալու համար անհրաժեշտ է կատարել OLS-ի նախապայմանները (Գաուս-Մարկովի պայմաններ): Անգլերեն գրականության մեջ նման գնահատականները կոչվում են BLUE (Best Linear Unbiased Estimators):

Ռեգրեսիայի պարամետրերի մեկնաբանություն

Պարամետրերը մասնակի հարաբերակցության գործակիցներ են. մեկնաբանվում է որպես Y-ի շեղումների հարաբերակցությունը, որը բացատրվում է մնացած գուշակողների ազդեցությունը ֆիքսելով, այսինքն՝ չափում է Y-ի բացատրության անհատական ​​ներդրումը։ որոնք կախված են այն հաջորդականությունից, որով գուշակողները ներառված են մոդելում: Նման դեպքերում անհրաժեշտ է կիրառել հարաբերակցության և փուլային ռեգրեսիոն վերլուծության մեթոդներ:

Ռեգրեսիոն վերլուծության ոչ գծային մոդելների մասին խոսելիս կարևոր է ուշադրություն դարձնել, թե արդյոք մենք խոսում ենք ոչ գծայինության մասին անկախ փոփոխականներում (ձևական տեսանկյունից, որը հեշտությամբ վերածվում է գծային ռեգրեսիայի), թե՞ գնահատված պարամետրերի ոչ գծայինության մասին (առաջացնում է լուրջ հաշվողական դժվարություններ): Առաջին տիպի ոչ գծայինության դեպքում, բովանդակային տեսանկյունից, կարևոր է ձևի տերմինների մոդելում առանձնացնել տեսքը , , նշելով հատկանիշների միջև փոխազդեցությունների առկայությունը և այլն (տես Բազմագծայինություն):

տես նաեւ

Հղումներ

  • www.kgafk.ru - Դասախոսություն «Ռեգրեսիոն վերլուծություն» թեմայով
  • www.basegroup.ru - ռեգրեսիոն մոդելներում փոփոխականներ ընտրելու մեթոդներ

գրականություն

  • Նորման Դրեյփեր, Հարրի ՍմիթԿիրառական ռեգրեսիոն վերլուծություն. Բազմակի ռեգրեսիա = Կիրառական ռեգրեսիայի վերլուծություն: - 3-րդ հրատ. - Մ.: «Դիալեկտիկա», 2007. - Էջ 912. - ISBN 0-471-17082-8
  • Վիճակագրական մոդելների գնահատման կայուն մեթոդներ. Մենագրություն. - K.: PP "Sansparel", 2005. - P. 504. - ISBN 966-96574-0-7, UDC: 519.237.5:515.126.2, BBK 22.172+22.152
  • Ռադչենկո Ստանիսլավ Գրիգորևիչ,Ռեգրեսիոն վերլուծության մեթոդիկա. Մենագրություն. - Կ.: «Կոռնիյչուկ», 2011. - P. 376. - ISBN 978-966-7599-72-0

Վիքիմեդիա հիմնադրամ. 2010 թ.

Այն բանից հետո, երբ հարաբերակցության վերլուծությունը բացահայտեց փոփոխականների միջև վիճակագրական հարաբերությունների առկայությունը և գնահատեց դրանց մերձեցման աստիճանը, մենք սովորաբար անցնում ենք որոշակի տեսակի կախվածության մաթեմատիկական նկարագրությանը ռեգրեսիոն վերլուծության միջոցով: Այդ նպատակով ընտրվում է ֆունկցիաների դաս, որը միացնում է արդյունք y ցուցանիշը և x 1, x 2, ..., x k փաստարկները, ընտրվում են առավել տեղեկատվական արգումենտները, պարամետրերի անհայտ արժեքների գնահատականները: Հաղորդակցման հավասարումը հաշվարկվում է, և ստացված հավասարման հատկությունները վերլուծվում են:

F(x 1, x 2,..., x k) ֆունկցիան, որը նկարագրում է y արդյունքային հատկանիշի միջին արժեքի կախվածությունը փաստարկների տրված արժեքներից, կոչվում է ռեգրեսիոն ֆունկցիա (հավասարում): «Ռեգեսիա» տերմինը (լատիներեն՝ ռեգրեսիա՝ նահանջ, վերադարձ ինչ-որ բանի) ներմուծել է անգլիացի հոգեբան և մարդաբան Ֆ. Գալթոնը և կապված է բացառապես առաջիններից մեկի առանձնահատկությունների հետ։ կոնկրետ օրինակներ, որում օգտագործվել է այս հայեցակարգը։ Այսպիսով, մշակելով վիճակագրական տվյալներ՝ կապված հասակի ժառանգականության վերլուծության հետ, Ֆ. Գալթոնը պարզել է, որ եթե հայրերը բոլոր հայրերի միջին հասակից շեղվում են x դյույմով, ապա նրանց որդիները բոլոր որդիների միջին հասակից շեղվում են x-ից պակաս: դյույմ. Հայտնաբերված միտումը կոչվում էր «հետընթաց դեպի միջին»: Այդ ժամանակից ի վեր «ռեգեսիա» տերմինը լայնորեն կիրառվում է վիճակագրական գրականության մեջ, թեև շատ դեպքերում այն ​​ճշգրիտ չի բնութագրում վիճակագրական կախվածության հասկացությունը։

Ռեգրեսիայի հավասարումը ճշգրիտ նկարագրելու համար անհրաժեշտ է իմանալ y արդյունավետ ցուցիչի բաշխման օրենքը: Վիճակագրական պրակտիկայում մարդը սովորաբար պետք է սահմանափակվի անհայտ ճշմարիտ ռեգրեսիոն ֆունկցիայի համար հարմար մոտարկումների որոնմամբ, քանի որ հետազոտողը ճշգրիտ գիտելիքներ չունի վերլուծված արդյունքային ցուցանիշի y-ի պայմանական հավանականության բաշխման օրենքի մասին տվյալ արժեքների համար: փաստարկ x.

Դիտարկենք ճշմարիտ f(x) = M(y1x), մոդելային ռեգրեսիայի հարաբերությունները: և ռեգրեսիայի գնահատում y. Թող y արդյունավետ ցուցիչը կապված լինի x փաստարկի հետ հարաբերությամբ.

որտեղ պատահական փոփոխական է, որն ունի նորմալ բաշխման օրենք, և Me = 0 և D e = y 2: Ճշմարիտ ռեգրեսիոն ֆունկցիան այս դեպքում ունի ձև՝ f (x) = M(y/x) = 2x 1.5:

Ենթադրենք, որ մենք չգիտենք ճշմարիտ ռեգրեսիոն հավասարման ձևը, բայց մենք ունենք երկչափ պատահական փոփոխականի ինը դիտարկում, որը կապված է yi = 2x1,5 + e առնչությամբ և ներկայացված է Նկ. 1

Նկար 1 - Ճշմարտության հարաբերական դիրքը f (x) և տեսականը: ռեգրեսիայի մոդելներ

Կետերի գտնվելու վայրը Նկ. 1-ը թույլ է տալիս սահմանափակվել դասով գծային կախվածություններբարի? = 0-ում + 1 x-ում: Օգտագործելով նվազագույն քառակուսիների մեթոդը, մենք գտնում ենք ռեգրեսիոն հավասարման գնահատումը y = b 0 + b 1 x: Համեմատության համար Նկ. 1-ը ցույց է տալիս իրական ռեգրեսիոն ֆունկցիայի գրաֆիկները y = 2x 1.5, տեսական մոտավոր ռեգրեսիոն ֆունկցիան: = 0-ում + 1 x-ում:

Քանի որ մենք սխալվել ենք ռեգրեսիոն ֆունկցիայի դասի ընտրության հարցում, և դա բավականին տարածված է վիճակագրական հետազոտության պրակտիկայում, մեր վիճակագրական եզրակացությունները և գնահատականները սխալ կլինեն: Եվ որքան էլ մեծացնենք դիտումների ծավալը, մեր ընտրանքային գնահատականը y մոտ չի լինի իրական ռեգրեսիոն f(x) ֆունկցիային։ Եթե ​​մենք ճիշտ էինք ընտրել ռեգրեսիոն ֆունկցիաների դասը, ապա f(x)-ը նկարագրելու անճշտությունը օգտագործելով? կարելի է բացատրել միայն ընտրանքային սահմանափակումներով:

Բնօրինակ վիճակագրական տվյալներից լավագույնս վերականգնելու համար արդյունավետ ցուցիչի y(x) և անհայտ ռեգրեսիոն ֆունկցիայի պայմանական արժեքը f(x) = M(y/x), համարժեքության հետևյալ չափանիշները (կորստի ֆունկցիաները) առավելագույնն են. հաճախ օգտագործվում է.

Նվազագույն քառակուսի մեթոդ. Ըստ դրա՝ արդյունավետ ցուցիչի դիտարկված արժեքների y, (i = 1,2,..., n) շեղման քառակուսին մոդելային արժեքներից,? = f(x i), որտեղ x i-ն արգումենտի վեկտորի արժեքն է i-րդ ​​դիտարկում:?(y i - f(x i) 2 > min Ստացված ռեգրեսիան կոչվում է արմատի միջին քառակուսի:

Ամենափոքր մոդուլների մեթոդը. Ըստ այդմ, մոդուլային արժեքներից արդյունավետ ցուցիչի դիտարկվող արժեքների բացարձակ շեղումների գումարը նվազագույնի է հասցվում: Եվ մենք ստանում ենք,? = f(x i), նշանակում է բացարձակ միջին ռեգրեսիա: |y i - f(x i)| > րոպե

Ռեգրեսիոն վերլուծությունը y պատահական փոփոխականի կախվածության վիճակագրական վերլուծության մեթոդ է x j = (j = 1,2,..., k) փոփոխականներից, որը ռեգրեսիոն վերլուծության մեջ դիտարկվում է որպես ոչ պատահական փոփոխականներ՝ անկախ բաշխման իրական օրենքից: ի x j.

Սովորաբար ենթադրվում է, որ y պատահական փոփոխականն ունի նորմալ բաշխման օրենք՝ y պայմանական ակնկալիքով, որը x/ (/ = 1, 2,..., k) փաստարկների ֆունկցիա է և y 2-ից անկախ հաստատուն շեղում: փաստարկները։

Վերջիվերջո գծային մոդելռեգրեսիոն վերլուծությունն ունի հետևյալ տեսքը.

Յ = Յ կ j=0Վ ժց ժ(x 1 , x 2 . . .. , x կ)+Է

որտեղ q j-ն իր փոփոխականների որոշ ֆունկցիա է՝ x 1, x 2: . .. ,x k, E-ը պատահական փոփոխական է՝ զրոյական մաթեմատիկական ակնկալիքով և շեղում y 2:

Ռեգրեսիոն վերլուծության ժամանակ ռեգրեսիոն հավասարման տեսակն ընտրվում է՝ ելնելով ուսումնասիրվող երեւույթի ֆիզիկական բնույթից և դիտարկման արդյունքներից։

Ռեգրեսիոն հավասարման անհայտ պարամետրերի գնահատականները սովորաբար գտնում են նվազագույն քառակուսիների մեթոդով: Ստորև մենք ավելի մանրամասն կանդրադառնանք այս խնդրին:

Երկչափ գծային հավասարումհետընթաց. Հետազոտվող երեւույթի վերլուծությունից ելնելով ենթադրենք, որ «միջին» y ունի գծային ֆունկցիա x-ից, այսինքն կա ռեգրեսիոն հավասարում

y=M(y/x)=0-ում + 1 x-ում)

որտեղ M(y1x) y պատահական փոփոխականի պայմանական մաթեմատիկական ակնկալիքն է տրված x-ի համար. 0-ին և 1-ին - ընդհանուր բնակչության անհայտ պարամետրեր, որոնք պետք է գնահատվեն ընտրանքային դիտարկումների արդյունքների հիման վրա:

Ենթադրենք, որ 0-ով և 1-ով պարամետրերը գնահատելու համար n չափի նմուշ է վերցված երկչափ պոպուլյացիայից (x, y), որտեղ (x, y,) i-րդ դիտարկման արդյունքն է (i = 1): , 2,..., ժդ) . Այս դեպքում ռեգրեսիոն վերլուծության մոդելն ունի հետևյալ ձևը.

y j = 0 +-ում 1 x+e j-ում:

որտեղ e j-ն անկախ նորմալ բաշխված պատահական փոփոխականներ են՝ զրոյական մաթեմատիկական ակնկալիքով և y2 շեղումով, այսինքն՝ M e j: = 0;

D e j .= y 2 բոլոր i = 1, 2,..., n.

Համաձայն նվազագույն քառակուսիների մեթոդի, որպես անհայտ պարամետրերի գնահատումներ 0 և 1-ում, պետք է վերցնել նմուշի բնութագրերի այնպիսի արժեքներ b 0 և b 1, որոնք նվազագույնի են հասցնում արդյունքի արժեքների քառակուսի շեղումների գումարը: i-ի համար բնորոշ պայմանական մաթեմատիկական ակնկալիքից: ես

Մենք կքննարկենք ձեռնարկության շահույթի վրա շուկայավարման բնութագրերի ազդեցության որոշման մեթոդաբանությունը, օգտագործելով տասնյոթ բնորոշ ձեռնարկությունների օրինակը միջին չափերով և տնտեսական ակտիվության ցուցանիշներով:

Խնդիրը լուծելիս հաշվի են առնվել հետևյալ բնութագրերը, որոնք ճանաչվել են որպես ամենանշանակալից (կարևորը) հարցաթերթիկի հարցման արդյունքում.

* ինովացիոն գործունեությունձեռնարկություններ;

* արտադրվող ապրանքների տեսականու պլանավորում;

* գնային քաղաքականության ձևավորում;

* հասարակայնության հետ կապեր;

* վաճառքի համակարգ;

* աշխատողների խրախուսման համակարգ.

Գործոնների համեմատության համակարգի հիման վրա կառուցվել են հարևանության քառակուսի մատրիցներ, որոնցում յուրաքանչյուր գործոնի համար հաշվարկվել են հարաբերական առաջնահերթությունների արժեքները՝ ձեռնարկության նորարարական գործունեություն, ապրանքների տեսականու պլանավորում, գնային քաղաքականության ձևավորում, գովազդ։ , հասարակայնության հետ կապեր, վաճառքի համակարգ, աշխատակիցների խրախուսման համակարգ։

«Հասարակության հետ հարաբերություններ» գործոնի առաջնահերթությունների գնահատականները ստացվել են ձեռնարկությունների մասնագետների հարցման արդյունքում: Ընդունված են հետևյալ նշումները՝ > (ավելի լավ), > (ավելի լավ կամ նույնը), = (նույն),< (хуже или одинаково), <

Այնուհետև լուծվեց ձեռնարկության շուկայավարման մակարդակի համապարփակ գնահատման խնդիրը: Ցուցանիշը հաշվարկելիս որոշվել է դիտարկվող մասնակի բնութագրերի նշանակությունը (կշիռը) և լուծվել մասնակի ցուցիչների գծային ոլորման խնդիրը։ Տվյալների մշակումն իրականացվել է հատուկ մշակված ծրագրերի միջոցով։

Այնուհետև հաշվարկվում է ձեռնարկության շուկայավարման մակարդակի համապարփակ գնահատականը` շուկայավարման գործակիցը, որը մուտքագրված է Աղյուսակ 1-ում: Բացի այդ, աղյուսակը ներառում է ձեռնարկությունը որպես ամբողջություն բնութագրող ցուցանիշներ: Աղյուսակի տվյալները կօգտագործվեն ռեգրեսիոն վերլուծություն կատարելու համար: Արդյունքում հատկանիշը շահույթն է: Մարքեթինգային գործակցի հետ մեկտեղ որպես գործոնային բնութագրիչներ օգտագործվել են հետևյալ ցուցանիշները՝ համախառն արտադրանքի ծավալը, հիմնական միջոցների ինքնարժեքը, աշխատողների թիվը, մասնագիտացման գործակիցը։

Աղյուսակ 1 - Ռեգրեսիոն վերլուծության նախնական տվյալներ


Ըստ աղյուսակի տվյալների և հարաբերակցության գործակիցների առավել նշանակալի արժեք ունեցող գործոնների հիման վրա կառուցվել են գործոններից շահույթի կախվածության ռեգրեսիոն ֆունկցիաներ:

Մեր դեպքում ռեգրեսիայի հավասարումը կունենա հետևյալ ձևը.

Վերը քննարկված գործոնների քանակական ազդեցությունը շահույթի չափի վրա նշվում է ռեգրեսիոն հավասարման գործակիցներով։ Նրանք ցույց են տալիս, թե քանի հազար ռուբլի է փոխվում դրա արժեքը, երբ գործոնային բնութագրիչը փոխվում է մեկ միավորով: Ինչպես հետևում է հավասարումից, մարքեթինգային խառնուրդի գործակցի ավելացումը մեկ միավորով տալիս է շահույթի աճ 1547,7 հազար ռուբլով: Սա խոսում է այն մասին, որ շուկայավարման գործունեության բարելավումը հսկայական ներուժ ունի ձեռնարկությունների տնտեսական գործունեության բարելավման համար:

Մարքեթինգի արդյունավետությունն ուսումնասիրելիս ամենահետաքրքիր և ամենակարևոր գործոնը X5 գործոնն է՝ շուկայավարման գործակիցը։ Վիճակագրության տեսության համաձայն, գոյություն ունեցող բազմակի ռեգրեսիայի հավասարման առավելությունը յուրաքանչյուր գործոնի, ներառյալ մարքեթինգային գործոնի, մեկուսացված ազդեցությունը գնահատելու ունակությունն է:

Ռեգրեսիոն վերլուծության արդյունքներն ավելի լայն կիրառություն ունեն, քան հավասարման պարամետրերը հաշվարկելու համար։ (Կեֆ) ձեռնարկությունները համեմատաբար ավելի լավ կամ համեմատաբար վատ դասակարգելու չափանիշը հիմնված է արդյունքի հարաբերական ցուցանիշի վրա.

որտեղ Y facti-ն i-րդ ձեռնարկության իրական արժեքն է, հազար ռուբլի.

Y հաշվարկված - i-րդ ձեռնարկության շահույթի չափը, որը ստացվել է ռեգրեսիայի հավասարման միջոցով հաշվարկով

Լուծվող խնդրի առումով արժեքը կոչվում է «արդյունավետության գործակից»: Ձեռնարկության գործունեությունը կարող է արդյունավետ համարվել այն դեպքերում, երբ գործակցի արժեքը մեկից մեծ է: Սա նշանակում է, որ իրական շահույթը ավելի մեծ է, քան միջին շահույթը նմուշի նկատմամբ:

Փաստացի և գնահատված շահույթի արժեքները ներկայացված են աղյուսակում: 2.

Աղյուսակ 2 - Ստացված բնութագրի վերլուծություն ռեգրեսիոն մոդելում

Աղյուսակի վերլուծությունը ցույց է տալիս, որ մեր դեպքում հաջողված կարելի է համարել 3, 5, 7, 9, 12, 14, 15, 17 ձեռնարկությունների գործունեությունը դիտարկվող ժամանակահատվածում։

Ռեգրեսիայի հայեցակարգ. Կախվածությունը փոփոխականների միջև xԵվ yկարելի է նկարագրել տարբեր ձևերով. Մասնավորապես, կապի ցանկացած ձև կարող է արտահայտվել ընդհանուր հավասարմամբ, որտեղ yվերաբերվում է որպես կախյալ փոփոխականի, կամ գործառույթներըմյուսից՝ x անկախ փոփոխական, որը կոչվում է փաստարկ. Փաստարկի և ֆունկցիայի համապատասխանությունը կարող է սահմանվել աղյուսակով, բանաձևով, գրաֆիկով և այլն: Մեկ կամ մի քանի արգումենտների փոփոխությունից կախված ֆունկցիայի փոփոխությունը կոչվում է հետընթաց. Հարաբերակցությունները նկարագրելու համար օգտագործվող բոլոր միջոցները կազմում են բովանդակությունը ռեգրեսիոն վերլուծություն.

Ռեգրեսիա, հարաբերական կամ ռեգրեսիոն հավասարումներ արտահայտելու համար օգտագործվում են էմպիրիկ և տեսականորեն հաշվարկված ռեգրեսիոն շարքերը, դրանց գրաֆիկները, որոնք կոչվում են ռեգրեսիոն գծեր, ինչպես նաև գծային և ոչ գծային ռեգրեսիոն գործակիցներ:

Ռեգրեսիայի ցուցիչները փոխկապակցվածություն են արտահայտում երկկողմանի՝ հաշվի առնելով բնութագրի միջին արժեքների փոփոխությունները. Յարժեքները փոխելիս x եսնշան Xև, ընդհակառակը, ցույց են տալիս հատկանիշի միջին արժեքների փոփոխություն Xըստ փոփոխված արժեքների y եսնշան Յ. Բացառություն են կազմում ժամանակային շարքերը կամ ժամանակային շարքերը, որոնք ցույց են տալիս ժամանակի ընթացքում բնութագրերի փոփոխությունները: Նման շարքերի հետընթացը միակողմանի է.

Հարաբերությունների շատ տարբեր ձևեր և տեսակներ կան: Առաջադրանքը հանգում է յուրաքանչյուր կոնկրետ դեպքում կապի ձևի նույնականացմանը և այն համապատասխան հարաբերակցության հավասարման միջոցով արտահայտելուն, ինչը թույլ է տալիս կանխատեսել հնարավոր փոփոխությունները մեկ բնութագրիչում: Յուրիշի հայտնի փոփոխությունների հիման վրա X, առաջինի հետ կապված հարաբերականորեն։

12.1 Գծային ռեգրեսիա

Ռեգրեսիայի հավասարում.Կոնկրետ կենսաբանական օբյեկտի վրա կատարված դիտարկումների արդյունքները՝ հիմնված փոխկապակցված բնութագրերի վրա xԵվ y, կարելի է ներկայացնել հարթության վրա գտնվող կետերով՝ ուղղանկյուն կոորդինատների համակարգ կառուցելով։ Արդյունքը մի տեսակ ցրման դիագրամ է, որը թույլ է տալիս դատել տարբեր բնութագրերի միջև փոխհարաբերությունների ձևն ու սերտությունը: Հաճախ այս հարաբերությունները ուղիղ գծի տեսք ունեն կամ կարող են մոտավորվել ուղիղ գծով:

Փոփոխականների միջև գծային հարաբերություն xԵվ yնկարագրված է ընդհանուր հավասարմամբ, որտեղ Ա Բ Գ Դ,... – հավասարման պարամետրեր, որոնք որոշում են արգումենտների միջև հարաբերությունները x 1 , x 2 , x 3 , …, x մև գործառույթներ։

Գործնականում հաշվի են առնվում ոչ բոլոր հնարավոր փաստարկները, այլ միայն որոշ փաստարկներ ամենապարզ դեպքում՝ միայն մեկը.

Գծային ռեգրեսիայի հավասարման մեջ (1) աազատ տերմինն է, և պարամետրը բորոշում է ռեգրեսիոն գծի թեքությունը ուղղանկյուն կոորդինատային առանցքների նկատմամբ։ Անալիտիկ երկրաչափության մեջ այս պարամետրը կոչվում է լանջինև կենսաչափության մեջ՝ ռեգրեսիայի գործակիցը. Այս պարամետրի և ռեգրեսիայի գծերի դիրքի տեսողական ներկայացում ՅԸստ XԵվ XԸստ Յուղղանկյուն կոորդինատային համակարգում տալիս է նկ. 1:

Բրինձ. 1 Համակարգում Y-ի X-ով և X-ով Y-ի ռեգրեսիոն տողեր

ուղղանկյուն կոորդինատներ

Ռեգրեսիոն գծերը, ինչպես ցույց է տրված Նկար 1-ում, հատվում են O (,) կետում, որը համապատասխանում է միմյանց հետ փոխկապակցված բնութագրերի միջին թվաբանական արժեքներին: ՅԵվ X. Ռեգրեսիոն գրաֆիկներ կառուցելիս X անկախ փոփոխականի արժեքները գծագրվում են աբսցիսայի առանցքի երկայնքով, իսկ կախյալ փոփոխականի կամ Y ֆունկցիայի արժեքները գծագրվում են AB գծի երկայնքով, որն անցնում է O կետով (, ) համապատասխանում է փոփոխականների ամբողջական (ֆունկցիոնալ) հարաբերություններին ՅԵվ X, երբ հարաբերակցության գործակիցը . Որքան ուժեղ է կապը միջև ՅԵվ X, որքան մոտ են ռեգրեսիոն գծերը AB-ին, և, ընդհակառակը, որքան թույլ է կապը այս մեծությունների միջև, այնքան հետադիմական գծերը ավելի հեռու են AB-ից։ Եթե ​​բնութագրերի միջև կապ չկա, ապա ռեգրեսիոն գծերը միմյանց նկատմամբ ուղիղ անկյան տակ են և .

Քանի որ ռեգրեսիայի ցուցիչները փոխկապակցվածություն են արտահայտում երկկողմանի, ռեգրեսիոն հավասարումը (1) պետք է գրվի հետևյալ կերպ.

Առաջին բանաձևը որոշում է միջին արժեքները, երբ բնութագրիչը փոխվում է Xչափման միավորի համար, երկրորդի համար՝ միջին արժեքները հատկանիշի չափման մեկ միավորով փոխվելիս Յ.

Ռեգրեսիայի գործակիցը.Ռեգրեսիայի գործակիցը ցույց է տալիս, թե միջինում որքան է մեկ հատկանիշի արժեքը yփոխվում է, երբ մյուսի չափը, փոխկապակցված, փոխվում է մեկով Յնշան X. Այս ցուցանիշը որոշվում է բանաձևով

Ահա արժեքները սբազմապատկվում է դասերի միջակայքերի չափով λ , եթե դրանք գտնվել են տատանումների շարքից կամ հարաբերակցության աղյուսակներից:

Ռեգրեսիայի գործակիցը կարող է հաշվարկվել առանց ստանդարտ շեղումների հաշվարկման ս yԵվ ս xըստ բանաձևի

Եթե ​​հարաբերակցության գործակիցը անհայտ է, ապա ռեգրեսիայի գործակիցը որոշվում է հետևյալ կերպ.

Ռեգրեսիայի և հարաբերակցության գործակիցների կապը.Համեմատելով (11.1) (թեմա 11) և (12.5) բանաձևերը, մենք տեսնում ենք, որ դրանց համարիչն ունի նույն արժեքը, ինչը ցույց է տալիս այս ցուցանիշների միջև կապը: Այս հարաբերությունն արտահայտվում է հավասարությամբ

Այսպիսով, հարաբերակցության գործակիցը հավասար է գործակիցների երկրաչափական միջինին բ yxԵվ բ xy. Բանաձև (6) թույլ է տալիս, առաջին հերթին, հիմնվելով ռեգրեսիայի գործակիցների հայտնի արժեքների վրա բ yxԵվ բ xyորոշել ռեգրեսիայի գործակիցը Ռ xy, և երկրորդը, ստուգեք այս հարաբերակցության ցուցանիշի հաշվարկի ճիշտությունը Ռ xyտարբեր բնութագրերի միջև XԵվ Յ.

Ինչպես հարաբերակցության գործակիցը, այնպես էլ ռեգրեսիայի գործակիցը բնութագրում է միայն գծային հարաբերությունը և ուղեկցվում է դրական հարաբերությունների համար գումարած նշանով և բացասական հարաբերությունների համար մինուս նշանով:

Գծային ռեգրեսիայի պարամետրերի որոշում.Հայտնի է, որ քառակուսի շեղումների գումարը տարբերակ է x եսմիջինից ամենափոքր արժեքն է, այսինքն՝ այս թեորեմը կազմում է նվազագույն քառակուսիների մեթոդի հիմքը։ Գծային ռեգրեսիայի վերաբերյալ [տես Բանաձև (1)] այս թեորեմի պահանջը բավարարվում է հավասարումների որոշակի համակարգով, որը կոչվում է նորմալ:

Այս հավասարումների համատեղ լուծումը պարամետրերի նկատմամբ աԵվ բհանգեցնում է հետևյալ արդյունքների.

;

;

, որտեղից և.

Հաշվի առնելով փոփոխականների միջև փոխհարաբերությունների երկկողմանի բնույթը ՅԵվ X, պարամետրը որոշելու բանաձև Ապետք է արտահայտվի այսպես.

Եվ . (7)

Պարամետր բ, կամ ռեգրեսիայի գործակիցը, որոշվում է հետևյալ բանաձևերով.

Էմպիրիկ ռեգրեսիոն շարքերի կառուցում.Եթե ​​կան մեծ թվով դիտարկումներ, ռեգրեսիոն վերլուծությունը սկսվում է էմպիրիկ ռեգրեսիոն շարքերի կառուցմամբ: Էմպիրիկ ռեգրեսիայի շարքձևավորվում է մեկ տարբեր բնութագրիչի արժեքների հաշվարկով Xուրիշի միջին արժեքները՝ փոխկապակցված Xնշան Յ. Այլ կերպ ասած, էմպիրիկ ռեգրեսիոն շարքերի կառուցումը հանգում է Y և X բնութագրերի համապատասխան արժեքներից խմբի միջինների հայտնաբերմանը:

Էմպիրիկ ռեգրեսիոն շարքը թվերի կրկնակի շարք է, որը կարելի է ներկայացնել հարթության վրա գտնվող կետերով, այնուհետև այդ կետերը ուղիղ գծերի հատվածների հետ կապելով՝ կարելի է ստանալ էմպիրիկ ռեգրեսիոն գիծ։ Էմպիրիկ ռեգրեսիոն շարքերը, հատկապես դրանց գրաֆիկները, կոչվում են ռեգրեսիայի գծեր, հստակ պատկերացում տվեք տարբեր բնութագրերի միջև հարաբերակցության ձևի և սերտության մասին:

Էմպիրիկ ռեգրեսիոն շարքերի հավասարեցում.Էմպիրիկ ռեգրեսիոն շարքերի գրաֆիկները, որպես կանոն, ոչ թե հարթ, այլ կոտրված գծեր են ստացվում։ Սա բացատրվում է նրանով, որ հիմնական պատճառների հետ մեկտեղ, որոնք որոշում են փոխկապակցված բնութագրերի փոփոխականության ընդհանուր օրինաչափությունը, դրանց մեծության վրա ազդում է բազմաթիվ երկրորդական պատճառների ազդեցությունը, որոնք առաջացնում են ռեգրեսիայի հանգուցային կետերի պատահական տատանումներ: Փոխկապակցված բնութագրերի զուգակցված տատանումների հիմնական միտումը (միտումը) բացահայտելու համար անհրաժեշտ է կոտրված գծերը փոխարինել հարթ, սահուն ռեգրեսիոն գծերով: Կոտրված գծերը հարթ գծերով փոխարինելու գործընթացը կոչվում է էմպիրիկ շարքերի հավասարեցումԵվ ռեգրեսիայի գծեր.

Գրաֆիկական հավասարեցման մեթոդ.Սա ամենապարզ մեթոդն է, որը չի պահանջում հաշվողական աշխատանք։ Դրա էությունը հանգում է հետևյալին. Էմպիրիկ ռեգրեսիոն շարքը պատկերված է ուղղանկյուն կոորդինատային համակարգում որպես գրաֆիկ: Այնուհետև տեսողականորեն ուրվագծվում են ռեգրեսիայի միջնակետերը, որոնց երկայնքով գծվում է հոծ գիծ՝ օգտագործելով քանոն կամ նախշ: Այս մեթոդի թերությունն ակնհայտ է. այն չի բացառում հետազոտողի անհատական ​​հատկությունների ազդեցությունը էմպիրիկ ռեգրեսիոն գծերի հավասարեցման արդյունքների վրա։ Հետևաբար, այն դեպքերում, երբ կոտրված ռեգրեսիոն գծերը հարթ գծերով փոխարինելիս անհրաժեշտ է ավելի մեծ ճշգրտություն, օգտագործվում են էմպիրիկ շարքերի հավասարեցման այլ մեթոդներ:

Շարժվող միջին մեթոդ.Այս մեթոդի էությունը հանգում է էմպիրիկ շարքի երկու կամ երեք հարակից անդամներից թվաբանական միջինների հաջորդական հաշվարկին: Այս մեթոդը հատկապես հարմար է այն դեպքերում, երբ էմպիրիկ շարքը ներկայացված է մեծ թվով տերմիններով, այնպես որ դրանցից երկուսի կորուստը՝ ծայրահեղների, որն անխուսափելի է հավասարեցման այս մեթոդով, նկատելիորեն չի ազդի դրա կառուցվածքի վրա:

Նվազագույն քառակուսի մեթոդ.Այս մեթոդը առաջարկվել է 19-րդ դարի սկզբին Ա.Մ. Լեժանդրին և նրանից անկախ Կ.Գաուսին։ Այն թույլ է տալիս առավել ճշգրիտ կերպով հավասարեցնել էմպիրիկ շարքերը: Այս մեթոդը, ինչպես ցույց է տրված վերևում, հիմնված է այն ենթադրության վրա, որ քառակուսի շեղումների գումարը տարբերակ է x ես դրանց միջինից կա նվազագույն արժեք, այսինքն՝ այստեղից է գալիս մեթոդի անվանումը, որն օգտագործվում է ոչ միայն էկոլոգիայում, այլև տեխնոլոգիայի մեջ։ Նվազագույն քառակուսիների մեթոդը օբյեկտիվ է և ունիվերսալ, այն օգտագործվում է ռեգրեսիոն շարքերի էմպիրիկ հավասարումներ գտնելիս և դրանց պարամետրերը որոշելիս:

Նվազագույն քառակուսիների մեթոդի պահանջն այն է, որ ռեգրեսիոն գծի տեսական կետերը պետք է ստացվեն այնպես, որ էմպիրիկ դիտարկումների համար այս կետերից քառակուսի շեղումների գումարը. y եսնվազագույն էր, այսինքն.

Այս արտահայտության մինիմումը հաշվարկելով մաթեմատիկական վերլուծության սկզբունքներին համապատասխան և որոշակի ձևով փոխակերպելով՝ կարելի է ստանալ այսպես կոչված համակարգ. նորմալ հավասարումներ, որոնցում անհայտ արժեքները ռեգրեսիոն հավասարման պահանջվող պարամետրերն են, իսկ հայտնի գործակիցները որոշվում են բնութագրերի էմպիրիկ արժեքներով, սովորաբար դրանց արժեքների և դրանց խաչաձեւ արտադրությունների գումարներով:

Բազմակի գծային ռեգրեսիա:Մի քանի փոփոխականների միջև կապը սովորաբար արտահայտվում է բազմակի ռեգրեսիայի հավասարմամբ, որը կարող է լինել գծայինԵվ ոչ գծային. Իր ամենապարզ ձևով բազմակի ռեգրեսիան արտահայտվում է որպես հավասարում երկու անկախ փոփոխականներով ( x, զ):

Որտեղ ա- հավասարման ազատ ժամկետ; բԵվ գ- հավասարման պարամետրեր. (10) հավասարման պարամետրերը գտնելու համար (օգտագործելով նվազագույն քառակուսիների մեթոդը) օգտագործվում է նորմալ հավասարումների հետևյալ համակարգը.

Դինամիկ շարք. Տողերի հավասարեցում.Ժամանակի ընթացքում բնութագրերի փոփոխությունները ձևավորում են այսպես կոչված ժամանակային շարքերկամ դինամիկայի շարք. Նման շարքերի բնորոշ առանձնահատկությունն այն է, որ X անկախ փոփոխականն այստեղ միշտ ժամանակի գործոնն է, իսկ Y կախյալ փոփոխականը՝ փոփոխվող հատկանիշ։ Կախված ռեգրեսիայի շարքից՝ X և Y փոփոխականների միջև կապը միակողմանի է, քանի որ ժամանակի գործոնը կախված չէ բնութագրերի փոփոխականությունից։ Չնայած այս հատկանիշներին, դինամիկայի շարքերը կարելի է համեմատել ռեգրեսիոն շարքերի հետ և մշակել նույն մեթոդներով:

Ինչպես ռեգրեսիոն շարքերը, էմպիրիկ դինամիկայի շարքերը ազդում են ոչ միայն հիմնականների, այլև բազմաթիվ երկրորդական (պատահական) գործոնների վրա, որոնք թաքցնում են բնութագրերի փոփոխականության հիմնական միտումը, որը վիճակագրության լեզվով կոչվում է. միտում.

Ժամանակային շարքերի վերլուծությունը սկսվում է միտումի ձևի բացահայտմամբ: Դա անելու համար ժամանակային շարքը պատկերված է ուղղանկյուն կոորդինատային համակարգում գծային գրաֆիկի տեսքով: Այս դեպքում ժամանակային կետերը (տարիներ, ամիսներ և ժամանակի այլ միավորներ) գծագրվում են աբսցիսայի առանցքի երկայնքով, իսկ կախյալ փոփոխականի արժեքները գծագրվում են օրդինատների առանցքի երկայնքով, եթե առկա է գծային հարաբերություն X փոփոխականների միջև և Y (գծային միտում), ամենափոքր քառակուսիների մեթոդը ամենահարմարն է ժամանակային շարքերը հավասարեցնելու համար ռեգրեսիոն հավասարում է՝ Y կախված փոփոխականի շարքի տերմինների շեղումների տեսքով անկախ շարքի միջին թվաբանականից։ փոփոխական X:

Ահա գծային ռեգրեսիայի պարամետրը:

Դինամիկայի շարքերի թվային բնութագրերը.Դինամիկայի շարքերի հիմնական ընդհանրացնող թվային բնութագրերը ներառում են երկրաչափական միջինև դրան մոտ թվաբանական միջին: Նրանք բնութագրում են միջին արագությունը, որով կախված փոփոխականի արժեքը որոշակի ժամանակահատվածներում փոխվում է.

Դինամիկայի շարքի անդամների փոփոխականության գնահատումն է ստանդարտ շեղում. Ժամանակային շարքերը նկարագրելու համար ռեգրեսիոն հավասարումներ ընտրելիս հաշվի է առնվում միտումի ձևը, որը կարող է լինել գծային (կամ կրճատվել մինչև գծային) և ոչ գծային: Ռեգրեսիայի հավասարման ընտրության ճիշտությունը սովորաբար դատվում է կախված փոփոխականի էմպիրիկ դիտարկված և հաշվարկված արժեքների նմանությամբ: Այս խնդրի առավել ճշգրիտ լուծումը շեղումների ռեգրեսիոն վերլուծության մեթոդն է (թեմա 12, պարագրաֆ 4):

Ժամանակային շարքերի հարաբերակցություն.Հաճախ անհրաժեշտ է լինում համեմատել միմյանց հետ կապված զուգահեռ ժամանակային շարքերի դինամիկան որոշակի ընդհանուր պայմաններով, օրինակ՝ պարզել գյուղատնտեսական արտադրության և որոշակի ժամանակահատվածում անասնագլխաքանակի աճի միջև կապը: Նման դեպքերում X և Y փոփոխականների փոխհարաբերությունների բնութագիրը հետևյալն է հարաբերակցության գործակիցը R xy (գծային միտումի առկայության դեպքում):

Հայտնի է, որ ժամանակային շարքերի միտումը, որպես կանոն, քողարկվում է Y կախյալ փոփոխականի շարքի տատանումներով։ Սա առաջացնում է երկակի խնդիր՝ չափել կախվածությունը համեմատվող շարքերի միջև՝ առանց միտումը բացառելու, և չափել կախվածությունը նույն շարքի հարևան անդամների միջև՝ բացառելով միտումը։ Առաջին դեպքում համեմատվող ժամանակային շարքերի միջև կապի սերտության ցուցանիշն է հարաբերակցության գործակիցը(եթե հարաբերությունները գծային են), երկրորդում՝ ավտոկորելյացիայի գործակից. Այս ցուցանիշները տարբեր նշանակություն ունեն, թեև դրանք հաշվարկվում են նույն բանաձևերով (տես թեմա 11):

Հեշտ է տեսնել, որ ավտոկոռելյացիայի գործակիցի արժեքի վրա ազդում է կախված փոփոխականի շարքի անդամների փոփոխականությունը. որքան քիչ են շարքի անդամները շեղվում միտումից, այնքան բարձր է ավտոկոռելյացիայի գործակիցը և հակառակը:


Ամենաշատ խոսվածը
Մաթեմատիկայի դաս թեմայի շուրջ Մաթեմատիկայի դաս «Մաթեմատիկական վիճակագրության խնդիրները» թեմայով (11 դասարան)
Ինչպե՞ս զարգացնել հնչյունաբանական իրազեկությունը և ինչու է դա անհրաժեշտ: Ինչպե՞ս զարգացնել հնչյունաբանական իրազեկությունը և ինչու է դա անհրաժեշտ:
Նախապատրաստական ​​խմբում տրամաբանության պլան Նախապատրաստական ​​խմբում տրամաբանության պլան


գագաթ