Regression-ը Excel-ում մի միջոց է ավտոմատացնելու վիճակագրական գործընթացը՝ համեմատելով մի քանի լրատվություն տեղեկատվության՝ տեսնելու, թե ինչպես են անկախ փոփոխականների փոփոխությունները ազդում կախված փոփոխականների փոփոխությունների վրա: Եթե երբևէ ցանկացել եք կապ գտնել երկու բաների միջև, ապա Excel-ում ռեգրեսիոն վերլուծության օգտագործումը դա անելու լավագույն միջոցներից մեկն է:
Այս հոդվածի հրահանգները վերաբերում են Excel 2019, Excel 2016, Excel 2013, Excel 2010:
Ի՞նչ է ռեգրեսիայի իմաստը:
Ռեգեսիան վիճակագրական մոդելավորման մոտեցում է, որը վերլուծաբաններն օգտագործում են բազմաթիվ փոփոխականների միջև հարաբերությունները որոշելու համար:
Ռեգրեսիոն վերլուծությունը սկսվում է մեկ փոփոխականից, որը դուք փորձում եք վերլուծել, և անկախ փոփոխականներից, որոնք դուք փորձարկում եք՝ տեսնելու, թե արդյոք դրանք ազդում են այդ մեկ փոփոխականի վրա:Վերլուծությունը դիտարկում է անկախ փոփոխականների փոփոխությունները և փորձում է այդ փոփոխությունները փոխկապակցել միայնակ (կախյալ) փոփոխականի արդյունքում առաջացած փոփոխությունների հետ:
Սա կարող է թվալ առաջադեմ վիճակագրություն, սակայն Excel-ը այս բարդ վերլուծությունը հասանելի է դարձնում բոլորին:
Գծային ռեգրեսիայի կատարում Excel-ում
Ռեգեսիոն վերլուծության ամենապարզ ձևը գծային ռեգրեսիան է: Պարզ գծային ռեգրեսիան դիտարկում է միայն երկու փոփոխականների փոխհարաբերությունները:
Օրինակ, հետևյալ աղյուսակը ցույց է տալիս տվյալներ, որոնք պարունակում են տվյալներ, որոնք պարունակում են մարդու ամեն օր կերած կալորիաների քանակը և այդ օրը նրա քաշը:
Քանի որ այս աղյուսակը պարունակում է տվյալների երկու սյունակ, և մի փոփոխականը կարող է ազդեցություն ունենալ մյուսի վրա, կարող եք այս տվյալների վրա ռեգրեսիայի վերլուծություն կատարել Excel-ի միջոցով:
Միացնել Analysis ToolPak հավելումը
Նախքան Excel-ի ռեգրեսիոն վերլուծության գործառույթն օգտագործելը, դուք պետք է միացնեք Analysis ToolPak հավելումը Excel-ի ընտրանքների էկրանին:
-
Excel-ում ընտրեք Ֆայլ ընտրացանկը և ընտրեք Ընտրանքներ:
-
Ընտրեք Ավելացումներ ձախ նավիգացիոն ընտրացանկից: Այնուհետև համոզվեք, որ Excel Add-ins ընտրված է Կառավարում դաշտում:
-
Վերջապես ընտրեք Գնալ կոճակը:
-
Հավելումներ բացվող պատուհանում: Միացրեք Analysis ToolPack ՝ սեղմելով դրա դիմացի վանդակը՝ նշագիծ ավելացնելու համար և ընտրեք OK:
Այժմ, երբ Analysis ToolPak-ը միացված է, դուք պատրաստ եք սկսել ռեգրեսիոն վերլուծություն կատարել Excel-ում:
Ինչպես կատարել պարզ գծային ռեգրեսիա Excel-ում
Օգտագործելով քաշի և կալորիաների աղյուսակը որպես օրինակ՝ կարող եք կատարել գծային ռեգրեսիոն վերլուծություն Excel-ում հետևյալ կերպ:
-
Ընտրեք Data ընտրացանկը: Այնուհետև Analysis խմբում ընտրեք Տվյալների վերլուծություն.
-
Տվյալների վերլուծություն պատուհանում ընտրեք Regression ցանկից և սեղմեք OK:
-
Մուտքային Y միջակայք բջիջների այն տիրույթն է, որը պարունակում է կախված փոփոխականը: Այս օրինակում դա քաշն է: Input X Range-ը բջիջների այն տիրույթն է, որը պարունակում է անկախ փոփոխական: Այս օրինակում դա կալորիականության սյունակն է:
-
Ընտրեք Labels վերնագրի բջիջների համար, այնուհետև ընտրեք Նոր աշխատաթերթ արդյունքները նոր աշխատաթերթ ուղարկելու համար: Ընտրեք OK, որպեսզի Excel-ը կատարի վերլուծությունը և ուղարկի արդյունքները նոր թերթիկ:
-
Ուսումնասիրեք նոր աշխատաթերթը: Վերլուծության արդյունքն ունի մի շարք արժեքներ, որոնք դուք պետք է հասկանաք արդյունքները մեկնաբանելու համար:
Այս թվերից յուրաքանչյուրն ունի հետևյալ նշանակությունը՝
- Բազմաթիվ R՝ հարաբերակցության գործակից: 1-ը ցույց է տալիս երկու փոփոխականների միջև ամուր հարաբերակցություն, մինչդեռ -1 նշանակում է, որ կա ուժեղ բացասական հարաբերություն: 0-ը նշանակում է, որ հարաբերակցություն չկա:
- R քառակուսի. Որոշման գործակիցը, որը ցույց է տալիս, թե երկու փոփոխականների միջև քանի միավոր է ընկնում ռեգրեսիոն գծի վրա: Վիճակագրորեն սա միջինից քառակուսի շեղումների գումարն է։
- Ճշգրտված R քառակուսի. վիճակագրական արժեք, որը կոչվում է R քառակուսի, որը ճշգրտվում է ձեր ընտրած անկախ փոփոխականների քանակի համար:
- Ստանդարտ սխալ. Որքան ճշգրիտ են ռեգրեսիոն վերլուծության արդյունքները: Եթե այս սխալը փոքր է, ապա ձեր ռեգրեսիայի արդյունքներն ավելի ճշգրիտ են:
- Դիտարկումներ. Դիտարկումների քանակը ձեր ռեգրեսիայի մոդելում:
Մնացած արժեքները ռեգրեսիայի ելքում տալիս են մանրամասներ ռեգրեսիոն վերլուծության ավելի փոքր բաղադրիչների մասին:
- df. վիճակագրական արժեք, որը հայտնի է որպես ազատության աստիճաններ՝ կապված շեղումների աղբյուրների հետ:
- SS՝ քառակուսիների գումար: Քառակուսիների մնացորդային գումարի և ընդհանուր SS-ի հարաբերակցությունը պետք է ավելի փոքր լինի, եթե ձեր տվյալների մեծ մասը համապատասխանում է ռեգրեսիայի գծին:
- MS. ռեգրեսիայի տվյալների միջին քառակուսի:
- F. F վիճակագրություն (F-թեստ) զրոյական վարկածի համար: Սա ապահովում է ռեգրեսիայի մոդելի նշանակությունը։
- Նշանակություն F. Վիճակագրական արժեքը հայտնի է որպես F-ի P արժեք.
Քանի դեռ չեք հասկանում վիճակագրությունը և ռեգրեսիայի մոդելների հաշվարկը, ամփոփագրի ներքևի արժեքները մեծ նշանակություն չեն ունենա: Այնուամենայնիվ, բազմակի R և R քառակուսիները երկուսն են ամենակարևորը:
Ինչպես տեսնում եք, այս օրինակում կալորիաները մեծ հարաբերակցություն ունեն ընդհանուր քաշի հետ:
Բազմակի գծային ռեգրեսիայի վերլուծություն Excel-ում
Նույն գծային ռեգրեսիան կատարելու համար, բայց մի քանի անկախ փոփոխականներով, ընտրեք ամբողջ տիրույթը (բազմաթիվ սյունակներ և տողեր) Input X Range:
Բազմաթիվ անկախ փոփոխականներ ընտրելիս քիչ հավանական է, որ դուք կգտնեք նույնքան ամուր հարաբերակցություն, քանի որ կան շատ փոփոխականներ:
Սակայն Excel-ում ռեգրեսիոն վերլուծությունը կարող է օգնել ձեզ գտնել փոխկապակցվածություն այդ փոփոխականներից մեկի կամ մի քանիսի հետ, որոնք դուք կարող եք չհասկանալ, որ գոյություն ունեն՝ պարզապես ձեռքով վերանայելով տվյալները: