T-թեստը մի միջոց է որոշելու, թե արդյոք առկա են վիճակագրորեն նշանակալի տարբերություններ տվյալների հավաքածուների միջև՝ օգտագործելով Student-ի t-բաշխումը: Excel-ում T-Test-ը երկու նմուշի T-թեստ է, որը համեմատում է երկու նմուշների միջինները: Այս հոդվածը բացատրում է, թե ինչ է նշանակում վիճակագրական նշանակություն և ցույց է տալիս, թե ինչպես կատարել T-Test Excel-ում:
Այս հոդվածի հրահանգները վերաբերում են Excel 2019, 2016, 2013, 2010, 2007; Excel Microsoft 365-ի և Excel Online-ի համար:
Ի՞նչ է վիճակագրական նշանակությունը:
Պատկերացրեք, որ ուզում եք իմանալ, թե երկու զառերից որն ավելի լավ միավոր կտա: Դուք գլորում եք առաջին ձողը և ստանում 2; դուք գլորում եք երկրորդ ձողը և ստանում 6:Արդյո՞ք սա ձեզ ասում է, որ երկրորդ մահը սովորաբար ավելի բարձր միավորներ է տալիս: Եթե դուք պատասխանել եք «Իհարկե ոչ», ապա դուք արդեն որոշակի պատկերացում ունեք վիճակագրական նշանակության մասին: Հասկանում եք, որ տարբերությունը պայմանավորված էր միավորի պատահական փոփոխությամբ, ամեն անգամ, երբ գլորվում է մատրից: Քանի որ նմուշը շատ փոքր էր (միայն մեկ գլանափաթեթ), այն նշանակալի ոչինչ ցույց չտվեց։
Այժմ պատկերացրեք, որ դուք գլորում եք յուրաքանչյուր ձագը 6 անգամ:
- Առաջին ձողը գլորում է 3, 6, 6, 4, 3, 3; Միջին=4,17
- Երկրորդ ձողը գլորում է 5, 6, 2, 5, 2, 4; Միջին=4,00
Արդյո՞ք սա հիմա ապացուցում է, որ առաջին դիակը ավելի բարձր միավորներ է տալիս, քան երկրորդը: Հավանաբար ոչ. Միջոցների միջև համեմատաբար փոքր տարբերությամբ փոքր նմուշը հավանական է դարձնում, որ տարբերությունը դեռևս պատահական տատանումների պատճառով է: Քանի որ մենք ավելացնում ենք զառեր գլորելու թիվը, դժվարանում է ողջախոհություն տալ հարցին. միավորների միջև տարբերությունը պատահական փոփոխության արդյունք է, թե՞ մեկը իրականում ավելի բարձր միավորներ կտա, քան մյուսը:
Նշանակությունը հավանականությունն է, որ նմուշների միջև նկատված տարբերությունը պայմանավորված է պատահական տատանումներով: Նշանակությունը հաճախ կոչվում է ալֆա մակարդակ կամ պարզապես «α»: Վստահության մակարդակը կամ պարզապես «c»-ն այն հավանականությունն է, որ նմուշների միջև տարբերությունը պատահական տատանումների պատճառով չէ. այլ կերպ ասած, որ հիմքում ընկած պոպուլյացիաների միջև տարբերություն կա: Հետևաբար՝ c=1 – α
Մենք կարող ենք «α»-ն սահմանել ցանկացած մակարդակի վրա, որը ցանկանում ենք՝ վստահ զգալու համար, որ ապացուցված նշանակություն ունենք: Շատ հաճախ օգտագործվում է α=5% (95% վստահություն), բայց եթե մենք իսկապես ուզում ենք վստահ լինել, որ որևէ տարբերություն պայմանավորված չէ պատահական տատանումներով, մենք կարող ենք կիրառել վստահության ավելի բարձր մակարդակ՝ օգտագործելով α=1% կամ նույնիսկ α=0.1։ %.
Տարբեր վիճակագրական թեստեր օգտագործվում են տարբեր իրավիճակներում նշանակությունը հաշվարկելու համար: T-թեստերը օգտագործվում են որոշելու համար, թե արդյոք երկու պոպուլյացիաների միջինները տարբեր են, իսկ F- թեստերը օգտագործվում են որոշելու համար, թե արդյոք շեղումները տարբեր են:
Ինչու՞ վիճակագրական նշանակության թեստ:
Տարբեր բաներ համեմատելիս մենք պետք է օգտագործենք նշանակության թեստ՝ որոշելու համար, թե արդյոք մեկը մյուսից լավն է: Սա վերաբերում է բազմաթիվ դաշտերի, օրինակ՝
- Բիզնեսում մարդիկ պետք է համեմատեն տարբեր ապրանքներ և շուկայավարման մեթոդներ:
- Սպորտում մարդիկ պետք է համեմատեն տարբեր սարքավորումներ, տեխնիկա և մրցակիցներ:
- Ճարտարագիտության մեջ մարդիկ պետք է համեմատեն տարբեր դիզայներ և պարամետրերի պարամետրեր:
Եթե ցանկանում եք ստուգել, թե արդյոք ինչ-որ բան ավելի լավ է գործում, քան որևէ այլ բան, ցանկացած ոլորտում, դուք պետք է փորձարկեք վիճակագրական նշանակությունը:
Ի՞նչ է ուսանողական T-բաշխումը:
A ուսանողի t-բաշխումը նման է նորմալ (կամ Գաուսի) բաշխմանը: Սրանք երկուսն էլ զանգակաձև բաշխումներ են, որոնց մեծամասնությունը արդյունքները մոտ են միջինին, բայց որոշ հազվադեպ իրադարձություններ բավականին հեռու են միջինից երկու ուղղություններով, որոնք կոչվում են բաշխման պոչեր::
Ուսանողի t-բաշխման ճշգրիտ ձևը կախված է ընտրանքի չափից: 30-ից ավելի նմուշների համար այն շատ նման է նորմալ բաշխմանը: Քանի որ ընտրանքի չափը փոքրանում է, պոչերը մեծանում են, ինչը ներկայացնում է մեծացած անորոշությունը, որն առաջանում է փոքր նմուշի հիման վրա եզրակացություններ անելուց:
Ինչպես անել T-Test Excel-ում
Նախքան կարող եք կիրառել T-Test՝ որոշելու համար, թե արդյոք կա վիճակագրորեն նշանակալի տարբերություն երկու նմուշների միջինների միջև, նախ պետք է կատարեք F-Թեստ: Դա պայմանավորված է նրանով, որ T-Test-ի համար կատարվում են տարբեր հաշվարկներ՝ կախված նրանից, թե արդյոք տարբերությունների միջև էական տարբերություն կա:
Ձեզ անհրաժեշտ կլինի Analysis Toolpak հավելումը այս վերլուծությունը կատարելու համար միացված է:
Ստուգում և բեռնում է վերլուծության գործիքակազմի հավելումը
Վերլուծության գործիքակազմը ստուգելու և ակտիվացնելու համար հետևեք հետևյալ քայլերին.
- Ընտրեք FILE ներդիրը >ընտրեք Ընտրանքներ.
- Ընտրանքներ երկխոսության դաշտում ձախ կողմի ներդիրներից ընտրեք Ավելացումներ:
-
Պատուհանի ներքևում ընտրեք «Կառավարել» բացվող ընտրացանկը, այնուհետև ընտրեք Excel հավելումներ: Ընտրեք Go.
- Համոզվեք, որ Analysis Toolpak-ի կողքի վանդակը նշված է, ապա ընտրեք OK.
- Վերլուծության գործիքակազմն այժմ ակտիվ է, և դուք պատրաստ եք կիրառել F-Test և T-Tests:
F-Test և T-Test-ի կատարում Excel-ում
-
Մուտքագրեք տվյալների երկու հավաքածու աղյուսակում: Այս դեպքում մենք դիտարկում ենք մեկ շաբաթվա ընթացքում երկու ապրանքի վաճառքը։ Հաշվարկվում է նաև յուրաքանչյուր ապրանքի միջին օրական վաճառքի արժեքը՝ դրա ստանդարտ շեղման հետ միասին։
-
Ընտրեք Տվյալներ ներդիրը > Տվյալների վերլուծություն
-
Ընտրեք F-Test Two-Sample for Variance ցանկից, ապա ընտրեք OK.
F-Test-ը շատ զգայուն է ոչ նորմալության նկատմամբ: Հետևաբար, կարող է ավելի անվտանգ լինել Welch թեստ օգտագործելը, բայց դա ավելի դժվար է Excel-ում:
-
Ընտրեք փոփոխական 1 տիրույթը և փոփոխական 2 միջակայքը; սահմանել Ալֆան (0.05 տալիս է 95% վստահություն); ընտրեք բջիջ ելքի վերին ձախ անկյունում, հաշվի առնելով, որ այն կլրացնի 3 սյունակ և 10 տող: Ընտրեք OK.
Փոփոխական 1 տիրույթի համար պետք է ընտրվի ամենամեծ ստանդարտ շեղումը (կամ շեղումը) ունեցող նմուշը:
-
Դիտեք F-Test-ի արդյունքները՝ որոշելու, թե արդյոք տարբերությունների միջև էական տարբերություն կա: Արդյունքները տալիս են երեք կարևոր արժեք՝
- F՝ տարբերությունների միջև հարաբերակցությունը։
- P(F<=f) one-tail. Հավանականությունը, որ 1 փոփոխականն իրականում ավելի մեծ շեղում չունի, քան 2-ը: Եթե սա ավելի մեծ է, քան ալֆան, որը ընդհանուր առմամբ 0,05 է, ապա տարբերությունների միջև էական տարբերություն չկա:
- F Կրիտիկական մեկ պոչ. F-ի արժեքը, որը կպահանջվի P(F<=f)=α տալու համար: Եթե այս արժեքը F-ից մեծ է, սա նաև ցույց է տալիս, որ տարբերությունների միջև էական տարբերություն չկա:
P(F<=f) կարող է նաև հաշվարկվել՝ օգտագործելով FDIST ֆունկցիան F-ով և յուրաքանչյուր նմուշի ազատության աստիճանները որպես մուտքագրում: Ազատության աստիճանները պարզապես նմուշի դիտարկումների քանակն է՝ մինուս մեկ:
-
Այժմ, երբ դուք գիտեք, թե արդյոք տարբերությունների միջև տարբերություն կա, կարող եք ընտրել համապատասխան T-Test-ը: Ընտրեք Տվյալների ներդիրը > Տվյալների վերլուծություն, այնուհետև ընտրեք կամ t-Թեստ. Երկու նմուշ ենթադրելով հավասար տատանումներor t-Թեստ. երկու նմուշ՝ ենթադրելով անհավասար տատանումներ
-
Անկախ նրանից, թե որ տարբերակն եք ընտրել նախորդ քայլում, ձեզ կներկայացվի նույն երկխոսության տուփը՝ վերլուծության մանրամասները մուտքագրելու համար: Սկսելու համար ընտրեք նմուշներ պարունակող միջակայքերը Փոփոխական 1 Range և Փոփոխական 2 Range համար:
- Ենթադրենք, որ ցանկանում եք ստուգել միջինների միջև տարբերությունը, Հիպոթեզված միջին տարբերությունը սահմանեք զրո:
- Սահմանել Alpha նշանակության մակարդակը (0.05-ը տալիս է 95% վստահություն) և ելքի վերին ձախ անկյունի համար ընտրեք բջիջ՝ հաշվի առնելով, որ այն կլրացնի 3 սյունակ և 14 տող: Ընտրեք OK.
-
Վերանայեք արդյունքները՝ որոշելու, թե արդյոք միջոցների միջև էական տարբերություն կա:
Ինչպես F-Test-ի դեպքում, եթե p-արժեքը, այս դեպքում P(T<=t), ավելի մեծ է, քան ալֆան, ապա էական տարբերություն չկա: Այնուամենայնիվ, այս դեպքում տրված են երկու p-արժեքներ՝ մեկը մեկ պոչ թեստի համար, իսկ մյուսը երկու պոչ թեստի համար: Այս դեպքում օգտագործեք երկու պոչի արժեքը, քանի որ ավելի մեծ միջին ունեցող ցանկացած փոփոխական էական տարբերություն կլինի: