ev

Alfa əhəmiyyət səviyyəsinin standart dəyərləri. Statistik əhəmiyyət səviyyəsinin başa düşülməsi

Statistik nəticəyə haqq qazandırarkən sual verilməlidir: sıfır fərziyyəni qəbul etmək və rədd etmək arasında sərhəd haradadır? Təcrübədə təsadüfi təsirlərin olması səbəbindən bu sərhədi tam dəqiqliklə çəkmək mümkün deyil. Konsepsiyaya əsaslanır əhəmiyyət səviyyəsi. Əhəmiyyət səviyyəsi sıfır fərziyyənin yalançı şəkildə rədd edilməsi ehtimalı adlanır. Və ya başqa sözlə, əhəmiyyət səviyyəsi - Bu, qərar qəbul edərkən I tip səhvin olma ehtimalıdır. Bu ehtimalı ifadə etmək üçün, bir qayda olaraq, ya yunan hərfindən α, ya da Latın hərfindən istifadə edirlər R. Bundan sonra məktubu istifadə edəcəyik R.

Tarixən statistikadan istifadə edən tətbiqi elmlərdə, xüsusən də psixologiyada statistik əhəmiyyətin ən aşağı səviyyəsi səviyyəsi hesab olunur. p = 0,05; kifayət qədər - səviyyə R= 0,01 və daha yüksək səviyyə p = 0.001. Buna görə də, statistika dərsliklərinə əlavədə verilmiş statistik cədvəllərdə adətən səviyyələr üçün cədvəl qiymətləri verilir. p = 0,05, p = 0.01 və R= 0,001. Bəzən səviyyələr üçün cədvəl dəyərləri verilir R - 0,025 və p = 0,005.

0,05, 0,01 və 0,001 dəyərləri statistik əhəmiyyətin standart səviyyələridir. Eksperimental məlumatları statistik təhlil edərkən, psixoloq tədqiqatın məqsədlərindən və fərziyyələrindən asılı olaraq tələb olunan əhəmiyyət səviyyəsini seçməlidir. Gördüyümüz kimi, burada ən böyük dəyər və ya statistik əhəmiyyət səviyyəsinin aşağı həddi 0,05-ə bərabərdir - bu o deməkdir ki, yüz elementdən (hallarda, subyektlərdən) ibarət nümunədə beş səhvə və ya iyirmidə bir səhvə yol verilir. elementlər (hallar, mövzular). Hesab olunur ki, yüz dəfədən nə altı, nə yeddi, nə də daha çox səhv edə bilmərik. Belə səhvlərin qiyməti çox yüksək olacaq.

Qeyd edək ki, kompüterlərdə müasir statistik paketlər standart əhəmiyyət səviyyələrindən deyil, müvafiq statistik metodla iş prosesində birbaşa hesablanan səviyyələrdən istifadə edir. Bu səviyyələr, məktubla təyin olunur R, 0-dan 1-ə qədər müxtəlif ədədi ifadəyə malik ola bilər, məsələn, p = 0,7, R= 0,23 və ya R= 0,012. Aydındır ki, ilk iki halda əldə edilmiş əhəmiyyət səviyyələri çox yüksəkdir və nəticənin əhəmiyyətli olduğunu söyləmək mümkün deyil. Eyni zamanda, sonuncu halda nəticələr 12 mində bir səviyyədə əhəmiyyətlidir. Bu etibarlı səviyyədir.

Statistik nəticənin qəbul edilməsi qaydası belədir: əldə edilmiş eksperimental məlumatlara əsasən, psixoloq seçdiyi statistik metoddan istifadə edərək empirik statistika deyilənləri və ya empirik dəyəri hesablayır. Bu kəmiyyəti kimi qeyd etmək rahatdır H em . Sonra empirik statistika H em seçilmiş statistik metod üçün 5% və 1% əhəmiyyət səviyyələrinə uyğun gələn və kimi işarələnən iki kritik dəyərlə müqayisə edilir. H cr . Kəmiyyətlər H cr hər hansı statistika dərsliyinə əlavədə verilmiş müvafiq cədvəllərdən istifadə etməklə verilmiş statistik metod üçün tapılır. Bu kəmiyyətlər, bir qayda olaraq, həmişə fərqlidir və bundan sonra rahatlıq üçün onları aşağıdakı kimi adlandırmaq olar. H kr1H kr2 . Cədvəllərdən tapılan kritik dəyərlər H kr1H kr2 Onu aşağıdakı standart notasiya şəklində təqdim etmək rahatdır:

Bununla belə, qeyddən istifadə etdiyimizi vurğulayırıq H em H cr “nömrə” sözünün abreviaturası kimi. Bütün statistik üsullar bütün bu kəmiyyətlər üçün öz simvolik təyinatlarını qəbul etmişdir: həm müvafiq statistik metoddan istifadə etməklə hesablanmış empirik dəyər, həm də müvafiq cədvəllərdən tapılan kritik dəyər. Məsələn, bu əmsalın kritik dəyərləri cədvəlindən istifadə edərək Spearman rütbəsi korrelyasiya əmsalını hesablayarkən, bu metod üçün yunan hərfi ρ (“rho”) ilə işarələnən aşağıdakı kritik dəyərlər tapıldı. Belə ki, üçün p = Cədvəldən 0,05 dəyər tapıldı ρ cr 1 = 0,61 və üçün p = 0,01 bal gücündə ρ cr 2 = 0,76.

Aşağıdakı təqdimatda qəbul edilmiş standart qeyd formasında bu belə görünür:

İndi empirik dəyərimizi cədvəllərdən tapılan iki kritik dəyərlə müqayisə etməliyik. Bunu etməyin ən yaxşı yolu hər üç rəqəmi “əhəmiyyət oxu” adlanan yerə yerləşdirməkdir. "Əhəmiyyət oxu" düz bir xəttdir, sol ucunda 0-dır, baxmayaraq ki, bir qayda olaraq, bu düz xəttin özündə qeyd olunmur və soldan sağa say seriyasında artım var. Əslində, bu, adi məktəb absis oxudur OH Kartezian koordinat sistemi. Lakin bu oxun özəlliyi ondan ibarətdir ki, onun üç bölməsi, “zonası” var. Bir ekstremal zona əhəmiyyətsizlik zonası, ikinci ekstremal zona əhəmiyyətlilik zonası, aralıq zona isə qeyri-müəyyənlik zonası adlanır. Hər üç zonanın sərhədləri var H kr1üçün p = 0,05 və H kr2 üçün p =Şəkildə göstərildiyi kimi 0.01.

Bu statistik metodda nəzərdə tutulmuş qərar qaydasından (çıxış qaydasından) asılı olaraq iki variant mümkündür.

Birinci variant: əgər varsa alternativ fərziyyə qəbul edilir H emH cr .

Və ya ikinci variant: əgər alternativ hipotez qəbul edilir H emH cr .

sayılır H em hansısa statistik metoda görə mütləq üç zonadan birinə düşməlidir.

Əgər empirik dəyər əhəmiyyətsizlik zonasına düşürsə, onda fərqlərin olmaması haqqında H 0 hipotezi qəbul edilir.

Əgər H em əhəmiyyətlilik zonasına düşür, H 1 alternativ hipotezi qəbul edilir O fərqlərin olması və H 0 hipotezi rədd edilir.

Əgər H em qeyri-müəyyənlik zonasına düşür, tədqiqatçı dilemma ilə üzləşir. Beləliklə, həll olunan problemin əhəmiyyətindən asılı olaraq, əldə edilmiş statistik qiymətləndirməni 5% səviyyəsində etibarlı hesab edə bilər və bununla da H 0 hipotezini rədd edərək H 1 hipotezini qəbul edə bilər. , və ya - 1% səviyyəsində etibarsızdır, bununla da H 0 hipotezini qəbul edir. Bununla belə, vurğulayırıq ki, psixoloq birinci və ya ikinci növ səhvlərə yol verə bilər. Yuxarıda müzakirə edildiyi kimi, belə şəraitdə nümunənin ölçüsünü artırmaq daha yaxşıdır.

dəyəri olduğunu da vurğulayaq H em ya tam uyğun ola bilər H kr1 və ya H kr2 . Birinci halda, qiymətləndirmənin tam olaraq 5% səviyyəsində etibarlı olduğunu güman edə bilərik və H 1 hipotezini qəbul edə bilərik və ya əksinə, H 0 hipotezini qəbul edə bilərik. İkinci halda, bir qayda olaraq, fərqlərin mövcudluğu haqqında H 1 alternativ hipotezi qəbul edilir, H 0 hipotezi isə rədd edilir.

P-dəyəri(İngilis dili) - statistik fərziyyələrin yoxlanılmasında istifadə olunan kəmiyyət. Əslində, bu, sıfır hipotezini rədd edərkən səhv ehtimalıdır (I tip səhv). P-dəyərindən istifadə edərək fərziyyələrin sınaqdan keçirilməsi, paylanmanın kritik dəyəri vasitəsilə klassik sınaq proseduruna alternativdir.

Tipik olaraq, P-qiyməti verilmiş paylanma ilə təsadüfi dəyişənin (sınaq statistikasının sıfır fərziyyə altında paylanması) test statistikasının faktiki dəyərindən az olmayan qiymət alması ehtimalına bərabərdir. Vikipediya.

Başqa sözlə, p-dəyəri hesablanmış test statistikasının sıfır fərziyyənin rədd edilməsinə səbəb olduğu ən kiçik əhəmiyyət səviyyəsidir (yəni etibarlı fərziyyənin rədd edilməsi ehtimalı). Tipik olaraq, p-dəyəri 0,005 və ya 0,01 ümumi qəbul edilmiş standart əhəmiyyət səviyyələri ilə müqayisə edilir.

Məsələn, nümunədən hesablanmış test statistikası p = 0,005-ə uyğundursa, bu, fərziyyənin doğru olma ehtimalının 0,5% olduğunu göstərir. Beləliklə, p-dəyəri nə qədər aşağı olarsa, bir o qədər yaxşıdır, çünki o, sıfır fərziyyəni rədd etmək “gücünü” artırır və nəticənin gözlənilən əhəmiyyətini artırır.

Bunun üçün Habré-də maraqlı bir izahat var.

Statistik təhlil qara qutuya bənzəməyə başlayır: giriş məlumatdır, çıxış əsas nəticələrin cədvəli və p-dəyəridir.

p-dəyəri nə deyir?

Tutaq ki, qanlı kompüter oyunlarına aludəçiliklə real həyatda aqressivlik arasında əlaqə olub-olmadığını öyrənmək qərarına gəldik. Bu məqsədlə hər biri 100 nəfərdən ibarət məktəblilərdən ibarət iki qrup təsadüfi qaydada yaradılmışdır (1-ci qrup - atıcılıq oyunlarının həvəskarları, 2-ci qrup - kompüter oyunları oynamayanlar). Aqressivliyin göstəricisi, məsələn, həmyaşıdları ilə döyüşlərin sayıdır. Xəyali araşdırmamız nəticəsində məlum oldu ki, qumar aludəçisi olan bir qrup məktəbli əslində dostları ilə nəzərəçarpacaq dərəcədə tez-tez münaqişə edir. Bəs fərqlərin statistik cəhətdən nə qədər əhəmiyyətli olduğunu necə öyrənə bilərik? Bəlkə müşahidə edilən fərqi tamamilə təsadüfən əldə etdik? Bu suallara cavab vermək üçün əhəmiyyət səviyyəsinin p-dəyəri (p-dəyəri) istifadə olunur - bu, ümumi populyasiyada əslində heç bir fərq olmadığı təqdirdə belə və ya daha aydın fərqlərin əldə edilməsi ehtimalıdır. Başqa sözlə, bu, əslində, kompüter oyunlarının aqressivliyə heç bir təsiri olmaması şərti ilə qruplarımız arasında eyni və ya daha güclü fərqlərin əldə edilməsi ehtimalıdır. O qədər də çətin səslənmir. Bununla belə, bu xüsusi statistika çox vaxt səhv şərh olunur.

p-dəyəri haqqında nümunələr

Beləliklə, biz standart t-testindən (və ya bu vəziyyətdə daha uyğun olan qeyri-parametrik Xi-kvadrat testindən) istifadə edərək, iki qrup məktəblini aqressivlik səviyyəsinə görə bir-biri ilə müqayisə etdik və tapdıq ki, arzu olunan p- əhəmiyyətlilik səviyyəsi 0,05-dən azdır (məsələn, 0,04). Bəs nəticədə p-dəyəri bizə nə deyir? Beləliklə, əgər p-dəyəri populyasiyada əslində heç bir fərq olmamaq şərti ilə bu cür və ya daha aydın fərqlərin əldə edilməsi ehtimalıdırsa, sizcə düzgün ifadə nədir:

1. Kompüter oyunları 96% ehtimalla aqressiv davranışın səbəbidir.
2. Aqressiya və kompüter oyunlarının əlaqəli olmaması ehtimalı 0,04-dür.
3. Əgər biz 0,05-dən çox əhəmiyyət kəsb edən p-səviyyəsi almışıqsa, bu, aqressivliyin və kompüter oyunlarının heç bir şəkildə bir-biri ilə əlaqəsi olmadığını bildirir.
4. Belə fərqlərin təsadüfən əldə edilməsi ehtimalı 0,04-dür.
5. Bütün ifadələr yanlışdır.

Əgər beşinci variantı seçmisinizsə, deməli siz tamamilə haqlısınız! Lakin, çoxsaylı tədqiqatların göstərdiyi kimi, hətta məlumatların təhlilində əhəmiyyətli təcrübəsi olan insanlar da p-dəyərini çox vaxt səhv şərh edirlər.

Bütün cavablara ardıcıllıqla baxaq:

Birinci ifadə korrelyasiya səhvinin nümunəsidir: iki dəyişənin əhəmiyyətli dərəcədə korrelyasiya olması bizə səbəb və nəticə haqqında heç nə demir. Ola bilsin ki, daha aqressiv insanlar kompüter oyunları oynamağa vaxt ayırmağa üstünlük verirlər və insanları daha aqressiv edən kompüter oyunları deyil.

Bu daha maraqlı açıqlamadır. İş ondadır ki, biz əvvəlcə heç bir fərqin olmadığını qəbul edirik. Və bunu bir fakt kimi nəzərə alaraq, p-qiymətini hesablayırıq. Buna görə düzgün təfsir belədir: "Əgər biz aqressiya və kompüter oyunlarının heç bir əlaqəsi olmadığını fərz etsək, bu cür və ya daha da aydın fərqlərin əldə edilməsi ehtimalı 0,04 idi."

Bəs əhəmiyyətsiz fərqlər əldə etsək necə olar? Bu, tədqiq olunan dəyişənlər arasında əlaqənin olmadığı anlamına gəlirmi? Xeyr, bu o deməkdir ki, fərqlər ola bilər, lakin bizim nəticələrimiz onları aşkarlamağa imkan vermədi.

Bu, p-dəyərinin özünün tərifi ilə birbaşa bağlıdır. 0.04 bu və ya daha çox ekstremal fərqləri əldə etmə ehtimalıdır. Təcrübəmizdə olduğu kimi eyni fərqləri əldə etmək ehtimalını qiymətləndirmək prinsipcə mümkün deyil!

Bunlar p-dəyəri kimi bir göstəricinin şərhində gizlənə bilən tələlərdir. Buna görə də, əsas statistik göstəricilərin təhlili və hesablanması üsullarının əsasını təşkil edən mexanizmləri başa düşmək çox vacibdir.

P dəyərini necə tapmaq olar?

1. Təcrübənizin gözlənilən nəticələrini müəyyənləşdirin

Tipik olaraq, elm adamları bir təcrübə apardıqda, hansı nəticələrin "normal" və ya "tipik" hesab edildiyi barədə artıq təsəvvürə sahibdirlər. Bu, keçmiş eksperimentlərin eksperimental nəticələrinə, etibarlı məlumat toplularına, elmi ədəbiyyatdan alınan məlumatlara əsaslana bilər və ya alim bəzi digər mənbələrə istinad edə bilər. Təcrübəniz üçün gözlənilən nəticələri müəyyənləşdirin və onları rəqəmlərlə ifadə edin.

Nümunə: Məsələn, əvvəlki tədqiqatlar göstərdi ki, sizin ölkənizdə qırmızı avtomobillər mavi avtomobillərdən daha çox sürət həddinə çatma biletləri alırlar. Məsələn, orta nəticələr 2:1 nisbətində qırmızı avtomobillərə mavi avtomobillərə üstünlük verdiyini göstərir. Biz polisin şəhərinizdə avtomobillərin rənginə oxşar qərəzli olub-olmadığını müəyyən etmək istəyirik. Bunun üçün sürət həddinə görə verilən cərimələri təhlil edəcəyik. İstər qırmızı, istərsə də mavi avtomobillərə verilən 150 sürət biletinin təsadüfi dəstini götürsək, şəhərimizdəki polislər avtomobillərin rənginə bu qədər qərəzli yanaşsalar, qırmızı və ya mavi avtomobillərə 100, mavi avtomobillərə isə 50 bilet veriləcəyini gözləyərdik. bütün ölkə ərazisində müşahidə edilir.

2. Təcrübənizin müşahidə edilə bilən nəticələrini müəyyənləşdirin.

İndi gözlənilən nəticələri müəyyən etdikdən sonra bir təcrübə aparmaq və faktiki (və ya "müşahidə edilmiş") dəyərləri tapmaq lazımdır. Yenə də bu nəticələri rəqəmlərlə təmsil etməlisiniz. Əgər biz eksperimental şərait yaradırıqsa və müşahidə olunan nəticələr gözlənilənlərdən fərqlənirsə, onda bizim iki ehtimalımız var - ya təsadüfən baş verib, ya da bizim təcrübəmizdən yaranıb. P-qiymətinin tapılmasında məqsəd müşahidə edilən nəticələrin gözlənilən nəticələrdən o qədər fərqləndiyini müəyyən etməkdir ki, “sıfır fərziyyə” – eksperimental dəyişənlərlə müşahidə edilən nəticələr arasında heç bir əlaqənin olmadığı fərziyyəsi rədd edilə bilər.

Misal: Məsələn, şəhərimizdə qırmızı və ya mavi avtomobillərə verilən 150 sürət biletini təsadüfi seçdik. Müəyyən etdik ki, qırmızı avtomobillərə 90, mavi avtomobillərə isə 60 cərimə yazılıb. Bu, müvafiq olaraq 100 və 50 olan gözlənilən nəticələrdən fərqlidir. Təcrübəmiz (bu halda, məlumat mənbəyinin millidən şəhərə dəyişdirilməsi) həqiqətən nəticələrdə bu dəyişikliyə səbəb oldu, yoxsa şəhər polisimiz ölkə üzrə orta göstərici kimi qərəzlidir və biz sadəcə təsadüfi dəyişiklik görürük? P-dəyəri bunu müəyyən etməyə kömək edəcək.

3. Təcrübənizin sərbəstlik dərəcələrinin sayını təyin edin

Sərbəstlik dərəcələrinin sayı, tədqiq etdiyiniz kateqoriyaların sayı ilə müəyyən edilən təcrübənizdəki dəyişkənlik dərəcəsidir. Sərbəstlik dərəcələrinin sayı üçün tənlik Sərbəstlik dərəcələrinin sayı = n-1-dir, burada “n” təcrübənizdə təhlil etdiyiniz kateqoriyaların və ya dəyişənlərin sayıdır.

Nümunə: Təcrübəmizdə iki nəticə kateqoriyası var: qırmızı avtomobillər üçün bir kateqoriya və mavi avtomobillər üçün. Buna görə də təcrübəmizdə 2-1 = 1 sərbəstlik dərəcəsinə sahibik. Qırmızı, mavi və yaşıl avtomobilləri müqayisə etsəydik, 2 dərəcə sərbəstliyimiz olardı və s.

4. Xi-kvadrat testindən istifadə edərək gözlənilən və müşahidə olunan nəticələri müqayisə edin

Xi-kvadrat ("x2" yazılır) bir təcrübənin gözlənilən və müşahidə edilən dəyərləri arasındakı fərqi ölçən ədədi dəyərdir. Xi-kvadrat üçün tənlik x2 = Σ((o-e)2/e-dir), burada “o” müşahidə olunan dəyər və “e” gözlənilən dəyərdir. Bütün mümkün nəticələr üçün bu tənliyin nəticələrini yekunlaşdırın (aşağıya baxın).

Qeyd edək ki, bu tənliyə toplama operatoru Σ (siqma) daxildir. Başqa sözlə, hər bir mümkün nəticə üçün ((|o-e|-.05)2/e) hesablamalı və ki-kvadrat test dəyərini əldə etmək üçün yaranan ədədləri əlavə etməlisiniz. Bizim nümunəmizdə iki mümkün nəticə var - ya bilet alan avtomobil qırmızı, ya da mavi. Buna görə də ((o-e)2/e) iki dəfə hesablamalıyıq - bir dəfə qırmızı avtomobillər üçün, bir də mavi avtomobillər üçün.

Nümunə: Gözlənilən və müşahidə olunan dəyərlərimizi x2 = Σ((o-e)2/e) tənliyinə qoşaq. Unutmayın ki, cəm operatoruna görə ((o-e)2/e) iki dəfə hesablamalıyıq - bir dəfə qırmızı avtomobillər üçün, bir də mavi avtomobillər üçün. Bu işi aşağıdakı kimi edəcəyik:
x2 = ((90-100)2/100) + (60-50)2/50)
x2 = ((-10)2/100) + (10)2/50)
x2 = (100/100) + (100/50) = 1 + 2 = 3.

5. Əhəmiyyət səviyyəsini seçin

Təcrübəmizin sərbəstlik dərəcələrinin sayını bildiyimizə və xi-kvadrat testinin dəyərini bildiyimizə görə, p-qiymətimizi tapmaqdan əvvəl daha bir şey etməliyik. Biz əhəmiyyət səviyyəsini müəyyən etməliyik. Sadə dillə desək, əhəmiyyət səviyyəsi bizə nəticələrimizə nə qədər əmin olduğumuzu bildirir. Əhəmiyyətin aşağı dəyəri eksperimental nəticələrin təsadüfən baş verməsi ehtimalının aşağı olmasına uyğundur və əksinə. Əhəmiyyət səviyyələri eksperimental nəticələrin təsadüfən əldə edilməsi ehtimalına uyğun gələn onluq (məsələn, 0,01) kimi yazılır (bu halda bunun ehtimalı 1% təşkil edir).

Konvensiyaya görə, elm adamları təcrübələrinin əhəmiyyət səviyyəsini adətən 0,05 və ya 5% təyin edirlər. Bu o deməkdir ki, bu əhəmiyyət meyarına cavab verən eksperimental nəticələrin sırf təsadüf nəticəsində baş vermə şansı yalnız 5% təşkil edir. Başqa sözlə, nəticələrin alimin təsadüfən deyil, eksperimental dəyişənləri manipulyasiya etmə üsulu ilə meydana çıxması ehtimalı 95% var. Əksər təcrübələr üçün iki dəyişən arasında əlaqənin mövcudluğuna 95% inam onların bir-biri ilə “həqiqətən” əlaqəli olduğunu düşünmək üçün kifayətdir.

Nümunə: Qırmızı və mavi avtomobil nümunəmiz üçün alimlər arasında konsensusa əməl edək və əhəmiyyət səviyyəsini 0,05-ə təyin edək.

6. P-dəyərinizi tapmaq üçün xi-kvadrat paylama məlumat cədvəlindən istifadə edin.

Alimlər və statistiklər öz təcrübələrinin p-qiymətini hesablamaq üçün böyük cədvəllərdən istifadə edirlər. Bu cədvəllərin adətən solda sərbəstlik dərəcələrinin sayına uyğun şaquli ox, yuxarıda isə p-dəyərinə uyğun olan üfüqi oxu var. Əvvəlcə sərbəstlik dərəcələrinizin sayını tapmaq üçün cədvəl məlumatlarından istifadə edin, sonra ki-kvadrat dəyərinizdən böyük olan ilk dəyəri tapana qədər seriyanıza soldan sağa baxın. Sütununuzun yuxarısındakı müvafiq p dəyərinə baxın. Sizin p-dəyəriniz bu nömrə ilə növbəti nömrə arasındadır (sizdən solda olan).

Xi-kvadrat paylanması ilə cədvəlləri bir çox mənbələrdən əldə etmək olar (onlardan birini bu linkdə tapa bilərsiniz).

Nümunə: Xi-kvadrat test dəyərimiz 3 idi. Təcrübəmizdə yalnız 1 sərbəstlik dərəcəsinin olduğunu bildiyimiz üçün ilk sıranı seçəcəyik. Bu xətt boyunca soldan sağa 3-dən böyük bir dəyərlə qarşılaşana qədər ki-kvadrat test dəyərimizlə qarşılaşırıq. İlk tapdığımız 3.84-dür. Sütunumuzun yuxarı hissəsinə baxdıqda, müvafiq p-dəyərinin 0,05 olduğunu görürük. Bu o deməkdir ki, bizim p-dəyərimiz 0.05 ilə 0.1 arasındadır (cədvəldəki növbəti p-dəyəri artan qaydada).

7. Boş fərziyyənizi rədd etmək və ya saxlamaq barədə qərar verin

Təcrübəniz üçün təxmini p-dəyərini təyin etdiyiniz üçün təcrübənizin sıfır fərziyyəsini rədd edib-etməmək barədə qərar verməlisiniz (unutmayın ki, bu, manipulyasiya etdiyiniz eksperimental dəyişənlərin müşahidə etdiyiniz nəticələrə təsir etmədiyi fərziyyəsidir). Əgər p-dəyəriniz əhəmiyyət səviyyənizdən azdırsa, təbrik edirəm, manipulyasiya etdiyiniz dəyişənlərlə müşahidə etdiyiniz nəticələr arasında çox ehtimal əlaqənin olduğunu sübut etdiniz. Əgər p-dəyəriniz əhəmiyyət səviyyənizdən yüksəkdirsə, müşahidə etdiyiniz nəticələrin sırf təsadüf və ya dəyişənlərinizin manipulyasiyası nəticəsində olub olmadığını dəqiq deyə bilməzsiniz.

Misal: Bizim p-dəyərimiz 0,05 ilə 0,1 arasındadır. Bu, aydın şəkildə 0,05-dən az deyil, ona görə də təəssüf ki, sıfır fərziyyəmizi rədd edə bilmərik. Bu o deməkdir ki, şəhərimizdə polisin ölkə üzrə orta göstəricidən tamamilə fərqli bir ehtimalla qırmızı və mavi avtomobillərə bilet verdiyini söyləmək üçün minimum 95% ehtimala çatmamışıq.

Başqa sözlə, 5-10% şans var ki, müşahidə etdiyimiz nəticələr yer dəyişikliyinin təsiri deyil (bütün ölkə üzrə deyil, bir şəhərin təhlili), sadəcə olaraq təsadüf nəticəsində. Bizə 5%-dən az dəqiqlik tələb olunduğundan, şəhərimizdəki polislərin qırmızı avtomobillərə qarşı daha az qərəzli olduğuna əmin olduğumuzu deyə bilmərik - kiçik (lakin statistik cəhətdən əhəmiyyətli) şans var.

Statistik fərziyyələrin yoxlanılması nəzəriyyəsinin əsasları.

Statistik fərziyyə anlayışı

Statistik fərziyyə- bu, seçmə göstəricilər əsasında yoxlanıla bilən populyasiyanın naməlum parametrlərinin paylanma növü və ya dəyərləri haqqında fərziyyədir.

Statistik fərziyyələrə nümunələr:

Əhali Qauss qanununa (normal qanun) uyğun olaraq bölüşdürülür.

İki normal populyasiyanın dispersiyaları bir-birinə bərabərdir.

Biologiyada nümunə göstəriciləri əsasında ümumi parametrlərin dəyərini qiymətləndirmək üçün sözdə sıfır hipotez , yəni. güman ki seçmə məlumatları ilə qiymətləndirilən ümumi parametrlərin bir-birindən fərqlənmədiyini və seçmə göstəriciləri arasında müşahidə olunan fərqin sistematik deyil, sırf təsadüfi olduğunu.

İrəli sürülən fərziyyə ilə yanaşı, ona zidd olan fərziyyə də nəzərdən keçirilir. Əgər irəli sürülən fərziyyə rədd edilirsə, o zaman alternativ fərziyyə baş verir. Onları ayırd etmək faydalıdır.

Sıfır (amma) irəli sürülən fərziyyə adlanır.

Alternativ (H 1)- sıfır fərziyyə ilə ziddiyyət təşkil edən fərziyyə.

Yalnız bir və ya birdən çox fərziyyə ehtiva edən fərziyyələr var.

və sonlu və ya sonsuz sayda sadə fərziyyələrdən ibarət fərziyyə - kompleks .

Vurğulamaq lazımdır ki, sıfır fərziyyəsinin yoxlanılmasının təsvir edilən metodunun statistik xarakteri, xüsusən, sıfır fərziyyəsinin etibarlılığı haqqında bəyanatın mütləq şəkildə deyil, yalnız müəyyən bir əhəmiyyət səviyyəsində qəbul edilməsində ifadə olunur.

ƏHƏMİYYƏT SƏVİYYƏSİ qəbul edilmiş fərziyyə ilə ziddiyyət təşkil edən və ona şübhə yaradan mümkün olmayan halların faizidir.

Bioloji tədqiqatlarda adətən 5% əhəmiyyət səviyyəsi qəbul edilir ki, bu da P = 0,05 ehtimalına uyğundur.

Daha kritik hallarda, nəticələr xüsusilə ciddi olmalı olduqda, əhəmiyyət səviyyəsi qəbul edilir.



1% və ya P=0,01 və

0,1% və ya P = 0,001.

Beləliklə, seçmə müşahidələr əsasında ümumi parametrləri qiymətləndirərkən nəzərə alınmamaq qərarına gələn ehtimal qəbul edilmiş əhəmiyyətlilik səviyyəsi ilə ifadə edilir.

Fərziyyənin etibarlı olduğu zaman əks halların ehtimalı deyilir MƏXFİ EHTİMAL.

Tipik olaraq, tədqiqat təcrübəsində üç etimad həddi istifadə olunur:

P 1 =0,95; P 2 =0,99; P 3 =0,999

Ehtimal P 1 =0,95; t = 1,96-a uyğun gəlir

P 2 =0,99; t = 2,58-ə uyğun gəlir

P 2 =0,999; t = 3.29-a uyğun gəlir

Fərziyyələrin yoxlanılması zamanı etimad səviyyəsi və ya əhəmiyyət səviyyəsi tədqiqatın aparıldığı dəqiqlik dərəcəsindən və ondan irəli gələn nəticələrin məsuliyyətindən asılı olaraq tədqiqatçının özü tərəfindən müəyyən edilir.

Əgər P≥0,05 və ya P<0,95, то отвергать нулевую гипотезу нет оснований.

Əgər P<0,05 или Р≥0,95, нулевая гипотеза отвергается.

1-ci və 11-ci növ səhvlər. Əhəmiyyətlilik meyarı.

Əhəmiyyət səviyyəsi. Kritik bölgə

Statistik fərziyyəni rədd etmək və ya qəbul etmək qərarı nümunə məlumatları əsasında qəbul edilir. Ona görə də səhv qərarın mümkünlüyünü nəzərə almalıyıq. I və II tip səhvlər var.

Tip 1 xətası düzgün fərziyyənin rədd edilməsidir (yəni sıfır fərziyyə doğru olduğu halda rədd ediləcək)

Tip 1 xətası yanlış fərziyyənin qəbul edilməsidir (yəni sıfır fərziyyə doğru olmadıqda qəbul ediləcək)

Sıfır fərziyyəni rədd edərkən onun hələ də doğru olması ehtimalı var (yəni I tip xəta edirik), bu ehtimal α ilə işarələnir. α ehtimalı əhəmiyyətlilik səviyyəsi adlanır.

Əhəmiyyət səviyyəsi α- səhv etmək ehtimalıdır

II tip xətanın baş vermə ehtimalı ß və böyüklüklə işarələnir

1-ß-adlanır kriteriya gücü .

Güc nə qədər yüksək olarsa, II tip xəta ehtimalı bir o qədər az olar.


Birinci növ mümkün səhvlərin icazə verilən faizi qarşılıqlı razılaşma məsələsidir, digər şeylər arasında səhv qərarın qəbul edilməsinin mümkün nəticələri də nəzərə alınmalıdır. Yanlış qərarlar, məsələn, müayinə zamanı kimyəvi reagentin səhv elan edilmiş təmizliyindən daha ciddi nəticələrə səbəb ola bilər. Buna görə də, birinci halda, ikinci halda olduğundan daha yüksək etibarlılıq və buna görə də 1-ci tip mümkün səhvlərin daha az sayı təmin edilməlidir.

Adətən aşağıdakı qaydalara əməl olunur.

1-ci tip xəta bütün halların 100α = 1%-dən azında baş verə bilərsə, yoxlanılan fərziyyə rədd edilir (yəni α 0.01). Sonra sözügedən fərq əhəmiyyətli hesab olunur.

Yoxlanılan fərziyyə 100α = 5%-dən çox hallarda 1-ci tip xəta mümkün olduqda qəbul edilir (α 0.05). Onda sözügedən fərq əhəmiyyətsiz hesab olunur.

Mümkün tip I xətaların sayı 5% ilə 1% (0.01 0.05) arasında olarsa, nəzərdən keçirilən fərziyyə daha sonra müzakirə edilməlidir. Aşkar edilmiş fərq mübahisəli kimi şərh olunur. Çox vaxt əlavə ölçmələr vəziyyəti aydınlaşdıra bilər. Nədənsə əlavə ölçmələr kifayət deyilsə, əldə edilən məlumatlar ən pis vəziyyət ssenarisi əsasında şərh edilməlidir.

α-nın seçimi razılaşma məsələsidir; bəzən 100α = 10% seçmək kifayətdir; bəzi hallarda, praktiki olaraq, səhv qərarın mümkünlüyü istisna edilməlidir (məsələn, bir əczaçılıq dərmanının toksik təsirini qiymətləndirərkən). . Sonra 1-ci tipin mümkün səhvlərinin sayı, məsələn, 100α = 0,1% kimi əhəmiyyətsiz dərəcədə kiçik səviyyəyə çatan kimi yoxlanılan fərziyyə rədd edilir.

1 və 2-ci növ səhvlər bir-birindən asılıdır. Nə qədər az olacaq α, bir o qədər çox olacaq β ( və əksinə). Buna görə də, əhəmiyyət testi üçün çox kiçik bir dəyər seçməyin mənası yoxdur, çünki bu, bilinməyənləri xeyli artıracaq. ß. Seçim α təcrübə planlaşdırma mərhələsinə aiddir!

Əhəmiyyət səviyyəsi təyin edildikdən sonra bu fərziyyənin qəbul edildiyi və ya rədd edildiyi bir qayda tapılır. Bu qayda adlanır statistik meyar.

Statistik test- sıfır fərziyyənin qəbul edildiyi və ya rədd edildiyi qayda.

Kriteriyanın qurulması müvafiq funksiyanın seçilməsindən ibarətdir T= T(X 1, ..., Xn) müşahidə nəticələrindən X 1, ... X n , eksperimental və hipotetik dəyərlər arasındakı uyğunsuzluğun ölçüsü kimi xidmət edir.


Təsadüfi dəyişən olan bu Funksiya deyilir kriteriya statistikası.

Kriteriya statistikası- paylama funksiyası məlum olan xüsusi yaradılmış təsadüfi dəyişən.

Ehtimalın paylanması nəzərdə tutulur T=T(1, ...,X p) yoxlanılan fərziyyənin doğru olduğu və bu paylanmanın fərz edilən paylanmanın xüsusiyyətlərindən asılı olmadığı fərziyyəsi ilə hesablana bilər.

Müəyyən bir meyar seçildikdən sonra bütün mümkün dəyərlər dəsti iki ayrı alt qrupa bölünür: onlardan biri sıfır fərziyyənin rədd edildiyi meyar dəyərlərini, digəri isə qəbul edildiyi, yəni. kritik bölgəyə və hipotezin qəbulu bölgəsinə.

Kritik bölgə- sıfır fərziyyənin rədd edildiyi meyar dəyərlər toplusu.

Hipotezin Qəbul Sahəsi- sıfır fərziyyənin qəbul edildiyi meyar dəyərləri toplusu.

Hipotez testinin əsas prinsipi aşağıdakı kimi tərtib oluna bilər: kriteriyanın müşahidə edilən qiyməti kritik bölgəyə aiddirsə, fərziyyə rədd edilir, meyarın müşahidə edilən qiyməti hipotezin qəbul edildiyi bölgəyə aiddirsə, fərziyyə qəbul edilir.

Meyardan bəri T = T(X 1, ..., X p) - bir ölçülü təsadüfi dəyişən, onun bütün mümkün dəyərləri müəyyən bir intervala aiddir. Buna görə də kritik bölgə və hipotezin qəbul bölgəsi də intervallardır və buna görə də onları ayıran nöqtələr var. Belə nöqtələrə kritik deyilir.

Kriteriya Dəyərləri- bunlar kritik sahəni hipotezin qəbul edildiyi sahədən ayıran nöqtələrdir.

Kritik dəyər T cr statistik T-nin paylanmasına görə tapılır ki, fərziyyə doğrudursa, hadisənin baş vermə ehtimalı (T kritik bölgəsi) bərabərdir. α, a -əvvəlcədən müəyyən edilmiş əhəmiyyət səviyyəsi, yəni. bu, P(T kritik bölgə) = α olan T cr statistik T-nin qiymətidir.

Birtərəfli (sağ və ya sol tərəfli) və ikitərəfli kritik sahələr var. Onlar aşağıdakı ifadələrlə müəyyən edilir:

sağ əlli - P(T>T cr) = α;

solaxay - P(T<Т кр) = α

ikitərəfli - P(T Tcr2) =a Tcr1

Kriteriyanın paylanması sıfıra yaxın simmetrik olarsa, P(T<-Т кр) = Р(Т>T KR), buradan P(T>T KR)= alırıq a/2.

düyü. 37. Kritik sahələr: sol tərəfli, sağ tərəfli, ikitərəfli

Kriteriyanın paylanmasına uyğun gələn cədvəllərdən kritik nöqtələr tapılır.

Əhəmiyyətlilik testləri parametrik və qeyri-parametrik olaraq bölünür.

Birincilər nümunə populyasiyasının parametrləri əsasında qurulur və bu parametrlərin funksiyalarını təmsil edir,

ikincisi verilmiş çoxluğun variantlarının tezlikləri ilə funksiyalarıdır.

Parametrik meyarlar yalnız nümunənin götürüldüyü populyasiyanın normal şəkildə paylandığı hallarda tətbiq edilir.

Parametrik olmayan testlər müxtəlif formaların paylanması üçün tətbiq edilir. Sonuncuların istifadəsi üçün daha aşağı tələblər, daha geniş imkanlar diapazonu və tez-tez həyata keçirmək asanlığı səbəbindən parametrik olanlar üzərində müəyyən üstünlüklərə malikdir. Əlbəttə ki, parastrik meyarlarla müqayisədə bu meyarların çox vaxt daha aşağı dəqiqliyini də nəzərə almaq lazımdır.

Statistik test üsullarının nəticələri çox vaxt analitiklər üçün əlverişsiz olur. Bir çox hallarda onlar əhəmiyyətsizdirlər (a>O,O5) və ya mübahisəli fərqlər, baxmayaraq ki, “həqiqi” fərq artıq subyektiv təcrübə əsasında müəyyən edilmişdir. Belə hallarda əlavə ölçmələr tez-tez kömək edir. Nə qədər çox nəticə əldə edilsə, fərqlər bir o qədər az etibarlı şəkildə qeydə alınacaqdır. Heç bir halda subyektiv qiymətləndirmə əsasında dəqiq məlumatları şübhəli məlumatlarla əvəz etməyə şirnikləndirilməməlidir.

Əhəmiyyət səviyyəsi - bu, fərqləri əhəmiyyətli hesab etdiyimiz ehtimaldır, lakin onlar əslində təsadüfidir.

Fərqlərin 5% əhəmiyyətlilik səviyyəsində əhəmiyyətli olduğunu göstərdiyimiz zaman və ya nə vaxt R< 0,05 , onda biz onların etibarsız olma ehtimalının 0,05 olduğunu nəzərdə tuturuq.

Fərqlərin 1% əhəmiyyətlilik səviyyəsində əhəmiyyətli olduğunu göstərdiyimiz zaman və ya nə vaxt R< 0,01 , onda biz onların etibarsız olma ehtimalının 0,01 olduğunu nəzərdə tuturuq.

Bütün bunları daha rəsmi dilə çevirsək, o zaman əhəmiyyət səviyyəsi sıfır fərziyyəni rədd etmək ehtimalıdır, halbuki bu, doğrudur.

Səhv,ibarətbirnə bizrədd edildisıfır hipotezdüzgün olsa da, 1-ci tip xəta adlanır.(Cədvəl 1-ə baxın)

Cədvəl 1. Sıfır və alternativ fərziyyələr və mümkün sınaq şərtləri.

Belə bir səhvin olma ehtimalı adətən kimi işarələnir α. Əslində, biz p deyil, mötərizədə qeyd etməli olardıq < 0,05 və ya s < 0,01 və α < 0,05 və ya α < 0,01.

Səhv ehtimalı olarsa α , onda düzgün qərarın olma ehtimalı: 1-α. α nə qədər kiçik olsa, düzgün qərar vermə ehtimalı bir o qədər çox olar.

Tarixən psixologiyada statistik əhəmiyyətin ən aşağı səviyyəsinin 5% səviyyəsinin (p≤0,05) olması ümumi qəbul edilir: 1% səviyyə (p≤0,01) kifayətdir, ən yüksək isə 0,1% səviyyədir (p≤0,001). , buna görə də, kritik dəyərlər cədvəlləri adətən statistik əhəmiyyət səviyyələrinə uyğun meyarların qiymətlərini ehtiva edir p≤0.05 və p≤0.01, bəzən - p≤0.001. Bəzi meyarlar üçün cədvəllər onların müxtəlif empirik dəyərlərinin dəqiq əhəmiyyət səviyyəsini göstərir. Məsələn, φ*=1,56 p=O,06 üçün.

Lakin statistik əhəmiyyət səviyyəsi p=0,05-ə çatana qədər bizim hələ də sıfır fərziyyəni rədd etməyə haqqımız yoxdur. Fərqlərin olmaması (Ho) fərziyyəsini rədd etmək və fərqlərin statistik əhəmiyyəti fərziyyəsini (H 1) qəbul etmək üçün aşağıdakı qaydaya əməl edəcəyik.

Ho-nu rədd etmək və h1-i qəbul etmək qaydası

Testin empirik dəyəri p≤0.05-ə uyğun gələn kritik qiymətə bərabər və ya ondan böyükdürsə, H 0 rədd edilir, lakin H 1-i hələ qəti şəkildə qəbul edə bilmərik.

Əgər kriteriyanın empirik qiyməti p≤0.01-ə uyğun gələn kritik qiymətə bərabərdirsə və ya ondan artıqdırsa, H 0 rədd edilir və H 1 qəbul edilir.

İstisnalar : G işarəsi testi, Wilcoxon T testi və Mann-Whitney U testi. Onlar üçün tərs əlaqələr qurulur.

düyü. 4. Rosenbaumun Q meyarı üçün “əhəmiyyət oxu” nümunəsi.

Kriteriyanın kritik dəyərləri Q o, o5 və Q 0.01, meyarın empirik dəyəri isə Q em kimi təyin edilmişdir. O, ellipslə əhatə olunub.

Q 0.01 kritik dəyərinin sağında "əhəmiyyət zonası" uzanır - bu, Q 0.01-dən çox olan empirik dəyərləri əhatə edir və buna görə də əlbəttə ki, əhəmiyyətlidir.

Q 0.05 kritik dəyərinin solunda "əhəmiyyətsizlik zonası" uzanır - bu, Q 0.05-dən aşağı olan empirik Q dəyərlərini əhatə edir və buna görə də, şübhəsiz ki, əhəmiyyətsizdir.

Biz bunu görürük Q 0,05 =6; Q 0,01 =9; Q em. =8;

Kriteriyanın empirik dəyəri Q 0.05 və Q 0.01 arasında olan bölgəyə düşür. Bu, “qeyri-müəyyənlik” zonasıdır: fərqlərin etibarsızlığı (H 0) haqqında fərziyyəni artıq rədd edə bilərik, lakin onların etibarlılığı haqqında fərziyyəni (H 1) hələ qəbul edə bilmərik.

Təcrübədə isə tədqiqatçı əhəmiyyətsizlik zonasına düşməyən fərqləri etibarlı hesab edə bilər və onların p-də etibarlı olduğunu bəyan edə bilər. < 0,05, yaxud alınmış empirik kriteriya dəyərinin dəqiq əhəmiyyət səviyyəsini göstərməklə, məsələn: p=0,02. Riyazi metodlar üzrə bütün dərsliklərdə olan standart cədvəllərdən istifadə edərək, bunu Kruskal-Wallis H meyarlarına uyğun olaraq etmək olar, χ 2 r Fridman, Page's L, Fisher's φ* .

İstiqamətli və qeyri-istiqamətli statistik fərziyyələr yoxlanılarkən statistik əhəmiyyətlilik səviyyəsi və ya kritik test qiymətləri fərqli şəkildə müəyyən edilir.

İstiqamətli statistik fərziyyə ilə bir quyruqlu testdən, qeyri-istiqamətli fərziyyə ilə iki quyruqlu testdən istifadə olunur. İki quyruqlu test daha sərtdir, çünki o, hər iki istiqamətdə fərqləri və buna görə də əvvəllər əhəmiyyət səviyyəsinə uyğun olan testin empirik dəyərini yoxlayır. < 0.05, indi yalnız p səviyyəsinə uyğundur < 0,10.

Onun birtərəfli, yoxsa ikitərəfli kriteriyadan istifadə etməsinə hər dəfə özümüz qərar vermək məcburiyyətində qalmayacağıq. Kriteriyaların kriteriya dəyərlərinin cədvəlləri elə seçilir ki, istiqamətli fərziyyələr birtərəfli meyara, qeyri-istiqamətli fərziyyələr isə ikitərəfli meyara uyğun olsun və verilən qiymətlər tələbləri ödəsin. onların hər birinə müraciət edin. Tədqiqatçı yalnız onun fərziyyələrinin hər bir meyarın təsvirində irəli sürülmüş fərziyyələrlə məna və formaca üst-üstə düşməsini təmin etməlidir.

Müəyyənləşdirmək gözlənilir təcrübə nəticələrinizdə. Tipik olaraq, elm adamları bir təcrübə apardıqda, hansı nəticələrin "normal" və ya "tipik" hesab edildiyi barədə artıq təsəvvürə sahibdirlər. Bu, keçmiş eksperimentlərin eksperimental nəticələrinə, etibarlı məlumat toplularına, elmi ədəbiyyatdan alınan məlumatlara əsaslana bilər və ya alim bəzi digər mənbələrə istinad edə bilər. Təcrübəniz üçün gözlənilən nəticələri müəyyənləşdirin və onları rəqəmlərlə ifadə edin.

  • Nümunə: Tutaq ki, əvvəlki tədqiqatlar göstərdi ki, sizin ölkənizdə qırmızı rəngli avtomobil sahibləri mavi avtomobil sahiblərindən daha çox sürət həddini aşmaq üçün bilet alırlar. Məsələn, orta nəticələr 2:1 nisbətində qırmızı avtomobillərə mavi avtomobillərə üstünlük verdiyini göstərir. Bizim vəzifəmiz polisin şəhərinizdəki avtomobillərin rənginə bənzər qərəzli olub-olmadığını müəyyən etməkdir. Bunun üçün sürət həddinə görə verilən cərimələri təhlil edəcəyik. Qırmızı və ya mavi avtomobil sahiblərinə verilmiş 150 sürət biletinin təsadüfi dəstini götürsək, biz bunu gözləyirik 100 qırmızı avtomobil sahiblərinə cərimələr veriləcək və 50 - mavi olanların sahibləri, əgər şəhərimizdə polis bütün ölkədə müşahidə olunduğu kimi avtomobillərin rənginə qərəzlidirsə.

Müəyyənləşdirmək müşahidə olunur təcrübənizin nəticələri.İndi gözlənilən nəticələri müəyyən etdikdən sonra bir təcrübə aparmaq və faktiki (və ya "müşahidə edilmiş") dəyərləri tapmaq lazımdır. Yenə də bu nəticələri rəqəmlərlə təmsil etməlisiniz. Təcrübə şəraiti və müşahidə olunan nəticələri yaratsaq fərqli gözləniləndən, onda bizim iki ehtimalımız var - ya təsadüfən baş verib, ya da səbəb olub dəqiq bizim təcrübəmizlə. P-qiymətinin tapılmasında məqsəd müşahidə edilən nəticələrin gözlənilən nəticələrdən kifayət qədər fərqli olub-olmadığını müəyyən etməkdir ki, bizə “sıfır fərziyyəni” – eksperimental dəyişənlərlə müşahidə edilən nəticələr arasında heç bir əlaqənin olmadığı fərziyyəsini rədd etməyə imkan verir.

  • Misal: Deyək ki, şəhərimizdə qırmızı və ya mavi avtomobil sahiblərinə verilən 150 sürət biletini təsadüfi seçdik. Biz bunu müəyyən etmişik 90 qırmızı avtomobil sahiblərinə cərimələr verildi və 60 - mavi olanların sahibləri. Bu, gözlənilən nəticələrdən fərqlidir 100 50, müvafiq olaraq. Təcrübəmiz (bu halda məlumat mənbəyinin dövlət səviyyəsindən şəhər səviyyəsinə dəyişdirilməsi) həqiqətən nəticələrdə bu dəyişikliyə səbəb oldu, yoxsa bizim şəhər polisi sürücülərə qarşı qərəzlidir? oxşar, milli ortalama kimi və biz sadəcə təsadüfi bir sapma görürük? P-dəyəri bunu müəyyən etməyə kömək edəcək.
  • Nömrəni müəyyənləşdirin sərbəstlik dərəcələri təcrübəniz. Sərbəstlik dərəcələrinin sayı, tədqiq etdiyiniz kateqoriyaların sayı ilə müəyyən edilən təcrübənizdəki dəyişkənlik dərəcəsidir. Sərbəstlik dərəcələrinin sayı üçün tənlik belədir Sərbəstlik dərəcələrinin sayı = n-1, burada "n" təcrübənizdə təhlil etdiyiniz kateqoriyaların və ya dəyişənlərin sayıdır.

    • Misal: Təcrübəmizdə iki nəticə kateqoriyası var: bir kateqoriya qırmızı avtomobil sahibləri üçün, digəri isə mavi avtomobil sahibləri üçün. Buna görə də təcrübəmizdə 2-1 = var 1 dərəcə sərbəstlik. Qırmızı, mavi və yaşıl avtomobilləri müqayisə etsək, olardıq 2 sərbəstlik dərəcələri və s.
  • Bir meyardan istifadə edərək gözlənilən və müşahidə olunan nəticələri müqayisə edin xi-kvadrat. Xi-kvadrat ("x2" yazılır) arasındakı fərqi ölçən ədədi dəyərdir gözlənilirmüşahidə oluna bilən eksperimental dəyərlər. Xi-kvadrat üçün tənlik belədir: x 2 = Σ((o-e) 2 /e), burada "o" müşahidə olunan dəyər və "e" gözlənilən dəyərdir. Bütün mümkün nəticələr üçün bu tənliyin nəticələrini yekunlaşdırın (aşağıya baxın).

    • Qeyd edək ki, bu tənliyə toplama operatoru daxildir Σ (siqma). Başqa sözlə, hər bir mümkün nəticə üçün ((|o-e|-.05) 2 /e) hesablamalı və nəticədə çıxan ədədləri əlavə edərək, xi-kvadrat test qiymətini əldə etməlisiniz. Bizim nümunəmizdə iki mümkün nəticə var - ya bileti alan avtomobil qırmızı, ya da mavi. Buna görə də ((o-e) 2 /e) iki dəfə hesablamalıyıq - bir dəfə qırmızı avtomobillər üçün, bir də mavi avtomobillər üçün.
    • Nümunə: Gözlənilən və müşahidə olunan dəyərlərimizi x 2 = Σ((o-e) 2 /e) tənliyinə daxil edək. Yadda saxlayın ki, cəm operatoruna görə ((o-e) 2 /e) iki dəfə hesablamalıyıq - bir dəfə qırmızı avtomobillər üçün, bir də mavi avtomobillər üçün. Bu işi aşağıdakı kimi edəcəyik:
      • x 2 = ((90-100) 2 /100) + (60-50) 2 /50)
      • x 2 = ((-10) 2 /100) + (10) 2 /50)
      • x 2 = (100/100) + (100/50) = 1 + 2 = 3 .
  • seçin əhəmiyyət səviyyəsi. Təcrübəmizin sərbəstlik dərəcələrini bildiyimizə və xi-kvadrat testinin dəyərini bildiyimizə görə, p-qiymətimizi tapmaqdan əvvəl daha bir şey etməliyik. Biz əhəmiyyət səviyyəsini müəyyən etməliyik. Sadə dillə desək, əhəmiyyət səviyyəsi bizə nəticələrimizə nə qədər əmin olduğumuzu bildirir. Əhəmiyyətin aşağı dəyəri eksperimental nəticələrin təsadüf nəticəsində və əksinə olması ehtimalının aşağı olması ehtimalına uyğundur. Əhəmiyyət səviyyələri eksperimental nəticələrin təsadüfən əldə edilməsi ehtimalına uyğun gələn onluq (məsələn, 0,01) kimi yazılır (bu halda bunun ehtimalı 1% təşkil edir).

  • P-dəyərini tapmaq üçün ki-kvadrat paylama məlumat cədvəlindən istifadə edin. Alimlər və statistiklər öz təcrübələrinin p-qiymətini hesablamaq üçün böyük cədvəllərdən istifadə edirlər. Bu cədvəllərin adətən solda sərbəstlik dərəcələrinin sayına uyğun şaquli ox, yuxarıda isə p-dəyərinə uyğun olan üfüqi oxu var. Əvvəlcə sərbəstlik dərəcələrinizin sayını tapmaq üçün cədvəl məlumatlarından istifadə edin, sonra ilk dəyəri tapana qədər soldan sağa doğru sıranıza baxın, daha çox ki-kvadrat dəyəriniz. Sütununuzun yuxarısındakı müvafiq p dəyərinə baxın. Sizə lazım olan p-dəyəri bu nömrə ilə növbəti (sizin solunda olan) arasındadır.

    • Xi-kvadrat cədvəlləri bir çox mənbələrdən əldə edilə bilər - onları sadəcə onlayn tapa bilərsiniz və ya elm və ya statistika kitablarında axtara bilərsiniz. Əlinizdə bu kitablar yoxdursa, yuxarıdakı şəkildən və ya medcalc.org kimi pulsuz baxa biləcəyiniz onlayn qrafikdən istifadə edin. O yerləşir.
    • Nümunə: Xi-kvadrat test dəyərimiz 3 idi. Beləliklə, təxmini p dəyərini tapmaq üçün yuxarıdakı şəkildəki xi-kvadrat paylanma cədvəlindən istifadə edək. Çünki biz təcrübəmizdə hər şeyi bilirik 1 sərbəstlik dərəcəsi, ilk sıranı seçin. Daha böyük bir dəyərlə qarşılaşana qədər bu xətt boyunca soldan sağa gedirik 3 , bizim ki-kvadrat test dəyərimiz. İlk tapdığımız 3.84-dür. Sütunumuzun yuxarısına baxırıq və müvafiq p-dəyərinin 0,05 olduğunu görürük. Bu o deməkdir ki, bizim p-dəyərimiz 0,05 ilə 0,1 arasında(artan qaydada cədvəldə növbəti p-dəyəri).
  • Sıfır fərziyyəni rədd etmək və ya saxlamaq barədə qərar verin. Təcrübəniz üçün təxmini p-dəyərini təyin etdiyiniz üçün təcrübənizin sıfır fərziyyəsini rədd edib-etməmək barədə qərar verməlisiniz (unutmayın ki, bu, sizin manipulyasiya etdiyiniz eksperimental dəyişənlərin fərziyyəsidir. yox müşahidə etdiyiniz nəticələrə təsir etdi). Əgər p-dəyəri əhəmiyyət səviyyəsindən azdırsa, təbrik edirik, manipulyasiya etdiyiniz dəyişənlərlə müşahidə etdiyiniz nəticələr arasında çox ehtimal əlaqənin olduğunu sübut etdiniz. Əgər p-dəyəri əhəmiyyət səviyyəsindən yüksəkdirsə, müşahidə etdiyiniz nəticələrin sırf təsadüf və ya verilmiş dəyişənlərin manipulyasiyası nəticəsində olub olmadığını dəqiq deyə bilməzsiniz.

    • Misal: Bizim p-dəyərimiz 0,05 ilə 0,1 arasındadır. Bu aydındır yox 0,05-dən azdır, buna görə təəssüf ki, biz biz sıfır hipotezimizi rədd edə bilmərik. Bu o deməkdir ki, şəhərimizdə polisin qırmızı və göy rəngli avtomobil sahiblərinə ölkə üzrə orta göstəricidən tamamilə fərqli qiymətə bilet verdiyini söyləmək üçün minimum 95%-lik ehtimala çatmamışıq.
    • Başqa sözlə, 5-10% şans var ki, müşahidə etdiyimiz nəticələrin yer dəyişikliyinin təsiri deyil (bütün ölkəyə deyil, bir şəhərə baxsaq), sadəcə olaraq təsadüf nəticəsində. Bizim qeyd etdiyimiz dəqiqlik 5%-dən çox olmamalıdır, deyə bilmərik əminlikləşəhərimizdəki polislərin qırmızı avtomobil sahiblərinə qarşı daha az qərəzli olması - bunun belə olmadığı üçün kiçik (lakin statistik cəhətdən əhəmiyyətli) şans var.
  • Başqa nə oxumaq