Bəy gəl

Göndərildi: 08.09.2021
Məqalənin müəllifi Adəm Quliyev

Statistik araşdırmalar qeyri -müəyyənlik şəraitində qərarlar qəbul etməyi nəzərdə tutur, buna görə də hər zaman yanlış qərar vermək şansı var. Hipotez testində iki növ səhv qərar çıxa bilər.

Əgər sıfır hipotezi doğrudur, amma rədd ediriksə, səhv I tiplibir səhvdir.

Sıfır hipotez yanlışdırsa, amma rədd edə bilməsək, səhv II tipbir səhvdir.

Aşağıdakı cədvəl I və II tip səhvləri ümumiləşdirir.

Şərh

I və II tip səhvlər səhvlərdən qaynaqlanmır. Bu səhvlər təsadüfi təsadüflərin nəticəsidir. Məlumatlar saxta bir nəticəyə dəlil verir. Heç kimin günahı yoxdur!

Misal

Ağıllı Telefonlarda Məlumat İstifadəsi

Əvvəlki bir nümunədə, ağıllı telefonlarda məlumat istifadəsi haqqında bir hipotez testinə baxdıq. Tədqiqatçı, bütün yeniyetmələr üçün ortalama məlumat istifadəsinin 62 MB -dan çox olduğu iddiasını araşdırdı. Nümunə ortalaması 75 MB idi. P-dəyəri təxminən 0.023 idi. Bu vəziyyətdə, P-dəyəri, əsl ortalamanın 62 MB olması halında 75 MB və ya daha yüksək bir nümunə ortalaması əldə etmə ehtimalımızdır.

Nəticənin (75 MB) qeyri -mümkün olmadığını, çox qeyri -adi olduğunu unutmayın. Nəticə kifayət qədər nadirdir ki, sıfır hipotezinin doğru olub olmadığını soruşaq. Bu səbəbdən sıfır hipotezi rədd edirik. Ancaq ehtimal ki, sıfır hipotez hipotezi doğrudur və tədqiqatçı çox qeyri -adi bir nümunə ortalaması aldı. Bu vəziyyətdə nəticə yalnız təsadüfdən qaynaqlanır və məlumatlar I tip səhvinə səbəb oldu: sıfır hipotezi əslində doğru olduqda rədd etmək.

Misal

2012 -ci ildə Obamaya Ağ Kişi Dəstəyi

Əvvəlki bir nümunədə, 2012 -ci ildə Obamaya ağ kişilərin dəstəyinin 40%-dən az olub olmadığını müəyyən etmək üçün sorğu nəticələrini istifadə edərək bir hipotez testi apardıq. Ağ kişilər arasında keçirdiyimiz sorğu 2012-ci ildə Obamaya 35% səs verməyi planlaşdırdığını göstərdi. Nümunə bölgüsünə əsasən, P dəyərini 0.078 olaraq qiymətləndirdik. Bu vəziyyətdə, P-dəyəri, ağ kişilərin əhalisinin 0,40-ı Obamanı dəstəklədiyi təqdirdə nümunə nisbətini 0,35 və ya daha az əldə etmə ehtimalımızdır.

5% səviyyəsindəki sorğu, ağ kişilərin 40% -dən azının 2012 -ci ildə Obamaya səs verəcəyi qənaətinə gəlməyimiz üçün kifayət qədər güclü sübut vermədi.

Bu vəziyyətdə hansı səhvlər mümkündür? Əslində, bu əhalinin 40% -dən azının Obamanı dəstəklədiyi doğrudursa, məlumatlar II tip bir səhvlə nəticələndi: yalançı sıfır hipotezi rədd etməmək. Başqa sözlə, doğru olan alternativ bir fərziyyəni qəbul edə bilmədik.

Burada mütləq I tip səhv etmədik, çünki I tipli səhv sıfır hipotezini rədd etməyi tələb edir.

Yoxla

Yoxla

I tip bir səhv etməyimiz ehtimalı nədir?

Əgər əhəmiyyətlilik səviyyəsi 5% -dirsə (α = 0.05), onda vaxtın 5% -i sıfır fərziyyəni rədd edəcəyik (doğru olduqda!). Əlbəttə ki, nullun doğru olub olmadığını bilməyəcəyik. Ancaq əgər belədirsə, təsadüfi nümunələrdə gözlədiyimiz təbii dəyişkənlik nadir hallarda 5% nəticə verəcəkdir. Nümunə bölgüsünü yaratdığımız zaman sıfır hipotezinin doğru olduğunu zənn etdiyimiz üçün bu məntiqlidir. Sıfır hipotezlə təsvir edilən populyasiyadan seçilmiş təsadüfi nümunələrdəki dəyişkənliyə baxırıq.

Eynilə, əhəmiyyətlilik səviyyəsi 1% olarsa, nümunə nəticələrinin 1% -i sıfır hipotez hipotezini rədd edə biləcəyimiz qədər nadir olacaq. Beləliklə, sıfır hipotezi əslində doğrudursa, onda təsadüfən, vaxtın 1% -i əsl sıfır hipotezini rədd edəcəyik. Buna görə I tip səhv ehtimalı 1%-dir.

Ümumiyyətlə, I tip səhv ehtimalı α -dır.

Tip II Səhv Etmə ehtimalımız nədir?

Sıfır fərziyyə doğrudursa, I tip səhv ehtimalı əhəmiyyətlilik səviyyəsinə bərabərdir. II tip səhv ehtimalını hesablamaq daha mürəkkəbdir. Daha aşağı bir əhəmiyyət səviyyəsi istifadə edərək I tip səhv riskini azalda bilərik. Tip II səhv riskini azaltmağın ən yaxşı yolu nümunə ölçüsünü artırmaqdır. Teorik olaraq, məna səviyyəsini də artıra bilərik, amma bunu etmək eyni zamanda I tipli səhv ehtimalını da artırardı. Bu fikirləri daha sonra bir modulda müzakirə edəcəyik.

Yoxla

Ədalətli bir sikkə

Uzunmüddətli perspektivdə, ədalətli bir sikkə, zamanın yarısına enir. (Bu səbəbdən ağırlıqlı bir sikkə ədalətli deyil.) Hər bir nümunənin ədalətli bir sikkənin 40 döngəsindən ibarət olduğu bir simulyasiya apardıq. Burada 2000 nümunədə başların nisbəti üçün simulyasiya edilmiş bir nümunə paylanmasıdır. Nəticələr 0,25 ilə 0,75 arasında dəyişdi.

Şərh

Ümumiyyətlə, sıfır fərziyyə doğrudursa, əhəmiyyətlilik səviyyəsi I tip səhv etmək ehtimalını verir. Eyni sıfır hipotezdən istifadə edərək çox sayda hipotez testi aparsaq, hipotez testlərinin proqnozlaşdırılan faizində (α) I tipli bir səhv meydana gələcək. Bu problemdir! Bir hipotez testi keçirsək və məlumatlar 5% səviyyəsində əhəmiyyətli olarsa, alternativ hipotezin doğru olduğuna dair kifayət qədər yaxşı sübutumuz var. 20 hipotez testi keçirsək və testlərdən birindəki məlumatlar 5% səviyyəsində əhəmiyyətli olarsa, bizə heç nə deməz! Testlərin 5% -nin (20 -də 1) yalnız şans səbəbiylə əhəmiyyətli nəticələr verəcəyini gözləyirik.

Misal

Cib Telefonları və Beyin Xərçəngi

Aşağıda, David S. Moore -un Əsas İstifadə Statistikasında (4 -cü nəşr, New York: WH Freeman, 2007) istinad etdiyi "Cib telefonları: suallar amma cavablar yoxdur" başlıqlı 1999 -cu il New York Times məqaləsindən bir hissədir :

  • Beyin xərçəngi xəstələri ilə beyin xərçəngi olmayan oxşar bir qrupu müqayisə edən bir xəstəxanada edilən araşdırma, cib telefonu istifadəsi ilə glioma olaraq bilinən beyin xərçəngləri qrupu arasında heç bir statistik olaraq əhəmiyyətli bir əlaqə tapmadı. Ancaq 20 növ glioma ayrıca nəzərdən keçirildikdə, cib telefonu istifadəsi ilə nadir bir form arasında bir əlaqə tapıldı. Təəccüblüdür ki, bu risk daha çox mobil telefon istifadəsi ilə artmaq əvəzinə azaldı.

Bu, ehtimal olunan tip I xətasının nümunəsidir. Tutaq ki, 5% səviyyəsində "Cib telefonu istifadəsi xərçənglə əlaqəli deyil" sıfır hipotezi ilə 20 hipotez testi apardıq. Cib telefonu istifadəsi ilə xərçəng arasında heç bir əlaqə olmadığı təqdirdə, hər 20 nəfərdən birinin (5%) yalnız təsadüfən əhəmiyyətli nəticələr verəcəyini gözləyirik. Bu xərçəng növünün cib telefonu istifadəsi ilə əlaqəli olduğu qənaəti, ehtimal ki, təsadüfi təsadüflərin nəticəsidir və heç bir əlaqənin göstəricisi deyil.

Eyni fikri əks etdirən əyləncəli bir cizgi filmi görmək üçün bura vurun.

Yoxla

Neçə nəfər telepatikdir?

Telepatiya düşüncələri oxumaq qabiliyyətidir. Tədqiqatçılar 1900 -cü illərin əvvəllərində telepatiya ilə bağlı eksperimental tədqiqatlar üçün Zener kartlarından istifadə etdilər.

Bir telepatiya təcrübəsində "göndərən" 5 Zener kartından 1 -ə baxır, "alıcı" simvolu təxmin edir. Bu 40 dəfə təkrarlanır və düzgün cavabların nisbəti qeydə alınır. 5 kart olduğu üçün təsadüfi təxminlərin uzun müddətdə 20% (5 -dən 1) doğru olmasını gözləyirik. Beləliklə, 40 cəhddə, 0.20 nisbətində 8 doğru təxmin çox yayılmışdır. Əlbəttə ki, kimsə yalnız təxmin edərkən belə dəyişkənlik olacaq. 40 cəhddə on üç və ya daha çox, 0.325 nisbətində, 5% səviyyəsində statistik olaraq əhəmiyyətlidir. İnsanlar telepatiya testində bu işi yaxşı yerinə yetirdikdə, performanslarının təsadüfən olmadığı qənaətinə gəlirik və bunu zehni oxumaq qabiliyyətinin göstəricisi kimi qəbul edirik.

"Əhali nisbəti üçün hipotez testi" adlı növbəti bölmədə, bir populyasiya nisbətinə dair iddialar üçün hipotez testlərinin təfərrüatlarını öyrənirik. Detallara girməzdən əvvəl geri çəkilmək və hipotez testi haqqında daha çox düşünmək istəyirik. Hipotez testinə girişimizi faydalı bir bənzətmə ilə bağlayırıq.

Hipotez Testləri üçün Məhkəmə Otaqlarının Analogiyası

Təqsirləndirilən şəxs cinayət işi üzrə mühakimə olunduqda, günahı sübut olunana qədər günahsızdır. Təqsirləndirilən şəxsin ağlabatan bir şübhə olmadan günahkar olduğunu göstərən sübutları təqdim etmək prokurorluğun işidir . Ağlabatan bir şübhə yaratmaq üçün bu dəlilə etiraz etmək müdafiə tərəfinin işidir. Münsiflər heyəti dəlilləri ölçüb qərar verir.

Münsiflər heyəti qərar verəndə yalnız iki mümkün hökmə malikdir:

  • Günahkar:Münsiflər heyəti, müttəhimi məhkum etmək üçün kifayət qədər sübutun olduğu qənaətinə gəlir. Dəlillər o qədər güclüdür ki, müttəhimin günahkar olduğuna əsaslı şübhə yoxdur.
  • Günahkar deyil:Münsiflər heyəti, şübhəli bir şəxsin günahkar olduğuna dair kifayət qədər sübutun olmadığı qənaətinə gəlir. Diqqət yetirin ki, həmin şəxs günahsızdır. Bu hökm yalnız günahkar bir hökmü geri qaytarmaq üçün kifayət qədər dəlil olmadığını söyləyir.

Bu nümunə necə bir hipotez testinə bənzəyir?

Sıfır hipotez "İnsan günahsızdır". Alternativ hipotez "Şəxs günahkardır". Dəlillər məlumatlardır. Məhkəmə zalında, şəxsin günahı sübut olunana qədər günahsız olduğu qəbul edilir. Hipotez testində, məlumatlar əksini sübut etməyənə qədər sıfır hipotezinin doğru olduğunu düşünürük.

Mümkün olan iki hökm, hipotez testində mümkün olan iki nəticəyə bənzəyir.

Sıfır hipotezirədd edin :Sıfır bir fərziyyəni rədd etdikdə, alternativ hipotezi qəbul edirik. Bu günahkar bir hökmə bənzəyir. Münsiflərin günahsızlıq fərziyyəsini rədd etmələri üçün sübutlar kifayət qədər güclüdür. Hipotez testində məlumatlar sıfır fərziyyənin doğru olduğu fərziyyəsini rədd edə biləcəyimiz qədər güclüdür.

Sıfır hipotezi rədd etməmək: Sıfır hipotezirədd edə bilmədikdə, "günahsız" bir hökm veririk. Münsiflər heyəti, sübutların günahsızlıq fərziyyəsini rədd edəcək qədər güclü olmadığı qənaətinə gəlir. Məlumatların sıfır hipotezi rədd etmək üçün kifayət qədər güclü olmadığı qənaətindəyik, buna görə məlumatlar alternativ hipotezi qəbul etmək üçün çox zəifdir.

Məhkəmə salonu bənzətməsinin I və II tip səhvlərlə necə əlaqəsi var?

I tip səhv:Münsiflər heyəti günahsız bir şəxsi məhkum etdi. Analoji olaraq, əsl sıfır hipotezini rədd edirik və yalançı alternativ hipotezi qəbul edirik.

Tip II səhv:Münsiflər heyəti, bir insanın həqiqətən günahkar olmadığını söyləyir. Bənzərliklə, saxta olan sıfır hipotezi rədd edə bilmirik. Başqa sözlə, alternativ bir hipotezi həqiqətən doğru olduğu halda qəbul etmirik.

Xülasə edək

Bu bölmədə hipotez testinin dörd mərhələli prosesini təqdim etdik:

Addım 1: Hipotezləri müəyyənləşdirin.

  • Hipotezlər populyasiyalarla bağlı iddialardır.
  • Sıfır hipotez, parametrin müəyyən bir dəyərə bərabər olduğu hipotezidir.
  • Alternativ hipotez, parametrin sıfırdakı parametr dəyərindən kiçik, böyük və ya ona bərabər olmadığı iddiasıdır. Statistik araşdırmanı aparan iddia ümumiyyətlə alternativ hipotezdə olur.

Addım 2: Məlumatları toplayın.

Hipotez testi ehtimala əsaslandığından, məlumat istehsalında təsadüfi seçim və ya təyinat vacibdir.

Addım 3: Dəlilləri qiymətləndirin.

  • P dəyərini tapmaq üçün məlumatlardan istifadə edin.
  • P-dəyəri, sıfır hipotezinin doğru olması halında məlumatların nə qədər ehtimal olunmadığına dair bir ehtimal ifadəsidir.
  • Daha dəqiq desək, P-dəyəri nümunə nəticələrinin ehtimalını sıfır hipotezinin doğru olması halında ən az məlumatlar qədər həddindən artıq dərəcədə verir.

Addım 4: Nəticəni verin.

  • Kiçik bir P dəyəri, sıfır hipotezinin doğru olduğu təqdirdə məlumatların meydana gəlməsinin mümkün olmadığını söyləyir. Buna görə də, sıfır hipotezinin yəqin ki, doğru olmadığı və alternativ hipotezin doğru olduğu qənaətinə gəlirik.
  • P dəyərinin kifayət qədər kiçik olub olmadığını qiymətləndirmək üçün tez-tez bir məna səviyyəsi seçirik. P dəyəri dəyər səviyyəsindən az və ya bərabərdirsə, sıfır fərziyyəni rədd edirik və əvəzinə alternativ hipotezi qəbul edirik.
  • P dəyəri əhəmiyyət səviyyəsindən daha böyükdürsə, sıfır fərziyyəni "rədd etmədiyimizi" söyləyirik. Sıfır hipotezi "qəbul etdiyimizi" heç vaxt demirik. Sadəcə, bunu rədd etmək üçün kifayət qədər sübutumuz olmadığını söyləyirik. Bu, alternativ hipotezi dəstəkləmək üçün kifayət qədər sübutumuz olmadığını söyləməyə bərabərdir.
  • Nəticəmiz tədqiqat sualına cavab verəcək, buna görə də nəticəni tez -tez alternativ fərziyyə baxımından ifadə edirik.

Nəticə ehtimala əsaslanır, buna görə də həmişə qeyri -müəyyənlik var. Buna qarşı güclü dəlillərimiz olsa da, sıfır hipotez hələ də doğru ola bilər. Əgər belədirsə, I tipsəhvimiz var. Eynilə, sıfır fərziyyəni rədd edə bilməsək də, bu, alternativ hipotezin yalan olduğu anlamına gəlmir. Bu vəziyyətdə, II tipbir səhvimizvar . Bu səhvlər hipotez testinin aparılmasındakı səhvin nəticəsi deyil. Təsadüfi təsadüflər nəticəsində yaranır.