Statistik əhəmiyyət nədir?

Göndərildi: 08.09.2021
Məqalənin müəllifi Adəm Quliyev

Statistik əhəmiyyət, qərar qəbul etməyinizə əmin olmağa imkan verən bir analiz nəticəsində etibarlılıq ölçüsüdür.

Yalnız 2020 -ci ildə yaradılan məlumatların miqdarı təxminən 50.5 zettabayt (təxminən 21 sıfır) olduğu təxmin edilir; bəziləri, məlumatların 21 -ci əsrin ən qiymətli əmtəəsi - rəqəmsal iqtisadiyyatın yeni nefti olduğunu iddia edirlər.

Yaranan məlumatların miqdarı eksponent olaraq artmağa davam etdikcə, analiz daha da vacib hala gəldi. Ancaq dəqiq olmadıqda heç bir analiz faydalı deyil.

Statistik əhəmiyyət nədir?

Statistik əhəmiyyət, bir analizdə iki və ya daha çox dəyişən arasındakı əlaqənin sırf təsadüfən deyil, əslində başqa bir amildən qaynaqlandığı ehtimaldır. Başqa sözlə, statistik əhəmiyyət, müəyyən bir statistikanın etibarlı olduğunu riyazi olaraq sübut etmək üsuludur.

Niyə statistik əhəmiyyət müəssisələr üçün vacibdir?

Həqiqi dünyada müəssisələr, anketlərinin, təcrübələrinin, sorğularının və ya istifadəçi məlumatlarının nəticələrinin qərarlarına nə qədər güclü təsir etməli olduğunu anlamaq üçün statistik əhəmiyyətdən istifadə edirlər.

Statistik əhəmiyyət vacibdir, çünki təhlilinizə və əldə etdiyiniz fikirlərə inam verir. Yanıltıcı və ya yanlış anlayışlar üzərində hərəkət etmənin heç bir iş dəyəri yoxdur və üstəlik, aldadıcı məlumatlara qarşı tədbir görməyiniz də resursları düzgün sərmayə qoymağınıza mane ola bilər.

Statistik əhəmiyyətini necə hesablaya bilərəm?

Statistik əhəmiyyət tez -tez nəticələrinizin təsadüfən baş vermə ehtimalını anlamaqla hipotezin etibarlılığını yoxlayan statistik hipotez testi ilə hesablanır.

Burada "hipotez", məlumat dəstləriniz arasındakı əlaqəyə dair bir fərziyyə və ya inancdır. Hipotez testinin nəticəsi, bu fərziyyənin araşdırılmasının olub olmadığını görməyə imkan verir.

Standart bir hipotez testi iki fərziyyəyə əsaslanır.

  • Sıfır hipotez:təkzib etməyə çalışdığınız statistik testin standart fərziyyəsi (məs., Xərc artımı alış sayına təsir etməyəcək).
  • Alternativ hipotez: Sıfır hipotezinizəzidd olan alternativ bir nəzəriyyə (məsələn, xərclərin artması alış sayını azaldacaq). Bu sübut etməyə ümid etdiyiniz hipotezdir.

Hipotez testlərinin test hissəsi, hansı nəzəriyyənin, null və ya alternativin, məlumatlarla daha yaxşı dəstəkləndiyini müəyyən etməyə imkan verir. Bir çox hipotez test metodologiyası var və ən çox yayılmışlardan biri də burada müzakirə edəcəyimiz Z-testidir.



Ancaq Z-testinə getməzdən əvvəl, Z-testinin etibar etdiyi digər statistik anlayışları ziyarət etməyimiz vacibdir.

Normal paylanma

Normal paylama, məlumatların necə paylandığını göstərmək üçün istifadə olunur və əsasən aşağıdakılarla təyin olunur:

  • Orta (μ): Orta, məlumatlarınızın mərkəzinin yerini (və ya ortalamasını) təmsil edir.
  • Standart sapma (σ): Standart sapma, bir sıra dəyərlərin dəyişmə və ya dağılma miqdarının ölçüsüdür və məlumatlarınızın yayılmasını təmsil edir.

Normal paylanma əyrisi (Şəkil mənbəyi - Wikipedia)

Normal paylama, "zəng əyrisi" (şəklinə görə) adlanan şeylə qrafik olaraq təsvir olunur. Bir məlumat nöqtəsinin yerini standart sapma və ortalama baxımından qiymətləndirmək üçün normal paylanma əyrisi istifadə olunur. Bu, bir məlumat nöqtəsinin statistik ortalamadan neçə standart sapmaya əsaslandığını anomal olaraq təyin etməyə imkan verir. Normal paylanmanın xüsusiyyətləri o deməkdir ki:

  • Bütün məlumat nöqtələrinin 68,3% -i ortalamanın hər tərəfində 1 standart sapma aralığında olur.
  • Bütün məlumat nöqtələrinin 95.4% -i ortalamanın hər tərəfində 2 standart sapma aralığında olur.
  • Bütün məlumat nöqtələrinin .799.7% ortalamanın hər tərəfində 3 standart sapma aralığındadır.

Bir məlumat dəsti üçün normal bir paylama varsa, ortalamadan uzaq olan standart sapmaların sayına görə hər hansı bir məlumat nöqtəsini tapa bilərik.

Məsələn, bir musiqi axını tətbiqinin yüklənmə sayının 1000 olduğunu, standart yüklənmənin 100 yükləndiyini nəzərə alaq. MixTunes adlı bir tətbiqin 1200 yükləməsi varsa, bunun ortalamadan 2 standart sapma olduğunu və musiqi tətbiqlərinin ən yaxşı 2,3% -də olduğunu söyləyə bilərik.

Z-hesab

Statistikada, bir məlumat nöqtəsi ilə məlumat dəstinin ortası arasındakı məsafə Z skoru olaraq qiymətləndirilir. Z skoru (standart hesab olaraq da bilinir), bir məlumat nöqtəsinin ortalamadan uzaqlaşdırıldığı standart sapmaların sayıdır.

Z-hesablanması, hesablanan məlumat nöqtəsinin (x) dəyərindən paylanmanın ortasını (μ) çıxarmaq və nəticəni standart sapmaya (σ) bölməklə hesablanır.

Yuxarıda bəhs etdiyimiz nümunədə, MixTunes-un Z-2 qiyməti olardı, çünki ortalama 1000 yükləmə və standart sapma 100 yükləmədir.

Bizə bir təhlili müşahidə necə mənalı nəticə müəyyən bir normal paylanması imkan verir etsək, Z-hesab (müsbət və ya mənfi) yüksək bal gücündə daha edilir çətinnəticə təsadüfən baş və daha çox güman ki,onu mənalı olmaqdır. Təhlilinizin nəticəsinin nə qədər mənalı olduğunu ölçmək üçün daha bir anlayışdan istifadə edirik.

Ümumi bir populyasiyanın nümunəsinin nəzərdən keçirildiyi araşdırmalarda (sorğular və sorğular kimi), hər bir nümunənin ümumi populyasiyadan fərqli ola biləcəyini və beləliklə ümumi göstəricidən standart bir kənara çıxa biləcəyini nəzərə alaraq Z dəyəri formulu bir qədər dəyişdirilir. bütün nümunələrin paylanması.

Burada √n nümunə ölçüsünün kvadrat köküdür.

P dəyərləri

Z-testindən istifadə etməyimiz lazım olan son konsepsiya P dəyərləridir. P dəyəri, sıfır hipotezinin doğru olduğu zaman ölçülən nəticələr kimi ən az həddindən artıq nəticə tapmaq ehtimalıdır.



Məsələn, ABŞ -ın Kaliforniya və Nyu -York əyalətlərində fərdlərin orta boyunu ölçdüyümüzü söyləyin. Kaliforniyadakı fərdlərin orta boyunun Nyu Yorkdakı fərdlərin boyundan yüksək olmadığı boş bir hipotezlə başlaya bilərik.

Daha sonra bir araşdırma aparırıq və Kaliforniyalıların orta boyunun 1.4 düym daha yüksək olduğunu, P-dəyəri 0.48 olduğunu görürük. Bu, boş bir hipotezin - Kaliforniyalıların ortalama hündürlüyünün New Yorkluların orta boyundan yüksək olmadığı bir dünyada - Kaliforniyada yüksəklikləri ən azı 1,4 düym daha yüksək ölçmək şansımızın 48% olduğunu göstərir.

Beləliklə, Kaliforniyadakı hündürlüklər əslində daha yüksək deyilsə, məlumatların təsadüfi səs -küyündən ötəri onları ən azı yarı zamana görə ən azı 1,4 düym daha yüksək olaraq ölçərdik. Sonradan, P-dəyəri nə qədər aşağı olarsa, nəticə o qədər mənalı olar ki, səs-küydən və ya təsadüfi təsadüflərdən qaynaqlanır.

Bir araşdırmanın və ya analizin nəticəsinin statistik cəhətdən əhəmiyyətli adlandırıla bilməməsi, tədqiqat başlamazdan əvvəl qurulan test işinin "əhəmiyyət səviyyəsindən" asılıdır. Yunanıstanın alfa (α) hərfi ilə ifadə olunan əhəmiyyət dəyəri, araşdırmanın statistik olaraq əhəmiyyətli olduğunu düşünə biləcəyimiz maksimum P dəyərindən başqa bir şey deyil. Başqa sözlə, həqiqət olduqda sıfır hipotezi rədd etmə ehtimalı - və ya, sadəcə olaraq, səhv qərar vermə ehtimalı.

Bu əhəmiyyət dəyəri vəziyyətə və tədqiqat sahəsinə görə dəyişir, lakin ən çox istifadə edilən nəticə təsadüfi olaraq ortaya çıxma şansının 5% -ə bərabərdir.

R kimi bir proqramlaşdırma dilindən və ya Excel formulu, onlayn alət, qrafik kalkulyatoru və ya hətta Z adlanan sadə bir rəqəm cədvəlindən istifadə edərək bir Z balını P dəyərinə (və əksinə) çevirmək olar. -bal cədvəli.

Z testi

Z-testi üçün normal statistikanın əyrisi test statistikasının paylanması üçün təxmini olaraq istifadə olunur. Z-testi aparmaq üçün testiniz və ya təhsiliniz üçün Z-bal tapın və onu P-dəyərinə çevirin. Əgər P-dəyəriniz əhəmiyyətlilik səviyyəsindən aşağıdırsa, müşahidənizin statistik baxımdan əhəmiyyətli olduğu qənaətinə gələ bilərsiniz.

Bir nümunəyə baxaq.

X şəhərində yerləşən A Universitetinin qəbul şöbəsində çalışdığımızı düşünün. Böyük bir universitet olduğumuzu göstərmək üçün A Universitetinin tələbələrinin standart bir testdə şəhərdəki orta tələbədən daha yaxşı performans göstərdiyini sübut etmək istəyirik. X. Standartlaşdırılmış testin test komitəsinin idarə heyəti bütün test ballarını təhlil etdi və bizə bildirdi ki, X şəhərinin şagirdləri standartlaşdırılmış testdən orta hesabla 75 bal alırlar.

Şagirdlərimizin daha yaxşı performans göstərdiyini görmək üçün 100 şagirddən imtahan nəticələrini bölüşmək üçün sorğu keçiririk və ortalamanın 75 bal olduğunu, standart bir 2,5 sapma ilə fərqləndiyini öyrənirik. Əhəmiyyət səviyyəsi (α) dəyərini 0.05 olaraq təyin edirik, yəni nəticələr yalnız P-dəyəri 0.05-dən aşağı olduqda əhəmiyyətli olur.

Tələbələrimizin testdə daha yaxşı nəticə göstərdiyini sübut etməyə çalışdığımız üçün, sıfır fərziyyəmiz A Universitetində tələbələrin orta balının şəhər ortalamasından yüksək olmamasıdır.

Ölçmə dəyərimizdən (78) populyasiya ortalamasını (Şəhər X ortalaması 75) çıxarmaqla və nümunələrin sayının kvadrat kökünə (2.5) standart sapmaya bölməklə bu test üçün Z-hesabını hesablamağa başlayırıq. 100).

Z = (x-μ) / (σ / √n) = (78-75) / (2.5 / √100)

Bu bizə 12 Z-skoru verir. Bu Z-hesabını çevirmək bizə 0.00001-dən az olan çox kiçik bir P-dəyəri verir. Bu o deməkdir ki, sıfır hipotezi rədd edə bilərik. Başqa sözlə, A Universitetinin tələbələrinin X şəhərindəki digər tələbələrə nisbətən daha yüksək bal topladıqlarına dair statistik cəhətdən əhəmiyyətli sübutlar var.

Statistik əhəmiyyətdən nə üçün istifadə edə bilərəm?

Statistik əhəmiyyətin necə hesablanacağını bildiyiniz üçün, burada statistik əhəmiyyətlilik testindən istifadə edə biləcəyiniz bir neçə yer nümunəsi verilmişdir:

  • Açılış səhifəsi dönüşümləri
  • Bildiriş / e -poçt cavab dərəcələri və dönüşüm nisbətləri
  • İstifadəçilərin məhsul satışına reaksiyası
  • İstifadəçilərin qiymətlərə reaksiyası
  • Yeni istifadəyə verilən xüsusiyyətlərə istifadəçilərin reaksiyası

Qeyd etməli şeylər

Statistik əhəmiyyətlilik testi testləri və təhlilləri təsdiqləmək üçün əla bir vasitədir, lakin bu, məlumatlarınızın dəqiq və ya qərəzsiz olduğu anlamına gəlmir. Sorğuda iştirak edənlər yalan danışa və sizə yanlış məlumatlar verə bilər və sorğularınız müəyyən bir demoqrafik məlumatların qeyri-bərabər təqdim edilməsi ilə qərəzli ola bilər.

Əlavə olaraq, zəif işlədilən statistik əhəmiyyətlilik testi qeyri -dəqiq fikirlərə səbəb ola bilər. Bu, seçilmiş əhəmiyyətlilik səviyyəsi (α) səhv olduqda baş verə bilər.



Nəhayət, tərifinə görə P-dəyərləri, yalan pozitivliyin kiçik bir şansına imkan verir. Bunun qarşısını almağın bir yolu da nəticələrin təkrarlanmasıdır. Araşdırmanı təkrarlaya və aşağı bir P dəyərinə nail ola bilsəniz, saxta pozitiv müşahidə etmə ehtimalınız azalır.

Unutmayın ki, statistik əhəmiyyət artan inamla iş qərarları vermək üçün əla bir vasitədir, ancaq riyazi bir gümüş güllə deyil.