Logistik Reqressiya Təhlili | Stata Əlavə Çıxış

Göndərildi: 08.09.2021
Məqalənin müəllifi Adəm Quliyev

Bu səhifə, çıxışı izah edən dipnotlarla logistik reqressiya reqressiya təhlili nümunəsini göstərir. Bu məlumatlar 200 lisey şagirdi üzərində toplandı və elm, riyaziyyat, oxu və sosial araşdırmalar ( socst) daxil olmaqla müxtəlif testlərdəki ballardır. Dəyişən qadın, tələbə qadın olsaydı 1, kişi olarsa 0 kodlu ikiqat dəyişkəndir.

Bağımlı dəyişən olaraq istifadə etmək üçün uyğun bir ikiqatdəyişən olmadığından, davamlı dəyişən yazmağaəsaslanaraq ( honcompadlandıracağıq ) . Davamlı dəyişənlərdən ikili dəyişənlərin hazırlanmasının tərəfdarı deyilik; daha doğrusu, burada yalnız bu təsvirin məqsədləri üçün edirik.

Təkrarlama jurnalı

a. Bu, hər bir iterasyonda log ehtimallarının siyahısıdır. (Unutmayın ki, logistik reqressiya təkrarlanma proseduru olan maksimum ehtimaldan istifadə edir.) İlk iterasiya (iterasiya 0 adlanır) "sıfır" və ya "boş" modelin log ehtimalını; yəni proqnozlaşdırıcı olmayan bir model. Növbəti iterasiyada proqnozlaşdırıcılar modelə daxil edilir. Hər bir təkrarlama zamanı, log ehtimalını artırır, çünki məqsəd log ehtimalını maksimuma çatdırmaqdır. Ardıcıl təkrarlamalar arasındakı fərq çox kiçik olduqda, modelin "yaxınlaşdığı" deyilir, təkrarlama dayandırılır və nəticələr göstərilir. Bu proses haqqında daha çox məlumat üçün Kateqoriyalı və Məhdud Bağlı Dəyişənlər üçün Reqressiya Modelləri, J. Scott Long və Jeremy Freese tərəfindən Üçüncü Nəşrə baxın.

Model Xülasəsi

b. Günlük ehtimalı- Bu, son modelin log ehtimalıdır. -80.11818 dəyərinin özlüyündə heç bir mənası yoxdur; daha doğrusu, bu ədəd iç içə modelləri müqayisə etmək üçün istifadə edilə bilər.

c. OBS sayı- Bu təhlildə istifadə edilmişdir müşahidələr sayı. Logistika reqressiyasında istifadə olunan hər hansı bir dəyişən üçün dəyərləriniz yoxdursa, bu rəqəm məlumat dəstinizdəki müşahidələrin ümumi sayından az ola bilər. Stata, standart olaraq siyahıdan silinmə istifadə edir, yəni logistik reqressiyada hər hansı bir dəyişən üçün dəyər yoxdursa, bütün hal təhlildən çıxarılacaq.

d. LR chi2 (3)-Buehtimal nisbəti (LR) ki-kvadrat testidir. Ki-kvadrat test ehtimalı əllə 2*(115.64441-80.11818) = 71.05 kimi hesablana bilər. Bu, başlanğıc və bitiş ehtimalı arasındakı mənfi iki (yəni -2) dəfə fərqdir. Mötərizədə olan rəqəm sərbəstlik dərəcələrinin sayını göstərir. Bu modeldə üç proqnozlaşdırıcı var, buna görə də üç sərbəstlik dərəcəsi var.

e. Prob>chi2-Sıfırhipotezinin doğru olduğunu nəzərə alsaq, xi-kvadrat statistikasını əldə etmək ehtimalı budur. Başqa sözlə, müstəqil dəyişənlərin asılı dəyişənə heç bir təsiri olmadığı təqdirdə, bu xi-kvadrat statistikasını (71.05) əldə etmək ehtimalıdır. Bu, əlbəttə ki, ümumi modelin statistik cəhətdən əhəmiyyətli olub olmadığını müəyyən etmək üçün kritik bir dəyərlə, bəlkə də .05 və ya .01 müqayisə edilən p-dəyərdir. Bu halda, model statistik baxımdan əhəmiyyətlidir, çünki p-dəyəri .000-dən azdır.

f. Pseudo R2-Bu yalançı R-kvadratdır. Logistik reqressiyanın OLS reqressiyasında olan R-kvadratına ekvivalenti yoxdur; lakin, bir çox insanlar biri ilə gəlmək üçün çalışmışıq. Yalançı R-kvadrat statistikasının geniş çeşidi var. Bu statistika OLS reqressiyasında R-kvadratın nə demək olduğunu ifadə etmədiyi üçün (proqnozlaşdırıcılar tərəfindən izah edilən variasiya nisbəti) bu statistikanı çox ehtiyatla şərh etməyi təklif edirik.

Parametr təxminləri

g. honcomp- Bu, logistik reqressiyamızdakı asılı dəyişəndir. Aşağıda sadalanan dəyişənlər müstəqil dəyişənlərdir.

h. Qəhvə. - Bunlar asılı dəyişəni müstəqil dəyişəndən proqnozlaşdırmaq üçün logistik reqressiya tənliyinin dəyərləridir. Günlük nisbət vahidlərindədirlər. OLS reqressiyasına bənzər proqnoz tənliyi belədir

log (p/1-p) = b0 + b1*qadın + b2*oxumaq + b3*elm

burada p - fəxri kompozisiyada olma ehtimalı. Bu nümunədə istifadə olunan dəyişənlər baxımından ifadə edildikdə, logistik reqressiya tənliyi var

log (p/1-p ) = -12.7772 + 1.482498*qadın + .1035361*oxumaq + 0947902*elm

Bu təxminlər, asılı dəyişənin logit miqyasında olduğu müstəqil dəyişənlərlə asılı dəyişən arasındakı əlaqəni izah edir. Bu hesablamalar, bütün digər proqnozlaşdırıcıları sabit saxlayaraq, proqnozlaşdırıcıda 1 vahid artımla proqnozlaşdırılacaq olan honcomp = 1 -in proqnozlaşdırılan qeyd nisbətlərinin artım miqdarını bildirir. Qeyd: Əhəmiyyətli olmayan müstəqil dəyişənlər üçün əmsallar 0 -dan əhəmiyyətli dərəcədə fərqlənmir, bu əmsalları şərh edərkən nəzərə alınmalıdır. (Katsayıların statistik baxımdan əhəmiyyətli olub olmadığını yoxlamaqla əlaqədar olaraq z dəyərləri və p dəyərləri olan sütunlara baxın). Bu əmsallar gündəlik nisbət vahidlərində olduğu üçün şərh etmək çox vaxt çətindir, buna görə də tez-tez əmsal nisbətlərinə çevrilir. Bunu əmsalını qat -qat artıraraq əllə edə bilərsiniz,və ya istifadə edərəkvə ya logitəmri ilə və ya logistikəmrdən istifadə edərək seçim edin .

qadın- Dəyişən qadınüçün əmsal (və ya parametr təxminləri) 1.482498 -dir. Bir-vahid artım bu deməkdir qadın(kişi qadın gedir, başqa sözlə,), biz asılı dəyişən log-bahis bir 1,482498 artım gözləyirik honcompbütün digər müstəqil dəyişənlər daimi keçirilməsi. oxumaq-Oxuma balının hər bir vahid artımı üçün (oxu testinin hər bir əlavə nöqtəsi üçün), bütün digər müstəqil dəyişənləri sabit saxlayaraq, honcompunlog-odds-da .1035361 artımını gözləyirik . elm- elm hesab hər bir vahid artımı üçün biz log-bahis bir .0947902 artım gözləyirik honcompbütün digər müstəqil dəyişənləri sabit saxlayır. sabit- Bütün proqnozlaşdırıcı dəyişənlər sıfıra bərabər olduqda , honcomp-un log-odds-un gözlənilən dəyəridir . Əksər hallarda bu maraqlı deyil. Həm də tez -tez sıfır bir dəyişənin alacağı real bir dəyər deyil.

i. Std. Səhv.- Bunlar əmsallarla əlaqəli standart səhvlərdir. Standart səhv, parametrin 0 -dan əhəmiyyətli dərəcədə fərqləndiyini yoxlamaq üçün istifadə olunur; Parametr qiymətləndirməsini standart xətaya bölməklə bir z dəyəri əldə edirsiniz (z dəyərləri və p dəyərləri olan sütuna baxın). Standart səhvlər, bu cədvəlin son iki sütununda göstərildiyi kimi, parametr üçün etibarlılıq intervalı yaratmaq üçün də istifadə edilə bilər.

j. zP>| z |-Bu sütunlar əmsalın (parametrin) 0 olduğu sıfır hipotezini sınamaq üçün istifadə olunan z-dəyəri və 2-quyruqlu p-dəyərini təmin edir. 2 quyruqlu bir testdən istifadə edirsinizsə, onda hər bir p-dəyərini əvvəlcədən seçdiyinizlə müqayisə edərdiniz. alfa dəyəri. P-dəyərləri alfadan aşağı olan əmsallar statistik olaraq əhəmiyyətlidir. Məsələn, alfanı 0.05 olaraq seçsəniz, p-dəyəri 0.05 və ya daha az olan əmsallar statistik olaraq əhəmiyyətli olardı (yəni sıfır fərziyyəni rədd edə və əmsalın 0-dan xeyli fərqli olduğunu söyləyə bilərsiniz). Əgər 1 quyruqlu testdən istifadə edirsinizsə (yəni, parametrin müəyyən bir istiqamətdə gedəcəyini proqnozlaşdırırsınızsa), əvvəlcədən seçilmiş alfa səviyyənizlə müqayisə etməzdən əvvəl p-dəyərini 2-yə bölə bilərsiniz. 2 quyruqlu test və alfa 0,05 ilə əmsalın sıfır fərziyyəsini rədd edə bilərsiniz.qadıntətbiq olduqda; 0 1.482498 əmsalı üçün əmsalı xeyli böyükdür 0 çoxdur bərabər oxumaqonun p-dəyəri 0,05 daha kiçik olan 0.000 çünki 0,05 alfa istifadə 0 əhəmiyyətli dərəcədə fərqli .1035361 edir. Elmüçün əmsal 0,05 olan alfa istifadə edərək 0,0947902-dən əhəmiyyətli dərəcədə fərqlənir, çünki p-dəyəri 0,05-dən kiçik olan 0,000-dir.

k. [95% Konf. Aralıq]- Bu əmsal üçün 95% etibarlılıq aralığını göstərir. Bu çox faydalıdır, çünki parametrin faktiki populyasiya dəyərinin nə qədər yüksək və nə qədər aşağı olduğunu başa düşməyinizə kömək edir. Etibarlılıq intervalları, p-dəyərləri ilə əlaqədardır ki, etibar aralığına 0 daxil olarsa, əmsal statistik olaraq əhəmiyyətli olmayacaq.

Oran əmsalları

Bu növbəti nümunədə, nisbət nisbətlərinin şərhini göstərəcəyik. Logistikaəmrindən istifadə edəcəyik ki, əmsalların əvəzinə əmsal nisbətlərini görək. Bu nümunədə, modelimizi sadələşdirəcəyik ki, yalnız bir proqnozlaşdırıcımız olsun, ikili dəyişən qadın. Logistika reqressiyasına başlamazdan əvvəl , iki dəyişənin çarpazını əldə etmək üçün tabəmrindən istifadə edəcəyik .

Onur kompozisiyasında olan kişi sayını 18, fərqlənməyən kişi sayına 73 bölsək, kişilər üçün onur kompozisiyasında olma ehtimalını alırıq, 18/73 = .24657534. Eyni şeyi qadınlar üçün etsək, 35/74 = .47297297 alarıq. Az əvvəl hesabladığımız iki əmsalın nisbəti olan nisbət nisbətini əldə etmək üçün .47297297/.24657534 = 1.9181682 alırıq. Aşağıdakı çıxışda görə bildiyimiz kimi, bu, logistikaəmrindən əldə etdiyimiz nisbət nisbətidir . Burada xatırlamaq lazım olan şey, qrupun 0 olaraq kodlandığı qrupun 1 olaraq kodlanmasını istəməyinizdir, buna görə də həm kişilər, həm də qadınlar üçün honcomp = 1/honcomp = 0, sonra qadınlar üçün nisbətlər/kişilər üçün bahis, çünki qadınlar 1 olaraq kodlanır.

95% etibar aralığına gəldikdə, bunun 1 dəyərini daxil etməsini istəmirik. Katsayıları nəzərdən keçirərkən, etibar aralığının 0 olmasını istəməzdik. 0 -u eksponentləşdirsək, 1 (exp ( 0) = 1). Beləliklə, bu eyni şeyi söyləməyin iki yoludur. Gördüyünüz kimi, 95% etibar intervalına 1 daxildir; bu səbəbdən, bahis nisbəti statistik olaraq əhəmiyyətli deyil. 95% etibarlılıq aralığının alt həddi 1-ə çox yaxın olduğu üçün p-dəyəri .05-ə çox yaxındır.

Aşağıdakı çıxışla əlaqədar qeyd etməli olduğunuz bir neçə başqa şey var. Birincisi, yalnız bir proqnozlaşdırıcı dəyişənə sahib olmağımıza baxmayaraq, nisbət nisbəti testi modelin ümumi testi ilə uyğun gəlmir. Bunun səbəbi, z statistikasının əslində Wald xi-square testinin nəticəsidir, ümumi modelin testi isə ki-kare ehtimal nisbətidir. Bu iki növ xi-kvadrat testi asimptotik olaraq ekvivalent olsa da, kiçik nümunələrdə burada olduğu kimi fərqlənə bilər. Həm də iki testin nəticələrinin fərqli nəticələr verdiyi bədbəxt vəziyyətimiz var. Bu çox tez -tez baş vermir. Belə bir vəziyyətdə nə ilə nəticələnəcəyini bilmək çətindir. Güc hesab edilə bilər və ya bu böyüklüyün bir nisbət nisbətinin klinik və ya praktik baxımdan əhəmiyyətli olub olmadığına qərar verilə bilər.

Oran nisbətlərinin təfsiri haqqında daha çox məlumat üçün, logistika reqressiyasında nisbət nisbətlərini necə şərh edim? .