Logistik reqressiya

Göndərildi: 08.09.2021
Məqalənin müəllifi Adəm Quliyev

Reqressiya təhlili, bir sözlə, bir nöqtəni bir qrupa uyğunlaşdırmaqdır. Tələb olunan bir fərziyyə, asılı dəyişənin bir çox fərqli dəyərə sahib olan və dəyərlər arasında bərabər məsafədə olan bir miqyas olmasıdır.

Ancaq asılı dəyişən yalnız 0 və ya 1 dəyərini götürə bilərsə nə olur? Məsələn, bir şəxs müəyyən bir partiyaya səs veribsə (1) və ya (0). Adi bir reqressiya analizindən qəribə nəticələr əldə edə bilərik, məsələn, bir adamın partiyaya 0,75, ya da 1,2, hətta -0,3 səs verdiyini təxmin etmək.

Bununla belə, bu cür dəyişənlər üçün xüsusi bir reqressiya təhlili var: Logistik reqressiya.Yalnız 0 və ya 1 dəyəri olan asılı dəyişənlər üçün hazırlanmışdır. Funksiya hər bir müşahidənin 1 dəyərinə malik olma ehtimalını hesablayır və ehtimal heç vaxt 0 -dan kiçik və ya 1 -dən böyük olmamalıdır. Metod müşahidələri təsnif etmək üçün tez -tez istifadə olunur. ya sıfır, ya da bir.

Analiz, bir optimal həllin olduğu müntəzəm reqressiya təhlili kimi "həll edilə bilməz". Bunun əvəzinə, maksimum ehtimal metodunun köməyi ilə kompüterin tədricən ən yaxşı cavabı əldə etdiyi bir iterativ proses istifadə olunur. Ancaq praktikada, dəyişənlər arasındakı əlaqələr haqqında alınan nəticələr, müntəzəm reqressiya (OLS) və ya logistik reqressiya istifadə etməyimizdən asılı olmayaraq ümumiyyətlə eynidır.

Bu təlimatda, Stata'da bir logistik reqressiya necə aparılacağını, nəticələrin necə şərh ediləcəyini və "nizamlı" OLS reqressiyası ilə müqayisə aparmağı əhatə edəcəyik.

Amerikalı Ümumi Sosial Sorğunun məlumatlarından istifadə edəcəyik, müntəzəm insanlar arasında bir çox mövzu haqqında suallar var. 2018 versiyasını istifadə edəcəyik. Saytdan yükləyin və nümunədə davam etmək üçün yükləyin.

Sual və dəyişənlər¶

Respondentlərin ideologiyasının 2016 -cı il prezident seçkilərində Donald Trampa səs vermə ehtimalı ilə əlaqəli olub olmadığını araşdıracağıq. Səs seçimi haqqında məlumat "pres16" dəyişənində tapılıb. Dəyişəni recode ilə yenidən yazmağa başlayırıq ki, dəyişikliyə yalnız seçkidə həqiqətən səs verən insanlar daxil olsun. Tramp seçiciləri 1, digərləri 0 dəyərini alır. Məlumatı "dum_trump" adlı yeni dəyişənə saxlayırıq. Sonra sekmeli bir tezlik cədvəli hazırlayırıq.

Respondentlərin 40 faizi Trampa səs verdiyini söyləyib. İndi səs seçiminin ideologiyaya necə bağlı olduğunu görəcəyik. İdeologiya dəyişəninə "polviews" deyilir və "son dərəcə liberal" dan "son dərəcə mühafizəkar" a qədər dəyişir.

Nəticələrin təhlili və təfsiri

İndi təhlili aparmaq üçün lazım olan hər şeyə sahibik. Komanda sadədir: logit asılıdır. Bunu aşağıda edirik:

Əvvəlcə modelin ən yaxşı həll yoluna necə yaxınlaşdığı barədə bir hesabat alırıq. Normalda qayğı göstərməyimizə ehtiyac yoxdur, amma çox mürəkkəb bir modelimiz olanda modelin yaxınlaşmaması mümkündür. Sonra modeli sadələşdirmək yaxşı bir fikir ola bilər.

Sonrakı bir OLS reqressiyasından əldə etdiyimizə çox bənzəyən bir cədvəldir. Satırlarda hər birinin əmsalı, standart xətası, z-hesabı (t-dəyəri əvəzinə), əhəmiyyəti (sütunu P>| Z |) və əmsal üçün etibarlılıq intervalları olan müstəqil dəyişənlərimiz var.

Katsayı göstərir ki, "polviews" artdıqca (respondentin daha mühafizəkar olması deməkdir) Trump -a səs vermə ehtimalı artır. Əgər əmsalın mənfi işarəsi olsaydı, münasibətlər əksinə olardı. Katsayının statistik olaraq əhəmiyyətli olduğunu da görə bilərik (çünki p-vale 0.050-dən kiçikdir).

Cədvəlin yuxarısında və sağında "Pseudo R2" statistikası var. OLS reqressiyasında R2 dəyərinə bənzəmək üçün qurulmuşdur və 0 ilə 1 arasında dəyişir. Burada 0.2826 var, bu da Trump -a səs vermə varyasyonunun 28 faizini respondentlərin ideologiyası ilə izah etmək olar.

Günlük əmsalları və əmsallar¶

Amma ehtimal tam olaraq nə qədər artır? Bu əmsallardan bir şey söyləmək çətindir. "Polviews" bir addım artanda sözdə nisbətlərin nə qədər artdığını göstərirlər. Və log-odds nədir? Əvvəlcə ehtimalların nə olduğunu bilmək lazımdır. Oran, respondentin Trump -a səs vermə ehtimalıdır, eyni ehtimal 1 eksi ilə bölünür; yəni bir şeyin olma ehtimalı, baş verməmə ehtimalına bölünür.

Log-odds bu nisbətlərin təbii logarifmasıdır: $ logodds = ln \ left (\ frac

\ sağ) $

Beləliklə, "polviews" bir addım artdıqda, bu ölçü 1.04 artar. Təsirin müsbət və ya mənfi olduğunu görmək asan olduğu istisna olmaqla, çox intuitiv deyil.

İdeologiyanız daha mühafizəkar olsa, əmsalların Trump -a səs verməsinin neçə faiz daha çox ehtimal olmadığını göstərməməsinin səbəbi, əlaqəni normal bir geriləmədə olduğu kimi xətti hala gətirməsidir. Bu, məsələn, Trump -ın səs vermə ehtimalının 100%-dən çox olduğunu proqnozlaşdırmağımıza səbəb ola bilər. O məsələyə sonra qayıdacağıq.

Oran əmsalları¶

Katsayıları göstərməyin başqa bir yolu, əmsal nisbətləridir. Müstəqil dəyişənin artmasının nisbətləri nə qədər artıracağını göstərirlər, ancaq nisbət olaraq. Oran nisbəti 2 -dirsə, bu, müstəqil dəyişənin bir dəfə artması ehtimalı iki qat artıracağı deməkdir. Oran nisbəti 0,5 olarsa, bu, müstəqil dəyişənin bir dəfə artması ilə əmsalların yarıya endiriləcəyi deməkdir. Oran nisbətlərindən istifadə edərkən, pozitiv və mənfi əlaqələr arasındakı fərq, normal əmsallarda olduğu kimi, 0 -da deyil, 1 -də çəkilir.

Seçimi əlavə edərək və ya təhlili yenidən başladaraq nisbət nisbətlərini əldə edirik: