FAQ Bəzi dəyişənlər log çevrildikdə bir reqressiya modelini necə şərh edə bilərəm?

Göndərildi: 08.09.2021
Məqalənin müəllifi Adəm Quliyev

Bu səhifədə, modeldəki bəzi dəyişənlər log çevrildikdə bir reqressiya modelinin necə şərh ediləcəyini müzakirə edəcəyik. Nümunə məlumatları buradan yükləyə bilərsiniz (fayl .csv formatındadır). Məlumat toplusundakı dəyişənlər yazı, oxumaq və riyazi ballardır (\ (\ textbf \), \ (\ textbf \) və \ (\ textbf \)), qeyd yazıya çevrildi ( lgwrite) və çevrilmiş riyaziyyat ballarını ( lgmath) və \ (\ textbf \). Bu nümunələr üçün təbii log (ln) götürdük. Bütün nümunələr Stata -da aparılır, lakin istənilən statistik paketdə asanlıqla yaradıla bilər. Aşağıdakı nümunələrdə \ (\ textbf \) və ya onun log çevrilmiş versiyası nəticə dəyişən kimi istifadə olunacaq. Nümunələr illüstrasiya məqsədləri üçün istifadə olunur və əsaslı məna daşımaq üçün nəzərdə tutulmur. Burada \ (\ textbf \).

Nəticə dəyişənliyi log çevrilir

Çox vaxt, log çevrilmiş nəticə dəyişənləri və proqnozlaşdırıcı dəyişənlər qrupu arasında xətti bir əlaqə fərz edilir. Riyazi olaraq yazılan əlaqə tənliyi izləyir

\ başlayın \ log (y_i) = \ beta_0 + \ beta_1 x_ + \ cdots + \ beta_k x_ + e_i, \ son

burada \ (y \) nəticə dəyişənidir və \ (x_1, \ cdots, x_k \) proqnozlaşdırıcı dəyişənlərdir. Başqa sözlə, \ (\ log (y) - \ mathbf olduğunu qəbul edirik ^T \ boldsymbol \ beta \) normal olaraq paylanır, (və ya \ (y \) bütün kovaryatlar üçün log-normal şərtlidir). Bu sıradan bir ən kiçik kvadratlar reqressiyası olduğu üçün \ (y \) jurnalında \ (x_1 \) \ (x_1 \) modelinə yalnız əsas təsir olaraq daxil olduğunu düşünərək bütün digər dəyişənləri hər hansı bir sabit dəyərdə saxlamaq. Bəs \ (x \ \ \) bir vahid artım üçün \ (y \) nəticə dəyişəninin başına nələr gəldiyini bilmək istəyirik? Bunun təbii yolu, eksponentləşdirilmiş loqorifm funksiyasının tərsi olduğu üçün eksponentləşdirilmiş reqressiya əmsallarını \ (\ exp (\ beta) \) şərh etməkdir.

Yalnız tutma modelindən başlayaq.

Deyə bilərik ki, \ (3.95 \), \ (\ textbf \). Buna görə eksponentləşdirilmiş dəyər \ (\ exp (3.948347) = 51.85 \) dir. Bu \ (\ textbf \). Burada vurğu, arifmetik ortalamanın yerinə həndəsi ortadır. Orijinal dəyişənin OLS reqressiyası \ (y \), gözlənilən arifmetik ortalamanı təxmin etmək üçün istifadə olunur və log çevrilmiş nəticə dəyişəninin OLS reqressiyası, orijinal dəyişənin gözlənilən həndəsi ortalamasını təxmin etməkdir.

İndi tək bir ikili proqnozlaşdırıcı dəyişən olan bir modelə keçək.

\ (\ başlayın \ log (\ textbf ) & = \ beta_0 + \ beta_1 \ dəfə \ textbf \\ & = 3.89 + .10 \ dəfə \ textbf . \ son \)

Bu parametrlərin təfsirinə dalmadan əvvəl, asılı olan dəyişənimizin vasitələrini əldə edək, \ (\ textbf \) cinsinə görə.

İndi parametr hesablamalarını iki qrupun həndəsi vasitələrinə uyğunlaşdıra bilərik. \ (3.89 \) kəsiyi \ (\ textbf həndəsi ortalamasının qeydidir \) zaman \ (\ textbf = 0 \), yəni kişilər üçün. Buna görə də, eksponentləşdirilmiş dəyəri kişi qrupu üçün həndəsi ortadır: \ (\ exp (3.892) = 49.01 \). \ (\ Textbf üçün əmsal haqqında nə deyə bilərik? \)? Günlük miqyasında, \ (\ textbf logının gözlənilən həndəsi vasitələrindəki fərqdir \) qız tələbə ilə kişi tələbə arasında. \ (\ Textbf dəyişəninin orijinal miqyasında \), \ (\ textbf həndəsi ortalamasının nisbətidir \) qız şagirdlər üçün \ (\ textbf \) kişi tələbələr üçün \ (\ exp (.1032614) = 54.34383 / 49.01222 = 1.11 \). Yüzdə dəyişmə baxımından deyə bilərik ki, kişi tələbələrdən qız tələbələrə keçərkən, yazma puanlarının həndəsi ortalamasında \ (11 \%\) artım görəcəyimizi gözləyirik.

Sonda birdən çox proqnozlaşdırıcı dəyişənə malik bir modelə baxaq.

\ (\ başlayın \ log (\ textbf ) & = \ beta_0 + \ beta_1 \ dəfə \ textbf + \ beta_2 \ dəfə \ textbf + \ beta_3 \ dəfə \ textbf \\ & = 3.135 + .115 \ dəfə \ textbf + .0066 \ dəfə \ textbf + .0077 \ dəfə \ textbf . \ son \)

\ (\ Textbf üçün eksponentləşdirilmiş əmsal \ (\ exp (\ beta_1) \) \), qadın tələbə qrupu üçün gözlənilən həndəsi ortalamanın kişi tələbə qrupu üçün gözlənilən həndəsi ortalamaya nisbətidir, \ (\ textbf \) və \ (\ textbf \) müəyyən sabit dəyərdə saxlanılır. Əlbəttə ki, kişi və qadın tələbə qrupu üçün gözlənilən həndəsi vasitələr fərqli dəyərlər üçün \ (\ textbf \) və \ (\ textbf \). Lakin onların nisbəti sabitdir: \ (\ exp (\ beta_1) \). Misalımızda \ (\ exp (\ beta_1) = \ exp (.114718) \ təxminən 1.12 \). Yazı ballarının kişi tələbələrə nisbətən qız tələbələr üçün \ (12 \%\) daha yüksək olacağını söyləyə bilərik. \ (\ Textbf dəyişən üçün \), bir vahid artım üçün \ (\ textbf \), \ (\ exp (.0066305) = 1.006653 \ təxminən 1.007 \) olduğundan, yazma balında təxminən \ (0.7 \%\) artım görəcəyimizi gözləyirik. On vahid artım üçün \ (\ textbf \), \ (\ exp (.0066305 \ dəfə 10) = 1.0685526 \ təxminən 1.069 \) olduğundan, yazma balında təxminən \ (6.9 \%\) artım görəcəyimizi gözləyirik.

Proqnozlaşdırıcı dəyişənlər mərkəzləşdirilmədikdə və davamlı olduqda kəsmə daha az maraqlı olur. Bu xüsusi modeldə, kəsmə \ (\ log (\ textbf) üçün gözlənilən ortalamadır ) \) kişi üçün (\ (\ textbf = 0 \)) zaman \ (\ textbf \) və \ (\ textbf \) sıfıra bərabərdir.

Xülasə olaraq, nəticə dəyişənliyi log çevrildikdə, eksponentləşdirilmiş reqressiya əmsallarını şərh etmək təbiidir. Bu dəyərlər, orijinal nəticə dəyişəninin gözlənilən həndəsi vasitələrinin nisbətindəki dəyişikliklərə uyğundur.

Bəzi (hamısı deyil) proqnozlaşdırıcı dəyişənlər log çevrilir

Bəzən, log dəyişdirilən bəzi proqnozlaşdırıcı dəyişənlərimiz də var. Bu bölmədə, bəzi proqnozlaşdırıcı dəyişənlərin log çevrildiyi, lakin nəticə dəyişəninin orijinal miqyasında olduğu bir nümunəyə nəzər salacağıq.

Tənlikdə yazılmış, bizdə var

\ (\ başlayın \ textbf & = \ beta_0 + \ beta_1 \ dəfə \ textbf + \ beta_2 \ dəfə \ log (\ textbf ) + \ beta_3 \ times \ log (\ textbf ) \\ & = -99.164 + 5.389 \ times \ textbf + 20.941 \ dəfə \ log (\ textbf ) + 16.852 \ dəfə \ log (\ textbf ). \ son \)

Bu bir OLS reqressiyası olduğundan, çevrilməyən dəyişənlər üçün reqressiya əmsallarının təfsiri heç bir dəyişdirilməmiş OLS reqressiyasından dəyişməzdir. Məsələn, qız və oğlan şagirdləri arasında yazma ballarında gözlənilən orta fərq, təxminən digər proqnozlaşdırıcı dəyişənləri sabit saxlayaraq \ (5.4 \) baldır. Digər tərəfdən, log çevrilməsi səbəbindən \ (\ textbf \) və \ (\ textbf \ (\ log (\ textbf) təsirinə baxmayaraq \) artıq xətti deyil ) \) və \ (\ log (\ textbf ) \) xətti olur. Aşağıdakı süjet, riyaziyyat balı sabit olan qız tələbələr qrupu üçün oxu ballarına qarşı proqnozlaşdırılan dəyərlərin əyrisini göstərir.

Oxu balı qeydinin dəyişənləri üçün \ (16.852 \) əmsalını necə şərh edirik? Oxu balının iki dəyərini götürək, \ (r_1 \) və \ (r_2 \). \ (R_1 \) və \ (r_2 \) dəki yazma ballarında gözlənilən ortalama fərq, digər proqnozlaşdırıcı dəyişənləri sabit saxlayaraq \ (\ textbf (r_2) - \ textbf (r_1) = \ beta_3 \ times [\ log (r_2) - \ log (r_1)] = \ beta_3 \ times [\ log (r_2 / r_1)] \). Bu o deməkdir ki, \ (\ textbf \) (proqnozlaşdırıcı dəyişən) sabitdirsə, əsas oxu balının harada olmasından asılı olmayaraq yazı skorunda eyni fərqi görəcəyik. Məsələn, deyə bilərik ki, oxu balında \ (10 ​​\%\) artım üçün gözlənilən orta yazma balları arasındakı fərq həmişə \ (\ beta_3 \ times \ log (1.10) = 16.85218 \ times \ log ( 1.1) \ təxminən 1.61 \).

\ (X_0 = 0 \) ətrafında \ (f (x) = \ log (1 + x) \) funksiyasının Taylor genişləndirilməsini xatırlayaraq \ (\ log (1 + x) = x + \ mathcal (x^2) \). Buna görə, proqnozlaşdırıcı dəyişənində kiçik bir dəyişiklik üçün, asılı dəyişənin gözlənilən ortalamasının fərqini əmsalını dəyişən dəyişikliyə vuraraq yaxınlaşdıra bilərik. Misalımızda deyə bilərik ki, oxu balında \ (1 \%\) artım üçün gözlənilən orta yazma balları arasındakı fərq təxminən \ (\ beta_3 \ dəfə 0.01 = 16.85218 \ dəfə 0.01 = .1685218 \) olacaq. Günlükdən istifadə etsək, dəqiq dəyər \ (\ beta_3 \ times \ log (1.01) = 16.85218 \ times \ log (1.01) = .1676848 \) olacaq.

Həm nəticə dəyişənləri, həm də bəzi proqnozlaşdırıcı dəyişənlər log çevrilir

Həm nəticə dəyişənləri, həm də proqnozlaşdırıcı dəyişənlər log çevrildikdə nə baş verir? Daha əvvəl təsvir olunan iki vəziyyəti bir vəziyyətə birləşdirə bilərik. Budur belə bir modelin nümunəsi.

Bir tənlik olaraq yazılaraq modeli təsvir edə bilərik:

\ (\ başlayın \ log (\ textbf ) & = \ beta_0 + \ beta_1 \ dəfə \ textbf + \ beta_2 \ dəfə \ log (\ textbf ) + \ beta_3 \ dəfə \ textbf \\ & = 1.928101 + .1142399 \ times \ textbf + .4085369 \ times \ log (\ textbf ) + .0066086 \ dəfə \ textbf . \ son \)

\ (\ Textbf kimi çevrilməyən dəyişənlər üçün \), onun eksponentləşdirilmiş əmsalı qadın üçün həndəsi ortalamanın kişi tələbə qrupu üçün həndəsi ortalamaya nisbətidir. Məsələn, nümunəmizdə deyə bilərik ki, kişi tələbə qrupundan qız tələbə qrupuna qədər həndəsi ortalamada gözlənilən artım \ (\ \ \ \ \ \ \) olduğu üçün \ (\ exp (.1142399) \ təxminən 1.12 \). Oxu balı üçün deyə bilərik ki, oxu balının bir vahid artması üçün \ (\ exp (.0066086) = olduğundan, yazma həndəsi ortalamasının \ (0.7 \%\) artımını görəcəyimizi gözlədiyimizi söyləyə bilərik. 1.007 \).

İndi \ (\ textbf \). \ (\ Textbf \), \ (m_1 \) və \ (m_2 \) və digər proqnozlaşdırıcı dəyişənləri hər hansı bir sabit dəyərdə saxlayın. Yuxarıdakı tənlik gəlir

Sadələşdirilə bilər \ (\ log [\ textbf (m_2)/\ textbf (m_1)) = \ beta_2 \ times [\ log (m_2/m_1)] \), aparan

Bu bizə iki riyazi balın nisbəti \ (m_2/m_1 \) eyni qaldığı müddətcə nəticə dəyişəninin gözlənilən nisbətinin \ (\ textbf \) eyni qalır. Məsələn, hər hansı bir \ (10 ​​\%\) artımında \ (\ textbf \) skoru, yazılan balın gözlənilən nisbəti \ ((1.10) ^ = (1.10) ^ .4085369 = 1.0397057 \) olacaq. Başqa sözlə, riyaziyyat balı \ (10 ​​\%\) artdıqda yazma balında təxminən \ (4 \%\) artım olacağını gözləyirik.

Burada da bir yaxınlaşdırma metodundan istifadə edə bilərik. \ ((1 + x) ^ a \ təxminən 1 + ax \) kiçik bir \ (| a | x \) dəyəri üçün, buna görə də proqnozlaşdırıcı dəyişkəndəki kiçik bir dəyişiklik üçün, katsayını proqnozlaşdırıcı dəyişkənliyin dəyişmə nisbətinə vuraraq asılı dəyişən. Məsələn, hər hansı bir \ (1 \%\) artımında \ (\ textbf \) skoru, yazma balının gözlənilən nisbəti təxminən \ (1 + .01 \ dəfə = 1 + .01 \ dəfə .4085369 = 1.004085 \) təşkil edir. Dəqiq dəyər \ ((1.01) ^ = (1.01) ^ .4085369 = 1.004073 \) olacaq.