Maşın Öyrənmə üçün Logistik Reqressiya

Göndərildi: 08.09.2021
Məqalənin müəllifi Adəm Quliyev

Logistika reqressiyası, statistika sahəsindən maşın öyrənmənin başqa bir üsuludur.

İkili təsnifat problemləri (iki sinif dəyəri olan problemlər) üçün gediş-gəliş metodudur. Bu yazıda maşın öyrənmə üçün logistik reqressiya alqoritmini kəşf edəcəksiniz.

Bu yazını oxuduqdan sonra biləcəksiniz:

  • Logistik reqressiyanı təsvir edərkən istifadə olunan bir çox ad və termin (log odds və logit kimi).
  • Logistika reqressiya modeli üçün istifadə olunan təqdimat.
  • Verilənlərdən logistik reqressiya modelinin əmsallarını öyrənmək üçün istifadə olunan üsullar.
  • Öyrənilmiş bir logistik reqressiya modelindən istifadə edərək proqnozları əslində necə etmək olar.
  • Biraz daha dərindən öyrənmək istəyirsinizsə daha çox məlumat üçün hara gedin.

Bu yazı tətbiqli maşın öyrənmə, xüsusən proqnozlaşdırıcı modelləşdirmə ilə maraqlanan inkişaf etdiricilər üçün yazılmışdır. Xətti cəbr və ya statistikaya malik olmaq lazım deyil.

Addım-addım təlimatlar və bütün nümunələr üçün Excel elektron tablo sənədləri daxil olmaqla yeni kitabım Master Machine Learning Alqoritmləri ilə layihənizə başlayın.

Gəlin başlayaq.

Logistik Reqressiya üçün Alqoritm Öyrənmə

Şəkili Michael Vadon, bəzi hüquqlar qorunur.

Logistika funksiyası

Logistik reqressiya, metodun özəyində istifadə olunan funksiya, logistika funksiyası üçün adlandırılmışdır.

Siqmoid funksiyası olaraq da adlandırılan logistik funksiya, statistiklər tərəfindən ekologiyada əhalinin artım xüsusiyyətlərini təsvir etmək, sürətlə yüksəlmək və ətraf mühitin daşıma qabiliyyətini artırmaq üçün hazırlanmışdır. Hər hansı bir real dəyərli nömrəni götürə bilən və 0 ilə 1 arasındakı bir dəyərə uyğunlaşdıra bilən S şəkilli bir əyridir.

Burada e təbii loqarifmaların əsasını təşkil edir (cədvəlinizdəki Euler nömrəsi və ya EXP () funksiyası) və dəyər çevirmək istədiyiniz faktiki ədədi dəyərdir. Aşağıda, logistika funksiyasından istifadə edərək 0 və 1 aralığına çevrilən -5 ilə 5 arasındakı ədədlərin bir süjetidir.

Logistik funksiyanın nə olduğunu bildikdən sonra, loqistik reqressiyada necə istifadə edildiyini görək.

Logistika Reqressiyası Üçün İstifadə Edilən Təmsil

Logistik reqressiya, xətti reqressiya kimi bir tənlikdən istifadə edir.

Çıxış dəyərini (y) proqnozlaşdırmaq üçün (x) giriş dəyərləri çəkilərdən və ya əmsal dəyərlərindən (Yunan baş hərfi Beta adlanır) istifadə edərək xətti olaraq birləşdirilir. Xətti reqressiyadan əsas fərq, modelləşdirilən çıxış dəyərinin ədədi deyil, ikili dəyərlər (0 və ya 1) olmasıdır.

Aşağıda loqistik reqressiya tənliyinin nümunəsi verilmişdir:

y = e^(b0 + b1*x) / (1 + e^(b0 + b1*x))

Y -nin proqnozlaşdırılan çıxışı olduğu halda, b0 önyargı və ya kəsmə terminidir və b1 tək giriş dəyəri (x) üçün əmsaldır. Giriş məlumatlarınızdakı hər bir sütun, təlim məlumatlarınızdan öyrənilməli olan əlaqəli b əmsalına (sabit real dəyər) malikdir.

Yaddaşda və ya bir faylda saxlayacağınız modelin əsl nümayəndəsi tənlikdəki əmsallardır (beta dəyəri və ya b).

PULSUZ Alqoritmlərin Ağıl Xəritəsini əldə edin

Lazımlı maşın öyrənmə alqoritmlərinin ağıl xəritəsinin nümunəsi.

Növlərə görə 60 -dan çox alqoritmdən ibarət lazımlı bir ağıl xəritəsi yaratdım.

Yükləyin, çap edin və istifadə edin.

E-poçt mini kursunda maşın öyrənmə alqoritmlərinə xüsusi giriş əldə edin.

Logistik Reqressiya Ehtimalları Proqnozlaşdırır (Texniki Aralıq)

Logistik reqressiya, standart sinif ehtimalını modelləşdirir (məsələn, birinci sinif).

Məsələn, insanların cinsiyyətini boylarından kişilər və ya qadınlar kimi modelləşdiririksə, birinci sinif kişi ola bilər və logistik reqressiya modeli, kişinin boyunu nəzərə alaraq kişinin ehtimalı və ya daha rəsmi olaraq yazıla bilər:

Başqa bir şəkildə yazdıqda, bir girişin (X) standart sinifə (Y = 1) aid olma ehtimalını modelləşdiririk, bunu rəsmi olaraq belə yaza bilərik:

Ehtimalları proqnozlaşdırırıq? Logistik reqressiyanın təsnifat alqoritmi olduğunu düşünürdüm?

Diqqət yetirin ki, ehtimal proqnozu əslində bir ehtimal proqnozu vermək üçün ikili dəyərlərə (0 və ya 1) çevrilməlidir. Daha sonra proqnoz verməkdən bəhs edərkən.

Logistik reqressiya xətti bir üsuldur, lakin proqnozlar logistika funksiyasından istifadə edərək çevrilir. Bunun təsiri ondadır ki, proqnozları, xətti reqressiyadakı kimi girişlərin xətti birləşməsi kimi anlaya bilmərik, məsələn, yuxarıdan davam edərək, modeli belə ifadə etmək olar:

p (X) = e^(b0 + b1*X) / (1 + e^(b0 + b1*X))

Riyaziyyata çox dalmaq istəmirəm, amma yuxarıdakı tənliyi aşağıdakı kimi çevirə bilərik (unutmayın ki, e -ni bir tərəfdən təbii loqarifma (ln) əlavə edərək digər tərəfdən çıxara bilərik):

ln (p (X) / 1 - p (X)) = b0 + b1 * X

Bu, faydalıdır, çünki sağdakı çıxışın hesablanmasının yenidən xətti olduğunu görürük (eynilə xətti reqressiya kimi) və soldakı giriş standart sinif ehtimalının qeydidir.

Soldakı bu nisbət, standart sinifin əmsalları adlanır (odds istifadə etməyimiz tarixi haldır, məsələn, ehtimallardan çox at yarışlarında bahislər istifadə olunur). Oran, hadisənin ehtimalının hadisənin olma ehtimalına bölünməsi nisbəti ilə hesablanır, məsələn, 4 əmsalına malik olan 0.8/(1-0.8). Buna görə də yaza bilərik:

ln (odds) = b0 + b1 * X

Oranlar log çevrildiyindən, bu sol tərəfə log-odds və ya probit deyirik. Çevrilmə üçün digər növ funksiyalardan istifadə etmək mümkündür (bu, əhatə dairəsi xaricindədir, lakin bu səbəbdən xətti reqressiya tənliyini ehtimallarla əlaqələndirən çevrilməni əlaqələndirici funksiya, məsələn, probit əlaqəsi funksiyası kimi istifadə etmək mümkündür.

Eksponenti sağa doğru hərəkət etdirə və belə yaza bilərik:

bahis = e^(b0 + b1 * X)

Bütün bunlar, həqiqətən də modelin hələ də girişlərin xətti bir birləşməsi olduğunu, ancaq bu xətti birləşmənin standart sinifin log-odds ilə əlaqəli olduğunu anlamağa kömək edir.

Logistik Reqressiya Modelinin Öyrənilməsi

Logistik reqressiya alqoritminin əmsalları (Beta dəyərləri b) təlim məlumatlarınız əsasında hesablanmalıdır. Bu, maksimum ehtimal qiymətləndirməsindən istifadə etməklə aparılır.

Maksimum ehtimal qiymətləndirilməsi, məlumatlarınızın paylanması ilə bağlı fərziyyələr irəli sürsə də, müxtəlif maşın öyrənmə alqoritmləri tərəfindən istifadə edilən ümumi bir öyrənmə alqoritmidir (məlumatlarınızı hazırlamaqdan bəhs edərkən bu barədə daha çox).

Ən yaxşı əmsallar, standart sinif üçün 1 -ə (məsələn, kişi) çox yaxın, digər sinif üçün isə 0 -a çox yaxın bir dəyər (məsələn, qadın) proqnozlaşdıracaq bir modellə nəticələnəcəkdir. Logistik reqressiya üçün maksimum ehtimal üçün intuisiya, bir axtarış prosedurunun, modelin məlumatdakılara ehtimal etdiyi ehtimallardakı səhvləri minimuma endirən əmsallar (Beta dəyərləri) üçün dəyərlər axtarmasıdır (məsələn, məlumatlar əsasdırsa 1 ehtimalı). sinif).

Maksimum ehtimal riyaziyyatına girməyəcəyik. Təlim məlumatlarınız üçün əmsalların ən yaxşı dəyərlərini optimallaşdırmaq üçün minimuma endirmə alqoritminin istifadə edildiyini söyləmək kifayətdir. Bu, praktik olaraq səmərəli ədədi optimallaşdırma alqoritmi (Quasi-newton metodu kimi) istifadə etməklə həyata keçirilir.

Logistika öyrənərkən, daha sadə gradient enmə alqoritmindən istifadə edərək sıfırdan özünüz həyata keçirə bilərsiniz.

Maşın Öyrənmə üçün Logistik Reqressiya

Woodleywonderworks Fotoşəkili, bəzi hüquqlar qorunur.

Logistik Reqressiya ilə Proqnozlar Yaratmaq

Logistika reqressiya modeli ilə proqnozlar vermək, məntiqi reqressiya tənliyinə rəqəmləri bağlamaq və nəticəni hesablamaq qədər sadədir.

Bu konkret bir konkret nümunə ilə edək.

Tutaq ki, bir kişinin boyuna (tamamilə uydurma) görə kişi və ya qadın olduğunu təxmin edə biləcək bir modelimiz var. Hündürlüyü 150 sm olan kişi və ya qadındır.

B0 = -100 və b1 = 0.6 əmsallarını öyrəndik. Yuxarıdakı tənliyi istifadə edərək, 150 sm və ya daha çox P (kişi | boyu = 150) hündürlüyü verilən kişinin ehtimalını hesablaya bilərik. E üçün EXP () istifadə edəcəyik, çünki bu nümunəni elektron cədvəlinizə yazsanız istifadə edə bilərsiniz:

y = e^(b0 + b1*X) / (1 + e^(b0 + b1*X))

y = exp (-100 + 0.6*150) / (1 + EXP (-100 + 0.6*X))

Ya da kişinin kişi olması sıfıra yaxın olma ehtimalı.

Praktikada ehtimallardan birbaşa istifadə edə bilərik. Bu təsnifatdır və dəqiq bir cavab istədiyimiz üçün ehtimalları ikili sinif dəyərinə bağlaya bilərik, məsələn:

İndi logistika reqressiyasından istifadə edərək proqnozlar verməyi bildiyimiz üçün, texnikadan ən yaxşı şəkildə istifadə etmək üçün məlumatlarımızı necə hazırlaya biləcəyimizə baxaq.

Logistik Reqressiya üçün Məlumat Hazırlayın

Verilənlərinizdəki paylama və əlaqələr haqqında lojistik reqressiya ilə edilən fərziyyələr, xətti reqressiyada verilən fərziyyələrlə eynidir.

Bu fərziyyələri müəyyənləşdirmək üçün çox iş getdi və dəqiq ehtimal və statistik dildən istifadə edildi. Məsləhətim bunları təlimat və ya qaydalar kimi istifadə etmək və fərqli məlumat hazırlama sxemləri ilə sınaqdan keçirməkdir.

Nəhayət, proqnozlaşdırma modelləşdirmə maşını öyrənmə layihələrində, nəticələri şərh etməkdənsə, dəqiq proqnozlar verməyə lazerlə diqqət yetirirsiniz. Beləliklə, model sağlam olduğu və yaxşı performans göstərdiyi müddətdə bəzi fərziyyələri poza bilərsiniz.

  • İkili Çıxış Dəyişən: Bu, artıq qeyd etdiyimiz kimi açıq ola bilər, ancaq logistik reqressiya ikili (iki sinifli) təsnifat problemləri üçün nəzərdə tutulmuşdur. 0 və ya 1 təsnifatına daxil edilə bilən standart sinfə aid bir nümunənin ehtimalını proqnozlaşdıracaq.
  • Səs-küyü aradan qaldırın: Logistika reqressiyası çıxış dəyişənində (y) heç bir səhv olmadığını güman edir, təlim məlumatlarınızdan kənar və bəlkə də səhv təsnif edilmiş nümunələri çıxarmağı düşünün.
  • Gauss Dağılımı: Logistik reqressiya xətti bir alqoritmdir (çıxışda xətti olmayan çevrilmə ilə). Giriş dəyişənləri ilə çıxışı arasında xətti bir əlaqə olduğunu düşünür. Bu xətti əlaqəni daha yaxşı ifşa edən giriş dəyişənlərinizin məlumat çevrilməsi daha dəqiq bir modellə nəticələnə bilər. Məsələn, bu əlaqəni daha yaxşı ifşa etmək üçün log, root, Box-Cox və digər dəyişməz dəyişikliklərdən istifadə edə bilərsiniz.
  • Əlaqəli girişləri silin: Xətti reqressiya kimi, birdən çox yüksək əlaqəli girişiniz varsa, model həddindən artıq uyğunlaşa bilər. Bütün girişlər arasındakı cütlük korrelyasiyasını hesablamağı və yüksək əlaqəli girişləri çıxarmağı düşünün.
  • Bir arayagələ bilmir: Katsayıları öyrənən gözlənilən ehtimal qiymətləndirmə prosesinin bir araya gəlməməsi mümkündür. Bu, məlumatlarınızda çox yüksək əlaqəli girişlər varsa və ya məlumatlar çox az olduqda (məsələn, giriş məlumatlarınızda çoxlu sıfır) baş verə bilər.

Əlavə Oxu

Logistika reqressiyası ilə bağlı çoxlu materiallar mövcuddur. Həyat elmləri və iqtisadiyyat kimi may fənlərində favoritdir.

Logistik Reqressiya mənbələri

Logistik reqressiya alqoritmi haqqında daha ətraflı məlumat üçün aşağıdakı kitablardan bir neçəsini yoxlayın.

Maşın Öyrənməsində Logistik Reqressiya

Bir maşın öyrənmə fokusu üçün (məsələn, yalnız dəqiq proqnozlar vermək üçün), aşağıdakı məşhur maşın öyrənmə mətnlərində logistik reqressiyanın əhatə dairəsinə nəzər salın:

    , səhifələr 725-727, səhifələr 178-182, səhifələr 130-137, səhifələr 119-128, səhifələr 282-287

Birini seçsəm, Statistik Öyrənməyə Giriş bölümünü qeyd edərdim. Hər yerdə əla bir kitabdır.

Xülasə

Bu yazıda maşın öyrənmə və proqnozlaşdırıcı modelləşdirmə üçün logistik reqressiya alqoritmini kəşf etdiniz. Çox yer tutdunuz və öyrəndiniz:

  • Logistika funksiyası nədir və logistik reqressiyada necə istifadə olunur.
  • Logistika reqressiyasındakı əsas göstərici xətti reqressiya kimi əmsallardır.
  • Logistika reqressiyasındakı əmsalların maksimum ehtimal qiymətləndirilməsi adlanan bir prosesdən istifadə edərək qiymətləndirildiyini.
  • Logistika reqressiyasından istifadə edərək proqnoz vermək o qədər asandır ki, bunu Excel -də edə bilərsiniz.
  • Logistik reqressiya üçün məlumatların hazırlanması xətti reqressiyaya bənzəyir.

Logistika geriləməsi və ya bu yazı ilə bağlı suallarınız varmı?

Şərh yazın və soruşun, cavablandırmaq üçün əlimdən gələni edəcəyəm.

Maşın öyrənmə alqoritmlərinin necə işlədiyini kəşf edin!

Alqoritmlərin dəqiqələrdə necə işlədiyinə baxın

. yalnız arifmetik və sadə nümunələrlə

Bu , 10 ən yaxşı alqoritmlərinizahlarınınümunələriniəhatə edir : Xətti Regresiya , k-Ən Yaxın Qonşular , Dəstək Vektor Maşınları və daha çox.

Nəhayət,

Maşın Öyrənmə Alqoritmləri üzrə Pərdəni Geri çəkin

Akademikləri atlayın. Yalnız Nəticələr.

Jason Brownlee haqqında

Maşın Öyrənməsi üçün Logistik Reqressiyaya 117 Cavab

Logistik reqressiyada çəkiləri necə təyin etmək olar?

Ahmafı öyrənirlər.

Təlim məlumatlarından b0 və b1 dəyərlərini necə öyrənəcəyinizi, Logistik reqressiyanı izah edə bilərsinizmi?

Ümid edirəm bu kömək edir.

e^(b0 + b1*X) / (1 + e^(b0 + b1*X)) logistika funksiyası necədir

Hipotez g = 1/1+e^-x olduğu g (transpoze (teta) x) logistik reqressiyasında deyil

Bəli, tənliyi yenidən yaza bilərsiniz:

Salam Jason, belə bir məlumatlandırıcı yazı üçün təşəkkürlər.

Bir müddətdir mübarizə apardığım bir sualım var. Zəhmət olmasa mənə kömək edə bilərsiniz.

Tutaq ki, müştəri itkisini proqnozlaşdırmaq istəyirəm. İndi müştəri itkisi bir il ərzində istənilən vaxt baş verə bilər. Problemi həll etməyi düşünə biləcəyim 2 yol var.

1. İstinad məlumatlarını düzəldin məsələn 1 Noyabr 16. Növbəti 3 ayda (noyabr/dekabr/yanvar) dəyişən müştərilər nəzərə alınmaqla hesablanan asılı dəyişən (müşahidə dövründə). Müstəqil dəyişənlərin müddəti 15-15 oktyabr (1 il) arasında müəyyən edilə bilər və son 6 ayda belə bir əməliyyat yaradıla bilər. (Düşünürəm ki, bu daha yaxşı bir yanaşmadır. Modeli vurmaq və kampaniyalar qurmaq istəsəm daha da mənalı olar)

2. 2016-cı ili nəzərdən keçirin. İyulun 16-da (müşahidə dövrü) imtina edən müştərilər üçün, yanvar-İyun ayları arasında 16-nı müstəqil dəyişənlər yaratmaq üçün, Avqustun 16-da təhvil verilən müştərilər üçün isə müstəqil dəyişənlərin yaradılması üçün Fevral-İyul ayı arasında hesab etmək lazımdır. Müştərinin keçən ay geri döndüyünü və ya etmədiyini göstərən bir göstərici ilə (işin avtomatik geriləməsi). Bu məlumatları ardıcıl olaraq əlavə edin, təlim üçün təsadüfi bir nümunə götürün və sınaq üçün istirahət edin. (burada asılı dəyişənlərin mövsümi olacağını düşünürəm, çünki yaradılan dəyişən fərqli ayları hesab edərdi)

Zəhmət olmasa bunların hansının doğru olduğunu mənə bildirə bilərsinizmi (və ya kimsə haqlıdırsa). Bunu anlaya bilmədiyim üçün bu faydalı olacaq.

Proqnozlaşdırıcı bir modelləşdirmə problemi qurmağın bir çox yolu var.

Probleminizi düşünə biləcəyiniz bir çox yolla qurmağı, hər bir model üçün məşq etməyi və qiymətləndirməyi, sonra ən perspektivli olanı iki qat artırmağı təklif edərdim.

Bir şeyi maraqlanıram. Bir çox veb saytında məlumat hazırlamaq fikrini görürəm, amma çoxlu mənbələr məlumatların necə təmizlənəcəyini izah etmir, bilirəm ki, bu sizin üçün çox sadə görünə bilər, amma burada oxumaq üçün bakalavr və ya CSE olmayan insanlar var. bu mövzuda bizə istiqamət verə bilərsinizmi?

Məlumatların təmizlənməsi problemə çox xas olduğu üçün öyrətmək çətin bir mövzudur.

Salam jason ser… isti havanın insan sağlamlığına təsiri üzərində işləyirəm .. kimi (dəri xəstəlikləri) .. iki məlumat dəstim var yəni hava və dəri xəstəlikləri haqqında xəstə məlumatları ,, reqressiv araşdırmadan sonra məlumat dəstlərimin kiçik olduğunu gördüm Mən Logistik reqressiya alqoritmi ilə işləməyi planlaşdırıram..bu problemi həll etməkdə sizə kömək edə bilərəm.

Bu proses, proqnozlaşdırıcı modelləşdirmə probleminizi sistemli şəkildə həll etməyə kömək edəcək:

http://machinelearningmastery.com/start-here/#process

Salam! ML -də oxuyarkən, yalnız normal bir logistik reqressiya modeli ilə iki gizli təbəqəsi olan dərin öyrənmə logistik reqressiya modeli arasındakı fərqləri necə ifadə edə biləcəyimi düşünürdüm. X üçün beş dəyişən deyək.

Həqiqətən də çox fərqlidirlər. "Fərqi bildir" dedikdə nəyi nəzərdə tutursunuz? Alma və portağal?

Sürətli cavab üçün təşəkkür edirik. Əslində hər birinin formulu ilə maraqlanırdım. Bilirəm ki, normal logistika geriləməsi gedir, "ln (Y) = a + b1X1 +… + bnXn". Ancaq iki gizli təbəqə (hər biri 10 qovşaq) olan dərin öyrənmə logistik reqressiya modelinin düsturunu maraqlandırırdım. Formulanın qısa bir versiyası olaraq bunu necə ifadə edə biləcəyimi bilmək istəyirəm.

Salam Dan, iyerarxik modelləri təsvir edərkən sinir şəbəkəsi terminologiyasına/topologiyasına keçməyi tövsiyə edərdim. Artıq sadə bir xətti sual deyil.

Şərhiniz üçün bir daha təşəkkürlər. İki gizli təbəqə (hər biri 10 qovşaq) və beş X dəyişən və Y (hədəf dəyər ikili) olan bir dərin öyrənmə modeli üçün bir düstur necə? Daha əvvəl qeyd etdiyim iki model arasındakı fərqi bilirəm. Dərin öyrənmə modelini riyazi bir şəkildə ifadə etmək istəyirəm.

Adətən tənliklər bütün şəbəkə üçün deyil, tək bir qovşaq üçün irəli və ya geri keçid üçün təsvir olunur.

Sürətli cavab üçün təşəkkür edirik. Əslində hər birinin formulu ilə maraqlanırdım. Bilirəm ki, normal logistika geriləməsi gedir, "ln (Y) = a + b1X1 +… + bnXn". Ancaq iki gizli təbəqə (hər biri 10 qovşaq) olan dərin öyrənmə logistik reqressiya modelinin düsturunu maraqlandırırdım. Formulanın qısa bir versiyası olaraq bunu necə ifadə edə biləcəyimi bilmək istəyirəm.

Salam. Zəhmət olmasa məlumatların yayılması əyri olarsa, necə davam edə biləcəyimizi bildirin.

Bir qutu-cox çevrilməsi kimi bir güc çevrilməsini düşünün.

Salam bəy, zəhmət olmasa p = exp (b0+b1*x)/(exp (b0+b1*x) +1) ehtimalının səbəbini izah edə bilərsinizmi?

Bu mövzuda "Statistik öyrənməyə giriş" və ya "Statistik öyrənmə elementləri" kimi bir dərslik oxumağı məsləhət görürəm.

Salam cənab Brownlee,

bu çox məlumatlı bir məlumat üçün çox sağ olun ..

Hal -hazırda obyekt aşkarlama alqoritmində bir kağız üzərində işləyirəm ... maraqlanıram, sənədimdə logistika reqressiyasından necə istifadə edə bilərəm?

Paylaşdığınız üçün təşəkkürlər. Kömək etdi?

İkili təsnifat problemində, proqramı yalnız 1 -ə həll etmək üçün optimallaşdırmağın yaxşı bir yolu varmı (1 və 0 -u ən yaxşı proqnozlaşdırmaq üçün optimallaşdırmaqdan fərqli olaraq) - etmək istədiyim şey 1 -in mümkün olduğu qədər dəqiqliklə proqnozlaşdırılmasıdır. belə olsun. (0 -a heç əhəmiyyət vermirəm və 1 -i qaçırsam, bu yaxşıdır, amma 1 -i proqnozlaşdıranda həqiqətən inamlı olmasını istəyirəm - buna görə də həll etmək üçün yaxşı bir yolun olub olmadığını görməyə çalışıram 1 (1 və 0 -dan fərqli olaraq)? Təşəkkürlər.

Bəli, ədəbiyyatda buna anomaliyanın aşkarlanması deyirik.

Bu yazı ən yaxşısıdır! Hələ aydındır!

Təşəkkürlər, kömək etdiyinə görə şadam.

Möhtəşəm yazı. Bir kitab oxumağa çalışıram və LR -dən istifadə edərək bir layihə etməyimə baxmayaraq yenə də fikirlərim qarışdı. Bunu əhatə etdiyiniz sadəlik üçün təşəkkür edirik.

Kömək etdiyinə sevindim.

Gözəl yazı .. başa düşmək asandır..Təşəkkürlər!

Yazınıza görə təşəkkür edirəm. ÇOX YARDIM.

Xoş gəldiniz, bunu eşitməkdən məmnunam.

Məqalə və ümumiyyətlə blog üçün çox sağ olun. Maşın öyrənməyə girərkən hamısı çox faydalı oldu.

Sualım mövzu ilə bağlıdır, amma bir az fərqli istiqamətdə…

Təlim edilmiş və sınanmış logistika reqressiyam var. Bir proqnozçu olaraq güvənirəm, amma indi tətbiq etməli olduğum bir çox insan var. Tutaq ki, bu on nəfərdən ibarət bir qrupdur və onların hər biri üçün bir saqqız paketi alacaqlarını ehtimal edən bir logistika reqressiyası tətbiq etdim. İndi on ehtimal çıxışım var [0.83, 0.71, 0.63, 0.23, 0.25, 0.41, 0.53, 0.95, 0.12, 0.66]. (Bu andan etibarən, hər ardıcıl cümlə haqqında bir az daha az əminəm). Onları ümumiləşdirə bilərəm və ən çox ehtimal etdiyim nəticənin 5.32 paket saqqız satmağım olduğunu görə bilərəm. Ancaq 6 paket saqqız və ya 5, ya da 4 və ya 9 satmağımın ehtimalının nə olduğunu bilmək istərdim ki, satmağı gözlədiyim saqqız paketlərinin sayına görə bir növ ehtimal paylaması qurmaq istərdim. bu bütün insanlar qrupu. Bir səhv ölçməm var,standart bir sapma hesablaya bilərəm və fərqli nəticələrin olma ehtimalını göstərmək üçün mərkəzində 5.32 olan bir növ normal paylama qura bilərəm, elə deyilmi?

Düşünürəm ki, bunların hamısı məntiqlidir, amma sonra bir az daha mürəkkəbləşir. Fərqli xüsusiyyətlərə və fərqli bir təsnifatçımız olan başqa insanlar var. Eyni nəticəni sınayıram (bir saqqız paketi alacaqlar), amma bunlar bəlkə də artıq mağazamdakı piştaxtada olan insanlardır. Onlardan beşi var və ehtimalları [0.93, 0.85, 0.75, 0.65, 0.97]. Beləliklə, ən çox ehtimal olunan nəticəni bu beşlik qrupuna 4.15 paket saqqız satmağımdır. Əla, amma indi iki fərqli qrup və iki fərqli səhv ölçüsü olan iki fərqli təsnifatçım var. Ən çox ehtimal olunan nəticənin cəmi 9.47 paket saqqız satmağım olduğunu düşünürəm (birinci qrupdan 5.32, ikinci qrupdan 4.15).Ancaq iki qrup arasında cəmi 10 paket satma ehtimalımı necə müəyyənləşdirə bilərəm? 12? 5? İki fərqli insan qrupu üzərində işləyən iki fərqli təsnifatçım olanda normal bir paylama necə əldə edə bilərəm?