Bəy gəl

Göndərildi: 08.09.2021
Məqalənin müəllifi Adəm Quliyev

Bu yaxınlarda böyük bir məlumat alimi üçün Data Mettle komandasına qoşulması üçün bir müsahibə başa vurduq (Yingdə xoş gəlmisiniz!).

Yüksək məlumat alimlərini işə götürən hər kəs bunun işə götürülməsinin kompleks bir rol olduğunu bilir. Yüksək məlumat alimlərindən ibarət bir qrup üçün belə. Namizədlərin kodlaşdırma və mühəndislik, eləcə də statistika üzrə bacarıqları olmalıdır.

Namizədin riyazi qabiliyyətlərini anlamaq üçün onlara doğum günü problemi sualını verməyi öyrəndik.

Əgər tanış deyilsinizsə: doğum günü problemi və ya ad günü paradoksu, bir otaqdakı hər iki insanın eyni ad gününə sahib olma ehtimalını həll edir. Paradoks, iki nəfərin doğum gününü bir otaqda cəmi 23 nəfərlə bölüşmə ehtimalının yüzdə 50 -ə çatmasından qaynaqlanır. 70 nəfərlə ehtimal 99.9% -ə çatır.

Beləliklə, müsahibə prosesində namizəddən, "Bir otaqda N adamınız varsa, ad günlərini bir -birləri ilə bölüşmək ehtimalı nə qədərdir" deyə soruşaraq bu problemi həll etmələrini xahiş edirik?

Başqa cür ifadə edildikdə, \ (n \) bir otaqdakı insanlar nəzərə alınsa, ikisinin və ya daha çoxunun eyni ad gününə sahib olma ehtimalı \ (P (A_n) \) nədir? Bu problemi çox bəyənirik, çünki statistikada əsaslı bir məlumat əldə etmək üçün 15-20 dəqiqədən çox vaxt keçməməlidir.

Mənim böyük bir qüsurum var və bu, \ (P (A_n) \) birbaşa hesablamaq üçün çox mürəkkəbdir. Bunun əvəzinə problemi həll etməyin hiyləsi tamamlayıcıya baxmaqdır \ (P (A'_n) \): Doğum gününü heç kiminpaylaşmaması ehtimalı nədir ? Bunu hesablamaq olduqca sadədir və \ (P (A_n) \) asanlıqla \ (P (A'_n) \) \ (P (A_n) = 1 - P (A'_n) \) olaraq hesablanır.

Müsahibə götürdüyümüz çox az namizəd bu hiyləni əslində düşündü və bunun əvəzinə onu həll edildiyi kimi həll etməyə çalışdı. Ancaq ilişib qaldıqdan sonra bu ipucunu atırıq və ümumiyyətlə bir irəliləyişə səbəb olur.

Müsahibələrimiz başa çatdıqdan sonra bu problemi daha ətraflı araşdırmaq və ad günü problemini həll etməyə kömək edən əsas riyaziyyatı bölüşmək istədik.

Həllini standart hiylə ilə izah edəcəyik, amma hiyləni nəzərə almadan həll etməyə çalışacağıq ki, bu da özlüyündə çox maraqlı (və mürəkkəb) kombinator problemidir.

Qeyd: bütün günləri eyni dərəcədə ehtimal edirik və heç bir sıçrayış ili yoxdur

Standart Namizəd Həll

Əksər namizədlərin işə başlamaq üçün bir az köməyə ehtiyacı var, buna görə də ümumiyyətlə iki nəfər üçün vəziyyəti nəzərdən keçirməyi təklif edirik, \ (P (A_2) \). Onlara Alice və Bob deyək.

Alice və Bobun eyni doğum gününə sahib olma ehtimalını hesablamaq olduqca sadədir. Sadəcə Alisin doğum gününü verildiyi kimi qəbul edin, sonra Bobun eyni doğum gününə sahib olma ehtimalı \ (1/365 \).

Ancaq sonrakı şeyləri qurmaq üçün bu ehtimalı bir az fərqli şəkildə ifadə edəcəyik. Birincisi, Alisanı Boba məhəl qoymadan, tək -tək nəzərdən keçirsək, onun doğum günü ilin istənilən gününə düşə bilər, buna görə də onun unikal bir ad gününə sahib olma ehtimalı (hələlik Boba məhəl qoymamaq) \ (365/365 \). İndi Bobun doğum günü Alice ilə eyni gündə düşməlidir və bunun ehtimalı \ (1/365 \), bu bizə

\ [

P (A_2) = \ frac \ cdot \ frac < 1>.

\]

İndi 3 nəfərin vəziyyətinə keçək, \ (P (A_3) \). Carol ilə tanış olun.

Bu nöqtədə, bir neçə namizəd "1/365²" sözünü söyür, bu da ümumiyyətlə necə davam edəcəkləri üçün itirdiklərini göstərən bir xəbərdarlıqdır. İşlərin mürəkkəbləşməyə başladığı yer budur. Mümkün olan müxtəlif halları diqqətlə nəzərdən keçirməliyik (şəkillərdə üst üstə yığılmış insanlar eyni doğum gününü paylaşır):

I. Hamısının fərqli ad günləri var,

II. Alice və Bob eyni doğum gününü paylaşır, Carolun fərqli bir doğum günü var,

III. Alice və Carol eyni doğum gününü paylaşır, Bobun fərqli bir doğum günüdür,

IV. Bob və Carol eyni doğum gününü paylaşır, Alicein fərqli bir doğum günü var,

V. Alice, Bob və Carolun hamısı eyni ad gününə malikdir.

Bunlar ayrı -ayrı hadisələr olduğu üçün bunu görə bilərik

II, III və ya IV hadisələrin baş vermə ehtimalının bərabər olduğunu da qeyd edə bilərik, buna görə də bunu daha da sadələşdirə bilərik:

Ancaq bir az tüklənməyə başladığı yerdir və bu yanaşmanı daha çox insan üçün ümumiləşdirmək tez bir zamanda çox çətinləşir (bir az sonra görəcəyimiz kimi). Bunun əvəzinə, bu nöqtədə, bəlkə də daha yaxşı bir yol olduğunu göstəririk ki, bu da adətən namizədin bunu dərk etməsinə səbəb olur

Beləliklə, diqqətimizi \ (P (A'_3) \), yəni Alice, Bob və Carolun fərqli doğum günlərinə yönəldək. \ (P (A_2) \) hesablanarkən olduğu kimi eyni yanaşma ilə bunu edirik

  • Alisin doğum günü ilin istənilən gününə düşə bilər (ehtimal \ (365/365 \)),
  • Bobun doğum günü Alisin doğum günündən başqa bir günə düşməlidir (ehtimal \ (364/365 \)) və
  • Carolun doğum günü Alice və Bobun doğum günündən başqa bir günə düşməlidir (ehtimal \ (363/365 \)).

Bu düşüncə xətti n nəfərə asanlıqla yayılır ki, bu da

və nəhayət cavaba gəlirik:

Çətin yol

Hiylə istifadə etmədən bunu necə hesablaya bilərik ? Bir anda \ (n = 3 \) olduğu vəziyyətə sadiq qalsaq, \ (P (\ textrm) hesablamaq olduqca sadədir ) \) və \ (P (\ textrm ) \), yuxarıdakı kimi eyni arqumentə əməl edərək. II hadisə üçün bizdə var:

  • Alisin doğum günü ilin istənilən gününə düşə bilər (ehtimal \ (365/365 \)),
  • Bobun doğum günü Alisin doğum gününə düşməlidir (ehtimal \ (1/365 \)) və
  • Carolun doğum günü Alice və Bobun birgə doğum günündən başqa bir günə düşməlidir (ehtimal \ (364/365 \)),

belə \ (P (\ textrm ) = 364/365^2 \). \ Üçün (P (\ textrm ) \), hamısının eyni doğum gününə ehtiyacı var və bunun baş vermə şansı

\ (1/365^2 \). Ümumiyyətlə ,

\ [

P (A_3) = 3 \ frac + \ frac .

\]

Qeyd edək ki, \ (P (A_3) + P (A_3 ′) = 1 \) olmalıyıq, bu doğrudur. Maraqlananlar üçün bu aşağıdakı Əlavədə göstərilmişdir.

N adamın ümumi vəziyyətinə müraciət edək. İndi hadisələrin sayı tez bir zamanda çox çətinləşir. Məsələn, 4 nəfər (Dan ilə tanışlıq) vəziyyətində 15 fərqli hal var (yenə üst -üstə yığılmış insanlar eyni doğum gününü paylaşırlar):

5 nəfərdə 52 hadisə var, 6 nəfərdə 203 hadisə var və s. Çox sürətlə artır. 23 nəfərdən çox \ (4 \ cdot 10^ \) hal var!

Qeyd edək ki, 5 fərqli "forma" olduqda 4 nəfər üçün 15 tədbir gəlir:

  • Heç kim doğum gününü başqası ilə paylaşmır (1 hadisə),
  • İki nəfər doğum gününü paylaşır, digər ikisinin də öz doğum günü var (6 hadisə),
  • İki nəfər doğum gününü, digər ikisi də ad gününü paylaşır (3 hadisə),
  • Üç nəfər doğum gününü paylaşır, qalanları isə paylaşmır (4 hadisə),
  • Dörd insanın hamısının eyni ad günü var (1 hadisə).

İki əsas müşahidələr, eyni formalı bütün hadisələrin eyni ehtimala malik olması və bir rəqəmin (n n) hissəsinin riyazi anlayışı ilə ələ keçirilməsidir.

Arakəsmələr və çoxnomial əmsallar

Bir ədədin bölünməsi \ (n \), onu müsbət ədədlərin cəmi olaraq yazmağın bir yoludur:

\ [

n = a_1 + a_2 + \ cdots + a_k.

\]

Məsələn, dörd rəqəminin beş bölməsi var,

\ begin

4 & = 1 + 1 + 1 + 1, \\

4 & = 2 + 1 + 1, \\

4 & = 2 + 2, \\

4 & = 3 + 1, \\

4 & = 4,

\ end

hər biri yuxarıdakı müəyyən bir forma uyğundur (yəni \ (2 + 1 + 1 \), iki nəfərin ad gününü bölüşdüyü, digər ikisinin fərqli ad günlərinin olduğu üçüncü vəziyyətə uyğundur). Bölmələr ümumiyyətlə \ (\ lambda \) yunan hərfi ilə işarələnir, burada \ (\ lambda \ vdash n \) \ (\ lambda \) ədədinin \ (n \) xüsusi bir bölməsi olduğunu bildirir. \ (N (\ lambda) \) forma hadisələrinin sayını \ (\ lambda \), \ (P (\ lambda) \) müəyyən bir forma hadisəsinin ehtimalını ifadə etsək \ (\ lambda \ ) baş verdikdə və \ (\ max (\ lambda) \) bölmədə maksimum müddət olduğu üçün \ (P (A_n) \)

\ [

P (A_n) = \ mathop >_ N (\ lambda) P (\ lambda).

\ qquad \ qquad \ textrm

\]

Diqqət yetirin ki, məbləğ \ (n = 1 + \ cdots + 1 \) istisna olmaqla, bütün bölmələri əhatə edir ki, bu da ayrı -ayrı ad günləri olan hər kəsin unikal hadisəsinə uyğundur.

\ (P (\ lambda) \) işləməklə başlayırıq, çünki idarə etmək daha asandır. Göründüyü kimi, \ (P (\ lambda) \) yalnız bölmənin "uzunluğundan", yəni doğum günlərinin əhatə etdiyi günlərin sayından asılıdır. Bunu ciddi şəkildə sübut etmək əvəzinə bunu nümunə ilə göstərəcəyik. İki günü əhatə edən iki fərqli hadisəyə baxaq. Əvvəlcə Alice və Bobun doğum günlərini, Carol və Dan'ın doğum günlərini paylaşmasını düşünün:

  • Alisin doğum günü ilin istənilən gününə düşə bilər (ehtimal \ (365/365 \)),
  • Bobun doğum günü Alisin doğum gününə düşməlidir (ehtimal \ (1/365 \)) və
  • Carolun doğum günü Alice və Bobun birgə doğum günündən başqa bir günə düşməlidir (ehtimal \ (364/365 \)),
  • Dan ad günü Carolun doğum gününə təsadüf etməlidir (ehtimal \ (1/365 \)),

bunun baş vermə ehtimalı belədir:

\ [

\ frac \ cdot \ frac \ cdot \ frac \ cdot \ frac

=

\ frac .

\]

İndi Alice, Bob və Carolun doğum günlərini paylaşmasını, Dan'ın fərqli bir gündə doğum gününü qeyd etməsini düşünün:

  • Alisin doğum günü ilin istənilən gününə düşə bilər (ehtimal \ (365/365 \)),
  • Bobun doğum günü Alisin doğum gününə təsadüf etməlidir (ehtimal \ (1/365 \)),
  • Carolun doğum günü Alice və Bobun ortaq doğum gününə təsadüf etməlidir (ehtimal \ (1/365 \)) və
  • Dan'ın doğum günü Alice, Bob və Carolun ortaq doğum günlərindən başqa hər günə düşməlidir (ehtimal \ (364/365 \)),

bunun baş vermə ehtimalı belədir:

\ [

\ frac \ cdot \ frac \ cdot \ frac \ cdot \ frac

=

\ frac .

\]

Xüsusilə hər iki ifadənin sol tərəfinin fərqli bir ardıcıllıqla eyni faktorlara sahib olduğunu unutmayın. Doğum gününü əvvəlki şəxslə bölüşən birini nə vaxt əlavə etsək, bir faktor \ (1/365 \), nə vaxt "yeni" ad günü olan birini əlavə etsək, bir faktor əlavə edərik:

\ [

\ frac >.

\]

Beləliklə, ümumiyyətlə, bir hadisə \ (k \) günləri əhatə edərsə, onun baş vermə ehtimalı

\ [

\ frac .

\]

Əgər \ (\ operator adı (\ lambda) \) \ (\ lambda \) uzunluğunu ifadə edir, bu o deməkdir ki,

\ [

P (\ lambda) = \ frac (\ lambda)! 365^n>. \ qquad \ qquad \ textrm

\]

İndi \ \ N (\ lambda) \ 'nın nə olduğunu anlamaq qalır. Bunu "şəkli insanlarla neçə yolla doldurmaq olar?" Deyə düşünə bilərik. Multinomial əmsallar bizə bunu tam olaraq söyləyir! Bir bölmə üçün \ (\ lambda = a_1 + \ cdots + a_k \)

\ [

\ binom olaraq təyin olunur = \ binom = \ frac .

\]

Məsələn, \ (4 = 2 + 2 \) bölməsi üçün

\ [

\ binom = \ frac = \ Frac = 6,

\]

buna görə müvafiq formanı doldurmağın 6 yolu var:

Hm, bu düzgün görünmür, yuxarıda bu formada 3 halımız yoxdur? Həqiqətən də edirik! Bu "forma doldurma" üsulu əslində eyni hadisəni bir neçə dəfə sayır. Qeyd edək ki, həm birinci, həm də dördüncüsü Alice və Bobun doğum günlərini, Carol və Dan ad günlərini bölüşməklə uyğundur, iki gün sadəcə dəyişdirilir. Üst sıradakı hər bir hadisə, onun altındakı hadisə ilə eynidir. Yaxşı, bunu necə düzəldə bilərik?

Məsələ burasındadır ki, doldurma metodu günləri etmək istəmədiyimiz şəkildə fərqləndirir. İnsanların doğum gününün hansı günə təsadüf etməsi bizi maraqlandırmır. O günlərdə eyni sayda insanın doğum günlərini paylaşdığı iki və ya daha çox günümüz olanda, bunu bir hal kimi sayırıq, halbuki müvafiq çoxnomial əmsal o günləri dəyişə biləcəyimiz bütün mümkün yolları sayır. Bunun öhdəsindən gəlmək üçün bir hissədəki bərabər şərtlərin uzunluğunu nəzərə almalıyıq. Məsələn,

\ [

7 = 2 + 2 + 1 + 1 + 1 = 2 \ cdot 2 + 3 \ cdot 1

\] bölməsinin

bir uzunluq qaçışı var \ (2 \) (iki 2) və bir qaçış uzunluğu \ (3 \) (üç 1).

Bunu rəsmiləşdirmək üçün \ (\ lambda \ vdash n \) permütasiya üçün bərabər şərtlər toplayıb

\ [

n = c_1b_1 + \ cdots + c_mb_m,

\] olaraq yaza bilərik ki,

burada \ (b_1>b_2>\ cdots>b_m \ ). Sonra \ (c_1 \), \ (c_2 \),…, \ (c_m \) ədədləri bölməmizdəki bərabər şərtlərin bütün uzunluqlarıdır.

\ [

S (\ lambda) = c_1! \ Cdots c_m kimi eyni hadisədə olarkən günləri bir formada dəyişdirməyimizin yollarını sayan \ (s (\ lambda) \) təyin edə bilərik!

\]

Bütün bu maşınlar yerində olduğunda, nəhayət, \ (P (A_n) \) düsturunu yazmaq üçün bir yerdəyik. \ (S (\ lambda) \) çoxnomial əmsalların "ikiqat sayılmasını" hesab etdiyinə görə, bizdə

\ [

N (\ lambda) = \ binom / s (\ lambda). \ qquad \ qquad \ textrm

\]

\ (P (\ lambda) \) və \ (N (\ lambda) \) ifadələrinin (2) və (3) ifadələrini yuxarıdakı (1) Tənlikdə əvəz etməklə us

\ [

P (A_n) = \ mathop >_ \ binom \ cdot \ frac (\ lambda))! 365^ns (\ lambda)>.

\]

Bütün bu işləri gördüyümüz üçün qeyd etmək lazımdır ki, \ (n \) ədədlərinin bölmə sayı \ (\ tilde e^ >\), bu düsturun hesablanmasının mürəkkəbliyi \ (n \) dəki eksponensialdır. Bu, "hiylə" həllinin xətti mürəkkəbliyi ilə ziddiyyət təşkil etməlidir. Digər tərəfdən, bu daha mürəkkəb həlli yoxdur "ehtimalı nə kimi daha mürəkkəb suallara cavab uyğunlaşmaq üçün asandır üç nəfər eyni ad bölüşmək".

Nəhayət

Doğum günü problemi dərhal intuitiv deyil - iki adamın eyni doğum gününü paylaşma şansı əldə etmək üçün yalnız 23 nəfərin yanında olması lazım olduğu fikri. Bu paradoksun həlli daha da asan deyil. Bu günə qədər oxumusunuzsa, şübhəsiz ki, Data Mettle -də məlumat alimi vəzifəsi üçün növbəti müsahibənizi başa vuracaqsınız.

Növbəti dəfə 70 -dən çox adamın xatırladığı bir ad gününə gedəndə, yəqin ki, heç olmasa bir adama doğum günün mübarək deməyi unudursan.