Головна Статистика
Математична статистика
|
|
|||||
ВИПАДКОВІ ВЕЛИЧИНИРозподіли випадкових величинВипадкова величина - це величина, яка в результаті випробувань може приймати певні значення (із сукупності своїх значень) з певною ймовірністю. Випадковою можна назвати будь-яку (не обов'язково чисельну) змінну x, значення якої х створюють множину випадкових елементарних подій {х}. Розрізняють дискретну і неперервну випадкові величини. Дискретною випадковою величиною називається випадкова величина, що приймає скінчене число значень з множини, елементи якої можна пронумерувати. Неперервною випадковою величиною називається випадкова величина, можливі значення якої неперервно заповнюють деякий інтервал. Рядок розподілу дискретної випадкової величини x може бути представлений як у табличній формі - у вигляді таблиці, де перераховано значення випадкової величини х1, х2, хп з відповідними до них ймовірностямир1, р2, рп (див. табл. 3.2), так і у вигляді графічного зображення (рис. 3.7). Таблиця 3.2 Рядок розподілу дискретної випадкової величини X Рис. 3.7. Графік розподілу дискретної випадкової величини X Рядок розподілу може мати аналітичну форма представлення, наприклад: В загальному вигляді це можна записати якД(Х) = Р(Х=х) - значення функції /(X) дорівнює ймовірності Р(Х=х) того, що змінна X приймає значення х. За аналогією з випадковими подіями, можна вважати, що простором елементарних випадкових значень х1, х2, хп змінної X є скінчена множина цих значень С1={х}. Кожному елементарному значенню х1, х2, хп, яке належить до множини СІ, поставлено у відповідність невід'ємне число - ймовірностір1, р2, рп, тобто р! = Р(Х = х{) > 0, причому сума ймовірностей появи всіх елементарних значень змінної x дорівнює одиниці: Р, = 1. (3.14) Отже, пару {СІ, Р} можна вважати імовірнісним простором, який складається зі скінченої множини значень О змінної x і невід'ємної функції Р, яка визначена на множині значень О і задовольняє умові (3.14). Якщо емпіричні дані є результат статистичних випробувань, то емпіричний розподіл частот можна також трактувати як розподіл випадкової величини - співвідношення можливих значень з відповідними ймовірностями їхньої появи. Оскільки класичні ймовірності збігаються з відносними частотами (див. поняття класичної ймовірності), то розподіли частот можна представляти як відповідні розподіли випадкових величин, проте, лише за певними умовами і обмеженнями (мова про них йтиме нижче). Розглянемо на прикладі побудову розподілу дискретної випадкової величини. Приклад 3.11. Розрахувати розподіл кількості виконаних завдань за результатами тестування навмання відібраної з академічного потоку вибірки студентів обсягом 20 осіб (табл. 3.3). Таблиця 3.3 Кількість виконаних завдань Послідовність рішення:
винна скласти обсяг вибірки, тобто ^ ті = 20 (див. комірку С10 рис. 3.8); і=1 o для розрахунку ймовірностейр = Р(Х = хї) внести в комірку вираз =С3/$С$10, аналогічні вирази внести у комірки 04:09;
Отже, у таблиці рис. 3.8 розраховано розподіли ймовірностей дискретної змінної X (кількості виконаних завдань) р'(х) = Р(Х = х) і р(х) = Р(Х< х), на рис. 3.9 зображено відповідні графіки. Сукупність ймовірностей р'і = Р(Х = хі) має назву щільності розподілу змінної X (див. стовпчик Б рис. 3.8 і гістограму рис. 3.9). Кожне окреме значення щільності розподілу визначає ймовірність р',- кожного окремого значення X! змінної X , тобто Р(Х = хі). Сума ймовірностей р',- усіх елементарних значень X! змінної X (за умови повної системи випадкових значень) дорівнює п одиниці, тобто ^ р] = 1. Як бачимо з рис. 3.8 (див. комірку 010), ця вимога і=1 виконується: 0,00+0,05+0,10+0,20+0,25+0,30+0,10= 1,00. Сукупність ймовірностей р! = Р(Х < X!) має назву розподілу змінної X (див. стовпчик Е рис. 3.6 і дискретний графік рис. 3.7 у вигляді сходинок з насиченням до 1,00). Розподіл випадкової величини показує ймовірність для змінної X, значення якої не перевищує х^ , тобто Р(Х < х^. Кожне значення розподілу є сумою ймовірностей р'і усіх попередніх елементарних значень х, і змінної X, тобто: рі =^р'І. Наприклад, для і = 4 значення ймовірність р4 і=1 4 Аналогічно може бути представлено й щільність розподілу Дх). Для дискретної змінної розподіл і щільність розподілу зв'язані співвідношенням: Р (хі) = ±/ (х,) (3.17) і=1 Для неперервної змінної можна записати такі співвідношення:
складатиме р4 р'. = 0,00 + 0,05 + 0,10 + 0,20 = 0,35 (див. комірку Е6 рис. 3.6). ¡=1 Ймовірність отримання у випробуванні будь-якого значення з повної системи випадкових значень (фактично, це є ймовірність достовірної події) дорівнює п одиниці. І дійсно, для і = п ймовірність рп = ^ р] = 1(див. комірку Е9 рис. 3.6 і=1 або останнє значення ймовірності розподілу на графіку рис. 3.7). Законом розподілу випадкової величини є співвідношення, що встановлює зв'язок між можливими значеннями випадкової величини і відповідними до них ймовірностями. Закон розподілу може бути задано функціями: o функцією розподілу Р(х) Р(х) = Р(Х < х); (3.15) o функцією щільності розподілуДх) Дх) = Р(Х = х). (3.16) Для дискретної змінної функція розподілу Р(х) може бути представлена в аналітичній формі. Так, заданими рис. 3.8 функція Р(х) матиме вигляд: Математичний аналіз надає геометричну інтерпретацію визначеному інтегралові (3.18) як площі (див. зафарбовану площу на рис. 3.10), яка зверху обмежена графіком функції /(х), а знизу - віссю абсцис у межах -ю < х < +со. Розмір площі за інтегралом (3.18) дорівнює одиниці. Значення функції розподілу ¥(х) для певного значення х (наприклад, х = а) визначається через щільність розподілу /(х) за формулою: Інтеграл (3.19) і функція ¥(а) розподілу також мають сенс площі (див. зафарбовану площу на рис. 3.11), яка обмежена з трьох боків: зверху - графіком функції Дх), знизу - віссю абсцис у межах -" < х < а, з правого боку -ординатою, яка проходить через точку х = а. Для х = +со функція розподілу ¥(со)=1, тобто і (со) = / (х)^х = 1. (3.20) -ОС Отже, порівнюючи алгебру випадкових подій з математичним апаратом випадкової величини, можна дійти до висновку про те, що розподіли випадкових величин ізоморфно відтворюються на розподілах випадкових подій. Розглянемо приклад розподілу неперервної випадкової величини. Приклад 3.12. Як відомо з психодіагностики, коефіцієнт інтелекту О (показник інтелектуального розвитку сукупності однакових за віком осіб) розподіляється за законом, близьким до нормального12, щільність розподілу якого визначається формулою: гґ 1 -0,5((х-1в)/<7)2 г г, . 1 | (х - І02 і де /(х) - ймовірність Р(І<2 = х) того, що ї<2 прийме значення х; І<2 і а -середнє арифметичне і стандартне відхилення генеральної сукупності; % ~ 3,14; е ~ 2,71. Для певного контингенту індивідуумів середнє значення 1<2=100 і а =15. Завдання: Побудувати розподіл коефіцієнта інтелекту І£) в діапазоні значень від І<2МІН = 50 до І(2макс = 150. Визначити ймовірності того, що І(2 прийматиме значення: а) І£) < 80; б) Щ > 110; в) у межах 70 < І£) < 90; г) прийматиме значення поза межами інтервалу 80 < Щ < 120. Рішення: Розрахуємо значення щільності/(х) нормального розподілу і розподіл і(х) у табличній формі в указаному діапазоні з інтервалом 10 (рис. 3.10). Деталі розрахунку розглянемо пізніше у відповідному розділі. Важливим моментом є досягнення так званої нормалізації, за умови якої площа під кривою щільності розподілу /(х) повинна дорівнювати одиниці. Як бачимо з комірки С14 рис. 3.10, ця вимога виконується. Побудуємо відповідні графіки розподілу І£) (рис. 3.13). Форма графіка щільності /(ІО) має вигляд "дзвону". Вона є симетричною відносно середнього значення ІО=100. Графік розподіл досягає насичення на рівні 1,00. 12 Докладніше щодо нормального закону розподілу див. розділ 3.4. Слід звернути увагу на те, що ймовірність Р(/£> < 100) = 0,50. Інакше кажучи, ймовірність отримати значення 12 на рівні не більше середнього значення ї<2=100 складає 50%. На рис. 3.13 це відповідає зафарбованій площі, яка складає 50% від загальної. Аналітично це можна записати так: 100 Р (х < 100) = | / (х)Сх = 0,50. -сс Розглянемо пункти завдання щодо визначення ймовірності отримання конкретних значень коефіцієнта інтелекту
Р(х < 80) = | Л(х)сІх ~ 0,091. -сс Отже, ймовірність Р(І<2 < 80) = 0,091 = 9,1%.
Р(х > 110) = 1 - Р(х < 110) = 1 - | Л(х)Сх = 1 - 0,748 = 0,252. -сс Значення Р(110) = 0,748 можна отримати з табл. рис. 3.12. Отже, ймовірність Р(/((>110) ~ 25,2%.
| Л(х)Сх = | Л(х)Сх - | Л(х)Сх = Р(90) - Р(70), або Р(90) - Р(70) = 0,253 - 0,023 = 0,23. Отже, ймовірність Р(70< ¡2 < 90) = 23%.
|/(х)ах = і(80), або з табл. рис. 3.12 маємо і(80) = 0,091. Ймовірність Р(А2) події ^42 визначиться як доповнення до протилежної події І2{ІО< 120} або Р(А2) = 1 - ~Аі{ІО< 120}, а саме 120 і(х > 120) = 1 - | /(х)йх = 1 - і(120) або
і(х > 120) = 1 - і(х < 120) = 1 - | /(х)ох = 1 - 0,909 ~ 0,091. -ос Ймовірність Р(А) події А складається з суми ймовірностей Р(АА і Р(А2) подій А1 і А2, тобто Р(А) = Р(А1) + Р(А2) = 0,091 + 0,091 ~ 0,182 = 18,2%. 2-й варіант. Подію ^4{80>І< >120} можна звести і розглядати як доповнення до протилежної події А, яку позначимо _8{80 <І(2 < 120} (див. незафарбовану площу рис. 3.17). Тоді Р(А) = 1- Р(В). Подія _8{80< ¡2 <120} відповідає попередній ситуації (див. вище п. "в"), коли з події В1 {¡2 < 120} треба вилучати елементи події В2{2< 80}. Ймовірність Р(В) події В є різниця ймовірностей Р(В{) і Р(В2) Р(В) = Р(12 < 120) - Р(12 < 80). Ймовірність Р(А) бажаної події А дорівнюватиме Р(А) = 1- Р(В) = 1 - [Р(Щ < 120) - Р(12 < 80)]. Визначення ймовірності за допомогою функцій розподілу матиме вигляд:
Отже, ймовірність того, що ¡2 не прийматиме значення в діапазоні від 80 до 120, тобто Р(80 > ¡2>120), складає 18,2%. Зауваження: якщо графік розподілу симетричний і зафарбовані площі однакові за розміром, ймовірність Р(А) розраховується як подвоєна площа однієї з частин, наприклад, Р(А) = 2-Д80 < ¡2) = 2-0,091 ~ 0,182 = 18,2%. Розподіли дають можливість рішення і зворотної задачі: знаходження значень змінної x, ймовірність якої задано. Так, за даними прикладу 3.12 можна стверджувати, що на рівні ймовірності 0,05 (5%) коефіцієнт інтелекту ¡2 не перевищуватиме значення 75,3. З графіка функції розподілу Р(2) рис. 3.18 видно, що ймовірності 0,05 відповідає зафарбована площа, яка обмежена графіком щільностіЛ(Ш) і ординатою ¡2 = 75,3. Інакше кажучи, Р(!2) = ^(¡2 < 75,3) = 0,05. Аналогічно можна отримати значення змінної ¡2, ймовірність якої складає 20% або 0,20. З рис. 3.19 видно, що ймовірності 0,20 відповідає зафарбована площа, яка обмежена графіком щільностіЛ(Ш) і ординатою ¡2 = 87,4. Інакше кажучи, Р(!2) = ^(¡2 < 87,4) = 0,20. На даному етапі вивчення властивостей розподілів доречно згадати поняття "процентиль" і надати йому додаткового змістовного сенсу. Як визначалося вище, процентилі ділять обсяг упорядкованої сукупності на сто частин, тобто відокремлюють від сукупності по 0,01 частки (по 1%). Pj - це z'-й процентиль - межа, нижче за яку лежать /' відсотків значень. Наприклад, якщо п'ятий процентиль дорівнює 30 (записують Р5 = 30), це значить, що 5% всіх значеньx не перевищують 30. Значення функції розподілу F(X), які знаходяться у межах від 0 для F(-") до 1 для F(+co), також зручно поділити на сто частин і представляти функцію розподілу у вигляді процентилів. Якщо ціна шкали функції розподілу F(x) становить 0,01 (1%), отримані вище результати можна прокоментувати у такій спосіб:
Значення процентиля для нормального розподілу можна отримати за допомогою функції MS Excel =НОРМОБР(ймовірність; середнє; ст.відхилення). Так, ^5 = НОРМОБР(0,05;100;15) = 75,3; а Р20 = НОРМОБР(0,20;100;15) = 87,4. |
<< | ЗМІСТ | >> |
---|