Головна Соціологія
Що варто знати про соціологію та соціальні дослідження?
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Загадкові похибки й імовірності репрезентативної вибіркиВ основі формування вибірок – теорія імовірності та математична статистика, виклад яких є поза межами цього видання. Втім, це не означає, що читачеві зовсім нічого не варто знати про похибки й імовірності репрезентативних опитувань. Цей підрозділ та наступний – для тих, хто любить рахувати й працювати з таблицями. їх матеріал допоможе не лише грамотніше сприймати повідомлення про опитування громадської думки, а й навчитися визначати орієнтовні розміри (обсяги) вибірок і супутні їм похибки, зокрема розібратися, наскільки точними насправді є репрезентативні опитування. Однак, якщо ви не в настрої роздивлятися таблиці й формули, можна одразу переходити до підрозділу "10 міфів про вибірку й опитування громадської думки", який не містить математичних розрахунків, але теж стане в пригоді всім, хто прагнуть бути більш критичними, компетентними читачами публікацій про опитування громадської думки. В ідеалі фахові повідомлення про результати репрезентативного опитування містять інформацію про похибку, ймовірність та дизайн-ефект. Наприклад, у прес-релізі про фахове репрезентативне опитування 2000 респондентів можемо прочитати: "Статистична похибка вибірки (з імовірністю 0,95 та за дизайн-ефекту 1,5) не перевищує:
Що це за ймовірність, похибки та дизайн-ефект? Що нам варто про них знати? Відповідно до законів математики не можна бути на 100% впевненими, що результати дослідження вибірки ідентично відображають ситуацію в генеральній сукупності, навіть якщо ми дуже ретельно сформували нашу вибірку. Однак можна бути впевненими з високою імовірністю, що результати для вибірки не відрізняються від ситуації в генеральній сукупності більше, ніж на певний відсоток. Скільки саме становить такий відсоток максимального відхилення й наскільки високою є імовірність залежить від потреб дослідження, дослідницьких традицій і навіть особистих уподобань. У соціальних дослідженнях склалася традиція виходити з імовірності близько 0,95, тобто 95% впевненості в точності результатів. Найчастіше, мабуть, використовують імовірність 0,950[2], тобто рівно 0,95. Однак імовірність 0,9545, або 95,45%, теж по-своєму зручна, оскільки спрощує формулу розрахунку. У деяких інших галузях (наприклад, епідеміології] нерідко використовують імовірність 0,99. Коли читач чує про результати опитувань громадської думки в українському або інших суспільствах, зазвичай ідеться про вибірки, сформовані, виходячи з імовірності 0,9545 або 0,95 рівно. Власне, не дуже важливо, яка саме з цих двох імовірностей була використана, оскільки похибки за них майже не різняться (для порівняння див. додаток 2). Максимальні допустимі похибки в опитуваннях громадської думки часто становлять понад 2%, але менше ніж 5%. Однак це аж ніяк не є догмою. Можна провести опитування з максимальною похибкою і 7%, і 10%, якщо така точність результату прийнятна. Результати дослідження тим точніші, чим вища ймовірність і чим менша похибка. Втім, щоб імовірність була вищою, а похибка меншою, потрібна більша вибірка, що вимагає вищих витрат на дослідження. Тому визначення похибки – це завжди баланс між бажаним і можливим. Нехай імовірність становить 0,9545, n – обсяг вибірки, N – обсяг генеральної сукупності, Δ – максимальна прийнятна похибка, виражена часткою (тобто якщо йдеться про похибку 3%, то Δ = 0,03). Для визначення розміру вибірки потрібно скористатися не вельми складною формулою: n = 1 / (Δ2 + 1/N)[3]. Нехай ми вирішили, що нам важлива висока точність результатів: похибка не має перевищувати 2%. У такому разі Δ = 0,02, а отже, формула набуває такого вигляду: n = 1 / (0,022 + 1/N) = 1 / (0,0004 + 1/N). Натомість якщо ми зупинили свій вибір на похибці 5%, то формула стає такою: n = 1 / (0,052 + 1/N) = 1 / (0,0025 + 1/N). У таблиці 4.1 наведено низку прикладів, яким має бути обсяг вибірки залежно від обсягу генеральної сукупності (N) та максимальної прийнятної похибки (Δ) за ймовірності 0,9545. У таблиці представлені різні генеральні сукупності від 50 одиниць до 50 млн. Аналогічну інформацію для ймовірності 0,95 рівно наведено в таблиці 4.2. У таблицях 4.1 і 4.2 можемо побачити, що за малих обсягів генеральної сукупності (50, 100, 200) навряд чи доцільно формувати вибірку: варто опитати всю генеральну сукупність, якщо важлива висока точність результатів. Ми також можемо побачити в цих таблицях, що зі збільшенням обсягу генеральної сукупності розмір вибірки дедалі менше різниться й урешті-решт зовсім перестає збільшуватися. Таблиця 4.1. Як змінюється обсяг вибірки залежно від обсягу генеральної сукупності та максимальної допустимої похибки за ймовірності 0,9545
Таблиця 4.2. Як змінюється обсяг вибірки залежно від обсягу генеральної' сукупності та максимальної допустимої похибки за ймовірності 0,950
Річ у тім, що чим більший обсяг генеральної сукупності (тобто N у формулі), тим менше значення компонента 1/N. Тобто зі збільшенням N цей компонент зменшується та прямує до нуля. Якби в нас була нескінченно велика генеральна сукупність, то 1/N дорівнювало б нулю. Таким чином, якщо ми працюємо з великими[4] генеральними сукупностями, наведену вище формулу можна спростити: n = 1 / (Δ2 + 0); n = 1 / Δ2. Після такого спрощення вельми зручним стає підрахунок похибки залежно від розміру вибірки: Якщо ми бажаємо отримати похибку, виражену у відсотках, а не часткою (наприклад, 3%, а не 0,03), потрібно просто помножити Δ на 100. У таблиці 4.3 наведені приклади похибок вибірок різного обсягу для нескінченно великої генеральної сукупності та ймовірності 0,9545. У цій самій таблиці допитливі читачі можуть побачити, яким буде розмір вибірки, якщо ймовірність наближатиметься до 100 (на прикладі значення ймовірності 0,99993). На прикладі даних таблиці 4.3 легко побачити, чому обсяг вибірок зазвичай становить сотні або тисячі осіб, але не десятки: для вибірки 10 одиниць похибка не перевищує 63,1% з імовірністю 0,99993, для вибірки 50 одиниць – 28,2%, 100 – 20,0%. Зайве казати, що результати з такою похибкою мало кого задовольнять! Натомість вибірка 400 одиниць уможливлює вже таку точність результату, яка була б прийнятною в багатьох дослідницьких проектах: похибка до 5% з імовірністю 0,9545 та до 10% з імовірністю 0,99993. Таблиця 4.3. Як змінюється максимальна допустима похибка за ймовірностей 0,9545 та 0,99993[5] залежно від обсягу вибірки, репрезентативної для нескінченно великої[6] генеральної сукупності
Важливо наголосити: вказані в таблицях 4.1-4.3 похибки справджуються лише для ідеально випадкового відбору респондентів – такого, ніби вибірку нам сформував генератор випадкових чисел. Такі похибки називають теоретичними. Однак це не означає, що вони неможливі на практиці. У низці випадків теоретична похибка – це і є дійсна похибка реальної вибірки. Проте на практиці процедура формування вибірки часто спричинює так званий дизайн-ефект, який збільшує похибку в півтора-два рази. У цьому контексті "дизайн" означає "методика формування вибірки"; "ефект" – вплив (від англ, design-effect). Відповідно дизайн-ефект – це величина, що показує, у скільки разів теоретична похибка збільшилася внаслідок специфіки застосованої методики формування вибірки[7]. Наприклад, якщо теоретична похибка – 5%, дизайн-ефект – 1,5, то похибка становить: 5% * 1,5 = 7,5%. Чому з'являється дизайн-ефект? Коли його немає? Уявімо планування опитування, репрезентативного для мешканців певного населеного пункту, певного регіону або певної країни. В усіх цих випадках дослідникам потрібно придумати, як визначити географічні точки, у яких шукати респондентів, а також процедуру випадкового відбору респондента в тій унікальній точці[8]. Щоб дослідження не було надто дорогим, намагаються спланувати його таким чином, щоб опитати кількох людей поруч, а не всіх респондентів у рівновіддалених точках. Наприклад, якщо вибірка 2000, репрезентативна для дорослого населення України, на практиці людей не опитують у 2000 різних населених пунктах. Натомість процедура формування вибірки може бути приблизно такою:
За такої процедури не кожна адреса мала однаковий шанс потрапити до нашої вибірки, адже ми кілька разів формували підвибірку й наступний вибір здійснювали лише в її межах. Таким чином і з'явився дизайн-ефект вибірки. Натомість дизайн-ефект дорівнював би одиниці (тобто був відсутній), якби ми могли отримати список усіх людей, які становлять доросле населення України, відібрати з них необхідну кількість осіб за допомогою таблиць випадкових чисел й опитати саме їх. Наведемо ще один приклад, коли методика формування вибірки спричинює дизайн-ефект. Нехай ми плануємо опитування, репрезентативне для студентів ВНЗ України. Нам доведеться спершу відібрати самі ВНЗ, а потім уже студентів у межах кожного з них. Така процедура створює дизайн-ефект, тобто збільшує похибку, через те що спершу ми утворили вибіркову сукупність університетів, а потім уже відбирали студентів. Знову-таки дизайн-ефект дорівнював би одиниці (тобто ніяк не збільшував би теоретичної похибки), якби можна було отримати список усіх студентів України та відібрати на основі нього необхідну кількість респондентів за допомогою таблиць випадкових чисел. Отже, при визначенні припустимої похибки потрібно брати до уваги, що теоретична похибка має бути помножена на величину дизайн-ефекту. Лише після цього ми отримаємо дійсну похибку результатів репрезентативного опитування. У таблиці 4.4 наведені приклади похибок із урахуванням дизайн-ефекту 1,5. Варто наголосити: точне значення дизайн-ефекту можуть визначити лише ті, хто мають докладну інформацію про процедуру формування вибірки. Тому фахове повідомлення про репрезентативне опитування має містити уточнення, яким є дизайн-ефект вибірки; інакше залишається за лаштунками значення дійсної, а не теоретичної похибки. Таблиця 4.4. Як змінюється максимальна похибка з урахуванням дизайн-ефекту 1,5 за ймовірності 0,9545 залежно від обсягу вибірки, репрезентативної для нескінченно великої генеральної сукупності
Як бачимо в таблиці 4.4, якщо маємо велику генеральну сукупність і нас влаштовує похибка 5% з імовірністю 0,9545, то можемо запланувати опитування 900 осіб. Однак це справедливо лише в тому разі, якщо наші висновки будуть у стилі: стільки-то відсотків висловили думку X. Натомість часто ми потребуємо від даних більшого, наприклад: дізнатися, що думають жінки про питання X, а що – чоловіки; що думають люди різних вікових категорій, різного рівня освіти, мешканці міст і сіл, різних регіонів. Такі очікування щодо результатів змінюють потрібний розмір вибірки. Як саме? Приміром, нехай нам важлива максимальна похибка до 5% з урахуванням дизайн-ефекту 1,5 при визначенні думок жінок і чоловіків. Тоді потрібно, щоб у кожній категорії – як чоловіків, так і жінок – було щонайменше 900 осіб. Якщо в нас 900 жінок і 900 чоловіків, то розмір вибірки буде 1800. Оскільки жінок дещо більше загалом, ніж чоловіків, то це ще трохи збільшить вибірку, якщо ми не бажаємо втратити жодної десятої відсотка похибки. Нехай нам відомо з державної статистики, що жінок 18 років і старших в 1,17 раза більше, ніж чоловіків такого самого віку. Тоді потрібний нам розмір вибірки: n = 900 + 900 * 1,17 = 900 + 1053 = 1953. За такої вибірки зможемо довідатися думку чоловіків із похибкою, що не перевищує 5% з урахуванням дизайн-ефекту з імовірністю 0,9545, і жінок зі ще меншою похибкою – 4,6%, оскільки їх у вибірці дещо більше, ніж чоловіків, – 1053. Якщо ми поділили Україну на 4 макрорегіони з приблизно однаковою кількістю населення й при цьому бажаємо, щоб похибка з урахуванням дизайн-ефекту 1,5 не перевищувала 5% для кожного із макрорегіонів, то нам потрібно опитати по 900 осіб у кожному з макрорегіонів. А отже, розмір вибірки має бути таким: n = 900 * 4 = 3600. Нерідко ми не знаємо точної частки тих категорій, інформація щодо яких нас цікавить. У такому разі вже після опитування розрахуємо точну похибку саме для цієї категорії. Наприклад, ми провели репрезентативне опитування 1000 містян і виявили, що 38% з них знають про заплановану реформу житлово-комунального господарства в місті. Цей результат має похибку 4,7% з імовірністю 0,9545 та з урахуванням дизайн-ефекту 1,5. Але нам ще потрібно довідатися, який відсоток людей, які знають про реформу, підтримує її запровадження. 38% від 1000 – це 380 осіб. Скористаймося вже відомою нам формулою: Переводимо величину вибірки з частки у відсотки та враховуємо дизайн-ефект: 0,051 * 100 * 1,5 = 7,7%. Отже, максимальна похибка за ймовірності 0,9545 та з урахуванням дизайн-ефекту 1,5 становитиме 7,7% для результатів серед містян, які знають про реформу X. Похибка має вельми корисну для точності результатів властивість: вона є найбільшою для значень, близьких до 50%, а з наближенням до 100% або 0% зменшується. Згадаймо приклад повідомлення про репрезентативне опитування, наведений на початку підрозділу: Статистична похибка вибірки (з імовірністю 0,95 та за дизайн-ефекту 1,5) не перевищує:
Цілком закономірно, що найбільша з усіх задекларованих похибок у цьому прикладі (3,3%) вказана саме для показників, близьких до 50%, а найменша (0,7%) – для показників, близьких до 1% та 99%. Для особливо допитливих читачів, які люблять рахувати, пояснимо, як розрахувати похибки для певних показників. Нехай
Тоді максимальна похибка Δ для показника р вибірки обсягом п: Значення "4" в цій формулі пов'язане з вибором імовірності 0,9545. Якби ймовірність була 0,95 рівно (тобто 0,950), то відповідний коефіцієнт становив би 3,8416 (1,962): Якби ймовірність була 0,99993, то відповідний коефіцієнт становив би: Отже, формула мала б такий вигляд: Якщо ми бажаємо отримати похибку, виражену у відсотках, а не часткою, то потрібно помножити Δ на 100. Якщо воліємо ще й урахувати дизайн-ефект, то помножити також на його величину. Отже, похибка у відсотках з урахуванням дизайн-ефекту 1,5 (позначимо її "х"): Спробуймо застосувати ці формули на прикладі. Уявімо, що ми провели опитування, репрезентативне для "нескінченно великої" сукупності. Вибірка – 400 осіб, дизайн-ефект – 1,5. Ми виявили, що 20% мають думку А, 80% – думку Б. Як можемо побачити в таблиці 4.4 або порахувати самі, максимальна похибка в цьому випадку з урахуванням дизайн-ефекту становить 7,5% з імовірністю 0,9545. Якби ми не знали, що максимальна похибка зменшується з наближенням до 0 і 100, то могли б сказати так: з імовірністю 0,9545 думку А має не менш як 12,5% і не більше ніж 27,5%, а думку Б – відповідно від 72,5% до 87,5%[12]. Однак ми тепер вміємо визначити похибку більш точно. Якщо думку А мають 20%, думку Б – 80%, то р = 0,2 і р = 0,8.3 формули очевидно, що для обох значень р (як 0,8, так і 0,2) похибка буде ідентичною, тож не важливо, яке саме з цих двох значень поставимо до формули. Отже, рахуємо: Як бачимо, ми отримали значення 4% як похибку без урахування дизайн-ефекту, що є дещо меншим, ніж 5% – максимальна теоретична похибка у вибірці такого розміру. Візьмімо до уваги дизайн-ефект 1,5: 6% – це на 1,5% менше, ніж максимальна похибка нашої вибірки з урахуванням дизайн-ефекту (7,5%). У таблиці 4.5 наведені різні значення показників для вибірок чотирьох розмірів: 400, 500, 1000 та 2000 респондентів, виходячи з того, що генеральна сукупність є "нескінченно великою", а ймовірність – 0,9545. Спробуймо застосувати таблицю 4.5 на практиці. Уявімо, що у вибірці обсягом 500 респондентів лише 3% висловило певну думку. Якою буде похибка в цьому разі, якщо дизайн-ефект становить 1,5? У таблиці 4.5 можемо побачити, що така похибка становить 2,29% (для зручності читачів відповідне значення виділене в таблиці). Отже, з імовірністю 0,9545 таку думку в генеральній сукупності мають від 0,71% (3 – 2,29) до 5,29% (3 + 2,29) респондентів. Зважаючи на все викладене вище в цьому розділі, можемо підсумувати, що фахове повідомлення про репрезентативне опитування обов'язково міститиме таку інформацію:
Таблиця 4.5. Як змінюється максимальна похибка без та з урахуванням дизайн-ефекту 1,5 за ймовірності 0,9545 залежно від показника та обсягу вибірки, репрезентативної для нескінченно великої генеральної сукупності
Таке повідомлення може також містити:
Крім того, у повідомленні має бути зазначено:
Тепер, коли ми розібралися в практичному значенні таких "загадкових" аспектів вибірки, як похибка, ймовірність та ди- зайн-ефект, спробуймо сформувати вибірку.
|
<< | ЗМІСТ | >> |
---|