Автор: А.М.Михайлов
Материал этой статьи будет полезен для всех, кто по роду своей деятельности работает с медиа и пользуется данными исследовательских компаний.
Выборка. Репрезентативность.
Исследовательские компании при проведении исследований не в состоянии опросить все население. Причины очевидны: недостаток времени и/или денег. Понятно, что для опроса всего населения, скажем, одного миллионного города требуется много интервьюеров, которые к тому же работают не бесплатно. Примем для определенности, что исследовательская компания имеет 100 интервьюеров в городе. Каждый может провести не более 10 интервью в день (если больше – качество работы снижается). Тогда на сплошной опрос всего населения этого города потребуется 1000000/100/10 = 1000 дней! А это 2.7 года. Через 2 года данные уже безнадежно устареют. Можно увеличить количество интервьюеров до 1000, сократив время проведения исследования до 100 дней, но соответственно в 10 раз вырастут затраты на проведение исследований!
Поэтому исследовательские компании опрашивают не все население – а только специальным образом отобранных людей (респондентов).
Вся исследуемая совокупность людей называется генеральной совокупностью (univers), а опрашиваемые люди – респонденты, представляют собой выборку (sample).
Для того, чтобы данные, полученные в результате выборочных исследований, соответствовали данным по исследуемой генеральной совокупности (всего населения или некоторой целевой аудитории), выборка должна быть репрезентативной, то есть полученные выборочные данные можно с заданной точностью переносить на всю генеральную совокупность.
Обычно репрезентативность достигается с помощью случайной выборки определенного объема. Если путем случайного отбора респондентов не удается достичь выборки, идентичной по набору признаков (пол, возраст, образование, род занятий, доход, потребление определенного продукта и т.д.) исследуемой совокупности (имеются «перекосы» выборки), то выборку корректируют, задавая квоты или используют процедуру взвешивания. Здесь мы будем говорить о простой случайной выборке. Другие типы выборок – стратифицированная, расслоенная, «снежного кома» и т.д. рассматриваются в книге «Рабочая книга социолога». М. Наука, 1983.
Доверительный интервал и доверительная вероятность.
Для оценки точности любых измерений используют понятия доверительного интервала (D) и доверительной вероятности (V). Здесь D – максимальная ошибка измерения, V – это уровень надежности измерений. Эти два параметра позволяют переносить результаты выборочных опросов на исследуемую (генеральную) совокупность.
Как правило используются следующие уровни надежности и доверительные интервалы:
V=95 (или 99) %; D=1 (или 3) %.
Как следует это понимать? Пусть мы провели опрос n случайно отобранных респондентов и Х% из них ответили на заданный вопрос «да» (скажем видели телепердачу). Объем выборки n был таким, что гарантировал уровень надежности V=95% и доверительный интервал D=1%. Это означает, что если провести опрос генеральной совокупности, то «истинное» значение Х% (т.е. относящееся к генеральной совокупности) с вероятностью 95% находится в интервале Х ±1% при любых значениях Х. Но результаты 5% опросов в этот интервал не попадут, поскольку уровень надежности 95%.
Объем репрезентативной выборки.
Для простоты изложения, не будем приводить формулы для определения нужного объема выборки. Интересующиеся могут их посмотреть в вышеназванной книге для разных типов выборок. Скажем только, что объем выборки зависит от максимальной ошибки измерений, надежности и доверительного интервала. Приведем таблицу:
Таблица 1. Объем репрезентативной выборки, гарантирующий заданную точность измерений. (Г.Шматов. Основы медиаплпнирования. 2007)
Из таблицы следует, что для того, чтобы обеспечить 95%-ю надежность 3% доверительного интервала, достаточно опросить 1067 случайно выбранных человек при какой угодно большой численности генеральной совокупности! Опросы такого объема обычно используются при исследовании медиапредпочтений.
Ошибки измерения рейтингов.
Все приведенные выше сведения применимы для любых выборочных исследований. Поэтому мы можем их использовать для оценки точности измерения рейтингов СМИ.
Постараемся обойтись без формул, тем более, что эти формулы можно найти в любом учебнике по статистике.
Из теории известно, что ошибка измерения зависит от объема бесповторной случайной выборки, уровня надежности измерения и величины рейтинга.
Определим максимальную ошибку измерений. Напомним, что действительный («истинный») рейтинг будет находится в интервале Рейтинг± максимальная ошибка, где Рейтинг – любой рейтинг из выборочной совокупности.
Формула будет иметь очень простой вид в случае если объем генеральной совокупности существенно превышает объем выборки.
D=0.5 t /n1/2
Здесь D – максимальная ошибка, n – объем выборки, а t – коэффициент (t = 1.96 при V=95%, и t=2,576 при V=99%). При t=1 мы получаем стандартную ошибку (standard error).
Очень важно заметить, что рейтинг, величина которого меньше максимальной ошибки просто не имеет смысла!
В литературе иногда приводят какое-то конкретное минимально допустимое число опрашиваемых человек для надежного определения рейтинга целевой группы. Но, на самом деле этого делать не следует, только следует помнить, что рейтинги меньше некоторой величины Р мин вообще неопределенны (ошибка равна величине рейтинга).
Поэтому можно ввести понятие минимально значимого рейтинга, т.е. рейтинга, при котором ошибка измерения равна самому рейтингу.
Опуская подробности, приведем формулу:
Р мин= t2/(n+ t2)
По этой формуле построим таблицу 2.
Таблица 2. Зависимость максимально значимых рейтингов от объема выборки.
(Г.Шматов. Основы медиаплпнирования. 2007)
Поясним, как применять эту таблицу в наших условиях. Выборка ТВ Индекс в среднем 1200 человек, обеспечивающая 95% надежность, 3% доверительного интервала. Наша задача определить какое значение рейтинга имеет смысл, для определенных целевых групп. Пусть в наши целевые группы попали 800, 400, 200, 100, 60 и 50 человек (статистика — sample). Тогда по таблице 2 определяем, что для этих целевых групп имеют смысл рейтинги превышающие 0,5, 1, 2, 4, 6 и 7 % соответственно (цифры округлены).
Заметим, что для казахстанской панели, значимыми будут рейтинги, превышающие значение 0,3.
Осуществлять медиапланирование при более низких значениях рейтинга с точки зрения статистики не имеет смысла. Нужно всегда иметь ввиду, что нам известны только текущие ТВ-рейтинги, но не абсолютно точно, а с определенной ошибкой измерения. Бедующие же рейтинги вообще не могут быть измерены, а могут быть лишь спрогнозированы. Отсюда вывод – национальная ТВ панель предназначена не для целей медиапланирования, а скорее для формирования ценовой политики размещения рекламы на каналах.