Малые выборки применяют когда исследуется число единиц. Типы выборок

Помимо собственно случайной выборки с ее четким вероятностным обоснованием существуют и другие выборки, которые не являются абсолютно случайными, однако широко применяются. Следует заметить, что строгое применение собственно случайного отбора единиц из генеральной совокупности далеко не всегда возможно на практике. К таким выборкам относятся механическая выборка, типическая, серийная (или гнездовая), многофазовая и ряд других.

Редко бывает, чтобы генеральная совокупность была однородной, это скорее исключение, нежели правило. Поэтому при наличии в составе генеральной совокупности различных типов явления часто желательно обеспечить более равномерное представительство в выборочной совокупности различных типов. Эта цель успешно достигается при применении типической выборки. Главная трудность заключается в том, что мы должны иметь дополнительную информацию о всей генеральной совокупности, что в ряде случаев является затруднительным.

Типическую выборку называют еще расслоенной или стратифицированной выборкой; ее применяют также в целях более равномерного представления в выборке различных районов, и в этом случае выборку называют районированной.

Итак, иод типической выборкой понимается такая выборка, при которой генеральная совокупность разделена на типические подгруппы, сформированные по одному или нескольким существенным признакам (например, население разделено на 3-4 подгруппы по величине среднедушевого дохода или но уровню образования - начальное, среднее, высшее и т.п.). Далее из всех типических групп можно вести отбор единиц в выборку несколькими способами, формируя:

  • а) типическую выборку с равномерным размещением, где из разных типов (слоев) отбирается равное число единиц. Эта схема работает хорошо, если в генеральной совокупности слои (типы) не очень сильно отличаются друг от друга по числу единиц;
  • б) типическую выборку с пропорциональным размещением, когда требуется (в отличие от равномерного размещения), чтобы доля (%) отбора для всех слоев была бы одинаковой (например, 5 или 10%);
  • в) типическую выборку с оптимальным размещением, когда учитывается степень вариации признаков в различных группах генеральной совокупности. При таком размещении пропорция отбора для групп с большой колеблемостью признака увеличивается, что в итоге приводит к уменьшению случайной ошибки.

Формула средней ошибки при типическом отборе похожа на обычную ошибку выборки для собственно случайной выборки с той лишь разницей, что вместо общей дисперсии проставляется средняя из частных внутригрупповых дисперсий, что, естественно, приводит к уменьшению погрешности по сравнению с собственно случайной выборкой. Однако ее применение не всегда возможно (по многим причинам). Если нет необходимости в большой точности, легче и дешевле использовать серийную выборку.

Серийная (гнездовая) выборка состоит в том, что в выборку отбираются не единицы совокупности (например, студенты), а отдельные серии, или гнезда (например, учебные группы). Говоря иначе, при серийном (гнездовом) отборе единица наблюдения и единица отбора не совпадают: отбираются некоторые группы примыкающих друг к другу единиц (гнезда), а обследованию подлежат входящие в состав этих гнезд единицы. Так, например, при выборочном обследовании жилищных условий мы можем в случайном порядке выбрать некоторое число домовладений (единица отбора) и выяснить далее жилищные условия проживающих в этих домах семей (единицы наблюдения).

Серии (гнезда) состоят из единиц, связанных между собой территориально (районы, города и т.д.), организационно (предприятия, цеха и г.д.) или во времени (например, совокупность единиц выработанной за данный отрезок времени продукции).

Серийный отбор может быть организован в форме одноступенчатого, двухступенчатого или многоступенчатого отбора.

Случайно отобранные серии подвергаются сплошному исследованию. Таким образом, серийная выборка состоит из двух этапов случайного отбора серий и сплошного изучения этих серий. Серийный отбор дает значительную экономию в силах и средствах и поэтому часто используется на практике. Ошибка серийного отбора отличается от ошибки собственно случайного отбора гем, что вместо значения общей дисперсии используется межсерийная (межгрупповая) дисперсия, а вместо объема выборки - количество серий. Точность обычно не очень велика, но в ряде случаев это допустимо. Серийная выборка может быть повторной и бесповторной, а серии - равновеликими и неравновеликими.

Серийная выборка может быть организована по разным схемам. Например, можно сформировать выборочную совокупность в два этапа: сначала в случайном порядке выбираются подлежащие обследованию серии, затем из каждой отобранной серии также в случайном порядке отбирается определенное количество единиц, подлежащих непосредственному наблюдению (измерению, взвешиванию и пр.). Ошибка такой выборки будет зависеть от ошибки серийного отбора и от ошибки индивидуального отбора, т.е. многоступенчатый отбор дает, как правило, менее точные результаты по сравнению с одноступенчатым, что объясняется возникновением ошибок репрезентативности на каждой ступени выборки. В этом случае требуется использовать формулу ошибки выборки для комбинированного отбора.

Другой формой отбора является многофазовый отбор (1, 2, 3 фазы, или этапа). Этот отбор по своей структуре отличается от многоступенчатого, так как при многофазовом отборе пользуются на каждой фазе одними и теми же единицами отбора. Ошибки при многофазовом отборе рассчитывают на каждой фазе отдельно. Главная особенность двухфазовой выборки состоит в том, что выборки отличаются друг от друга по трем критериям в зависимости: 1) от доли единиц, изученных на первой фазе выборки и вновь включенных во вторую и последующие фазы; 2) от соблюдения равенства шансов каждой единицы выборки первой фазы вновь быть объектом изучения; 3) от величины интервала, отделяющего фазы друг от друга.

Остановимся еще на одном виде отбора, а именно механическом (или систематическом). Этот отбор является, вероятно, самым распространенным. Это объясняется, видимо, тем, что из всех приемов выбора данный прием является простейшим. В частности, он значительно проще, чем случайный отбор, предполагающий умение пользоваться таблицами случайных чисел, и не требует дополнительных сведений о генеральной совокупности и ее структуре. К тому же механический отбор тесно переплетается с пропорциональным стратифицированным отбором, что приводит к снижению ошибки выборки.

Например, применение механического отбора членов жилищного кооператива из списка, составленного в порядке поступления в данный кооператив, обеспечит пропорциональное представительство членов кооператива с разным стажем. Использование этого же приема для отбора респондентов из списка лиц, составленного по алфавиту, обеспечивает равные шансы для фамилий, начинающихся на разные буквы, и т.п. Использование табельных или иных списков на предприятиях или в учебных заведениях и др. может обеспечить необходимую пропорциональность в представительстве работников с разным стажем. Заметим, что механический отбор широко применяется в социологии, при изучении общественного мнения и др.

В целях снижения величины ошибки и особенно расходов на проведение выборочного исследования широко используются разные комбинации отдельных видов отбора (механического, серийного, индивидуального, многофазового и т.п.). В таких случаях следует рассчитывать более сложные ошибки выборок, которые состоят из ошибок, имеющих место на разных этапах исследования.

Малая выборка - это совокупность единиц меньше 30. Малые выборки встречаются на практике довольно часто. Например, число заболеваний редкими болезнями или число единиц, обладающих редким признаком; кроме того, к малой выборке прибегают, когда исследование стоит дорого или исследование связано с уничтожением продукции или образцов. Широкое применение малые выборки получили в сфере обследования качества продукции. Теоретические основы для определения ошибок малой выборки были заложены английским ученым У. Госсетом (псевдоним Стьюдент).

Необходимо помнить, что при определении ошибки для малой выборки следует вместо численности выборки брать величину (п - 1) или же до определения средней ошибки выборки рассчитывать так называемую исправленную дисперсию выборки (в знаменателе вместо п следует ставить (п - 1)). Отметим, что такая поправка делается только один раз - при расчете выборочной дисперсии или при определении ошибки. Величина (п - 1) носит название степени свободы. Кроме того, нормальное распределение заменяется ^-распределением (распределением Стыодента), которое табулировано и зависит от количества степеней свободы. Единственным параметром распределения Стыодента является величина (п - 1). Еще раз подчеркнем, что поправка (п - 1) важна и существенна лишь при малых но численности выборочных совокупностях; при yi > 30 и выше различие сходит на нет, приближаясь к нулю.

До сих пор шла речь о случайных выборках, т.е. таких, когда выбор единиц из генеральной совокупности производится случайно (или почти случайно) и все единицы имеют равную (или почти равную) вероятность попасть в выборку. Однако отбор единиц может быть основан на принципе неслучайного отбора, когда во главу угла ставится принцип доступности и целенаправленности. В таких случаях нельзя говорить о репрезентативности полученной выборки, а исчисление ошибок репрезентативности можно производить, лишь имея сведения о генеральной совокупности.

Известны несколько схем формирования неслучайной выборки, которые получили значительное распространение и используются главным образом в социологических исследованиях: отбор доступных единиц наблюдения, отбор по нюрнбергскому методу, целевая выборка при определении экспертов и др. Важное значение имеет также квотная выборка, которая формируется исследователем по небольшому количеству существенных параметров и дает очень близкое совпадение с генеральной совокупностью. Говоря иначе, квотный отбор должен обеспечить исследователю почти полное совпадение выборочной и генеральной совокупностей по избранным им параметрам. Целенаправленное достижение близости двух совокупностей но ограниченному кругу показателей достигается, как правило, с помощью выборки существенно меньшего объема, чем при использовании случайного отбора. Именно это обстоятельство делает квотный отбор привлекательным для исследователя, не имеющего возможности ориентироваться на самовзвеши- вающуюся случайную выборку большого объема. Следует добавить, что сокращение объема выборки чаще всего сочетается с уменьшением денежных затрат и сроков проведения исследования, что увеличивает преимущества указанного способа отбора. Отметим также, что при квотной выборке имеется довольно значительная предварительная информация о структуре генеральной совокупности. Главное преимущество здесь состоит в том, что объем выборки существенно меньше, чем при случайной выборке. Выделенные признаки (чаще всего социально-демографические - пол, возраст, образование) должны тесно коррелировать с изучаемыми характеристиками генеральной совокупности, т.е. объекта исследования.

Как уже указывалось, выборочный метод дает возможность получить сведения о генеральной совокупности с гораздо меньшими затратами средств, времени и усилий, чем при сплошном наблюдении. Понятно также, что сплошное изучение всей генеральной совокупности в ряде случаев невозможно, например при проверке качества продукции, образцы которой уничтожаются.

Вместе с этим, однако, следует указать, что генеральная совокупность не является полностью «черным ящиком» и кое-какими сведениями о ней мы все же располагаем. Проводя, например, выборочное исследование, касающееся жизни, быта, имущественного положения, доходов и расходов студентов, их мнений, интересов и т.п., мы все же располагаем сведениями об общей их численности, группировке по полу, возрасту, семейному положению, местожительству, курсе обучения и другими характеристиками. Эти сведения всегда используются в выборочном исследовании.

Существует несколько разновидностей распространения выборочных характеристик на генеральную совокупность: способ прямого пересчета и способ поправочных коэффициентов. Пересчет выборочных характеристик производится, как правило, с учетом доверительных интервалов и может быть выражен в абсолютных и относительных величинах.

Здесь вполне уместно подчеркнуть, что большая часть статистической информации, касающейся экономической жизни общества в самых разных ее проявлениях и видах, основана на выборочных данных. Конечно, они дополняются и данными сплошного учета, и сведениями, полученными в результате переписей (населения, предприятий и пр.). Так, например, все сведения бюджетной статистики (о доходах и расходах населения), приводимые Росстатом, основаны на данных выборочного исследования. Сведения о ценах, размерах производства, объемах торговли, выраженные в соответствующих индексах, также в значительной мере основаны на выборочных данных.

Свои способности человек может узнать, только попытавшись приложить их. (Сенека)

Бутстреп, малые выборки, применение в анализе данных

Основная идея

Метод бутстрепа предложен Б. Эфроном как развитие метода складного ножа в 1979 году.

Опишем основную идею бутстрепа.

Цель анализа данных – получить максимально точные выборочные оценки и распространить результаты на всю популяцию.

Технический термин, которым обозначаются численные данные, построенные по выборке, это выборочная статистика.

Основные описательные статистики это выборочные среднее, медиана, стандартное отклонение и т.д.

Итоговая статистика, например, выборочное среднее, медиана, корреляция будут меняться от выборки к выборке.

Исследователю требуется знать размер этих отклонений в зависимости от популяции. На основании этого рассчитывается предел погрешности.

Исходная картина всех возможных значений выборочной статистики в форме распределения вероятностей называется выборочным распределением.

Ключевым является размер выборки. Что делать, если размер выборки небольшой? Один из разумных подходов состоит в том, чтобы случайным образом извлекать данные из имеющейся выборки.

Идея бутстрепа в том, чтобы использовать результаты вычислений по выборкам как “фиктивную популяцию” с целью определить выборочное распределение статистики. Фактически, при этом анализируется большое число “фантомных” выборок, называемых бутстреп-выборками.

Обычно случайным образом генерируется несколько тысяч выборок, из этого набора можно найти бутстреп-распределение интересующей нас статистики.

Итак, пусть имеем выборку выберем на первом шаге случайным образом один из элементов выборки, возвратим этот элемент в выборку, вновь случайным образом выберем элемент и тд.

Повторим описанную процедуру случайного выбора n раз.

В бутстрепе проводится случайный выбор с возвращением, выбранные элементы исходной выборки возвращается в выборку и далее могут быть снова выбраны.

Формально на каждом шаге мы выбираем элемент исходной выборки с вероятностью 1/n .

Всего имеем n элементов исходной выборки, вероятность получить выборку с номерами (N 1 … Nn ), где Ni меняется от 0 до n описывается полиномиальным распределением.

Таких выборок генерируется несколько тысяч, что вполне достижимо для современных компьютеров.

Для каждой выборки строится оценка интересующей величины, далее оценки усредняются.

Так как выборок много, можно построить эмпирическую функцию распределения оценок, далее рассчитать квантили, вычислить доверительный интервал.

Ясно, что бутстреп метод является модификацией метода Монте-Карло.

Если выборки генерируются без возвращения элементов, то получается известный метод складного ножа.

Вопрос: зачем это делать и когда метод разумно использовать в реальном анализе данных?

В бутстрепе мы не получаем новой информации, но разумно используем имеющиеся данные, исходя из поставленной задачи.

Например, бутстреп можно использовать для малых выборок, для оценок медианы, корреляций, построения доверительных интервалов и в других ситуациях.

В исходной работе Эфрона рассматривались оценки парной корреляции для размера выборки n = 15.

Генерируется B = 1000 бутстреп выборок (bootstrap replication ).

На основе полученных коэффициентов ro 1 … ro В строится общая оценка коэффициента корреляции и оценка стандартного отклонения.

Стандартная ошибка выборочного коэффициента корреляции, вычисленная с помощью нормального приближения, имеет вид:

где коэффициент корреляции равен 0.776, размер исходной выборки n = 15.

Бутстреп оценка стандартной ошибки равна 0.127, см. Efron , Gall Gong , 1982.

Теоретический бэкграунд

Пусть - целевой параметр исследования, например, средний доход в выбранном обществе.

По произвольной выборке размера получаем набор данных Пусть соответствующая выборочная статистика -

Для большинства выборочных статистик при большом значении (>30) выборочное распределение представляется из себя нормальную кривую с центром и стандартным отклонением , где положительный параметр зависит от популяции и вида статистики

Этот классический результат известен как центральная предельная теорема.

Зачастую при оценке требуемого стандартного отклонения по данным возникают серьезные технические трудности.

Например, если медиана или выборочная корреляция .

Метод бутстрепа позволяет обойти эти трудности.

Идея простая: обозначим через произвольную величину, представляющую собой такую же статистику, вычисленную по бутстреп-выборке, которая получена из исходной выборки

Что можно сказать про выборочное распределение , если “исходная” выборка фиксирована?

В пределе выборочное распределение также является колоколообразным с параметрами и

Таким образом, бутстреп-распределение хорошо аппроксимирует выборочное распределение

Заметим, что когда мы переходим от одной выборки к другой, в выражении меняется только , так как вычислена по

По сути это является бутстреп версией центральной предельной теоремы.

Также было установлено, если предельное выборочное распределение статистической функции не включает в себя неизвестные по популяции, бутстреп-распределение позволяет получить более хорошее приближение к выборочному распределению, чем центральная предельная теорема.

В частности, когда статистическая функция имеет вид где через обозначена истинная, или выборочная оценка стандартной ошибки при этом предельное выборочное распределение обычно стандартное нормальное.

Этот эффект получил название коррекции второго порядка с помощью бутстреппинга.

Пусть т.е. среднее по популяции, и т.е. среднее по выборке; - стандартное отклонение в популяции, - выборочное стандартное отклонение, вычисленное по исходным данным, а - вычисленное по бутстреп-выборке.

Тогда выборочное распределение величины где , будет аппроксимироваться бутстреп-распределением , где - среднее по бутстреп-выборке, .

Аналогично, выборочное распределение будет аппроксимироваться бутстреп-распределением , где .

Первые результаты по коррекции второго порядка были опубликованы Бабу и Сингхом в 1981-83 годах.

Приложения бутстрепа

Аппроксимация стандартной ошибки выборочной оценки

Предположим, что для популяции известен параметр

Пусть - оценка сделанная на основе случайной выборки размера т.е. это функция от Так как выборка меняется на множестве всех возможных выборок, то для того, чтобы оценить стандартную ошибку используется следующий подход:

Вычислим используя ту же формулу, что использовалась для но на этот раз на основе различных бутстреп-выборок размера каждая. Грубо говоря, можно принять если только не сильно велико. В этом случае можно сократить до n lnn . Тогда можно определить исходя, собственно, из сути бутстреп-метода: популяция (выборка) заменяется эмпирической популяцией(выборкой).

Байесовская коррекция с помощью бутстреп метода

Среднее выборочного распределения часто зависит от обычно как для больших То есть, Байесовская аппроксимация:

где - это бутстреп-копии . Тогда скорректированное значение будет -

Стоит отметить, что предыдущий метод ресэмплинга(замен выборки), называемый методом складного ножа, является более популярным.

Доверительные интервалы

Доверительные интервалы (ДИ) для заданного параметра это основанные на выборке диапазоны .

Этот диапазон обладает тем свойством, что значение с очень высокой (заранее установленной) вероятностью принадлежит ему. Это называется уровнем значимости. Конечно, эта вероятность должна относиться к любой выборке из возможных, т.к. каждая выборка привносит свой вклад в определение доверительного интервала. Два наиболее часто используемых уровня значимости это 95% и 99%. Здесь мы ограничимся значением 95%.

Традиционно ДИ зависят от выборочного распределения величины точнее в пределе . Есть два основных вида доверительных интервалов, которые могут быть построены с помощью бутстрепа.

Метод процентилей

Этот метод уже упоминался во введении, он очень популярен благодаря своей простоте и естественности. Предположим, что у нас есть 1000 бутстреп копий обозначим их через Тогда в доверительный интервал попадут значения из диапазона Возвращаясь к теоретическому обоснованию метода, стоит отметить, что в нем требуется симметрия выборочного распределения вокруг Причина этого заключается в том, что в методе аппроксимируется выборочное распределение с помощью бутстреп-распределения , хотя по логике получается, что оно должно аппроксимироваться значением то есть противоположным по знаку.

Центрированный метод бутстреп-процентилей

Предположим, что выборочное распределение аппроксимируется с помощью бутстреп распределения то есть как изначально и предполагалось в бутстреппинге. Обозначим 100-й процентиль (в бутстреп-повторениях) через Тогда предположение, что значение лежит в диапазоне от до будет верным с вероятностью 95%. Это же выражение легко преобразуется в аналогичное для диапазона от до Этот интервал и называется центрированным доверительным интервалом по бутстреп-процентилям (при уровне значимости 95%).

Бутстреп-t критерий

Как уже было отмечено, в бутстрепе используется функция вида где есть выборочная оценка стандартной ошибки

Это дает дополнительную точность.

В качестве основного примера возьмем стандартную t-статистику (отсюда название метода): то есть частный случай, когда (популяционное среднее), (выборочное среднее) и - выборочное стандартное отклонение. Бутстреп аналогом такой функции является где вычисляется также, как и только по бутстреп-выборке.

Обозначим 100-й бутстреп-процентиль через и будем полагать, что значение лежит в интервале

Используя равенство можно переписать предыдущее утверждение, т.е. лежит в интервале

Этот промежуток называется бутстреп t-доверительным интервалом для при уровне 95%.

В литературе он используется для достижения большей точности, чем предыдущий подход.

Пример реальных данных

Возьмем для первого примера данные из работы Холландера и Вольфе 1999 года, стр. 63, которые представляют собой эффект влияния света на скорость вылупления цыплят.

Стандартный бокс-график предполагает отсутствие нормальности по данным популяции. Мы провели бутстреп анализ медианы и среднего.

Отдельно стоит отметить отсутствие симметрии на бутстреп t-гистограмме, которая отличается от стандартной предельной кривой. 95%-е доверительные интервалы для медианы и среднего (вычисленные с использованием бутстреп метода процентилей), грубо говоря, покрывают диапазон

Этот диапазон представляет общую разницу (нарастание) в результатах скорости вылупления цыплят в зависимости от подсветки.

В качестве второго примера рассмотрим данные из работы Девора (Devore) 2003 г., стр 553, в которой рассматривалась корреляция между показателем биохимической потребности в кислороде (БПК, BOD) и результатами гидростатического взвешивания (HW) профессиональных спортсменов - футболистов.

Двумерные данные состоят их пар и пары можно произвольно выбирать во время бутстреп ресэмплинга. Например, сначала взять затем и т.д.

На рисунке график ящики-усы показывает отсутствие нормальности для основных популяций. Гистограммы корреляций, вычисленные на основе бутстреп двумерных данных, являются асимметричными (сдвинутыми влево).

По этой причине, центрированный метод бутстреп процентилей является в данном случае более подходящим.

В результате анализа выяснилось, что измерения скоррелированы для как минимум 78% популяции.

Данные для примера 1:

8.5 -4.6 -1.8 -0.8 1.9 3.9 4.7 7.1 7.5 8.5 14.8 16.7 17.6 19.7 20.6 21.9 23.8 24.7 24.7 25.0 40.7 46.9 48.3 52.8 54.0

Данные для примера 2 :

2.5 4.0 4.1 6.2 7.1 7.0 8.3 9.2 9.3 12.0 12.2 12.6 14.2 14.4 15.1 15.2 16.3 17.1 17.9 17.9

8.0 6.2 9.2 6.4 8.6 12.2 7.2 12.0 14.9 12.1 15.3 14.8 14.3 16.3 17.9 19.5 17.5 14.3 18.3 16.2

В литературе часто предлагаются различные схемы для бутстреппинга, которые могли бы давать достоверные результаты в различных статистических ситуациях.

То, что обсуждалось выше - лишь самые базовые элементы, и других вариантов схем на самом деле очень много. Например, какой метод лучше использовать в случае двухступенчатой выборки или стратифицированной выборки?

Естественную схему в этом случае нетрудно придумать. Бутстрэппинг в случае данных с моделями регрессии вообще привлекает много внимания. Есть два основных метода: в первом ковариации и переменные отклика ресэмплируются вместе (парный бутстреппинг), во втором - бутстреппинг производится по остаткам (остаточный бутстреппинг).

Парный метод остается корректным (в смысле результатов при ) даже если дисперсии ошибок в моделях не равны. Второй метод в этом случае некорректен. Этот недостаток компенсируется тем, что такая схема дает дополнительную точность в оценке стандартной ошибки.

Гораздо сложнее применять бутстреппинг для данных временных рядов.

Анализ временных рядов, однако, является одной из ключевых областей в эконометрике. Здесь можно выделить две основные трудности: во-первых, данные по временным рядам обладают свойством быть последовательно зависимыми. То есть, зависит от , и т.д.

Во-вторых, статистическая популяция со временем меняется, то есть появляется нестационарность.

Для этого разработаны методы, которые переносят зависимость в исходных данных на бутстреп-выборки, в частности, блоковая схема.

Вместо бутстреп выборки сразу строится блок данных, сохраняющий в себе зависимости из исходной выборки.

В области приложения бутстреппинга к разделам эконометрики в настоящий момент проводится довольно много исследований, в целом метод активно развивается.

В процессе оценки степени представительности данных выборочного наблюдения важное значение приобретает вопрос об объеме выборочной совокупности. выборка пересчет коэффициент стьюдент

От него зависит не только величина пределов, которые с данной вероятностью не превзойдет ошибка выборки, но и способы определения этих пределов.

При большом числе единиц выборочной совокупности () распределение случайных ошибок выборочной средней в соответствии с теоремой Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений.

Вероятность выхода ошибки за определенные пределы оценивается на основе таблиц интеграла Лапласа . Расчет ошибки выборки базируется на величине генеральной дисперсии, так как при больших коэффициент, на который для получения генеральной умножается выборочная дисперсия, большой роли не играет.

В практике статистического исследования часто приходится сталкиваться с небольшими по объему так называемыми малыми выборками.

Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30.

Разработка теории малой выборки была начата английским статистиком В.С. Госсетом (печатавшимся под псевдонимом Стьюдент ) в 1908 г. Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения.

Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента , определяемым по формуле

где - мера случайных колебаний выборочной средней в

малой выборке.

Величина вычисляется на основе данных выборочного наблюдения:

Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки в генеральной совокупности.

При небольшой численности выборки распределение Стьюдента отличается от нормального: большие величины критерия имеют здесь большую вероятность, чем при нормальном распределении.

Предельная ошибка малой выборки в зависимости от средней ошибки представлена как

Но в данном случае величина иначе связана с вероятной оценкой, чем при большой выборке.

Согласно распределению Стьюдента , вероятная оценка зависит как от величины, так и от объема выборки в случае, если предельная ошибка не превысит среднюю ошибку в малых выборках.

Таблица 3.1 Распределение вероятности в малых выборках в зависимости от коэффициента доверия и объема выборки


Как видно из табл. 3.1 , при увеличении это распределение стремится к нормальному и при уже мало от него отличается.

Покажем, как пользоваться таблицей распределения Стьюдента.

Предположим, что выборочное обследование рабочих малого предприятия показало, что на выполнение одной из производственных операций рабочие затрачивали времени (мин.): . Найдем выборочные средние затраты:

Выборочная дисперсия

Отсюда средняя ошибка малой выборки

По табл. 3.1 находим, что для коэффициента доверия и объема малой выборки вероятность равна.

Таким образом, с вероятностью можно утверждать, что расхождение между выборкой и генеральной средней лежит в пределах от до, т.е. разность не превысит по абсолютной величине ().

Следовательно, средние затраты времени во всей совокупности будут находиться в пределах от до.

Вероятность того, что это предположение в действительности неверно и ошибка по случайным причинам будет больше, чем, равна: .

Таблица вероятностей Стьюдента часто приводится в иной форме, нежели в табл.3.1 . Считается, что в ряде случаев такая форма более удобна для практического использования (табл. 3.2 ).

Из табл. 3.2 следует, что для каждого числа степеней свободы указана предельная величина, которая с данной вероятностью не будет превышена в силу случайных колебаний результатов выборки.

На основе указанной в табл. 3.2 величины определяются доверительные интервалы : и.

Это область тех значений генеральной средней, выход за пределы которой имеет весьма малую вероятность, равную:

В качестве доверительной вероятности при двусторонней проверке используют как правило, или, что не исключает, однако, выбора и других, не приведенных в табл. 3.2 .

Таблица 3.2 Некоторые значения -распределения Стьюдента

Вероятности случайного выхода оцениваемой средней величины за пределы доверительного интервала соответственно будут равны и, т.е. весьма малы.

Выбор между вероятностями и является до известной степени произвольным. Этот выбор во многом определяется содержанием тех задач, для решения которых применяется малая выборка.

В заключение отметим, что расчет ошибок в малой выборке мало отличается от аналогичных вычислений большой выборке. Различие заключается в том, что при малой выборки вероятность нашего утверждения несколько меньше, чем при больше выборке (в частности, в приведенном ранее примере и соответственно).

Однако все это не означает, что можно использовать малую выборку тогда, когда нужна большая выборка. Во многих случаях расхождения между найденными пределами могут достигать значительных размеров, что вряд ли удовлетворяет исследователей. Поэтому малую выборку следует применять в статистическом исследовании социально-экономических явлений с большой осторожностью, при соответствующем теоретическом и практическом обосновании.

Итак, выводы по результатам малой выборки имеют практическое значение лишь при условии, что распределение признака в генеральной совокупности является нормальным или асимптотически нормальным. Необходимо также принимать во внимание и то, что точность результатов выборки малого объема все же ниже, чем при большой выборке.

А.М. Носовский1*, А.Э. Пихлак2, В.А. Логачев2, И.И. Чурсинова3, Н.А. Мутьева2 СТАТИСТИКА МАЛЫХ ВЫБОРОК В МЕДИЦИНСКИХ ИССЛЕДОВАНИЯХ

"Государственный научный центр Российской Федерации - Институт медико-биологических проблем Российской академии наук, 123007, Москва, Россия; 2ГБОУ ВПО «Московский государственный медико-стоматологический университет имени А.И.Евдокимова» Минздрава России, 127473, Москва, Россия; 3АНО «Артрологическая больница НПО СКАЛ», 109044, Москва, Россия

*Носовский Андрей Максимович, E-mail: [email protected]

♦ Экспериментально найдены характеристики статистических критериев. В результате вычисляли значение статистик W. Ансари-Бредли (Ansari-Bradly) и К. Клотца (Klotz). Для каждой исходной статистики вычисляется нормальная аппроксимация (Z-статистика) и уровень значимости p нулевой гипотезы об отсутствии различий в разбросе значений двух выборок. Если p>

Предлагаемые методы математической статистики позволяют подтверждать достоверность различий полученных результатов даже в небольших группах наблюдений, если различия достаточно значимы. Иллюстрацией служили клинические примеры пациентов с костно-суставной патологией. Ключевые слова: малая выборка, мощность критерия, коксартроз, подагрический полиартрит

A.M. Nosovskiy1, A.E.Pikhlak2, V.A. Logachev2, I.I. Chursinova3, N.AMuteva2 SMALL-DATA STATISTICS ANALYSIS IN MEDICAL STUDIES

1The state research center-institute of medical biological problems of the Russia academy of medical sciences, 123007 Moscow, Russia; 2Moscow State University of Medicine and Dentistry named after A.I. Evdokimov, 127473 Moscow, Russia; 3Arthrology hospital of scientific and practical association SKAL, 109044 Moscow, Russia

♦ The experimentally was found characteristics of statistical criteria. As a result, calculated the value of the statistics by W. An-sari-Bradly and K. Klotz. For each source of statistics calculated normal approximation (Z-statistics) and the significance level of p of the null hypothesis of no difference in the spread of the values of the two samples. Atp>0.05 the null hypothesis can be accepted. Suggested methods of mathematical statistics can be confirming the accuracy of the differences of the results, even in small groups of observations, if the differences are significant enough.

We used medical cases of patients with joint and bone pathology.

Key words: small data analysis, power of criteria, coxarthrosis, gouty arthritis

Принципы доказательной медицины предъявляют высокие требования к достоверности сравнительной оценки полученных результатов исследований. Это становится тем более важным, что большинство врачей имеет весьма поверхностное представление о методиках статистической обработки, ограничиваясь в своих публикациях помимо вычисления процентов, в лучшем случае /-критерием Стьюдента.

Однако для проведения полноценного анализа результатов исследования в ряде случаев этого бывает недостаточно. Не вызывает обычно сомнений достоверность выявленных закономерностей, когда число наблюдений составляет несколько тысяч или даже сотен. А если это - несколько десятков? А если мы имеем лишь несколько случаев? Ведь в медицине встречаются достаточно редкие заболевания, хирурги порой выполняют уникальные операции, когда количество наблюдений совсем невелико. Где та грань, тот необходимый и достаточный объем исследований, позволяющий утверждать о несомненном наличии той или иной закономерности?

Этот вопрос имеет важнейшее значение не только при оценке уже проведенных исследований, но и при планировании научной работы. Достаточно ли провести наблюдение за 20 пациентами или необходимо минимум 40? А может быть, хватит и 10 случаев? От своевременного и правильного ответа на этот вопрос зависит не только достоверность сделанных выводов, но и сроки проведения исследований, их стоимость, потребность в кадрах, оснащении и т.д.

Современная статистика знает довольно много приемов, с помощью которых можно определять достоверность результатов даже при небольшом числе наблюдений. Это - методы «малой выборки». Принято считать, что начало статистике малых выборок было положено в первом десятилетии XX века публикацией работы У Гос -

сета, где он под псевдонимом «Стьюдент» (студент) постулировал так называемое /-распределение. В отличие от теории нормального распределения, теория ^распределения для малых выборок не требует априорного знания или точных оценок математического ожидания и дисперсии генеральной совокупности, а также не требует допущений относительно параметров. В /-распределении одно из отклонений от выборочного среднего всегда фиксировано, так как сумма всех таких отклонений должна равняться нулю. Это сказывается на сумме квадратов при вычислении выборочной дисперсии как несмещённой оценки дисперсии генеральной совокупности и ведёт к тому, что число степеней свободы df получается равным числу измерений минус единица для каждой выборки. Отсюда, в формулах и процедурах вычисления /-статистики для проверки нулевой гипотезы df=w-1. Известны также классические работы крупнейшего английского статистика Р.А. Фишера (в честь которого получило свое название ^-распределение) по дисперсионному анализу - статистическому методу, явно ориентированному на анализ малых выборок. Из многочисленных статистик, которые можно обоснованно применять к малым выборкам, можно упомянуть: критерий точной вероятности Фишера; двухфак-торный непараметрический (ранговый) дисперсионный анализ Фридмана; коэффициент ранговой корреляции / Кендалла; коэффициент конкордации Кендалла; Я-критерий Краскела-Уоллеса для непараметрического (рангового) однофакторного дисперсионного анализа; ^/-критерий Манна-Уитни; медианный критерий; критерий знаков; коэффициент ранговой корреляции г Спирме-на; /-критерий Уилкоксона.

Определённого ответа на вопрос, какой объем должна иметь выборка, чтобы её можно было считать малой, не существует. Однако условной границей между малой и большой выборкой принято считать df=30. Основанием

для этого в какой-то мере произвольного решения служит результат сравнения /-распределения (для малых выборок) с нормальным распределением (г). Расхождение значений / и г имеет тенденцию возрастать с уменьшением и снижаться с увеличением Фактически, 1 начинает тесно приближаться к ъ задолго до предельного случая, когда /=г. Простое визуальное изучение табличных значений / позволяет увидеть, что это приближение становиться довольно быстрым, начиная с ^=30 и выше. Сравнительные величины / (при ^=30) и г равны соответственно: 2,04 и 1,96 для р=0,05; 2,75 и 2,58 для р=0,01; 3,65 и 3,29 для р=0,001.

В математической статистике употребляют коэффициент доверия /, значения функции табулированы при разных его значениях, при этом получают соответствующие уровни доверительной вероятности (табл. 1) .

Коэффициент доверия позволяет вычислить предельную ошибку выборки АХ, вычисляемую по формуле АХср=1цср, т.е. предельная ошибка выборки равна /-кратному числу средних ошибок выборки .

Таким образом, величина предельной ошибки выборки может быть установлена с определённой вероятностью. Как видно из последней графы таблицы 1, вероятность появления ошибки равной или большей утроенной средней ошибки выборки, т. е. АХс =3цс крайне мала и равна 0,003 (1-0,997). Такие маловероятные события считаются практически невозможными, а потому величину АХ =3цс можно принять за предел возможной ошибки выбо рки р3].

Интервал, в который с данной степенью вероятности будет заключена неизвестная величина оцениваемого параметра, называют доверительным, а вероятность Р - доверительной вероятностью . Чаще всего доверительную вероятность принимают равной 0,95 или 0,99, тогда коэффициент доверия 1 равен соответственно 1,96 и 2,58.

Это означает, что доверительный интервал с заданной вероятностью заключает в себе генеральную среднюю.

Чем больше величина предельной ошибки выборки, тем больше величина доверительного интервала и тем, следовательно, ниже точность оценки .

Применение данного подхода может быть проиллюстрировано наблюдением за 20 пациентами с коксартрозом, находившихся на лечении в Артрологической больнице НПО «СКАЛ» (Научно-производственное объединение «Специализированное курсовое амбулаторное лечение») г. Москвы.

При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.

Вероятность ошибки первого рода называется уровнем значимости и обозначается а. Таким образом, а=Р{Ш¥ | Н0}, т.е. уровень значимости а - это вероятность события {Це¥}, вычисленная в предположении, что верна нулевая гипотеза Н0.

Уровень значимости и мощности критерия объединяются в понятии функции мощности критерия - функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута. Функция мощности зависит от критической области ¥ и действительного распределения результатов наблюдений. В параметрической

Таблица 1

Коэффициент доверия t и соответствующие уровни доверительной вероятности

t 1,00 1,96 2,00 2,58 3,00

F(0 0,683 0,950 0,954 0,990 0,997

задаче проверки гипотез распределение результатов наблюдений задается параметром 0. В этом случае функция мощности обозначается М(¥,0) и зависит от критической области ¥ и действительного значения исследуемого параметра 0. Если Н0: 0=00, Н1: 0=01, то М(¥,00) = а, М(¥,01)=1-в, где а - вероятность ошибки первого рода, в - вероятность ошибки второго рода. Тогда, мощность критерия - это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.

Функция мощности М(¥,0) в случае одномерного параметра 0 обычно достигает минимума, равного а, при 0=00, монотонно возрастает при удалении от 00 и приближается к 1 при | 0 - 00 | ^ да.

Оценим необходимую мощность статистических критериев (рис. 1), которые могли бы быть применены для анализа лечения 20 пациентов с коксартрозом.

Как видим, при среднеквадратическом отклонении равном 3,0, что бывает крайне редко, будут получены результаты с высокой степенью надёжности /><0,05, если разность между средними будет превышать 8. Но уже при среднеквадратическом отклонении равном 1,5, эта разность должна превышать всего 4.

Для определения уровня значимости р обычно используется приближенная нормальная 2-аппроксимация соответствующей статистики. Такая аппроксимация дает хорошее приближение при достаточно больших размерах выборок. При малом объеме выборки и значениях р, близких к 0,05, мы проверяли вывод о нулевой гипотезе срав-

Power Curve alpha=0,05, sigma=

Power Curve alpha=0,05, sigma=1,

True Difference Between Means

True Difference Between Means

Рис. 1. Экспериментально найденные характеристики статистических

критериев.

Таблица 2 .

Группы наблюдения

Группа 1 Группа 2 Группа 3 Всего наблюдений

Нимесулид, витамины, хондропротекторы, лечебная физкультура + + + 20

Физиотерапия --- + + 15

Массаж... --- + 8

Боль при движении

Боль в покое 43±13 27±17

нением вычисленного значения статистики с критическим значением в таблице соответствующего распределения из статистического справочника.

Критерии различия сдвига (положения). Мы использовали эти критерии для проверки следующих гипотез:

♦ отсутствие различий во взаимном положении (медианах) двух исследованных выборках;

♦ сдвиг выборок друг относительно друга равен некоторому значению d;

♦ медиана одной анализируемой выборки равна значению d.

В случае б) необходимо было предварительно все значения второй выборки уменьшить на величину d: yi=yi-d.

В случае в) необходимо подготовить вспомогательную парную выборку, все элементы которой равны d.

В результате вычисляли:

♦ значение статистики W. Вилкоксона (Wilco-xon) - сумма рангов Rxi элементов одной из выборок в объединенной ранжированной выборке;

♦ значение статистики V Ван дер Вардена (van der Varden), основанную на использовании метода «произвольных меток».

Для каждой статистики вычислялась нормальная аппроксимация (Z-статистика) и уровень значимости P нулевой гипотезы об отсутствии различий в сдвиге по отношению друг к другу. Если p>0,05 нулевая гипотеза может быть принята.

Некоторые пакеты и авторы предлагают использовать ^/-критерий Манна-Уитни (Mann-Whitney) и критерий Вальда-Вольфовица (Vald-Wolfowitz). Однако давно уже доказано , что критерий Манна-Уитни эквивалентен, т.е. обладает теми же возможностями, что и крите-

Таблица 3 .

Средние показатели интенсивности боли (в баллах по ВАШ)

Группа 1 (n= 5) Группа 2 (n=7) Группа 3 (n= =8)

Показатель Начало наблюдения Конец наблюдения Снижение боли Начало наблюдения Конец наблюдения Снижение боли Начало наблюдения Конец наблюдения Снижение боли

Таблица 4.

Данные лабораторного обследования больного Б.

№ Показатель Норма Результат предпослед- Результат последнего

него посещения посещения

Гематокрит, % 40-48 38,7

Лимфоциты, % 19-37 42

СОЭ, мм/час 2-10 39

Мочевая кислота, мкмоль/л 200-416 504

Креатинин, мкмоль/л 44-106 238

Паратиреоидный гормон, пг/мл 7-53 76,8

Фибриноген, г/л 1,69-3,92 5,7

Белок в моче, г/л 0-0,1 1

43,5 39 10 489 202 101 3

Предпоследнее

Последнее

Рис. 2. р-значения клинических показателей больного Б. при предпоследнем и последнем обследовании.

рий Вилкоксона, а критерий Вальда-Вольфовица страдает сравнительно малой чувствительностью.

Критерии различия масштаба (рассеяния). Мы использовали эти критерии для проверки следующих гипотез:

♦ гипотеза об отсутствии различий в масштабах (в разбросе или рассеянии значений) исследуемых выборок;

♦ гипотеза о том, что отношение масштабов выборок равна заданной величине g.

В последнем случае необходимо предварительно изменить значения второй выборки у1=(у1-т0)^ , где т0 -общая медиана двух исследуемых спектров.

Если медианы генеральных совокупностей, из которых извлечены выборки, не равны по величине, но их

применить, предварительно модифицировав одну из выборок, например, в выборку yi=yi-m2+mr

Если же медианы не равны и не известны, то следует подтвердить гипотезу об отсутствии различий сдвига или же использовать метод для обнаружения произвольных альтернатив.

В результате вычисляли значение статистик W. Ансари-Бредли (Ansari-Bradly) и К. Клотца (Klotz), которые являются концептуальными аналогами статистик Вилкоксона и Ван дер Вардена.

Для каждой исходной статистики вычисляется нормальная аппроксимация (Z-статистика) и уровень значимости P нулевой гипотезы об отсутствии различий в разбросе значений двух выборок. Если />>0.05, нулевая гипотеза может быть принята.

Таким образом, предлагаемые выше методы математической статистики позволяют подтверждать достоверность различий

полученных результатов даже в небольших группах наблюдений, если различия достаточно значимы.

Иллюстрацией могут служить два клинических примера пациентов с костно-суставной патологией.

Клинический пример № 1. У 20 пациентов с кок-сартрозом применяли базовый лечебный комплекс, включающий пероральный прием нимесулида, хондропротекторов, внутримышечные инъекции витаминов и лечебную физкультуру. Кроме этого у 15 из них применяли физиотерапевтическое лечение, а у 6 пациентов - массаж. Таким образом, образовалось 3 группы пациентов с небольшим (от 5 до 8) числом наблюдений (табл. 2).

Среди прочих параметров перед началом лечения и после завершения курса (21±2 дня) оценивали интенсивность боли при движении и в покое по 100-бальной визуальной аналоговой шкале (ВАШ).

Использовались следующие методы статистик W. Ансари-Бредли (Ansari-Bradly) и К. Клотца (Klotz) (табл. 3).

Согласно полученным данным (табл. 3) было отмечено, что снижение боли в покое в группе 1 в конце наблюдения не являлось достоверным. Однако по всем другим изучаемым параметрам выявлены достоверные значения. Рассматриваемый клинический пример свидетельствует о возможности получения достоверных результатов на малом количестве выборки.

В клиническом примере № 2 рассматриваются в динамике лабораторные данные больного Б., страдающего хроническим подагрическим полиартритом, подагрической не-фропатией с явлениями ХПН, которые находились за пределами референсных значений (табл. 4).

Рассчитаем вероятность того, что результаты анализа статистически достоверно выходят за границы клинической нормы. Для этого используем вероятностный калькулятор статистического пакета «STATISTICA 6.0». В данном случае p-значение характеризует ошибку первого рода: вероятность отклонить правильную гипотезу, когда на самом деле она верна. В большинстве случаев результаты предпоследнего посещения статистически достоверно отличаются от нормы (рис. 2). Поскольку пороговый уровень значимости в данном случае мы принимаем равным 0,05, то результаты гематокрита, лимфоцитов, СОЭ, фибриногена статистически значимо улучшились при последнем посещении. Соответственно, клинические показатели мочевой кислоты, креатинина, паратиреоидного гормона и белка в моче, с точки зрения математической статистики, не улучшились.

Таким образом, при планировании исследования важно учитывать мощность применяемых статистических критериев, которые определяются вариабельностью выборки и заданным уровнем значимости.

Предлагаемый подход может быть интересен специалистам в области персонифицированной медицины для

анализа в динамике применяемых методов лечения и лекарственных средств, при контроле за проводимыми лечебными и диагностическими мероприятиями.

ЛИТЕРАТУРА

1. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука; 1995.

2. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука; 2003.

3. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.: ФИЗМАТЛИТ; 2006.

4. Правецкий Н.В., Носовский А.М., Матросова М.А., Холин С.Ф., Шакин В.В. Математическое обоснование достаточного количества измерений для достоверной оценки регистрируемых параметров в космической биологии и медицине. Космическая биология и авиакосмическая медицина. М.: Медицина; 1990; 5: 53-6.

5. ХоллендерМ., Вульф Д.А. Непараметрические методы статистики. М.: Финансы и статистика; 1983.

6. Носовский А.М. Применение вероятностных моделей на окружности в медико-биологических исследованиях. Космическая биология и авиакосмическая медицина. Тезисы докладов IX Всесоюзная конференция. Калуга, 19-21 июня 1990.

7. Носовский А.М., Правецкий Н.В., Холин С.Ф. Математический подход к оценке точности измерений физиологического параметра различными методами. Космическая биология и авиакосмическая медицина. М.: Медицина; 1991; 6: 53-5.

1. Bol"shev L.N., Smirnov N.V. Tables of Mathematical Statistics. Moscow: Nauka; 1995 (in Russian).

2. Korn G., Korn T. Mathematical Handbook for Scientists and Engineers. Moscow: Nauka; 2003 (in Russian).

3. Kobzar" A.I. Applied Mathematical Statistics. For engineers and scientists. Moscow: FIZMATLIT; 2006 (in Russian).

4. Pravetskiy N.V., Nosovskiy A.M., Matrosova M.A., Kholin S.F., Shakin V.V. Mathematical justification of a sufficient number of measurements for reliable evaluation of recorded parameters in space biology and medicine. Space Biology and Aerospace Medicine. Moscow: Meditsina; 1990; 5: 53-6 (in Russian).

5. Khollender M., Vul"f D.A. Non-parametric statistical methods. Moscow: Finansy i statistika; 1983 (in Russian).

6. Nosovskiy A.M. The use of probabilistic models on the circle in biomedical research. Space Biology and Aerospace Medicine. Abstracts of the IX All-Union Conference. Kaluga, June 19-21, 1990 (in Russian).

7. Nosovskiy A.M., Pravetskiy N.V., Kholin S.F. Mathematical approach to estimation accuracy of the physiological parameter by different methods. Space Biology and Aerospace Medicine. Moscow: Me-ditsina; 1991; 6: 53-5 (in Russian).

Выборка – ограниченная по численности группа объектов (в психологии – испытуемых, респондентов) специально отбираемая из генеральной совокупности для изучения ее свойств .

Генеральная совокупность – это все множество объектов, в отношении которого формулируется исследовательская гипотеза .

Изучение на выборке свойств генеральной совокупности называется выборочным исследованием . Практически все психологические исследования являются выборочными, а их выводы распространяются на генеральные совокупности.

Основное требование к выборке испытуемых – ее репрезентативность – представительность, показательность, соответствие характеристик, полученных в результате частичного (выборочного) обследования какой-либо группы, характеристикам этой группы в целом. . Исследователь должен помнить о возможности распространения выводов конкретного обследования на всю популяцию, частью которой является обследуемая группа.

Необходимо очень внимательно подходить к составлению выборки в испытуемых в эмпирическом исследовании. Важно учитывать пол, возраст, социальное положение, уровень образования, состояние здоровья, индивидуально-психологические особенности испытуемых и другие параметры, которые могут оказать влияние на результаты.

Выделяют два основных типа выборки: вероятностную (построенную на математических и статистических расчетах) ицелевую (заданную целью исследования и определяемую доступностью, типичностью и равным представительством испытуемых).

В строгом понимании репрезентативной может быть только вероятностная выборка, т.к. она соответствует принципу рандомизации: одинаково равной вероятности попадания каждого члена генеральной совокупности в выборочную совокупность. Существуют следующие виды вероятностной выборки: простая, случайная, систематическая, стратифицированная, кластерная, многоступенчатая .

Чаще всего в психологических исследованиях применяют целевой отбор, используют целевую выборку. Критериями для построения целевой выборки являются: доступность, типичность, равное представительство. В связи с этим можно выделить следующие виды выборки по принципу целевого отбора: выборка на основании принципа доступных случаев; отбор критических, либо типичных случаев; выборка, построенная на основании метода «снежного кома»; квотная выборка.

Выборка на основании принципа доступных случаев – наиболее распространенный вариант выборки испытуемых. Применяется при изучении больших по численности групп испытуемых, не обладающих уникальными, специфическими параметрами.

Выборка по принципу отбора критических, либо типичных случаев , построенана основаниитеоретических представлений или предшествующего эмпирического опыта исследователя. Из всей обследуемой совокупности испытуемых отбираются те, которые обладают необходимыми специфическими характеристиками.

Пример: Выборку исследования составляют родители, которыми ситуация поступления их ребенка в школу оценивается как стрессовая.

Выборка, построенная по методу «снежного кома» или методу «редких» совокупностей . Первоначально опрашиваются один или несколько человек интересующей исследователя выборочной совокупности, которые в дальнейшем служат источниками информации о других членах данной совокупности. Выборка расширяется в геометрической прогрессии, подобно формирующемуся «снежному кому». Данный метод применяется тогда, когда испытуемые по различным причинам не афишируют свою принадлежность к той или иной группе людей.

Пример: Выборку составляют ученые, исследования которых касаются узкой научной проблемы.

Квотная выборка связана с разбиением изучаемой совокупности на подгруппы на основании социально-демографических или иных характеристик, которые являются важными для проведения исследования. Опираясь на известные пропорции определенных групп в генеральной совокупности, исследователь выделяет «квоту» для каждой обследуемой подгруппы. (Социально-демографические данные можно найти в статистических сборниках, выпускаемых ежегодно отделами статистики регионов).

Пример: Выборка исследования включает мужчин и женщин предпенсионного возраста – 50-60 лет. По статистике мужчины данного возраста составляют 46%, а женщины – 54 % генеральной совокупности. Следовательно, при общей численности выборки 100 человек должно быть обследовано не менее 46 мужчин и 54 женщин.

Одни из важных вопросов психологического исследования является вопрос объема выборки испытуемых , который должен обеспечивать доказательность выводов научного исследования. Исходя из методов математической обработки, к объему выборки предъявляются следующие требования:

    Наибольший объем выборки необходим при разработке диагностической методики – от 200 до 1000-2500 человек.

    При сравнении двух выборок, их общая численность должна быть не менее 50 человек. При этом численность сравниваемых выборок должна быть примерно одинаковой.

    При изучении взаимосвязи между свойствами, чертами и т.п. объем выборки должен быть не меньше 30-35 человек.

    Если для обработки данных применяется факторный анализ, важно помнить, что надежные факторные решения можно получить лишь в том случае, если количество испытуемых превышает число регистрируемых переменных в три и более раз.

    Чем больше изменчивость изучаемого свойства, тем больше объем выборки. Изменчивость можно уменьшить, увеличивая однородность выборки, например, по полу, возрасту и т.д. Но возможности распространения выводов исследования на генеральную совокупность уменьшатся.

    Целесообразно увеличение количества испытуемых на 5-10 % по сравнению с планируемым, так как часть полученных бланков будет отбракована в ходе исследования (не поняли инструкцию, не приняли задачу, дали отклоняющиеся результаты и т.п.) .

Зависимые и независимые выборки

Часто исследование строится таким образом, что свойство, интересующее исследователя, изучается на двух или более выборках с целью их дальнейшего сравнения. Эти выборки могут находиться в различных соотношениях – в зависимости от цели и задач исследования.

Независимые выборк и характеризуются тем, что вероятность отбора любого испытуемого из одной выборки не зависит от отбора любого испытуемого другой выборки.

Зависимые выборки характеризуются тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки.

Пример 1: Зависимые выборки – два ряда значений, полученных при обследовании одной и той же группы испытуемых: измерено состояние какого-либо свойства «до» и «после» экспериментального воздействия.

В этом случае выборки (одна – «до», другая – «после» воздействия) зависимы в максимально возможной степени, так как они включают одних и тех же испытуемых.

Пример 2: Зависимые выборки: мужья – 1 выборка, жены – 2 выборка.

Пример 3: Зависимые выборки: дети 5-7 лет – 1 выборка, их братья и сестры – 2 выборка.

В примерах 2,3 представлены варианты менее зависимых выборок.

В общем случае зависимые выборки предполагают попарный подбор испытуемых в сравниваемые выборки, а независимые выборки – независимый отбор испытуемых .