4.2. Алгоритм формирования выборочной совокупности
Выборочная совокупность формируется из основы выборки, распределенной по видам экономической деятельности ОКВЭД2, на региональном уровне.
Совокупность СОНКО делится на три массива.
1) В первый массив входят СОНКО, включенные в реестры социально ориентированных некоммерческих организаций - получателей поддержки федеральных органов власти, органов власти субъектов Российской Федерации, а также органов местного самоуправления; частично финансируемые из бюджетов различных уровней; получатели грантов, представленных за счет субсидий из федерального бюджета; включенные в реестры поставщиков социальных услуг; исполнители общественно-полезных услуг; вновь образованные; особо крупные организации (алгоритм определения особо крупных организаций приведен ниже). Если количество организаций по исследуемому виду экономической деятельности по ОКВЭД2 <= 3, то такие организации включаются в первый массив.
Определение особо крупных организаций
Для выявления особо крупных организаций используется метод Тьюки, основанный на применении квартилей.
В данном методе границы предельно-допустимого интервала рассчитываются с помощью следующих формул:
верхняя граница = третий квартиль + 1.5 x (третий квартиль - первый квартиль),
нижняя граница = первый квартиль - 1.5 x (третий квартиль - первый квартиль).
Квартили определяются как величины, делящие ранжированный ряд значений показателя на четыре равные по количеству единиц группы.
Квартиль порядка 0 (q0) - минимальное значение, квартиль порядка 1/4 - первый квартиль, квартиль порядка 1/2 - медиана, квартиль порядка 3/4 - третий квартиль, четвертый квартиль - максимальное значение.
Если у организации значение исследуемого признака превышает верхнюю границу, то необходимо организацию с данными признаками перенести в первый массив. Далее необходимо повторить процесс вычислений до тех пор, пока не получим ряд без резко выделяющихся значений.
2) Во второй массив включаются СОНКО, у которых имеются данные о размере поступлений денежных средств и иного имущества (> 0) за прошлый год и которые не включены в первый массив.
3) В третий массив включаются остальные СОНКО, не включенные в первый и второй массивы.
Объемы выборки в каждом массиве определяются отдельно.
Организации первого массива обследуются сплошным методом.
Организации из второго массива отбираются после проведения процедуры расслоения и в соответствии с оптимальным размещением Неймана по признаку "всего поступило средств".
Организации из третьего массива - с использованием метода пропорционального размещения по видам экономической деятельности.
Второй массив
Расслоение второго массива производится по признаку "всего поступило средств" и по видам экономической деятельности по ОКВЭД2. Для расчета объема выборки во втором массиве определяем количество слоев по исследуемому признаку (показателю) "всего поступило средств" по каждому исследуемому виду экономической деятельности по ОКВЭД2.
Границы слоев выбираются по правилу Экмана.
Nj (Cj - Cj-1) = const,
где
|
Cj, j = 1, ..., J
|
-
|
границы слоев;
|
C0 = xmin
|
-
|
минимальное значение показателя в исследуемом виде экономической деятельности;
|
|
Cj = xmax
|
-
|
максимальное значение показателя в слое j исследуемого вида экономической деятельности;
|
|
x
|
-
|
количественный признак;
|
|
Nj
|
-
|
количество организаций в слое j.
|
Количество организаций в каждом слое должно быть больше или равно (>=) 4.
Слои по каждому виду экономической деятельности по ОКВЭД2 должны быть сформированы таким образом, чтобы:
в них попали все СОНКО, образующих основу выборки исследуемого вида экономической деятельности второго массива;
слои должны быть закрытыми, т.е. для каждого слоя должна быть определена минимальная и максимальная границы по значению показателя "всего поступило средств";
разница между минимальной и максимальной границами соседних слоев должна быть равна единице;
организации с одинаковым значением показателя "всего поступило средств" не могут быть отнесены к разным слоям.
Далее определяем объем выборки по каждому виду экономической деятельности по ОКВЭД2 по показателю "всего поступило средств".
где
|
n2g
|
-
|
объем выборки в g виде экономической деятельности во 2 массиве;
|
N2gj
|
-
|
количество организаций слоя j, принадлежащего g-му виду экономической деятельности во 2 массиве;
|
|
X2g
|
-
|
суммарное значение показателя ("всего поступило средств") для организаций, относящихся ко 2 массиву базовой совокупности по виду экономической деятельности g;
|
|
S2gj
|
-
|
среднеквадратическое отклонение по показателю "всего поступило средств" для организаций слоя j, принадлежащего g-му виду экономической деятельности во 2 массиве;
|
|
RE
|
-
|
заданная относительная погрешность этого показателя.
рекомендуется для выборки значение RE = 0,05;
|
|
tp
|
-
|
квантиль стандартного нормального распределения или распределения Стьюдента, соответствующий доверительной вероятности p = 0,95.
|
Если количество объектов, относящихся ко второму массиву базовой совокупности по виду экономической деятельности g по ОКВЭД2, больше 60, то tp берется из таблиц стандартного нормального распределения, в противном случае tp находится по таблице распределения Стьюдента. Для нормального распределения при доверительной вероятности 0,95 tp = 1,96.
По исследуемому виду экономической деятельности по ОКВЭД2 распределяем объем выборки по слоям. Объем выборки в j-м слое:
где
|
n2gj
|
-
|
объем выборки в j слое g-го вида экономической деятельности во 2 массиве;
|
n2g
|
-
|
объем выборки в g виде экономической деятельности во 2 массиве;
|
|
N2gj
|
-
|
количество организаций слоя j, принадлежащего g-му виду экономической деятельности во 2 массиве;
|
|
S2gj
|
-
|
среднеквадратическое отклонение по показателю "всего поступило средств" для организаций слоя j, принадлежащего g-му виду экономической деятельности во 2 массиве.
|
Далее определяем объем выборки для второго массива:
где
|
n2
|
-
|
объем выборки во 2 массиве;
|
n2g
|
-
|
объем выборки в g виде экономической деятельности во 2 массиве.
|
Третий массив
Расслоение третьего массива осуществляется по видам экономической деятельности по ОКВЭД2.
Объем выборки (n3) в третьем массиве определяется из расчета 30% от количества организаций базовой совокупности третьего массива. Объем выборки по g-му виду экономической деятельности в третьем массиве:
где
|
n3g
|
-
|
объем выборки в g виде экономической деятельности в 3 массиве;
|
n3
|
-
|
объем выборки в 3 массиве;
|
|
N3g
|
-
|
количество организаций g-го виду экономической деятельности в 3 массиве;
|
|
N3
|
-
|
количество организаций в 3 массиве.
|
Наименьший объем выборки в g виде экономической деятельности в третьем массиве n3g должен быть >= 3.
Таким образом, общий объем выборки по трем массивам:
n = n1 + n2 + n3,
где
|
n
|
-
|
общий объем выборки,
|
n1, n2, n3,
|
-
|
объемы выборок соответственно в 1, 2, 3 массивах.
|
В выборочную совокупность отбираются:
все СОНКО первого массива с вероятностью равной единице;
СОНКО из второго и третьего массивов основы выборки методом простого случайного отбора.