2.3.2. Формирование выборочной совокупности

2.3.2. Формирование выборочной совокупности

Выборочная совокупность представляет собой объединение всех единиц наблюдения, включенных в первый массив, и независимых расслоенных случайных выборок из второго и третьего массивов.

Список единиц второго массива на региональном уровне расслаивается по кодам ОКВЭД2 на уровне 3 знаков для оптовой торговли и 4 знаков для розничной торговли. Для расслоения по показателю выручки используется алгоритм, основанный на правиле Экмана. Согласно ему для достижения минимальной дисперсии оценки показателя границы слоев нужно выбирать такими, чтобы наилучшим образом выполнялось следующее приближенное равенство:

, (1)

где Nh - объемы слоев;

ch, h = 1, ..., H, - границы слоев;

c0 = xmin, cH = xmax - минимальное и максимальное значение расслаивающего признака.

Таким образом, из 2 массива производится расслоенный случайный отбор, предусматривающий группировку по следующим признакам:

- коды okved 3 или 4 знака (подклассы),

- выручка.

Для субъектов Российской Федерации, в составе которых есть автономные округа, вводится дополнительный признак расслоения - по автономным округам и территории области без автономных округов. При этом сначала проводится расслоение по этому признаку, а затем по кодам ОКВЭД2:

- коды okato;

- коды okved 3 или 4 знака (подклассы);

- выручка.

Объем выборки из второго массива составляет не более 20% от числа предприятий, включенных в данный массив. В целях распределения установленного объема выборки по слоям используется метод оптимального размещения по Нейману по показателю выручка.

Оптимальное размещение задается соотношением:

, (2)

где n - объем выборки;

H - число слоев,

h = 1, 2 ... H - номер слоя;

nh - объем выборки из h-го слоя;

Nh - объем h-го слоя;

- дисперсия h-го слоя, рассчитывается по формуле:

,

где

xk - значение признака (выручки) элемента k основы выборки,

- среднее значение признака в h-ом слое.

Список единиц третьего массива расслаивается только по кодам ОКВЭД2 на уровне 3 или 4 знаков.

В целях распределения установленного для 3 массива объема выборки по слоям используется метод пропорционального размещения.

Пропорциональное размещение задается соотношением:

, (3)

где n - объем выборки;

H - номер слоя;

nh - объем выборки из h-го слоя;

Nh - объем h-го слоя;

N - объем массива.

Для субъектов Российской Федерации, в составе которых есть автономные округа, вводится дополнительный признак расслоения (для 2 и 3 массивов) по автономным округам и территории области без автономных округов. При этом сначала проводится расслоение по этому признаку, а затем видам деятельности по кодам ОКВЭД2.

Минимально допустимый объем выборки из слоев - 2. Если объем слоя меньше установленного минимума, то слой включается в выборку целиком.

Для предприятий 2 и 3 массивов рекомендуемый объем выборки составляет 20% (возможно снижение объема выборки до 10%).