IX. Требования к обработке данных исследования

IX. Требования к обработке данных исследования

69. Показателями проверки качества данных исследования являются в том числе:

проверка анкет на полноту заполнения - 100 процентов анкет заполнены полностью (дан ответ на каждый вопрос согласно логической схеме, заложенной в анкете);

проверка анкет на правильность заполнения - 100 процентов анкет заполнены без исправлений и с учетом соблюдения смыслового содержания ответа на поставленный вопрос;

проверка правильности процедуры прохождения маршрута в рамках социологического опроса в части "бытовой" коррупции - не менее 95 процентов анкет должны полностью соответствовать разработанной маршрутной карте;

проверка правильности процедуры рассылки в рамках социологического опроса в части "деловой" коррупции - 100 процентов анкет должны соответствовать плановой выборке рассылки;

проверка анкет на соответствие геолокации и времени проведения каждого интервью в рамках социологического опроса в части "бытовой" коррупции - не менее 95 процентов анкет должны иметь четко идентифицируемые координаты точки геолокации в рамках установленного счетного участка, а также адекватную длительность проведения одного интервью.

70. В случае формирования территориальной выборки в отношении "бытовой" коррупции в административно-территориальных единицах субъекта Российской Федерации с целью нивелирования искажения общей выборки в части доли респондентов соответствующих территорий для восстановления правильных пропорций необходимо провести процедуру взвешивания данных, которая подразумевает вычисление для каждой административно-территориальной единицы субъекта Российской Федерации весового коэффициента (веса), который зависит от численности его населения и от числа опрошенных.

71. По результатам проведения исследования в субъекте Российской Федерации предоставляется в том числе полученная в ходе исследования база данных в форматах Excel и SPSS (Statistical Package for the Social Sciences) (наряду с данными в случае ремонта выборки предоставляются коэффициенты перевзвешивания). Полученная база данных в Excel и SPSS должна пройти логическую проверку на непротиворечивость данных, отсутствие пропущенных значений и дублирования записей.

72. Общий массив данных в форматах Excel и SPSS состоит из основной и дополнительной частей. Основной массив данных формируется в соответствии со структурой базовых анкет, дополнительный массив данных - со структурой вариативных частей анкет. Последовательность вопросов и вариантов ответа является фиксированной согласно базовой и вариативной частям анкет. В качестве имен переменных ответов необходимо использовать номера вопросов с добавлением символа Q (от слова "question" - вопрос).

73. В качестве названий (меток) переменных и альтернатив необходимо использовать дословные формулировки вопросов и вариантов ответа. В случае если длина формулировки вопроса превышает 255 символов или длина формулировки ответа превышает 120 символов, соответствующая формулировка сокращается до указанной в настоящем пункте длины формулировки с учетом сохранения смысловой целостности.

74. По результатам опроса должен быть сформирован массив данных в форматах Excel и SPSS, содержащий формулировки вопросов и варианты ответов в закодированном виде.

75. Закрытым вопросам, в которых можно выбрать только один ответ, в массивах Excel и SPSS должна соответствовать одна переменная, которая содержит код выбранного ответа.

76. Для закрытых вопросов, в которых можно выбрать несколько вариантов ответа, каждому варианту должна соответствовать отдельная переменная, в имя которой входит номер вопроса и номер альтернативы. Например, в случае, если в вопросе N N пять альтернатив, то ему соответствуют пять переменных "QN_1", "QN_2", "QN_3", "QN_4", "QN_5" соответственно, каждая из которых принимает значение 1 или 0 в зависимости от того, выбрал респондент эту альтернативу или нет.

77. Вопросам, которые могут принимать числовые значения, должна соответствовать одна переменная, которая может принимать все допустимые числовые значения, а также значения кодов, заданных для особых ответов. Например, в случае, если в вопросе N M требуется указать месячный доход в рублях, то ему соответствует переменная QM, значениями которой могут быть числа от 0 до максимально заданного в программе ввода (например, 999999), а также отрицательные числа -1 или -2, которыми кодируются "отказ от ответа" и "затрудняюсь ответить".

78. Открытым вопросам, в которых предусмотрен свободный ответ в виде:

текста, - должна соответствовать одна текстовая переменная (ее имя начинается с символа T вместо Q), которая содержит тексты ответов респондентов;

числового значения, - должна соответствовать одна переменная (ее имя начинается с символа N вместо Q), которая содержит числовые ответы респондентов.

79. Для полуоткрытых вопросов, в которых можно выбрать варианты из предложенных или дать свой вариант ответа в свободной форме, к стандартным переменным, содержащим коды выбранных альтернатив, необходимо добавить еще одну текстовую переменную, которая содержит текстовые пояснения к свободной позиции. Например, если в полуоткрытом вопросе N L предлагается 18 альтернатив, среди которых есть позиция "другое (укажите)", то ему соответствуют две переменных - TL и QL. Переменная TL содержит ответ респондента в свободной форме, если он не смог выбрать ни одну из предложенных альтернатив и остановился на варианте "другое".

80. Табличные вопросы, которые представляют собой набор однотипных вопросов с общим порядковым номером, в массиве данных должны быть представлены отдельными переменными в соответствии со своими типами. Их отличие состоит в двойной нумерации переменных. Например, в случае, если вопрос N 9 состоит из 15 однотипных вопросов с номерами 9.1 - 9.15, то в массиве ему соответствуют 15 переменных "Q_9_1", "Q_9_2", ..., "Q_9_15" соответственно.