Учет качественных параметров в регрессионном анализе
Секция: Экономика
лауреатов
участников
лауреатов
участников
XLI Студенческая международная заочная научно-практическая конференция «Молодежный научный форум: общественные и экономические науки»
Учет качественных параметров в регрессионном анализе
Актуальность. Использование статистики в оценке того или иного объекта является популярной темой для оценщика. Статистические операции, которые давно известны специалистам в области экономики делают вычисления более достоверными и аргументированными.
Наиболее надежным и результативным статистическим инструментом для оценщика является регрессионный анализ. Он позволяет обнаружить ценообразующие факторы и установить тип взаимосвязи. Однако при его применении оценщики встречаются с многочисленными трудностями (малое количество аналогов, недоступность данным по объектам, изменчивость рынков и другие). В данной публикации будут рассматриваться возможности учета качественных параметров в построении регрессионных зависимостей.
Параметры, описывающие свойства того либо другого объекта оценки формируются под воздействием большого количества разных факторов: количественных и качественных. Значения количественных параметров представляются в виде числа. Примерами данных параметров выступают, например, прибыль предприятия, площадь объекта, температура воздуха, возраст человека и т.п.
Но далеко не всегда получается охарактеризовать целиком тот или иной объект только лишь количественными параметрами. В построении регрессионной модели часто возникает потребность ввести в исследование качественные параметры и изучить их воздействие на результирующую переменную. Определить качественные параметры при помощи числа невозможно. Их величина отображается рисунком, текстовым изложением либо иным объясняющим его значение методом. Примерами могут служить: пол, образование, должность, национальность, место проживания, время года, вкусы потребителя и др.
Учет качественных параметров в регрессионном анализе можно выполнить разными методами. На первый взгляд простейшим решением является построение индивидуальных моделей отдельно для каждого значения качественного параметра. Так как чем меньше учитывается параметров в модели, тем легче решение задачи. Однако, на самом деле подобное решение не всегда наилучшее [2].
Другим вариантом является учет качественных параметров в модели, для которой используют фиктивные переменные. Этот метод считается более эффективным, благодаря возможности дать оценку значимости воздействия этого фактора на зависимую переменную на фоне других параметров, включенных в модель, и тем самым повысить точность модели за счет введения большего числа аналогов.
Фиктивная переменная (англ. dummy variable) – в эконометрике это переменная модели, полученная через преобразование данных, когда качественные параметры преобразованы в количественные (в данном случае этим качественным параметрам присваиваются определенные числовые метки), включающей качественные и прочие не поддающиеся числовой оценке значения. Также в литературе можно столкнуться с определениями «искусственные переменные» и «структурные переменные».
Чаще всего это переменная дихотомического (бинарного) вида, которая может принимать только лишь два значения: ноль и единица. При этом ноль обозначает отсутствие признака, а единица – его наличие [1].
Например, «условие действует – условие не действует», «сезон весенний – сезон осенний», «есть среднее полное образование – нет среднего полного образования» и др.
Рассмотрим все вышесказанное на примере. Допустим, необходимо изучить зависимость почасовой оплаты труда – y (измеряется в денежных единицах в час), не только от итоговых результатов выпускного теста - x (измеряется в баллах), но и от признака D – пол. Пол – это типичные пример качественных параметров, которые должны быть преобразованы в числовую форму так, чтобы они могли быть использованы в уравнении регрессии. Поскольку пол может быть мужской или женский, то это параметры с двумя категориями. Поэтому мы должны решить, какая категория будит учитываться в качестве ссылки. Если независимая переменная D должна представлять мужчин, то она может принять значение 1 для мужчин и 0 для всех остальных значений в наборе данных.
Регрессионная модель имеет вид:
Следовательно, фиктивная переменная D для мужчин может быть выражена таким образом:
Запишем уравнение отдельно как для мужчин, так и для женщин:
Уравнение для мужчин: , где D=1
Уравнение для женщин: , где D=0
Соответственно, для мужчин почасовая оплата труда составляет д.е., а для женщин д.е..
$
То есть, при одинаковых результатах теста почасовая оплата мужчин будет выше почасовой оплаты женщин на 2,4 денежных единиц [3].
В результате можно сказать, что большую часть объектов оценки невозможно описать только лишь качественными параметрами, для этого включают качественные параметры. Такие параметры, как пол, вид объекта, местоположение предмета, материал основных элементов и другие нередко оказывают значительное воздействие на результат исследования. Также при проведении регрессионного анализа следует учитывать отличия в качественных параметрах, для этого в модель чаще всего вводят одну или несколько фиктивных переменных. Фиктивные переменные являются простым способом введения данных в регрессионный анализ. Их использование дает возможность гибко учитывать воздействие качественных факторов, в том числе структурных и прочих изменений.