Множественная регрессия и корреляция. Спецификация модели парной регрессии Спецификация модели выбор уравнения регрессии

Основой эконометрики является построение эконометрической модели и определение возможностей использования данной модели для описания анализа и прогнозирования реальных экономических процессов. Цели курсового проекта – разработка проектных решений по информационно-методическому обеспечению исследования в области эконометрического моделирования а также получение практических навыков построения и исследования эконометрических моделей. Конечной прикладной целью эконометрического моделирования реальных социально-экономических процессов в данном...


Поделитесь работой в социальных сетях

Если эта работа Вам не подошла внизу страницы есть список похожих работ. Так же Вы можете воспользоваться кнопкой поиск


МИНОБРНАУКИ РОССИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«Тверской государственный технический университет»

(ТвГТУ)

Институт дополнительного профессионального образования

Кафедра «Бухгалтерский учет, анализ и аудит»

Курсовой проект

По дисциплине: «Эконометрика»

На тему: «Сравнительный анализ эконометрических моделей регрессии»

ВЫПОЛНИЛА: студентка 3курса

Института ДПО и П

Группы РБАиА-37-12

Замятина

Кристина Дмитриевна

(Ф.И.О. студента)

ПРОВЕРИЛА:

Коновалова А. С.

(Ф.И.О. преподавателя)

Ржев 2015

ВВЕДЕНИЕ

ГЛАВА 1. АНАЛИТИЧЕСКАЯ ЧАСТЬ

Основы эконометрического исследования моделей регрессии.

Технология эконометрического исследования моделей регрессии.

ГЛАВА 2. ПРОЕКТНАЯ ЧАСТЬ

2.1 Информационно-методическое обеспечение

эконометрического исследования

Парная и множественная регрессии.

ЗАКЛЮЧЕНИЕ

Список ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ВВЕДЕНИЕ

Эконометрика – это наука, предметом изучения которой являются количественные закономерности и взаимозависимости в экономике на основании методов математической статистики. Основой эконометрики является построение эконометрической модели и определение возможностей использования данной модели для описания, анализа и прогнозирования реальных экономических процессов.

Создавая возможность для принятия обоснованных экономических решений, эконометрический анализ является основой экономического анализа и прогнозирования.

В любой области экономики деятельность специалиста требует применения современных методов работы, основанных на эконометрических моделях, концепциях и приемах.

В качестве предмета эконометрического исследования в курсовом проекте выбрано количество прибывших в страны ЕС на постоянное место жительства. Миграционные процессы являются чрезвычайно важным фактором для оценки перспектив развития общества, поэтому актуальность темы исследования обуславливает рост социальной значимости этих процессов в современном мире.

Экономическое исследование миграционных процессов - существенный фактор повышения эффективности развития стран. История развития человечества неразрывно связана с изменениями динамики численности населения. В Европе быстрый рост населения обусловлен в первую очередь социально-экономическими изменениями, т.е. следует за экономическим ростом и изменениями в социальной сфере.

Цели курсового проекта – разработка проектных решений по информационно-методическому обеспечению исследования в области эконометрического моделирования, а также получение практических навыков построения и исследования эконометрических моделей.

Задача курсового проекта – использование на практике знаний и навыков в построении и исследовании эконометрических моделей для проведения эконометрического анализа данных.

Конечной прикладной целью эконометрического моделирования реальных социально-экономических процессов в данном курсовом проекте является прогноз экономических и социально-экономических показателей, характеризующих состояние и развитие анализируемой системы, то есть определение тенденций миграционных процессов в странах ЕС и их зависимость от имеющихся факторов, учитываемых при построении эконометрической модели.

ГЛАВА 1. АНАЛИТИЧЕСКАЯ ЧАСТЬ

1.1. Основы эконометрического исследования моделей регрессии.

Экономической дисциплиной, занимающейся разработкой и применением статистических методов для измерения взаимосвязей между эконометрическими переменными, является эконометрика, представляющая собой комбинацию экономической теории, статистики и математики.

Эконометрические данные не являются результатами контролируемого эксперимента. Эконометрика имеет дело с конкретными экономическими данными и занимается количественным описанием конкретных взаимосвязей, то есть заменяет коэффициенты, представленные в общем виде, конкретными численными значениями. В эконометрике разрабатываются специальные методы анализа, позволяющие снизить влияние ошибок измерения на полученные результаты.

Главный инструмент эконометрики - эконометрическая модель, то есть формализованное описание количественных взаимосвязей между переменными. В методологии моделирования заложены большие возможности саморазвития, поскольку моделирование – это циклический процесс, за каждым циклом может последовать следующий, а знания об исследуемом объекте расширяются и уточняются, исходная модель постепенно совершенствуется. Недостатки, обнаруженные после предыдущего цикла моделирования, обусловленные малым знанием объекта и ошибками в построении модели, можно исправить в последующих циклах.

Можно выделить три класса эконометрических моделей:

Модель временных данных;

Регрессионная модель с одним уравнением;

Система одновременных уравнений.

Классификация задач, решаемых с помощью эконометрической модели: 1) по конечным прикладным целям:

Прогноз эконометрических и социально-экономических показателей, характеризующих состояние и развитие анализируемой системы;

Имитация возможных сценариев социально-экономического развития системы.

2) по уровню иерархии:

Задачи макроуровня (страна в целом);

Задачи мезоуровня (регионы, отрасли, корпорации);

Микроуровень (семья, предприятие, фирма).

3) по профилю эконометрической системы, направленные на изучение:

Рынка;

Инвестиционной, финансовой или социальной политики;

Ценообразование;

Распределительных отношений;

Спроса и потребления;

Комплекса проблем.

Основные этапы эконометрического моделирования:

1 этап - постановочный. Определение конечных целей модели, набора участвующих в ней факторов и показателей, их роли. Основные цели исследований: анализ состояния и поведения экономического объекта, прогноз его экономических показателей, имитация развития объекта, выработка управленческих решений.

2 этап - априорный. Анализ сущности изучаемого объекта, формирование и формализация известной до начала моделирования информации.

3 этап - параметризация. Выбор общего вида модели, состава и формы входящих в нее связей. Основная задача этого этапа - выбор функции f(Х).

4 этап - информационный. Сбор необходимой статистической информации.

5 этап - идентификация модели. Статистический анализ модели и оценка ее параметров. Основная часть эконометрических исследований.

6 этап - верификация модели. Проверка адекватности модели, оценка точности модельных данных. Выясняется, насколько удачно решены проблемы спецификации и идентификации, какова точность расчетов по данной модели. Проверяется, насколько соответствует построенная модель моделируемому реальному экономическому объекту или процессу.

При моделировании экономических процессов в эконометрических моделях используют:

1. Пространственные данные - набор сведений по разным объектам, взятым за один и тот же период времени.

2. Временные данные - набор сведений, характеризующих один и тот же объект, но за разные периоды времени.

Набор сведений представляет собой множество признаков, характеризующих объект исследования. Признаки могут выступать в одной из двух ролей: роль результативного признака и роль факторного признака.

Переменные делятся на:

Экзогенные, значения которых задаются извне;

Эндогенные, значения которых определяются внутри модели;

Лаговые - эндогенные или экзогенные переменные эконометрической модели, датированные предыдущими моментами времени и находящиеся в уравнении с текущими переменными;

Предопределенные - экзогенные переменные, привязанные к прошлым, текущим и будущим моментам времени и лаговые эндогенные переменные, уже известные к данному моменту времени.

В эконометрике в основном рассматривают ошибки спецификации модели, предполагая, что ошибки измерения сведены к минимуму.

Спецификация модели - выбор вида функциональной зависимости (уравнения регрессии). Величина случайных ошибок не будет одна и та же для спецификаций модели, и сведение остаточного члена к минимуму позволяет выбрать наилучшую спецификацию.

Помимо выбора спецификации модели не менее важно также правильное описание структуры модели. Значение результативного признака может зависеть не от фактического значения объясняющей переменной, а от значения, которое ожидалось в предыдущем периоде.

Простейшая регрессионная модель всего лишь с двумя переменными входит в класс регрессионных моделей с одним уравнением, в которых одна объясняемая переменная представляется в виде функции от нескольких независимых (объясняющих) переменных и параметров. Этот класс включает модели множественной регрессии.

Более простыми являются модели временных рядов, которые объясняют поведение временного ряда, исходя только из его предыдущих значений, это модели:

Тренда,

Сезонности,

Адаптивного прогноза,

Скользящего среднего и др.

Более общими являются системы одновременных уравнений, в которых кроме объясняющих переменных в правых частях могут находиться также и объясняемые переменные из других уравнений, т.е. отличные от объясняемой переменной, стоящей в левой части данного уравнения.

При использовании отдельных уравнений регрессии предполагается, что факторы можно изменять независимо друг от друга, хотя в действительности их изменения не независимы, а изменение одной переменной чаще всего влечет за собой изменения во всей системе признаков, т.к. они являются взаимосвязанными. Необходимо уметь описывать структуру связей между переменными с помощью системы одновременных (структурных) уравнений.

Статистические и математические модели экономических явлений и процессов определяются спецификой той или иной области экономических исследований. Теория и практика экспертных оценок - важный раздел эконометрики, так как экспертные оценки используют для решения ряда экономических задач.

Более известными в теоретических и учебных публикациях являются различные эконометрические модели, предназначенные для прогнозирования макроэкономических показателей. Это обычно модели, имеющие целью прогнозирование многомерного временного ряда. Они представляют собой систему линейных зависимостей между прошлыми и настоящими значениями переменных. В таких задачах оценивают как структуру модели, т.е. вид зависимости между значениями известных координат вектора в прежние моменты времени и их значениями в прогнозируемый момент, так и коэффициенты, входящие в эту зависимость. Структура такой модели - объект нечисловой природы. Свои эконометрические модели соответствуют каждой области экономических исследований.

1.2. Технология эконометрического исследования моделей регрессии.

Исследование и количественная оценка объективно существующих взаимосвязей и зависимостей между экономическими явлениями - основная задача эконометрики.

Причинно-следственное отношение – это такая связь между явлениями, при которой изменение одного из них, называемого причиной, ведет к изменению другого, называемого следствием. Следовательно, причина всегда предшествует следствию.

Причинно-следственные отношения между явлениями представляют наибольший интерес для исследователя, что позволяет выявлять факторы, оказывающие основное влияние на вариацию изучаемых явлений и процессов.

Причинно-следственные связи в социально-экономических явлениях обладают следующими особенностями:

1. причина Х и следствие Y взаимодействуют не непосредственно, а через промежуточные факторы, которые при анализе опускаются.

2. социально-экономические явления развиваются и формируются в результате одновременного воздействия большого числа факторов. Одной из главных проблем при изучении этих явлений становится задача выявления основных причин и абстрагирование от второстепенных.

По направлению изменения связи подразделяются:

1. прямые (изменение результативного и факторного признаков происходит в одном направлении),

2. обратные (изменение результативного и факторного признаков происходит в противоположных направлениях).

По характеру проявления различают:

1. функциональная связь - связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака, проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности, изучается в основном в естественных науках.

2. стохастическая зависимость - причинная зависимость, которая проявляется не в каждом отдельном случае, а в общем, при большом числе наблюдений, а одним и тем же значениям факторных признаков, как правило, соответствуют различные значения результативного признака, но, рассматривая всю совокупность наблюдений можно отметить наличие определенной зависимости между значениями признаков. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

По аналитическому выражению выделяют связи:

1. линейные: изменение результативного признака прямо пропорционально изменению факторных признаков.

2. нелинейные.

Аналитически линейная стохастистическая связь между явлениями может быть представлена уравнением прямой линии на плоскости, либо уравнением гиперплоскости в n-мерном пространстве (при наличии n факторных переменных).

Построение эконометрической модели - это основа эконометрического исследования. От того, насколько хорошо полученная модель описывает изучаемые закономерности между экономическими процессами, зависит степень достоверности результатов анализа и их применимости.

Построение эконометрической модели начинается со спецификации модели, заключающейся в получении ответа на два вопроса:

1) какие экономические показатели должны быть включены в модель;

2) какой вид имеет аналитическая зависимость между отобранными признаками.

В исследованиях, посвященных разработке методов прогнозирования таких финансовых показателей, как курсы валют, ценных бумаг, индексов широко применяются модели, основанные на предположении, что динамика этих процессов полностью определяется внутренними условиями.

После выделения совокупности рассматриваемых переменных следующим этапом является определение конкретного вида модели, наилучшим образом соответствующего изучаемому явлению.

По характеру связей факторов с переменной у модели подразделяются на линейные и нелинейные. По свойствам своих параметров модели подразделяются на модели с постоянной и переменной структурой.

Особый вид моделей составляют системы взаимосвязанных эконометрических уравнений.

Если на основе предварительного качественного анализа рассматриваемого явления не удается однозначно выбрать наиболее подходящий тип модели, то рассматриваются несколько альтернативных моделей, среди которых в процессе исследования выбирается та, которая в наибольшей степени соответствует изучаемому явлению.

В общем случае процедуру построения эконометрической модели можно представить в виде следующих этапов:

1. Спецификация модели, т. е. выбор класса моделей, наиболее подходящих для описания изучаемых явлений и процессов.

Этот этап предполагает решение двух задач:

а) отбор существенных факторов для их последующего включения в модель;

б) выбор типа модели, т. е. выбор вида аналитической зависимости, связывающей включенные в модель переменные.

2. Оценка параметров модели, т. е. получение численных значений констант модели. При этом используется предварительно полученный массив исходных данных.

3. Проверка качества построенной модели и обоснование возможности ее дальнейшего использования. Наиболее сложным и трудоемким в эконометрическом исследовании является этап оценки параметров модели, где применяются методы теории вероятностей и математической статистики.

При решении проблемы выбора вида аналитической зависимости могут использоваться различные соображения:

Выводы аналитических исследований о качественном характере зависимости,

Описание свойств различных аналитических зависимостей,

Цели построения модели.

Выбор вида эконометрической модели основывается, прежде всего, на результатах предварительного качественного или содержательного анализа, проводимого методами экономической теории. Характер предполагаемой зависимости обосновывается исходя из теоретически предположений о характере закономерности развития изучаемого явления или процесса.

Другой подход основан на анализе массива исходных данных, который позволяет выявить некоторые характеристики предполагаемых зависимостей и на этой основе сформулировать, как правило, несколько предположений о виде аналитической связи. Построенная модель используется для формулирования предположений о характере закономерности в развитии изучаемого явления, которые проверяются в течение дальнейших исследований.

Наибольшее применение в эконометрике нашли линейные модели.

Это обусловлено несколькими причинами:

Существуют эффективные методы построения таких моделей.

В небольшом диапазоне значений факторных признаков линейные модели с достаточной точностью могут аппроксимировать реальные нелинейные зависимости.

Параметры модели имеют наглядную экономическую интерпретацию.

Прогнозы по линейным моделям, характеризуются меньшим риском значительной погрешности прогноза.

Важной составляющей процесса построения эконометрической модели является отбор факторов, существенно влияющих на изучаемый показатель и подлежащих включению в разрабатываемую модель. Оптимальный набор факторов определяется на основе качественного и количественного анализа.

На этапе постановки задачи и содержательного экономического анализа экономической модели отбираются факторы, влияние которых должно быть учтено при построении модели. В ряде случаев набор факторов определяется однозначно или с большой степенью уверенности. В более сложных случаях на следующем этапе с помощью формальных статистических методов проверяется целесообразность включения в модель каждого фактора. Прежде всего, факторы проверяются на наличие тесной линейной корреляционной зависимости между ними, существование которой приводит к получению ненадежных оценок параметров модели.

Для преодоления сильной межфакторной корреляции применяются:

– исключение из модели одного или нескольких факторов. Из двух коррелирующих факторов исключаются тот, который более коррелирует с остальными факторами;

– преобразование факторов, при котором уменьшается корреляция между ними.

Одним из критериев включения факторов в модель является степень их изолированного влияния на результативный признак.

Два метода определения оптимального набора факторов:

1. метод включения. Строится уравнение регрессии с одним наиболее влияющим фактором, затем в него последовательно вводятся следующие факторы и определяется пара наиболее влияющих факторов, затем к первым двум добавляется еще по одному фактору и определяется наилучшая тройка факторов и т. д. На каждом шаге строится модель регрессии и проверяется значимость факторов. В модель включают только значимые факторы. Для проверки значимости фактора могут использоваться либо критерий Стьюдента, либо частный критерий Фишера. Процесс заканчивается, когда не остается факторов, которые следует включить в модель.

2. метод исключения. Строится уравнение регрессии с полным набором факторов, из числа которых затем последовательно исключаются незначимые или наименее значимые факторы. На каждом шаге исключается только один фактор, так как после исключения какого-либо фактора другой фактор, бывший до этого незначимым, может стать значимым. Процесс заканчивается, когда не остается факторов, которые следует исключить.

Методы включения и исключения не гарантируют определение оптимального набора факторов, но в большинстве случаев дают результаты либо оптимальные, либо близкие к ним. Не рекомендуется включать в модель очень большое число факторов, так как это может затруднить выявление качественных закономерностей и возрастает опасность включения в модель несущественных случайных факторов. Для получения надежных оценок параметров желательно, чтобы количество наблюдений превышало количество определяемых параметров не менее чем в 6-7 раз.

После отбора факторов и выбора вида аналитической зависимости осуществляется оценка параметров модели. При оценке параметров модели в качестве исходных данных используется заранее подготовленный массив наблюдений. Качество оценок определяется наличием у них таких свойств как несмещенность, состоятельность и эффективность. Оценка параметра называется несмещенной, если ее математическое ожидание равно оцениваемому параметру. Оценка параметра называется состоятельной, если она сходится по вероятности к оцениваемому параметру при возрастании количества наблюдений. Оценка параметра называется эффективной, если она имеет наименьшую дисперсию среди возможных несмещенных оценок параметра, вычисленных по выборкам одного и того же объема n.

ГЛАВА 2. ПРОЕКТНАЯ ЧАСТЬ

2.1 Информационно-методическое обеспечение эконометрического исследования.

Методика эконометрического исследования включает следующие этапы: спецификация; параметризация, верификация, дополнительное исследование.

1. Спецификация моделей уравнения парной и множественной регрессии включает анализ корреляционной зависимости зависимой переменной от каждой объясняющей переменной. По результатам анализа делается заключение о модели уравнения регрессии. В результате этапа определяется модель уравнения регрессии.

2. Параметризация уравнения парной регрессии предполагает оценку параметров регрессии и их социально-экономическую интерпретацию. Для параметризации рекомендуется использовать инструмент «Регрессия» в составе надстроек «Анализ данных» MsExcel. По результатам автоматизированного регрессионного анализа определяются параметры регрессии, также дается их интерпретация.

Таким образом, эконометрическое исследование парной регрессии включает расчет параметров уравнений регрессии, оценку дисперсий ошибок и дисперсий параметров модели, оценку силы связи фактора с результатом с помощью коэффициента эластичности, оценку тесноты связи, оценку качества уравнения с помощью средней ошибки аппроксимации, оценку статистической надежности уравнений регрессии с помощью F-критерия Фишера.

Для построения и анализа парной регрессии из статистического ежегодника выбран список из двадцати наиболее крупных стран Европейского союза, а именно число прибывших в страну на постоянное место жительства и номинальная годовая заработная плата наемных работников.

Рассчитывается коэффициент корреляции по формуле:

Где

Коэффициент корреляции показывает тесноту связи изучаемых явлений.

Для построения уравнения парной регрессии необходимо рассмотреть возможные уравнения регрессии:

  1. линейную зависимость
  2. показательную зависимость
  3. квадратичную зависимость
  4. кубическую зависимость

Для оценки параметров регрессий ко всем этим моделям применим метод наименьших квадратов (МНК).

Идея метода состоит в получении наилучшего приближения набора наблюдений x i , y i , i = 1,…, n линейной функцией в смысле минимизации функционала:

Для расчета параметров a и b линейной регрессии решается система уравнений относительно a и b .

из которой можно определить оценки параметров a и b .

t –критерием Стьюдента.

Выдвигается гипотеза H 0 о случайной природе показателя, т.е. незначимом его отличии от нуля. H 0 : =0

Построению уравнения показательной кривой предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения:

Параметры уравнения модели находятся по следующим формулам:

Получено линейное уравнение.

х , можно получить теоретические результаты значения. По ним рассчитывается показатель тесноты связи – индекс корреляции.

Проверяется данный коэффициент на значимость, воспользовавшись t –критерием Стьюдента.

Расчет оценок дисперсий ошибок и дисперсий параметров модели осуществляется по следующим формулам:

Производится построение уравнения квадратичной кривой, произведя замену

Подставляя в уравнение фактические значения х

Проверяется данный коэффициент на значимость, воспользовавшись t –критерием Стьюдента.

Расчет оценок дисперсий ошибок и дисперсий параметров модели осуществляется по следующим формулам:

Производится построение уравнения кубической кривой, произведя замену

Получается линейное уравнение

Подставляя в данное уравнение фактические значения х , можно получить теоретические результаты значения. По ним рассчитаем показатель тесноты связи – индекс корреляции.

Проверяется данный коэффициент на значимость, воспользовавшись t –критерием Стьюдента.

Расчет оценок дисперсий ошибок и дисперсий параметров модели осуществляется по следующим формулам:

Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора х на 1% от своего среднего значения:

Коэффициент детерминации дает оценку качества построенной модели. Коэффициент детерминации характеризует долю дисперсии результирующего признака у, объясняемую регрессией, в общей дисперсии результативного признака.

Коэффициент детерминации равен квадрату индекса корреляции. Чем ближе к единице, тем лучше качество подгонки, т.е. более точно аппроксимирует у.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

Допустимый предел значений - не более 8-10%.

Оценка значимости уравнения регрессии осуществляется с помощью F -критерия Фишера. При этом выдвигается нулевая гипотеза о равенстве фактической и остаточной дисперсий, и следовательно, фактор x не оказывает влияния на y , т.е.

H 0 : D факт = D ост

Для этого выполняется сравнение фактического и критического (табличного) значений F -критерия Фишера. определяется из соотношения значений факторной и остаточной дисперсий:

Максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости. Уровень значимости - вероятность отвергнуть правильную гипотезу при условии, что она верна.

Если <, то отклоняется и признается статистическая значимость и надежность уравнения регрессии, иначе - принимается и делается вывод о не значимости уравнения регрессии.

3. Параметризация уравнения множественной регрессии предполагает оценку параметров регрессии и их социально-экономическую интерпретацию. Для параметризации рекомендуется использовать инструмент «Регрессия» в составе надстроек «Анализ данных» MsExcel. По результатам автоматизированного регрессионного анализа определяются параметры регрессии, также дается их интерпретация.

Верификация уравнения регрессии проводится на основе результатов автоматизированного регрессионного анализа.

Таким образом, эконометрическое исследование множественной регрессии включает в себя построение уравнения множественной регрессии, расчет коэффициентов эластичности для каждого фактора и сравнительную оценку силы связи каждого фактора с результатом, экономическую интерпретацию построенной модели, построение матрицы корреляции, вычисление коэффициента множественной корреляции, расчет оценок дисперсий ошибок модели и оценок параметров модели, построение доверительных интервалов для коэффициентов модели с выбранным уровнем значимости, проверку значимости каждого коэффициента, оценку тесноты связи, оценку статистической надежности уравнения регрессии с помощью F – критерия Фишера.

Для построения и анализа множественной регрессии вводятся в модель еще несколько показателей, позволяющих учитывать несколько факторов, влияющих на число прибывших в страну на постоянное место жительства. А именно такие факторы как число безработных и ВВП страны.

Множественная регрессия – уравнение связи с несколькими неизвестными переменными:

где y – зависимая переменная (результативный признак),

Независимые переменные (факторы).

Для построения уравнения множественной регрессии используется линейная функция, записанная в матричной форме:

где,

Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов:

Строится следующая система уравнений, решение которых позволяет получить оценки параметров регрессии:

Ее решение в явном виде обычно записывается в матричной форме, иначе оно становится слишком громоздким.

Оценки параметров модели в матричной форме определяются выражением:

X – матрица значений объясняющих переменных;

Y – вектор значений зависимой переменной.

Для выявления зависимости числа прибывших на постоянное место жительства от номинальной годовой з/п наемных рабочих, числа безработных и уровня ВВП построим уравнение множественной регрессии в виде:

Для характеристики относительной силы влияния факторов на y рассчитаем средние коэффициенты эластичности. Средние коэффициенты эластичности для линейной регрессии рассчитываются по формулам:

При линейной зависимости коэффициент множественной корреляции можно определить через матрицу парных коэффициентов корреляции:

где - определитель матрицы парных коэффициентов корреляции;

Определитель матрицы межфакторной корреляции.

Матрица парных коэффициентов корреляции:

Матрица межфакторной корреляции:

Расчет оценок дисперсий ошибок и дисперсий параметров модели осуществляется по следующим формулам:

Для оценки статистической значимости коэффициентов регрессии рассчитываются t -критерий Стьюдента и доверительные интервалы каждого из параметров. Выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля. Получим набор гипотез:

: b 0 =0; b 1 =0; b 2 =0; b 3 =0

t -критерия Стьюдента проводится путем сопоставления их значений с табличным значением, вычисляемым как квантиль распределения Стьюдента, где уровень значимости - вероятность отвергнуть правильную гипотезу при условии, что она верна.

Для расчета доверительных интервалов пользуются следующей формулой:

Качество построенной модели в целом оценивает коэффициент детерминации. Коэффициент множественной детерминации рассчитывается, как квадрат индекса множественной корреляции: .

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:

где n – число наблюдений;

m – число факторов.

Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F- критерия Фишера:

При этом выдвигается гипотеза о незначимости уравнения регрессии:

В заключение формируется суждение о качестве уравнения регрессии.

4. Проводится сравнительный анализ моделей регрессии.

2.2. Пример эконометрического исследования.

На основе статистических данных проводится эконометрическое исследования в соответствие с методикой п.2.1.

Все необходимые расчеты проводятся при помощи MS Excel, рассчитывая в ручную, при помощи функций пакета анализа данных «Регрессия» проводится проверка полученных результатов.

Линейный коэффициент парной корреляции равен:

0,504652547

Коэффициент корреляции имеет положительное значение и равен, умеренная прямая зависимость между показателем y и фактором x : с увеличением среднегодовой з/п работников страны, количество прибывшего в страну населения увеличивается.

2. Проводится построение и анализ парной регрессии. Исходные данные представлены в Таблице 1.

Таблица 1. Исходные данные для построения и анализа парной регрессии

y - число прибывших в страну на постоянное место жительства, тыс. чел;

В результате анализа необходимо установить насколько заработная плата наемных рабочих в стране влияет на количество людей, прибывших в страну на постоянное место жительство.

Оценка параметров a и b .

Уравнение регрессии:

Коэффициент регрессии b =4,279 показывает среднее изменение результата с изменением фактора на одну единицу: с увеличением годовой з/п наемных рабочих на 1 тыс.евро. количество прибывших на постоянное место жительства увеличится в среднем на 4,279 тыс. чел. Положительное значение коэффициента регрессии показывает прямое направление связи.

Линейный коэффициент парной корреляции равен:

0,504652547

Связь прямая и умеренная.

2.47 T табл (0,05;18) = 2,101

> T табл , коэффициент значим.

Проводится расчет оценок дисперсий ошибок и дисперсий параметров модели. Промежуточные расчеты представлены в Таблице 2.

10765,218 = 1477,566815 = 2,976774696

Построение уравнения показательной кривой.

Значения параметров регрессии составили

0,068027 = 1,68049

Получено линейное уравнение: .

После потенцирования:

Индекс корреляции.

Проверяется данный коэффициент на значимость.

2.15 T табл (0,05;18) = 2,101

> T табл , коэффициент значим.

Проводится расчет оценок дисперсий ошибок и дисперсий параметров модели. Промежуточные расчеты представлены в Таблице 3.

В результате получены следующие значения:

11483,75 = 452,87517 = 3,1754617

Таблица 2. Расчет значений для линейной модели

Таблица 3. Расчет значений для показательной модели

Строится уравнение квадратичной кривой.

Параметры уравнения:

Индекс корреляции.

Проверяется данный коэффициент на значимость.

3,41 T табл (0,05;18) = 2,101

> T табл , коэффициент значим.

Проводится расчет оценок дисперсий ошибок и дисперсий параметров модели. Промежуточные расчеты представлены в Таблице 4.

В результате получены следующие значения:

8760,35808 = 743,283328 = 0,00123901

Строится уравнение кубической кривой.

Параметры уравнения:

Уравнение регрессии принимает вид:

Индекс корреляции.

Проверяется данный коэффициент на значимость.

4,38 T табл (0,05;18) = 2,101

> T табл , коэффициент значим.

Проводится расчет оценок дисперсий ошибок и дисперсий параметров модели. Промежуточные расчеты представлены в Таблице 5.

В результате получены следующие значения:

6978,45007 = 514,7649432 = 5,9851E-07

Самая высокая степень связи переменных в модели с кубической зависимостью, т.к. коэффициент корреляции в кубической модели наиболее близок к единице, а самая низкая - в показательной модели. Дисперсии ошибок и параметров модели принимают минимальные значения в кубической.

Таблица 4. Расчет значений для квадратичной модели

Таблица 5. Расчет значений для кубической модели

Находится средний коэффициент эластичности.

Линейная зависимость

1,250028395 %.

Показательная зависимость

1,2083965

С ростом годовой заработной платы наемных рабочих на 1% число прибывших в страну на постоянное место жительства увеличивается на 1,2083965 % .

Квадратичная зависимость

С ростом годовой заработной платы наемных рабочих на 1% число прибывших в страну на постоянное место жительства увеличивается на 1,24843054 % .

Кубическая зависимость

0,938829224

С ростом годовой заработной платы наемных рабочих на 1% число прибывших в страну на постоянное место жительства увеличивается на 0,938829224 % .

Значения коэффициентов эластичности приведены в Таблице 6.

Все построенные модели подтверждают, что величина заработной платы наемных рабочих является фактором увеличения числа прибывших в страну на постоянное место жительства. Коэффициент эластичности показывает, что годовая заработная плата наемных рабочих в больше степени влияет на число прибывших в страну на постоянное место жительства при линейной и квадратичной зависимостях. В меньшей степени данная связь прослеживается в кубической зависимости.

Находится коэффициент детерминации.

Линейная зависимость

Уравнением регрессии объясняется 25% дисперсии результативного признака, а на долю остальных факторов приходится 75% ее дисперсии.

Модель линейной зависимости плохо аппроксимирует исходные данные.

Показательная зависимость =

Зависимость между показателями такая же слабая, как и в линейной модели. Вариация у всего на 20% объясняется вариацией х , а на долю остальных факторов приходится 80%. Связь в данной модели самая слабая. Поэтому качество модели неудовлетворительное.

Квадратичная зависимость

Зависимость между показателями немного лучше, чем в показательной и линейной моделях. Вариация у только на 40% объясняется вариацией х. Данную модель также не желательно использовать для прогнозирования.

Кубическая зависимость

Зависимость между показателями лучше, чем в предыдущих моделях. Вариация у на 52% объясняется вариацией х.

Значения коэффициентов детерминации представлены в Таблице 6.

Таблица 6. Расчет параметров и характеристик моделей.

Качество построенных моделей низкое , самая высокая оценка качества у модели с кубической зависимостью, так как доля объясненной вариации составила 52%.

Определяется средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

Линейная модель = 1153,261 %

В среднем расчетные значения отклоняются от фактических на 1153,261 %, что говорит об очень большой ошибке аппроксимации.

Показательная зависимость = 396,93259

Ошибка аппроксимации несколько ниже, чем у остальных моделей, но также является недопустимой.

Квадратичная зависимость = 656,415018

Наблюдается высокая ошибка аппроксимации, что свидетельствует о низком качестве подгонки уравнения

Кубическая зависимость = 409,3804652

Ошибка аппроксимация также значительно превышает допустимые значения. Во всех рассмотренных моделях средняя ошибка аппроксимации значительно превышает допустимые значения, качество подгонки моделей к исходным данным очень низкое.

3. Проводится построение и анализ множественной регрессии.

Исходные данные для построения множественной регрессии приведены в Таблице 7.

Таблица 7. Исходные данные для построения множественной регрессии.

y - число прибывших в страну на постоянное место жительства, тыс. чел:

x 1 - номинальная годовая заработная плата наемных работников, тыс. евро.

x 2 - число безработных, тыс. чел.

x 3 - ВВП, млрд. евро.

Оценки параметров уравнения регрессии:

Уравнение множественной регрессии:

Средние коэффициенты эластичности.

0,12026241 = -0,06319176 = 0,86930458

Расчет данных значений приведен в Таблице 8.

С увеличением величины годовой заработной платы наемных рабочих на 1% от среднего уровня при неизменных показателях остальных факторов, число прибывших на постоянное место жительства увеличивается на 0,12 %.

С увеличением численности безработных на 1% от среднего при неизменных показателях остальных факторов, число прибывших на постоянное место жительства уменьшается на 0,06 %

С увеличением величины ВВП на 1% от среднего при неизменных показателях остальных факторов, число прибывших на постоянное место жительства увеличивается на 0,87 %

Изменение числа прибывших в страну на постоянное место жительства находится в прямой зависимости от годовой заработной платы наемных рабочих и величины уровня ВВП страны и в обратной зависимости от численности безработных, что не противоречит и логическим предположениям. Коэффициенты эластичности, как показатели силы связи, показывают, что наибольшее изменение числа прибывших в страну вызывает величина ВВП, а наименьшее – численность безработных.

Рассчитывается коэффициент множественной корреляции:

Значение индекса множественной корреляции лежит в пределах от 0 до 1.

Рассчитывается средняя ошибка аппроксимации:

372,353247%

Значение средней ошибки аппроксимации свидетельствует о плохой подгонке модели под исходные данные.

Таблица 8. Расчет значений характеристик модели множественной регрессии

Совместное влияние всех факторов на число прибывших в страну на постоянное место жительства достаточно велико. С вязь между рассматриваемым показателем и влияющими на него факторами усилилась по сравнению с парной регрессией ( r yx =0.506). Наблюдается довольно сильная связь.

Необходимо учитывать, что в модели наблюдается небольшая мультиколлинеарность, что может свидетельствовать о ее неустойчивости, поскольку определитель матрицы межфакторной корреляции достаточно далек от 1. Максимальный коэффициент парной корреляции наблюдается между факторами x 1 и x 3 (r x 1 x 3 =0.595), что вполне объясняемо, т.к. среднегодовая заработная плата в стране должна находиться в прямой зависимости от ВВП страны.

Расчет оценок дисперсий ошибок и дисперсий параметров модели:

n = 20 – количество наблюдений, m =4 – количество параметров.

Для построенной модели оценка дисперсии ошибок составила:

6674,02207

Оценки дисперсий параметров модели:

Стандартные ошибки параметров модели:

Промежуточные расчеты полученных данных представлены в приложении 8.

Оценка значимости коэффициентов регрессии с помощью t -критерия Стьюдента.

Значения, <, значит коэффициенты являются статистически незначимыми и случайно отличаются от 0.

>, значит является статистически значимым

Для построенной модели доверительные интервалы коэффициентов регрессии:

Все полученные коэффициенты регрессии, кроме , статистически незначимы, доверительные интервал для них достаточно большой, что может свидетельствовать о недостаточном качестве модели.

Коэффициент множественной детерминации для построенной модели

Данный коэффициент детерминации показывает, что качество модели удовлетворительное.

С добавлением еще одной переменной обычно увеличивается. Для того чтобы не допускать возможного преувеличения тесноты связи и применяется скорректированный коэффициент детерминации. При заданном объеме наблюдений при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. Для построенной модели значения скорректированного и нескорректированного коэффициента детерминации не значительно отличаются друг от друга, но т.к. скорректированный коэффициент детерминации немного уменьшился можно предположить, что увеличение доли объясненной регрессии при добавлении новой переменной незначительно, и что добавлять переменную нецелесообразно.

Оценка значимости уравнения регрессии с помощью F -критерия Фишера.

F (0.05, m -1, n - m )= F (0.05,1,18)= 4,413873

Линейная модель = 6,150512218

Показательная зависимость = 4,6394274

Квадратичная зависимость = 11,6775003

Кубическая зависимость = 19,25548322

Во всех рассмотренных моделях <, гипотеза отвергается.

Значимость уравнения множественной регрессии в целом с помощью F- критерия Фишера:

Так как F табл < F факт то не принимается

4. В результате проведенного исследования можно сделать следующее заключение: Все полученные уравнения регрессии значимы. По результатам F -теста и показателям коэффициента детерминации и средней ошибки аппроксимации можно сделать вывод, что среди рассмотренных моделей парной регрессии нет модели с хорошим качеством, которую можно было бы применять с целью прогнозирования. Однако, наилучшей моделью, описывающей взаимосвязь между годовой з/п наемных рабочих страны и числом прибывших в страну на постоянное место жительства, является модель с кубической зависимостью, поскольку она является значимой, коэффициент детерминации принимает наибольшее значение и средняя ошибка аппроксимации не так велика по сравнению с другими моделями, хотя и не принимает допустимого значения.

Все четыре модели парной регрессии являются статистически значимыми, однако достаточно малые значения коэффициента детерминации, большие ошибки средней аппроксимации свидетельствуют о плохом качестве данных моделей.

Сравнив параметры и характеристики данных уравнений, делается вывод, что наибольшей надежность и точностью обладает модель с кубической зависимостью. Об этом свидетельствуют наибольшее значение индекса корреляции и соответственно коэффициент детерминации, наиболее близкий к 1 и подтверждающий лучшее качество модели с точки зрения аппроксимации данных, результаты F-теста, признавшие модель значимой, а также средняя ошибка аппроксимации, меньшая, чем у других моделей. Стандартные ошибки параметров регрессии и стандартная ошибка прогноза для этой модели также принимают меньшие значения.

Уравнение множественной регрессии значимо, т.е. отвергается гипотеза о случайной природе оцениваемых характеристик. Полученная модель статистически надежна.

ЗАКЛЮЧЕНИЕ

В результате эконометрического исследования и анализа данных было рассмотрено четыре уравнения парной регрессии, устанавливающих зависимость между среднегодовой заработной платой наемных рабочих в стране и количеством людей, прибывших в страну на постоянное место жительство. Это линейная модель, показательная, модели с квадратичной и кубической зависимостью. Все построенные модели подтверждают, что рост величины заработной платы наемных рабочих, является фактором увеличения числа прибывших в страну на постоянное место жительства.

Самый высокий показатель тесноты связи переменных в модели с кубической зависимостью, т.к. коэффициент детерминации в кубической модели принимает наибольшее значение, что говорит о наибольшей надежности найденного уравнения регрессии. Модель в виде кубической зависимости наилучшим образом описывает взаимосвязь числа прибывших в страну на постоянное место жительства и годовой заработной платы наемных рабочих. Во всех рассмотренных моделях средняя ошибка аппроксимации значительно превышает допустимые значения, что говорит о низком качестве подгонки моделей. Однако модель с кубической зависимостью является лучшей с точки зрения аппроксимации данных и оценки тесноты связи, поскольку имеет наибольшую по сравнению с другими моделями долю объясненной вариации – 52% (коэффициент детерминации наиболее близок к 1).

По всем рассмотренным параметрам, уравнение регрессии с кубической зависимостью, является лучшим из рассмотренных. Но не оптимальным для практического использования и прогнозирования, что объясняется большим разбросом данных, а также тем, что число иммигрантов зависит от множества факторов, которые невозможно учесть в парной регрессии.

Не достаточно хорошие характеристики модели могут быть вызваны наличием в исходных данных единиц с аномальными значениями исследуемых признаков: в Великобритании число прибывших на постоянное место жительства значительно превышает данный показатель для других стран. Возможно, для получения более точного и надежного результата данную страну следует исключить из выборки.

В результате построения множественной регрессии исследовано влияние на число прибывших в страну на постоянное место жительства таких факторов, как ВВП страны, численность безработных и средняя годовая заработная плата наемных рабочих.

Изменение числа прибывших в страну на постоянное место жительства находится в прямой зависимости от годовой заработной платы наемных рабочих и величины уровня ВВП страны и в обратной зависимости от численности безработных. Наибольшее изменение числа прибывших в страну вызывает величина ВВП, а наименьшее – численность безработных.

Совместное влияние всех факторов на число прибывших в страну на постоянное место жительства достаточно велико, поскольку индекс множественной корреляции принимает высокое значение. Однако это может объясняться наличием мультиколлинеарности.

Все полученные коэффициенты уравнения множественной регрессии кроме коэффициента при факторе уровень ВВП статистически незначимы, доверительные интервал для них достаточно большой.

Не смотря на это, коэффициент детерминации показывает, что качество модели удовлетворительное. Уравнение множественной регрессии значимо, т.е. отвергается гипотеза о случайной природе оцениваемых характеристик.

Однако в модели может наблюдаться гетероскедастичность, т.е. возможно необходима коррекция модели.

Данные результаты можно объяснить достаточно малым объемом выборки, в особенности с учетом глобальности исследования, наличием аномального значения исследуемого признака, не учтенностью каких-либо существенных факторов, а также тем, что число эмигрантов в страну зависит от большого числа не количественных, личных факторов, индивидуальных предпочтений.

Не смотря на отсутствие точного результата и качественного уравнения регрессии, пригодного для прогнозирования и дальнейших исследований, в ходе исследования удалось выявить, что заработная плата наемных рабочих в стране, уровень безработицы и ВВП оказывают немаловажное влияние на число прибывших в страну на постоянное место жительства.

Список использованных источников

1. Герасимов, А.Н. Эконометрика: теория и практика [Электронный ресурс]: электронный учебник / Герасимов, А.Н., Гладилин, А.В., Громов, Е.И. - М.: КноРус, 2011. - CD. - (82803-2) (У; Г 37)

2. Яковлева, А. Заказ. Эконометрика: курс лекций - М.: Эксмо, 2010. - (83407-1)

3. Валентинов, В.А. Эконометрика [Текст]: практикум - М.: Дашков и К, 2010. - 435 с. - (84265-12) (У; В 15)

4. Валентинов, В.А. Эконометрика [Текст]: учебник для вузов по спец. "Мат. методы в экономике" и др. экон. спец. - М.: Дашков и К, 2010. - 448 с. - (84266-30) (У; В 15)

5. Новиков, А.И. Эконометрика [Текст]: учеб. пособие для вузов по направлению 521600 "Экономика" и экон. специальностям - М.: ИНФРА-М, 2011. - 143, с. - (86112-10) (У; Н 73)

6. Колемаев, В.А. Эконометрика [Текст]: учебник для вузов по специальности 061800 "Математические методы в экономике" / Гос. ун-т упр. - М.: ИНФРА-М, 2010. - 160 с. - (86113-10) (У; К 60)

7. Гладилин, А.В. Эконометрика [Текст]: учеб. пособие для вузов по экон. специальностям / Гладилин, А.В., Герасимов, А.Н., Громов, Е.И. - М.: КноРус, 2011. - 227 с. - (86160-10) (У; Г 52)

8. Новиков, А.И. Эконометрика [Текст]: учеб. пособие по напр. "Финансы и кредит", "Экономика" - М.: Дашков и К, 2013. - 223 с. - (93895-1) (У; Н 73)

9. Тимофеев, В.С. Эконометрика [Текст]: учебник для бакалавров по экон. напр. и спец. / Тимофеев, В.С., Фаддеенков, А.В., Щеколдин, В.Ю. - М.: Юрайт, 2013. - 328 с. - (94305-3) (У; Т 41)

10. Эконометрика [Текст]: учебник для магистров, для вузов по экон. направления и спец. / Елисеева, И.И., Курышева, С.В., Нерадовская, Ю.В., [и др.] ; под ред. И.И. Елисеевой; Санкт-Петербургский гoс. ун-т экономики и финансов - М.: Юрайт, 2012. - 449 с. - (95469-2) (У; Э 40)

11. Новиков, А.И. Эконометрика [Электронный ресурс]: учеб. пособие - М.: Дашков и К, 2013. - ЭБС Лань. - (104974-1) (У; Н 73)

12. Варюхин, А.М. Эконометрика [Текст]: конспект лекций / Варюхин, А.М., Панкина, О.Ю., Яковлева, А.В. - М.: Юрайт, 2007. - 191 с. - (105626-1) (У; В 18)

13. Эконометрика [Электронный ресурс]: учебник / Балдин, К.В., Башлыков, В.Н., Брызгалов, Н.А., [и др.] ; под ред. В.Б. Уткина - Москва: Дашков и К, 2013. - ЭБС Лань. - (107123-1) (У; Э 40)

14. Перепелица, Н.М. *Эконометрика: практикум (направление 100700.62 Торговое дело) [Электронный ресурс]: в составе учебно-методического комплекса / Тверской гос. техн. ун-т, Каф. МЕН - Тверь: ТвГТУ, 2012. - Сервер. - (107926-1)

EMBED Equation.3

Другие похожие работы, которые могут вас заинтересовать.вшм>

1589. Сравнительный анализ антивирусных программ 79.33 KB
В данной выпускной квалификационной работе рассмотрена проблема борьбы с компьютерными вирусами которой занимаются антивирусные программы. Среди набора программ используемого большинством пользователей персональных компьютеров каждый день антивирусные программы традиционно занимают особое место.
19100. Сравнительный анализ интуитивного и логического мышления 22.37 KB
Сравнительный анализ интуитивного и логического мышления. Основные теории мышления и подходы к его изучению в зарубежной и отечественной психологии. В процессе мышления человек отражает объективный мир иначе чем в процессах восприятия и воображения. В ходе самостоятельной работы будут рассмотрены основные теории мышления и подходы к его изучению в психологии.
18483. СКАЗКИ ИНДЕЙЦЕВ СЕВЕРНОЙ АМЕРИКИ: СРАВНИТЕЛЬНЫЙ АНАЛИЗ 8.39 KB
Феномен сказки является весьма загадочной темой исследования, так как устное народное творчество более других видов искусства подвержено изменениям и искажениям смысла под влиянием меняющихся факторов социокультурной среды.
18490. 115.79 KB
Ответственность государственного нотариуса при осуществлении нотариальных действий. Правовая основа деятельности частно-практикующих нотариусов на территории Республики Казахстан. Ответственность нотариуса занимающегося частной практикой. Сравнительный анализ институтов государственного и частного нотариата на территории Республики Казахстан. Судебная практика по рассмотрению дел об оспаривании действий нотариусов при осуществлении ими нотариальных...
9809. Сравнительный анализ и перспективы развития портативных компьютеров 343.85 KB
Проблемой данного исследования носит актуальный характер в современных условиях. Об этом свидетельствует частое изучение поднятых вопросов и не смотря на все обилие информации о портативных компьютеров остается непонятны их функциональные особенности, принципиальные отличия и дальней перспектива развития.
14351. ТЕНЕВАЯ ЭКОНОМИКА В СОВРЕМЕННОЙ ИНТЕРПРИТАЦИИ: СРАВНИТЕЛЬНЫЙ АНАЛИЗ 186.56 KB
Для достижения сформулированной цели ставятся следующие задачи. Во-первых, необходимо рассмотреть основные причины и предпосылки возникновения теневой экономики. Во-вторых, дать общую характеристику понятия явления теневой экономики, ее экономической природы. В-третьих, возникает необходимость провести содержательный и структурный анализ этого экономического явления
14398. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ГАЗОВЫХ МЕСТОРОЖДЕНИЙ ПРИАМУДАРЬИНСКОЙ ОБЛАСТИ ТУРКМЕНИСТАНА 5.97 MB
Сравнительная характеристика газовых месторождений по отложениям верхней и средней юры. На сегодняшний день основным объектом для поисков залежей нефти и газа являются юрские и меловые отложения. Другие объекты Приамударьинской области несмотря на свою перспективность остаются в ожидании бурения и открытия месторождений нефти и газа в кайнозойских...
20554. Сравнительный анализ подходов к определению маржинальных требований для портфелей ПФИ 275.48 KB
Центральные контрагенты обслуживают рынки, нередко существенно различающиеся как по микроструктуре, так и по ассортименту финансовых инструментов с различными профилями риска: спотовые рынки с режимом исполнения T+, инструменты денежного рынка (например, сделки РЕПО), биржевые и внебиржевые производные финансовые инструменты
19049. СРАВНИТЕЛЬНЫЙ АНАЛИЗ И ОЦЕНКА ЭКСПЛУАТАЦИОННЫХ ХАРАКТЕРИСТИК БЛОКОВ ПИТАНИЯ ПК 1.04 MB
Современный блок питания представляет собой импульсный блок, а не силовой. Импульсный блок содержит в себе больше электроники и имеет свои достоинства и недостатки. К достоинствам следует отнести небольшой вес и возможность непрерывного питания при падении напряжения. К недостаткам – наличие не очень продолжительного срока службы по сравнению с силовыми блоками из-за присутствия электроники.
16100. Спрос на услуги образования в России: сравнительный эконометрический анализ 228.72 KB
Используемые данные и переменные Для анализа расходов российских домохозяйств на образовательные услуги были использованы данные регулярного выборочного микро обследования бюджетов домашних хозяйств Федеральной службы государственной статистики РФ за 2007 год. Изменение переменной произведено для устранения выбросов в выборке и получения более робастных результатов оценивания. Модели и результаты Модель Хекмана Для оценки спроса домохозяйств на образование была выбрана модель Хекмана переменные со звездочками являются ненаблюдаемыми...

Построение уравнения регрессии начинается с решения вопроса о спецификации модели, т.е. формулировки вида модели, исходя из теории, устанавливающей связь между явлениями. Она включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии. Из всего круга факторов, влияющих на результативный признак, необходимо выделить наиболее существенно влияющие факторы.

От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретические значения результативного признака подходят к фактическим данным.

К ошибкам спецификации будут относиться не только неправильный выбор той или иной математической функции, а также влияние лишней переменной и недоучет в уравнении регрессии какого-либо существенного фактора.

Влияние неучтенной переменной.

Пусть - истинная модель.

Т.о. по МНК: (для ложной модели).

А на самом деле: - несмещенная, эффективная, состоятельная.

Т.е. - смещенная оценка параметра (т.к. в модель не включен ).

Рассмотрим величину смещения оценки : .

В истинной модели и прямо воздействуют на у с силой воздействия и соответственно. В ложной модели прямо воздействуют на у с силой воздействия , а также замещает переменную в ее воздействии на у, т.е. имеет место эффект замещения .

Это замещение возможно, т.к. , т.е. между и есть связь: , где по МНК.

Влияние лишней переменной.

Пусть - истинная модель.

Будем рассматривать ложную модель . По выборке для этой модели мы оценили уравнение регрессии: .

Т.к. на самом деле , то - оценка , т.е.

При этом , т.е. - несмещенная оценка.

Однако (см. условия Г-М).

Т.о. оценка - неэффективная. Она менее точная, чем . Учет лишней переменной дает неточную оценку параметра.

Мультиколлинеарность.

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

2. Включаемые во множественную регрессию факторы должны объяснять вариацию независимой переменной. При дополнительном включении в регрессию фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться. Если этого не происходит, то включаемый фактор не улучшает модель и практически является лишним фактором. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по критерию Стьюдента.

3. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.

Включение в модель факторов с высокой интеркорреляцией, когда для зависимости может привести к нежелательным последствиям – система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии.

Отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции.

Матрица коэффициентов корреляции:

y x z v
y
x 0,8
z 0,7 0,8
v 0,6 0,5 0,2

Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если ( - парный коэффициент корреляции).

Если факторы явно коллинеарны, то они дублируют друг друга, и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.

Очевидно, что факторы x и z дублируют друг друга. В анализ целесообразно включить фактор z , а не х, так как корреляция z с результатом у слабее, чем корреляция фактора х с у (), но зато слабее межфакторная корреляция . Поэтому в данном случае в уравнение множественной регрессии включаются факторы z, v.

По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов.

Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга.

Мультиколлинеарность – ситуация, при которой линейная зависимость между независимыми переменными приводит к получению неэффективных, ненадежных оценок линейной регрессии.

Реальная (частичная) мультиколлинеарность возникает в случае существования достаточно тесных статистических связей между объясняющими переменными.

Наличие мультиколлинеарности факторов может означать, что некоторые факторы всегда будут действовать вместе. В результате вариация в исходных данных перестает быть полностью независимой, и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью МНК:

предполагается, что , где

Общая сумма квадратов отклонений ;

Факторная (объясненная) сумма квадратов отклонений ;

Остаточная сумма квадратов отклонений .

В свою очередь, при независимости факторов друг от друга выполнимо равенство

Где

Суммы квадратов отклонений, обусловленные влиянием соответствующих факторов.

Если же факторы интеркоррелированы, то данное равенство нарушается.

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий :

· Затрудняется интерпретация параметров множественной регрессии; параметры линейной регрессии теряют экономический смысл;

· Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делают модель непригодной для анализа и прогнозирования.

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции была бы единичной матрицей, поскольку все недиагональные элементы были бы равны 0. Так для уравнения регрессии, включающего три объясняющих переменных, матрица парных коэффициентов корреляции имела бы определитель, равный 1:

. , то гипотеза Н 0 отклоняется. Это означает, что , недиагональные ненулевые коэффициенты корреляции указывают на коллинеарность факторов. Мультиколлинеарность считается доказанной.

Существует ряд подходов преодоления сильной межфакторной корреляции .

1) Самый простой путь устранения мультиколлинеарности состоит в исключении из модели одного или нескольких факторов.

2) Другой подход связан с преобразованием факторов, при котором уменьшается корреляция между ними. Например, при построении модели на основе рядов динамики переходят от первоначальных данных к первым разностям уровней , чтобы исключить влияние тенденции.

3) Используются такие методы, которые сводят к нулю межфакторную корреляцию, т.е. переходят от исходных переменных к их линейным комбинациям, не коррелированных друг с другом (метод главных компонент: с помощью метода главных компонент осуществляется переход к ортогонализированным объясняющим переменным. Эти новые объясняющие переменные представляют собой некоторые линейные комбинации исходных регрессоров, выбранные так, чтобы корреляции между ними были малы или вообще отсутствовали).

4) Решению проблемы устранения мультиколлинеарности факторов может помочь переход к уравнениям приведенной формы. С этой целью в уравнение регрессии производится подстановка рассматриваемого фактора через выражение его из другого уравнения.

5) К способам снижения мультиколлинеарности можно отнести увеличение объема выборки; увеличение (нерепрезентативность выборки→анализ ограниченной части генеральной совокупности→ занижена→оценки ненадежны); уменьшение (добавим важную переменную → снижается ); использование некоррелированных переменных: 1) использование теоретических ограничений на параметры модели, 2) использование внешних оценок.

Шпоры по эконометрике.

№ 1. СПЕЦИФИКАЦИЯ МОДЕЛИ

Простая регрессия представляет собой регрессию между двумя переменными -у и х, т.е. модель вида

, где у - результативный признак; х - признак-фактор.

Множественная регрессия представляет собой регрессию результативного признака с двумя и большим числом факторов, т. е. модель вида

Специ­фикация модели - формулировка вида модели, исходя из со­ответствующей теории связи между переменными. В урав­нении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией.

где y j - фактическое значение результативного признака;

y xj -теоретическое значение результативного признака.

- случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.

Случайная величина ε называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения.

От правильно выбранной спецификации модели за­висит величина случайных ошибок: они тем меньше, чем в боль­шей мере теоретические значения результативного признака

подходят к фактическим данным у.

К ошибкам спецификации относятся непра­вильный выбор той или иной математической функции для

, и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множест­венной.

Ошиб­ки выборки - исследователь чаще всего имеет дело с выборочными данными при установлении закономерной связи между признаками.

Ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками. Основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели.

В парной регрессии выбор вида математической функции

может быть осуществлен тремя методами: графическим, аналитическим и экспериментальным.

Графи­ческий метод основан на поле корреляции. Аналитический метод основан на изучении материальной природы связи исследуемых признаков.

Экспериментальный метод осуществляется путем сравнения величины остаточной дисперсии D ост, рассчитанной при разных моделях. Если фактические значения результативного признака совпадают с теоретическими у =

, то D ocm =0. Если имеют место отклонения фактических данных от теоретических (у - ) то .

Чем меньше величина остаточной дисперсии, тем лучше уравнение регрессии подходит к исходным данным. Число наблюдений должно в 6 - 7 раз превышать число рассчитывае­мых параметров при переменной х.

№ 2 ЛИНЕЙНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ: СМЫСЛ И ОЦЕНКА ПАРАМЕТРОВ.

Линейная регрессия сводится к нахождению уравнения вида

или .

Уравнение вида

позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактические значения фактора х.

Построение линейной регрессии сводится к оценке ее пара­метров а и в.

Оценки параметров линейной регрессии могут быть найдены разными методами.

Параметр b называется коэффициентом регрессии. Его вели­чина показывает среднее изменение результата с изменением фактора на одну единицу.

Формально а - значение у при х = 0. Если признак-фактор
не имеет и не может иметь нулевого значения, то вышеуказанная
трактовка свободного члена, а не имеет смысла. Параметр, а может
не иметь экономического содержания. Попытки экономически
интерпретировать параметр, а могут привести к абсурду, особенно при а < 0.

Интерпретировать можно лишь знак при параметре а. Если а > 0, то относительное изменение результата происходит медленнее, чем изменение фактора.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции r xy . Существуют разные модификации формулы линейного коэф­фициента корреляции.

Линейный коэффициент корреляции находится и границах: -1≤. r xy ≤ 1. При этом чем ближе r к 0 тем слабее корреляция и наоборот чем ближе r к 1 или -1, тем сильнее корреляция, т.е. зависимость х и у близка к линейной. Если r в точности =1или -1 все точки лежат на одной прямой. Если коэф. регрессии b>0 то 0 ≤.r xy ≤ 1 и наоборот при b<0 -1≤.r xy ≤0. Коэф. корреляции отражает степени линейной зависимости м/у величинами при наличии ярко выраженной зависимости др. вида.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции

, называемый коэффициентом детерминации. Коэффициент детермина­ции характеризует долю дисперсии результативного признака y, объясняемую регрессией. Соответствующая величина характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов.

№ 3. МНК.

МНК позволяет получить такие оценки параметров а и b , которых сумма квадратов отклонений фактических значений ре­зультативного признака (у) от расчетных (теоретических)

ми­нимальна: Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минималь­ной. Решается система нормальных уравнений

№ 4. ОЦЕНКА СУЩЕСТВЕННОСТИ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ И КОРРЕЛЯЦИИ .

Оценка значимости уравнения регрессии в целом дается с по­мощью F-критерия Фишера. При этом выдвигается нулевая ги­потеза, что коэффициент регрессии равен нулю, т. е. b = 0, и следовательно, фактор х не оказывает влияния на результат у.

Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложе­ние общей суммы квадратов отклонений переменной у от средне го значения у на две части - «объясненную» и «необъясненную»:

- общая сумма квадратов отклонений - сумма квадратов отклонения объясненная регрессией - остаточная сумма квадратов отклонения.

Любая сумма квадратов отклонений связана с числом степе­ней свободы, т. е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности nис числом определяемых по ней констант. Применительно к исследуемой проблеме число cтепеней свободы должно показать, сколько независимых откло­нений из п возможных требуется для образования данной суммы квадратов.

Дисперсия на одну степень свободы D .

F-отношения (F-критерий):

Ecли нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н 0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Английским статистиком Снедекором раз­работаны таблицы критических значений F-отношений при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия - это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным, если о больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: F факт > F табл Н 0 отклоняется.

Лекция 4. Нелинейная регрессия

Рассматриваемые вопросы

1. Спецификация модели

2. Классификация нелинейных функций

3. Отдельные виды нелинейных регрессий:

3.1. парабола;

3.2. равносторонняя гипербола;

3.3. степенная функция.

4. Коэффициенты эластичности в нелинейных регрессиях.

5. Корреляция для нелинейной регрессии.

Спецификация модели

Эконометрика как система специфических методов начала развиваться с осознания своей главной задачи – отражения связей экономических переменных. Многие экономические процессы наилучшим образом описываются нелинейными соотношениями, например, функциями спроса и производственными функциями. С этой целью в уравнение регрессии начали включаться переменные не только в первой, но и второй степени – с целью отразить свойства оптимальности экономических переменных, то есть наличия значений, при которых достигается минимальное или максимальное воздействие на зависимую переменную. Таково, например, влияние внесения удобрений на урожайность (до определенного уровня насыщение почвы удобрениями способствует росту урожайности, а по достижении оптимального уровня насыщение его дальнейшее наращивание может привести к снижению урожайности). То же можно сказать о воздействии многих социально-экономических переменных, например, влияния дохода на потребление некоторых продуктов питания. В условиях конкретной выборки данных нелинейность влияния переменных может и не подтвердиться, если эти данные варьируют в узких пределах, то есть являются однородными.

Предполагая, что ошибки измерения переменных сведены к минимуму, основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели, то есть ошибкам, вызванным неверным видом уравнения регрессии.

В парной регрессии выбор вида математической функции, моделирующей связь переменных, может быть осуществлен тремя методами:

1) графическим;

2) аналитическим, то есть исходя из теории изучаемой взаимосвязи;

3) экспериментальным.

При изучении зависимости между двумя признаками наиболее наглядным является графический метод подбора уравнения. Он основан на построении поля корреляции. Основные типы кривых, используемых при количественной оценке связей, представлены на слайде (рис.4.1).

Класс математических функций для описания связи двух переменных достаточно широк. Кроме указанных, используются и другие типы кривых.

Значительный интерес представляетаналитический метод выбора типа уравнения регрессии. Он основан на изучении материальной природы связи исследуемых переменных. Пусть, например, изучается потребность предприятия в электроэнергии у в зависимости от объема выпускаемой продукции х . Все потребление электроэнергии можно подразделить на две части:

1) не связанное с производством продукции (а);

2) непосредственно связанное с объемом выпускаемой продукции, пропорционально возрастающее с увеличением объема выпуска (в*х) – слайд.

Тогда зависимость потребления электроэнергии от объема продукции можно выразить уравнением регрессии вида

у = а + вх. 4.1.

Если затем разделить обе части уравнения на величину объема выпуска продукции (х), то получим выражение зависимости удельного расхода электроэнергии на единицу продукции z = у/х от объема выпущенной продукции (х) в виде уравнения равносторонней гиперболы

z = в + а/х. 4.2.

Аналогично, текущие производственные затраты предприятия могут быть подразделены на условно-постоянные и условно-переменные, и тогда зависимость себестоимости единицы продукции от объемов производства также характеризуется равносторонней гиперболой.

Выбор вида уравнения регрессии экспериментальным методом обычно осуществляется при обработке информации на компьютере путем сравнения величины остаточной дисперсии, рассчитанной при разных моделях. Чем меньше величина остаточной дисперсии, тем в меньшей мере наблюдается влияние прочих, не учитываемых в уравнении регрессии факторов, тем лучше уравнение регрессии подходит к исходным данным.

Одним из базовых предположений построения качественной модели является правильная (хорошая) спецификация уравнения регрессии. Правильная спецификация уравнения регрессии означает, что оно в целом верно отражает соотношение между изучаемой переменной и объясняющими факторами, участвующими в модели. Это является необходимой предпосылкой дальнейшего качественного оценивания регрессионной модели.

Неправильный выбор функциональной формы или набора объясняющих переменных называется ошибками спецификации, основными типами которых являются.

  • 1. Отбрасывание значимой переменной. Суть данной ошибки и ее последствия наглядно иллюстрируются следующим примером. Пусть теоретическая модель, отражающая рассматриваемую экономическую зависимость, имеет вид

Данной модели соответствует следующее эмпирическое уравнение регрессии:

Исследователь по каким-то причинам (недостаток информации, поверхностное знание о предмете исследования и т. п.) считает, что на переменную Y реально воздействует лишь переменная Х у Он ограничивается рассмотрением модели

При этом он не рассматривает в качестве объясняющей переменную Х 2 , совершая ошибку отбрасывания существенной переменной.

Пусть эмпирическое уравнение регрессии, соответствующее теоретическому уравнению (9.28), имеет вид

Последствия данной ошибки достаточно серьезны. Оценки, полученные с помощью МНК по уравнению (9.29), являются смещенными (М[у* 0 ] Ф Ь 0 , М[у*] Ф Ъ г) и несостоятельными даже при бесконечно большом числе испытаний. Следовательно, возможные интервальные оценки и результаты проверки соответствующих гипотез будут ненадежными.

Последствия данной ошибки будут не столь серьезными, как в предыдущем случае. Оценки у 0 , коэффициентов, найденные для модели (9.30), остаются, как правило, несмещенными (M = b 0 , М[у* 1 ] = Ъ 1) и состоятельными. Однако их точность уменьшится, увеличивая при этом стандартные ошибки, т. е. оценки становятся неэффективными, что отразится на их устойчивости. Данный вывод логически вытекает из расчета дисперсий оценок коэффициентов регрессии для этих уравнений:

Здесь r XiX2 - коэффициент корреляции между объясняющими переменными Х 1 иХ 2 .

Следовательно, причем знак равенства возможен

лишь при

Увеличение дисперсии оценок может привести к ошибочным результатам проверки гипотез относительно значений коэффициентов регрессии, расширению интервальных оценок.

3. Выбор неправильной функциональной формы. Суть ошибки проиллюстрируем следующим примером. Пусть правильная регрессионная модель имеет вид

Любая другая зависимость с теми же переменными, но имеющая другой функциональный вид, приводит к искажению истинной зависимости. Например, в следующих уравнениях

совершена ошибка выбора неправильной функциональной формы уравнения регрессии. Последствия данной ошибки будут весьма серьезными. Обычно такая ошибка приводит либо к получению смещенных оценок, либо к ухудшению статистических свойств оценок коэффициентов регрессии и других показателей качества уравнения. В первую очередь это вызвано нарушением условий Гаусса-Маркова для отклонений. Прогнозные качества модели в этом случае очень низки.

При построении уравнений регрессии, особенно на начальных этапах, ошибки спецификации допускаются довольно часто из-за поверхностных знаний об исследуемых экономических процессах, или из-за недостаточно глубоко проработанной теории, или из-за погрешностей сбора и обработки статистических данных при построении эмпирического уравнения регрессии. Важно уметь обнаружить и исправить эти ошибки. Сложность процедуры обнаружения определяется типом ошибки и нашими знаниями об исследуемом объекте.

Если в уравнении регрессии имеется одна несущественная переменная, то она обнаружит себя по низкой t-статистике. В дальнейшем эту переменную исключают из рассмотрения.

Если в уравнении несколько статистически незначимых объясняющих переменных, то следует построить другое уравнение регрессии без этих незначимых переменных. Затем с помощью F-статистики сравниваются коэффициенты детерминации для первоначального и дополнительного уравнений регрессий

где п -- число наблюдений;

га - число объясняющих переменных в первоначальном уравнении;

к -- число отбрасываемых из первоначального уравнения объясняющих переменных.

Возможные рассуждения и выводы для данной ситуации приведены в п. 6.7.2.

Однако проведение указанных проверок имеет смысл лишь при правильном подборе вида (функциональной формы) уравнения регрессии, что можно осуществить, если согласовывать его с теорией. Например, при построении кривой Филлипса, устанавливающей зависимость между заработной платой У и безработицей X, является обратной. Возможны следующие модели:

Отметим, что выбор модели далеко не всегда осуществляется однозначно и в дальнейшем требуется сравнивать модель как с теоретическими, так и с эмпирическими данными, и совершенствовать ее. Напомним, что при определении качества модели обычно анализируются следующие параметры:

  • а) скорректированный коэффициент детерминации Я;
  • б) t-статистики;
  • в) статистика Дарбина-Уотсона DW;
  • г) согласованность знаков коэффициентов с теорией;
  • д) прогнозные качества (ошибки) модели.

Если все эти показатели удовлетворительны, то данная модель может быть предложена для описания исследуемого реального процесса. Если же какая-либо из описанных выше характеристик не является удовлетворительной, т. е. основания сомневаться в качестве данной модели (неправильно выбрана функциональная форма уравнения; не учтена важная объясняющая переменная; имеется объясняющая переменная, неоказывающая значимого влияния на зависимую переменную).

  • Добавление незначимой переменной. В некоторых случаях в уравнения регрессии включают слишком много объясняющих переменных, причем не всегда обоснованно. Например,теоретическая модель имеет следующий вид Пусть исследователь подменяет ее более сложной моделью: добавляя при этом не оказывающую реального воздействия наY объясняющую переменную Х2. В этом случае совершаетсяошибка добавления несущественной переменной.


Вверх