Главная » 2015 » Сентябрь » 2 » Как провести регрессионный анализ
01:02

Как провести регрессионный анализ

Как провести регрессионный анализ

 

Значительный раздел статистики посвящен анализу регрессионных моделей. Такой анализ проводится как при использовании множественной регрессионной модели с несколькими переменными, так и простой линейной модели с одной независимой переменной. В этой статье рассказывается, как провести регрессионный анализ.

Шаги

  1. 1 Создайте модель, основанную на теории. Определите переменную, значение которой интересует вас, и решите, какие переменные будут независимыми и связанными линейно с первой переменной.
  2. 2 Соберите данные. Вообще говоря, для этого необходимо провести контролируемый эксперимент, но часто приходится иметь дело с результатами наблюдений.
  3. 3 Нарисуйте диаграмму, связывающую полученные данные. Диаграмма или график помогут заметить возможные корреляции между переменными. Однако часто это невозможно при наличии нескольких независимых переменных.
  4. 4 Определите уравнение регрессии. Обычно это делается при помощи компьютерных программ, особенно если в уравнение входит несколько независимых переменных.
  5. 5 Проверьте, выполняются ли необходимые условия. Если нет, откорректируйте уравнение. Необходимо выполнение следующих условий:
    • Распределение вероятности случайной ошибки ε является нормальным.
    • Среднее значение случайной ошибки равно 0.
    • Стандартное отклонение случайной ошибки является постоянной величиной (σε).
    • Ошибки независимы.
  6. 6 Проверьте точки, резко выпадающие из зависимости, и взаимно зависимые данные. Эти значения могут значительно повлиять на всю регрессионную модель, и необходимо определить, включать их в расчеты или отбросить.
  7. 7 Оцените точность модели. Для этого используются три статистических параметра:
    • Стандартная ошибка математического ожидания
    • Коэффициент детерминации и приведенный коэффициент детерминации
    • F-тест, или критерий Фишера при анализе дисперсии
  8. 8 Найдите и проанализируйте коэффициенты для каждой переменной.
    • Помните, если проверка показала, что какая-либо переменная не является значимой, это справедливо лишь для конкретной модели; в случае другой модели все может быть иначе.
    • Не упустите множественной коллинеарности. Она наблюдается тогда, когда независимые переменные взаимосвязаны между собой, и в этом случае с зависимой переменной их связывает не линейная зависимость. Это влияет лишь на коэффициенты каждой переменной, но не на F-тест всей модели.
    • Помните, что значения коэффициентов корректны лишь для конкретного набора данных, использованного при построении данной модели, поэтому будьте осторожны при экстраполяции созданной модели. В частности, значение на оси ординат в точке пересечения этой оси с регрессионной прямой часто не имеет никакого смысла.
  9. 9 Используйте построенную модель для предсказания значений зависимой переменной, либо для оценки ожидаемой величины этой переменной.

Советы

  • При обучении вам обычно дают в качестве упражнения набор данных или распечатку уже проведенного регрессионного анализа. В зависимости от вида исходных данных планируйте свои дальнейшие действия.
Категория: Вопросы и ответы | Просмотров: 469 | Добавил: fhorrigan | Рейтинг: 0.0/0