Справочный материал
Примеры
Обратите внимание!
Видео
Модели
Пройти тесты
Рассмотрим взаимосвязь двух переменных и , в которой выделим одну из переменных как независимую (объясняющую), а другую как зависимую (объясняемую). В этом случае изменение первой переменной может служить причиной изменения второй. Однако каждому конкретному значению объясняющей переменной может соответствовать не одно, а множество значений объясняемых переменных . Поэтому анализируют, как объясняющая переменная влияет на зависимую переменную в среднем. Зависимость такого вида выражается соотношением и называется функцией регрессии на .
Пусть имеем следующие результаты измерений:
Вид зависимости между переменными величинами можно установить различными способами, например, графически, построив корреляционное поле, которое представляет собою множество построенных на координатной плоскости точек вида , где .
Если все построенные точки незначительно уклоняются от некоторой прямой, то полагают, что между величинами и существует линейная зависимость (рис. 11.4).
Эмпирическое уравнение линейной регрессии на имеет вид:
Эмпирические коэффициенты и находят, решая систему уравнений:
Параметры эмпирических формул определяются по методу наименьших квадратов (МНК), т. е. минимизируется функция (рис. 11.5):
Если все построенные точки незначительно уклоняются от дуги некоторой параболы, то полагают, что между величинами и существует квадратичная зависимость (рис. 11.6).
Эмпирическое уравнение квадратичной регрессии на имеет вид:
Эмпирические коэффициенты и находят, решая систему уравнений:
Пример. Проанализировано слова из фрагмента произведения С. Есенина: – количество бука в слове; – количество согласных в слове. Получены следующие значения двумерной случайной величины
Необходимо: 1) построить корреляционное поле; 2) найти и построить уравнение регрессии.
Решение. 1. Построим корреляционное поле (рис. 11. 7).
2. Построим уравнение линейной регрессии 11.28, зная, что (см. Примеры / Корреляционный анализ).
Коэффициенты и найдем, решая систему уравнений 11.29:
Вычитая из первого уравнения второе, получим: Подставляя это значение в уравнение получим:
Запишем уравнение линейной регрессии 11.28:
3. Построим прямую регрессии (рис. 11.8).
Если имеем две объясняющие переменные, то, используя МНК, коэффициенты эмпирического уравнения регрессии
рассчитывают по формулам:
Дисперсии и стандартные ошибки коэффициентов рассчитывают по формулам ( – объем выборки):
Статистическую значимость коэффициентов регрессии и устанавливают на основе -статистики: и
Проверяются гипотезы: 1) 2)
Если и ( – уровень значимости, – объем выборки), то данные коэффициенты статистически значимы.
Доверительные интервалы коэффициентов регрессии рассчитывают по формуле:
Коэффициент детерминации рассчитывают по формуле
Статистическая значимость коэффициента детерминации проверяется с помощью гипотезы:
С помощью статистики Фишера находят
При уровне значимости находят критическое значение распределения Фишера:
Если , то нулевая гипотеза отклоняется, следовательно, коэффициент детерминации статистически значим.
Гипотеза об отсутствии автокорреляции проверяется на основе статистики Дарбина – Уотсона , которая определяется по формуле:
Если выполняется условие , то автокорреляция остатков отсутствует.