Справочный материал
Примеры
Обратите внимание!
Видео
Модели
Пройти тесты




















Рассмотрим взаимосвязь двух переменных
и
, в которой выделим одну из переменных как независимую (объясняющую), а другую как зависимую (объясняемую). В этом случае изменение первой переменной может служить причиной изменения второй. Однако каждому конкретному значению объясняющей переменной
может соответствовать не одно, а множество значений объясняемых переменных
. Поэтому анализируют, как объясняющая переменная влияет на зависимую переменную в среднем. Зависимость такого вида выражается соотношением
и называется функцией регрессии
на
.







Пусть имеем следующие результаты измерений:

Вид зависимости между переменными величинами можно установить различными способами, например, графически, построив корреляционное поле, которое представляет собою множество построенных на координатной плоскости точек вида
, где
.


Если все построенные точки незначительно уклоняются от некоторой прямой, то полагают, что между величинами
и
существует линейная зависимость (рис. 11.4).



Эмпирическое уравнение линейной регрессии
на
имеет вид:




Эмпирические коэффициенты
и
находят, решая систему уравнений:




Параметры эмпирических формул определяются по методу наименьших квадратов (МНК), т. е. минимизируется функция (рис. 11.5):


Если все построенные точки незначительно уклоняются от дуги некоторой параболы, то полагают, что между величинами
и
существует квадратичная зависимость (рис. 11.6).



Эмпирическое уравнение квадратичной регрессии
на
имеет вид:




Эмпирические коэффициенты
и
находят, решая систему уравнений:




Пример. Проанализировано
слова из фрагмента произведения С. Есенина:
– количество бука в слове;
– количество согласных в слове. Получены следующие значения двумерной случайной величины 









Необходимо: 1) построить корреляционное поле; 2) найти и построить уравнение регрессии.
Решение. 1. Построим корреляционное поле (рис. 11. 7).


Вычитая из первого уравнения второе, получим:
Подставляя это значение в уравнение
получим: 



3. Построим прямую регрессии (рис. 11.8).

Если имеем две объясняющие переменные, то, используя МНК, коэффициенты эмпирического уравнения регрессии

рассчитывают по формулам:


Дисперсии и стандартные ошибки коэффициентов рассчитывают по формулам (
– объем выборки):







Статистическую значимость коэффициентов регрессии
и
устанавливают на основе
-статистики:
и 





Проверяются гипотезы: 1)
2) 


Если
и
(
– уровень значимости,
– объем выборки), то данные коэффициенты статистически значимы.




Доверительные интервалы коэффициентов регрессии рассчитывают по формуле:

Коэффициент детерминации рассчитывают по формуле 

Статистическая значимость коэффициента детерминации проверяется с помощью гипотезы: 

С помощью статистики Фишера находят 

При уровне значимости
находят критическое значение распределения Фишера: 


Если
, то нулевая гипотеза отклоняется, следовательно, коэффициент детерминации статистически значим.



Гипотеза об отсутствии автокорреляции проверяется на основе статистики Дарбина – Уотсона
, которая определяется по формуле: 


Если выполняется условие
, то автокорреляция остатков отсутствует.
