Справочный материал Примеры Обратите внимание! Видео Модели Пройти тесты
Статистической называют зависимость, при которой изменение одной из случайных величин влечет изменение распределения другой.
Статистическую зависимость называют корреляционной, если изменение одной из случайных величин вызывает изменение среднего значения другой.
Коэффициент корреляции показывает тесноту связи между признаками LaTeX formula: X и LaTeX formula: Y.
Пусть из генеральной совокупности извлечена выборка двумерной случайной величины  LaTeX formula: (X;Y) объема  LaTeX formula: n=\sum_{i=1}^{n}n_{x_i}=\sum_{j=1}^{m}n_{y_j} .
Выборочный коэффициент корреляции находят по формуле:
LaTeX formula: r_{XY}=\frac{\overline{XY}-\overline{X}\cdot \overline{Y}}{\overline{\sigma}_X\cdot \overline{\sigma }_Y}, (11.26)
где 
LaTeX formula: \overline{X}=\frac{1}{n}\sum_{i=1}^{k}x_in_{x_i} , (11.2)                                                  LaTeX formula: \overline{Y}=\frac{1}{n}\sum_{j=1}^{m}y_jn_{y_j} , (11.2.1)
LaTeX formula: \overline{D}_X=\overline{X^2}-(\overline{X})^2 , (11.3)                                                LaTeX formula: \overline{D}_Y=\overline{Y^2}-(\overline{Y})^2 , (11.3.1)
LaTeX formula: \overline{X^2}=\frac{1}{n}\sum_{i=1}^{k}x^2_in_{x_i} , (11.4)                                                LaTeX formula: \overline{Y^2}=\frac{1}{n}\sum_{j=1}^{m}y^2_jn_{y_j} , (11.4.1)
LaTeX formula: \overline{\sigma }_X=\sqrt{\overline{D}_X} ; (11.5)                                                         LaTeX formula: \overline{\sigma }_Y=\sqrt{\overline{D}_Y} ; (11.5.1)

LaTeX formula: \overline{XY}=\frac{1}{n}\sum_{j=1}^{m}y_j\sum_{i=1}^{k}x_in_{xy}=\frac{1}{n}\sum_{i=1}^{k}x_i\sum_{j=1}^{m}y_jn_{xy} . (11.27)
Выборочные данные представлены в корреляционной таблице, где  LaTeX formula: n_{ij} –  количество пар LaTeX formula: (x_i;y_j) , LaTeX formula: i=\overline{1,m} , LaTeX formula: j=\overline{1,k} :
Пример. Проанализировано LaTeX formula: 32 слова из фрагмента произведения  С. Есенина LaTeX formula: CBX – количество букв в словеLaTeX formula: CBY – количество согласных в слове. Получены следующие значения двумерной случайной величины LaTeX formula: (X;Y)LaTeX formula: (1;0)LaTeX formula: (7;3)LaTeX formula: (7;3)LaTeX formula: (3;2)LaTeX formula: (8;3)LaTeX formula: (7;3)LaTeX formula: (4;2)LaTeX formula: (1;1)LaTeX formula: (3;2)LaTeX formula: (7;4)LaTeX formula: (2;1)LaTeX formula: (3;2)LaTeX formula: (5;4)LaTeX formula: (6;3)LaTeX formula: (4;2)LaTeX formula: (5;3)LaTeX formula: (6;4)LaTeX formula: (7;5)LaTeX formula: (8;4)LaTeX formula: (5;3)LaTeX formula: (9;6)LaTeX formula: (5;3)LaTeX formula: (4;2)LaTeX formula: (6;4)LaTeX formula: (8;5)LaTeX formula: (4;2)LaTeX formula: (6;4)LaTeX formula: (1;0)LaTeX formula: (4;2)LaTeX formula: (5;3)LaTeX formula: (1;1)LaTeX formula: (6;5)
Необходимо установить, существует ли зависимость между количеством гласных и количеством букв в слове
Решение. Построим интервальные вариационные ряды:
Заполним корреляционную таблицу (в качестве значений признаков взяты середины интервалов):
По формуле 11.2 получим: LaTeX formula: \overline{X}=\frac{160}{32}=5  (среднее кол-во букв в слове); 
По формуле 11.4 получим: LaTeX formula: \overline{X^2}=\frac{930,28}{32}=29,07 ; 
По формуле 11.3 получим: LaTeX formula: \overline{D}_X=29,07-25=4,07 ; 
По формуле 11.5 получим: LaTeX formula: \overline{\sigma }_X\approx 2,017 ; 
По формуле 11.2.1 получим: LaTeX formula: \overline{Y}=\frac{91,2}{32}=2,85  (среднее количество гласных в слове); 
По формуле 11.4.1 получим: LaTeX formula: \overline{Y^2}=\frac{331,2}{32}=10,35 ; 
По формуле 11.3.1 получим: LaTeX formula: \overline{D}_Y=10,35-8,12=2,2275 ; 
По формуле 11.5.1 получим: LaTeX formula: \overline{\sigma }_Y\approx 1,492 . 
По формуле 11.27 получим: LaTeX formula: \overline{XY}=\frac{544,32}{32}=17,01 .
По формуле 11.26 найдем коэффициент корреляции: LaTeX formula: r_{XY}=\frac{17,01-5\cdot 2,85}{2,017\cdot 1,492}=0,91 .
Ответ: Так как коэффициент корреляции равен LaTeX formula: 0,91, то существует сильная статистическая зависимость между количеством гласных и количеством букв в слове.
Коэффициентом корреляции двух случайных величин LaTeX formula: X и LaTeX formula: Y называют число, которое находят по формуле:
LaTeX formula: R(X;Y)=\frac{M(X;Y)-M(X)M(Y)}{\sigma (X)\sigma (Y)} .
Свойства коэффициента корреляции: 
1) LaTeX formula: \left | R(X;Y) \right |\leq 1 ;
2) если случайные величины LaTeX formula: X и LaTeX formula: Y независимы, то LaTeX formula: R(X;Y)=0 ;
3) если случайные величины LaTeX formula: X и LaTeX formula: Y связаны линейной зависимостью, т. е. LaTeX formula: Y=kX+b , то LaTeX formula: R(X;Y)=1 .

formula