Что такое корреляция

картинка Что такое корреляция

Корреляция – что означает слово

Корреляция (от лат. correlatio «соотношение») — взаимная зависимость значений нескольких величин друг от друга. В случае, когда между значениями существует корреляция, изменение одного из них всегда будет провоцировать изменение другого. Степень зависимости величин между собой определяет коэффициент корреляции.

История термина

Понятие корреляции впервые сформировал Жорж Кювье, занимавшийся палеонтологией в XVIII веке во Франции. Взаимная зависимость значений в его случае помогала в точности восстанавливать конечный облик древнего существа, располагая лишь отдельными его остатками.

Само значение слова интуитивно понятно даже для людей, далеких от точных наук. Relatio — общий корень множества европейских языков, всегда означающий «отношение». Префикс co- позволяет понять, что речь идет о двустороннем отношении двух и более значений.

Уже вскоре употребление слова вышло за рамки палеонтологии и благодаря работам Ф. Гальтона стало употребляться в статистике. Сперва лишь применимой к биологии, но затем применяемой во всех областях науки. Значительный вклад в развитие математической модели корреляционных связей сделал К. Пирсон.

Корреляция К. Пирсона

Английский математик, философ и биолог Карл Пирсон, сотрудничая с Р. Уэлдоном и Ф. Эджуортом, стал первым, кому удалось вывести точную формулу корреляционной связи. Она численно показывает степень зависимости между параметрами. Получаемое значение называется линейным коэффициентом корреляции. Его значение колеблется между значениями от «минус единицы» до «единицы».

Предложенная Пирсоном формула актуальна и до сегодня, и имеет широкую область применения:

  • компьютерное программирование;
  • математическая статистика;
  • экономика;
  • физика;
  • химия;
  • биология.

Ковариация

Значимым элементом взаимной зависимости величин является ковариация — среднее значение случайной величины (при стремлении выборки к бесконечности) произведения отклонения.

Характеристики ковариации:

  • наличие размерности, которая равна произведению размерности произвольных величин;
  • ковариация независимых друг от друга величин A и B всегда будет равна нулю;
  • величина ковариации A и B не может превышать значение разброса их математического ожидания.

Эти недостатки ковариации делали невозможной её полноценное использование в качестве инструмента корреляционного анализа. Выходом из ситуации стало введение линейного коэффициента корреляции.

картинка Что такое корреляция

Особенности корреляционного анализа

Под корреляционным анализом подразумевает методика обработки данных статистики. Для этого определяется теснота связи между несколькими переменными, которые необходимо исследовать.

Нередко корреляционный анализ проводят совместно с регрессионным. В таком случае удается получить более развернутые данные, уменьшив при этом влияние на конечный результат тех или иных посторонних факторов.

Основные ограничения корреляционного анализа заключаются в следующем:

  1. Применяться эта методика может только в тех случаях, когда присутствует достаточный объем наблюдений для исследования. Он должно быть довольно значительным – в 5 или 6 раз выше, чем количество внешних факторов.
  2. Весь объем имеющихся значений и результатов обязательно должен быть подвержен многомерному нормальному распределению. Без этого получить корректный результат исследования просто невозможно.
  3. Исходный объем всех полученных значений первоначально должен быть предельно однородным.
  4. Результат корреляционного анализа не позволяет сделать вывод о том, какая из переменных была триггером изменений в системе.

Несмотря на вышеперечисленные ограничения, свойственные корреляционному анализу, он пользуется значительной популярностью.

Сфера использования понятия

Корреляция широко распространена в разных видах деятельности с целью обработки массивов статистических данных. Это касается, прежде всего, таких наук, как:

  • экономика;
  • математика;
  • астрофизика;
  • психология;
  • социология и др.

Отдельно стоит выделить возможность применения корреляции в некоторых важных для человечества сферах деятельности. Это касается металловедения, агрохимии, биометрического анализа и биологии. В разных типах прикладных отраслей принято использовать предельные границы интервалов для оценки тесноты или же значимости связи.

Распространение использования метода корреляции обусловлено такими факторами, как:

  • простота подсчета;
  • отсутствие необходимости наличия специальной подготовки.

Интерпретация корреляции тоже под силы практически любому человеку. Именно поэтому данный метод так широко используется в различных сферах, где требуется анализ тех или иных статистических данных.