Статьи

НОУ ІНТУЇТ | лекція | Обробка результатів імітаційного експерименту

5.9. Сутність кореляційного аналізу

Часто при дослідженні об'єкта або його моделі необхідно спостерігати за характеристиками двох і більше випадкових величин. Наприклад, за двома відгуками одного експерименту. При цьому може виникнути питання: чи є зв'язок між цими випадковими величинами? Істотна або несуттєва цей зв'язок, якщо вона є?

Кореляційний аналіз - це сукупність методів виявлення залежності (кореляції) між двома або більше випадковими ознаками або процесами.

Під кореляцією будемо розуміти статистичну залежність між двома випадковими величинами, що не має, взагалі кажучи, строго функціонального характеру.

Зауважимо, що кореляційний аналіз не дозволяє визначити вид функціонального зв'язку між випадковими величинами, а тільки наявність або відсутність передбачуваної зв'язку, наприклад, лінійної, параболічної, експоненційної і т. Д. В рамках цього навчального посібника ми обмежимося розглядом гіпотези про наявність лінійної кореляції.

Визначення виду функціонального зв'язку між величинами розглядається в регресійному аналізі, елементи якого і практичне використання будуть розглянуті в наступному п. 5.10.

Назва "кореляційний аналіз" походить від латинського слова correlatio - узгодження, зв'язок, співвідношення, взаємозв'язок. Термін вперше введений Гальтон (Galton) в 1888 р

Зазвичай досліджують парну кореляцію, тобто залежність між двома випадковими величинами (процесами), хоча можливі і більш складні ситуації, коли необхідно виявити наявність або відсутність зв'язків між трьома або більше випадковими величинами.

Ми обмежимося дослідженням парної кореляції.

Як відомо, зв'язок між двома випадковими величинами можна описати за допомогою двовимірної функції розподілу. Однак такий опис часто дуже складно, а для практичних цілей можна задовольнитися визначенням залежностей середніх значень.

Отже, метою імітаційного експерименту є визначення характеристик двох випадкових величин Отже, метою імітаційного експерименту є визначення характеристик двох випадкових величин   і і . наприклад:

Необхідно перевірити: чи є зв'язок між величинами Необхідно перевірити: чи є зв'язок між величинами   і і ?

Перевірка наявності (або відсутності) зв'язку - кореляції - між випадковими величинами виконується так.

Проводиться два експерименти, кожен - з відповідною моделлю. У кожному експерименті - Проводиться два експерименти, кожен - з відповідною моделлю спостережень (нагадуємо, що комп'ютерний експеримент складається з спостережень, а спостереження - з реалізацій (прогонів) моделі, число яких розраховується з урахуванням необхідної точності і достовірності отриманих результатів моделювання). В результаті експериментів виходять два безлічі значень вимірюваних параметрів і : і , .

З цих множин формуються пари:

Кожна пара інтерпретується як координати випадкової точки в системі координат Кожна пара інтерпретується як координати випадкової точки в системі координат   , , .

Первинне дослідження можна провести графічно. Можливі такі варіанти розміщення точок на графіках ( Мал. 5.5 ).

Кореляція - важливе поняття. Навчіться візуально визначати по розташуванню даних, наскільки тісно вони коррелірованни.

Кажуть, що дві змінні позитивно коррелірованни, якщо при збільшенні значень однієї змінної збільшуються значення іншої змінної ( Мал. 5.5 б).


Мал.5.5.

Графічне дослідження кореляції

Дві змінні негативно корельовані, якщо при збільшенні однієї змінної інша змінна зменшується ( Мал. 5.5 в).

Відсутність кореляції - спільного поведінки змінних - виявляється хаотичним нагромадженням точок, що виключає проведення будь-якої апроксимуючої лінії (див. Мал. 5.5 г).

Але таке якісне дослідження недостатньо. Необхідно мати кількісну оцінку ступеня кореляції між величинами Але таке якісне дослідження недостатньо і .

Якщо спільний розподіл вірогідності випадкових величин Якщо спільний розподіл вірогідності випадкових величин   і   нормальне, то кількісною характеристикою ступеня лінійного зв'язку між ними є коефіцієнт кореляції r (введений Пирсоном (Pearson), 1896 г і нормальне, то кількісною характеристикою ступеня лінійного зв'язку між ними є коефіцієнт кореляції r (введений Пирсоном (Pearson), 1896 г.):

якщо якщо   , То між   і   лінійна незалежність , То між і лінійна незалежність.

рівність рівність   свідчить про наявність однозначної функціонального зв'язку між   і   , тобто свідчить про наявність однозначної функціонального зв'язку між і , тобто .

при при   між   і   існує стохастична зв'язок, причому, чим ближче коефіцієнт кореляції   до одиниці, тим цей зв'язок сильніший між і існує стохастична зв'язок, причому, чим ближче коефіцієнт кореляції до одиниці, тим цей зв'язок сильніший. Стохастична зв'язок означає, що при зміні є лише тенденція до зміни .

коефіцієнт кореляції коефіцієнт кореляції   визначається за даними експерименту, отже, можна визначити тільки його оцінку визначається за даними експерименту, отже, можна визначити тільки його оцінку . В якості оцінки прийнятий вибірковий коефіцієнт кореляції:

де де   оцінки математичних очікувань і   і   ; оцінки математичних очікувань і і ;

- оцінки середньоквадратичних відхилень   і - оцінки середньоквадратичних відхилень і

Вибірковий коефіцієнт кореляції Вибірковий коефіцієнт кореляції   , Так само як і теоретичний, приймає значення: , Так само як і теоретичний, приймає значення: .

якщо якщо   , То спостерігається позитивна кореляція (див , То спостерігається позитивна кореляція (див. Мал. 5.5 б). якщо - негативна кореляція (див. Мал. 5.5 в). якщо - лінійна кореляція відсутня (але не виключена нелінійна). якщо , То між випадковими величинами існує жорстка функціональний зв'язок.

Зауважимо, що даний коефіцієнт кореляції Зауважимо, що даний коефіцієнт кореляції   визначає ступінь лінійного зв'язку між випадковими величинами   і визначає ступінь лінійного зв'язку між випадковими величинами і . Ця кореляція найбільш популярна, тому часто, коли говорять про кореляцію, мають на увазі саме кореляцію Пірсона.

Однак цей лінійний коефіцієнт кореляції не є придатним для оцінки нелінійної зв'язку, якщо така є. При нелінійної залежності ступінь зв'язку між випадковими величинами встановлюється більш складними характеристиками, наприклад, кореляційним відношенням (К. Пірсон).

Чисельник виразу (5.1) іноді називають ковариацию - Чисельник виразу (5 .

Якщо випадкові величини Якщо випадкові величини   і   незалежні, вони і не коррелірованни і незалежні, вони і не коррелірованни . але некоррелірованні і не завжди свідчить про їх незалежності. Але якщо і мають нормальний розподіл, то умова є необхідною і достатньою умовою незалежності цих величин.

І ще. Наявність кореляції між випадковими величинами І ще і не завжди свідчить про їх взаємозв'язку. Справа в тому, що за часів незалежності і кожна з них окремо залежить від деякого випадкового фактора , Але ця залежність нами не помічено.

Тому хорошим тоном після обчислення кореляцій є побудова діаграм розсіювання, які дозволяють зрозуміти, чи дійсно між двома досліджуваними змінними є зв'язок.

Оцінка коефіцієнта кореляції повинна бути визначена з необхідними точністю і достовірністю, які залежать від числа реалізацій моделі. Знайдемо цей зв'язок.

У припущенні нормальності розподілу У припущенні нормальності розподілу   можна написати: можна написати:

З вираження (5.2) ми вже знайомі. тут:

- точне значення коефіцієнта кореляції; - точне значення коефіцієнта кореляції;

- середньоквадратичне відхилення випадкової величини   ; - середньоквадратичне відхилення випадкової величини ;

- аргумент функції Лапласа - аргумент функції Лапласа

Зазвичай середньоквадратичне відхилення Зазвичай середньоквадратичне відхилення   невідомо, тому потрібно брати її оцінку невідомо, тому потрібно брати її оцінку.

При великих вибірках При великих вибірках   оцінка середньоквадратичного відхилення   : оцінка середньоквадратичного відхилення :

З (5.2) випливає:

- абсолютна величина помилки - абсолютна величина помилки.

попереднє визначення попереднє визначення   здійснюється за даними пробного експерименту в кількості   реалізацій моделі здійснюється за даними пробного експерименту в кількості реалізацій моделі.

На підставі викладеного та у силу випадкового характеру досліджуваних величин На підставі викладеного та у силу випадкового характеру досліджуваних величин   і   ми можемо стверджувати лише наступне: справжнє значення коефіцієнта кореляції   лежить в межах і ми можемо стверджувати лише наступне: справжнє значення коефіцієнта кореляції лежить в межах

із заданою вірогідністю із заданою вірогідністю .

На закінчення відзначимо, що якщо спільний розподіл випадкових величин На закінчення відзначимо, що якщо спільний розподіл випадкових величин   і   не є нормальним, то оцінка   коефіцієнта кореляції може виступати в якості орієнтовної оцінки ступеня тісноти зв'язку   і і не є нормальним, то оцінка коефіцієнта кореляції може виступати в якості орієнтовної оцінки ступеня тісноти зв'язку і .

Приклад 5.7 [ 2 ]. Для оцінки конструкції нового великокаліберного кулемета було вироблено 96 пострілів по щиту, відстояв на відстані 300 метрів.

Результати відхилень влучень від точки прицілювання (бічні Результати відхилень влучень від точки прицілювання (бічні   , по висоті   ) Об'єднані в десятисантиметрові діапазони і зведені в таблицю (   табл , по висоті ) Об'єднані в десятисантиметрові діапазони і зведені в таблицю ( табл. 5.9 ).

Для оцінки конструктивних особливостей кулемета необхідно дізнатися: чи є якийсь зв'язок між бічними відхиленнями і відхиленнями по висоті.

Рішення

Відповідь на поставлене запитання може дати коефіцієнт кореляції. Попередньо зауважимо, що угруповання вимірювань в десятисантиметрові діапазони вносить деяку помилку в подальші розрахунки, однак можна показати, що при даній угрупованню помилка несуттєва.

В табл. 5.9 вказані не реальні відхилення, а центри діапазонів (-25 ... -15, -15 ... -5, -5 ... 5 і т. д.).

Для визначення коефіцієнта кореляції знадобляться наступні характеристики:

, ковариация , ковариация .

Всі ці характеристики обчислюються за даними виміряних відхилень бічних Всі ці характеристики обчислюються за даними виміряних відхилень бічних   і по висоті і по висоті .

Для прикладу, розрахунок Для прикладу, розрахунок   : :

Результати розрахунку інших показників:

Тепер оцінка коефіцієнта кореляції:

Середньоквадратичне відхилення цієї оцінки:

Через малу кількість пострілів оцінка Через малу кількість пострілів оцінка   визначена з помилкою, яка в припущенні про нормальний розподіл випадкової величини   і достовірності, наприклад,   (   ) Дорівнює: визначена з помилкою, яка в припущенні про нормальний розподіл випадкової величини і достовірності, наприклад, ( ) Дорівнює:

Звідси випливає, що справжнє значення коефіцієнта кореляції Звідси випливає, що справжнє значення коефіцієнта кореляції   лежить в межах: лежить в межах:

Виявлена ​​невелика лінійна залежність відхилень бічних і по висоті. Балістики, відкидаючи безпосередню кореляцію між відхиленнями Виявлена ​​невелика лінійна залежність відхилень бічних і по висоті і , Пояснюють значення впливом конструктивних особливостей кулемета. Виявлена ​​також систематична помилка в прицілі: , .

При цьому може виникнути питання: чи є зв'язок між цими випадковими величинами?
Істотна або несуттєва цей зв'язок, якщо вона є?

Новости


 PHILIP LAURENCE   Pioneer   Антистресс   Аромалампы   Бизнес   Игры   Косметика   Оружие   Панно   Романтика   Спорт   Фен-Шуй   Фен-Шуй Аромалампы   Часы   ЭКСТРИМ   ЭМОЦИИ   Экскурсии   визитницы   подарки для деловых людей   фотоальбомы  
— сайт сделан на студии « Kontora #2 »
E-mail: [email protected]



  • Карта сайта