Коефіцієнти зв'язку між двома ознаками. Кореляційний і регресійний аналіз

Коефіцієнти зв’язку між двома ознаками. Кореляційний і регресійний аналіз.

Одним із важливих завдань аналізу даних є пошук та оцінка взаємозв'язків між окремими ознаками для певної сукупності об'єктів. Вирішувати цю проблему починають з побудови кореляційних таблиць (їх ще називають таблицями спряженості двох ознак, двомірними таблицями). Вони дають змогу впорядковувати інформацію про розподіл сукупності об'єктів за двома ознаками. Такі таблиці мають прямокутну форму. Кількість рядків у них дорівнює кількості можливих значень однієї ознаки, а кількість стовпчиків — кількості можливих значень другої ознаки. В наведеній нижче таблиці в клітинці на перетині другого рядка і третього стовпчика знаходиться число 42 (в центрі клітинки) — кількість робітниць (значення ознаки «Стать» — «жіноча»), що не задоволені умовами праці (значення ознаки «Задоволеність умовами праці» — «не задоволений»).

Задовол. Не зовсім задовол. Не задовол. Всього

Чол. 18. 40% 75,94% 5. 66%

39 161 12 212

86. 67% 64. 66% 22. 22% 60. 92%

Жін. 4. 41% 64

71% 30. 88%

6 88 42 136

13. 33% 35. 34% 77. 78% 39. 08%

Всього 45 249 54

12. 93% 71. 55% 15. 52%

Крім того, двомірна таблиця, як правило, містить ще один додатковий стовпчик і ще один додатковий рядок — так звані маргінальні стовпчик та рядок. У таблиці маргінали помічені словом «Всього». Кожна клітинка маргінального стовпчика містить суму чисел відповідного рядка, тобто кількість об'єктів, що мають відповідне значення першої ознаки (незалежно від того, якого значення для цих об'єктів набуває друга ознака), а також відсоток, який становить це число відносно загальної кількості об'єктів. Так, з маргінального стовпчика

таблиці бачимо, що на підприємстві працює 136 жінок (39,08% від загальної кількості працюючих). Маргінальний рядок містить відповідні суми стовпчиків таблиці.

У кожній клітинці таблиці, як правило, записують відсоток, відносно відповідного значення в маргінальному стовпчику (цей відсоток записують вище від самого числа) та відсоток відносно відповідного значення в маргінальному рядку (записують нижче від числа). Якщо знову повернутися до клітинки в другому рядку третього стовпчика таблиці, побачимо, що кількість не задоволених умовами праці жінок (таких на підприємстві 42) становить 30,88 % від загальної кількості жінок (всього на підприємстві 136 жінок) та 77,78 % від загальної кількості незадоволених умовами праці (всього умовами праці на підприємстві не задоволені 54 працівники).

Числа в таблиці свідчать, що серед жінок відсоток незадоволених умовами праці на підприємстві значно вищий, ніж серед чоловіків. Отже, є підстави для гіпотези, що стать працівника та його задоволеність умовами праці взаємопов'язані, Вміння читати двовимірні таблиці приходить неодра-Зу — потрібна практика. Нелегко знаходити закономірності в досить великих за розміром таблицях. Крім того, далеко не завжди явно простежується зв'язок між ознаками. Тому на практиці наявність зв'язку між двома ознаками встановлюють за допомогою так званого критерію х2, який базується на аналізі частот, записаних в клітинках таблиці, і дає змогу робити висновки про те, чи можна висувати й аналізувати гіпотезу про наявність зв'язку між двома ознаками.

1 2 3 4

Схожі роботи

Реферати

Курсові

Дипломні