виділимо наступні основні групи даних:
сукупності чисел, що характеризують ті чи інші об'єкти (в якості таких сукупностей можуть виступати, наприклад, виробничі характеристики підприємств, вік респондентів, оцінки випускниками шкіл престижності деяких професій і т.д.);
безлічі індикаторів певних відносин між розглянутими об'єктами, такі дані часто використовуються при вивченні малих груп;
результати попарних зіставлень респондента ми (тобто особами, які відповідають на питання дослідників) будь-яких об'єктів;
сукупності певних висловлювань (на приклад, відповідей респондентів на питання про їх професії, про те, що їм подобається в політиці уряду; листи читачів газети до редакції; фрагменти з журнальних статей і т.д.);
тексти документів;
так чи інакше зафіксовані результати спостереження за невербальною поведінкою людей і т.п.
Найбільш часто в економічних, соціологічних, психологічних дослідженнях дані представляють собою сукупність значень яких-небудь ознак (характеристик, змінних, величин; вважатимемо ці терміни синонімами), виміряних для кожного з досліджуваних об'єктів. Результати обробки даних використовуються для побудови моделей і прогнозів соціально-економічних процесів і ситуацій.
Основна мета аналізу даних - виявлення (підтвердження, коректування) якихось цікавлять дослідника закономірностей. Прийнято виділяти дві основні форми закономірного зв'язку явищ, що відрізняються за характером випливають з них пророкувань: динамічні та статистичні закономірності 38. У законах динамічного типу пророкування має точний, визначений однозначний вигляд; в статистичних ж законах пророкування носить не достовірний, а лише імовірнісний характер, тобто воно більш-менш правдоподібно. У даному розділі розглядаються, в основному, статистичні закономірності. Це закономірності «в середньому». Статистичний підхід полягає в уявному поділі спостерігається мінливості на дві частини (обумовлені, відповідно, закономірними і випадковими причинами) і виявленні закономірною мінливості на тлі випадковою. Імовірнісний характер пророкувань в статистичних закономірностях зазвичай буває обумовлений дією безлічі випадкових факторів, які мають місце в статистичних сукупностях. Статистична закономірність виникає як результат взаємодії великого числа елементів, що складають сукупність, і характеризує не стільки поведінку окремого елемента сукупності, скільки всю сукупність в цілому. Що виявляється в статистичних закономірностях «необхідність» виникає внаслідок взаємної компенсації і врівноваження безлічі випадкових факторів, «пробиває» собі дорогу через масу випадковостей.
Коротко розглянемо, слідуючи С.С. Стівенсу, різні шкали та їх застосування в процесі збору та аналізу даних.
Номінальний вимір (привласнення позначення або позначень) навряд чи заслуговує того, щоб називатися «виміром». Це процес групування предметів у класи, коли об'єкти, що належать до одного класу, ідентичні (або майже ідентичні) відносно деякої ознаки чи властивості. Далі класам даються позначення; за позначення класу часто приймаються числа, які можуть служити поясненням заголовка «номінальне вимір».
Порядкове вимір можливо тоді, коли можливо виявити в предметах різні ступені ознаки або властивості. У цьому випадку використовується властивість «впорядкованості» чисел, і числа приписуються предметам таким чином, що якщо число, присвоєне предмету А, більше числа, присвоєного В, то це означає, що в А міститься більше даної властивості, ніж у В.
Інтервальне вимір можливо, коли вимірювач здатний визначити не тільки кількості властивості в предметах (характеристика порядкового виміру), але також фіксувати рівні відмінності між предметами. Для інтервального вимірювання встановлюється одиниця виміру (градус, долар, сантиметр, грам і т.д.). Предмету присвоюється число, рівне кількості одиниць виміру, яке еквівалентно кількості наявного властивості.
Вимірювання відносин відрізняється від інтервального тільки тим, що нульова точка не довільна, а вказує на повну відсутність вимірюваної властивості. Вимірювач може помітити відсутність властивості і має одиницю виміру, що дозволяє реєструвати розрізняються значення ознаки.
У системної аналітики, кадровому менеджменті більшість вимірювань відноситься до номінального, порядковому і інтервального рівням (наприклад, передвиборні рейтинги кандидатів). Лише найменш важливі змінні в цих областях допускають поки вимір відносин: насправді шкали, що задовольняють умовам інтервальної шкали, молено знайти з працею. Іноді змінні шкали відносин, такі як час (рішення задачі або заучування списку слів), зріст, вага або відстань, можуть представляти інтерес, але ...