Слід зазначити, що дискретні варіаційні ряди в практиці статистичної роботи застосовуються нечасто. Вони застосовуються в тих випадках, коли варіююча ознака приймає невелику кількість значень, тобто зустрічається у малій кількості варіантів. Більш поширені інтервальні варіаційні ряди. Вони застосовуються, коли число варіант ознаки велике і коли ознаки приймають будь-які значення - як цілі, так і дробові.
В загальному вигляді інтервальний варіаційний ряд є груповою таблицею, яка теж складається з двох стовпчиків (рядків). Один з них складається із значень варіюючої ознаки згрупованих в певні інтервали - варіанти, інший - число одиниць сукупності, що потрапляють в даний інтервал - частоти.
Значення варіюючої ознаки, з якої починається той або інший інтервал, називається нижньою межею інтервалу, а значення ознаки, якою закінчується інтервал - верхньою його межею.
Таким чином, інтервальний варіаційний ряд - це ряд, в якому варіанти з'єднані в певні інтервали.
У нас вже є ранжируваний ряд, в якому результати спостереження розташовані в порядку зростання. Щоб перетворити його на інтервальний, треба утворити групи у вигляді інтервалів. Тобто треба встановити певну величину інтервалу, який і буде встановлений в основу інтервального ряду.
Статистичні таблиці, їх основні елементи, різновиди та правила побудови.
Існують три способи представлення статистичних даних: в тексті, в таблицях, графічно.
Частіше всього результати обробки статистичних даних оформлюються у вигляді статистичних таблиць. Таблична форма дозволяє висловити матеріал найбільш зручно, компактно, наочно і раціонально. Основна перевага табличної форми викладу статистичних даних полягає в тому, що за допомогою таблиць легше всього здійснювати порівняння, зіставлення і аналіз цифрової інформації.
Слід мати на увазі, що не кожна таблиця, що має цифрову інформацію, є статистичною! Статистичними вважаються тільки ті таблиці, в яких містяться результати (підсумки) зведення первинної статистичної інформації.
Статистичну таблицю можна представити як своєрідну логічне речення - в ній розрізняють підмет і присудок. Підмет - те, про що йде мова в таблиці, що характеризується (підприємство, населення, врожайність).
Присудок - те, що мовиться про підмет, тобто ті показники, які характеризують підмет (випуск продукції, число працюючих, валовий збір зерна і т.п.).
За побудовою підмета таблиці підрозділяються на: прості, групові і комбінаційні.
Прості - це ті, в яких підмет є переліком окремих одиниць сукупності (заводів, районів, об'єктів), а також динамічні таблиці, де підметом є окремі роки, місяцями або іншими періодами часу.
Групові - ті, підмет яких містить групування одиниць спостереження за однією ознакою.
Комбінаційні - підмет яких містить групування одиниць спостереження за двома і більш ознаками.
Групові і комбінаційні таблиці називаються одним словом - складні.
При побудові таблиць необхідно:
Щоб кожна таблиця мала докладну назву, що показує яке коло питань виражається або ілюструється таблицею. Тобто чіткість заголовків, їх стислість і виразність.
В назві таблиці вказати період часу, за який приведені дані, або момент часу, до якого вони відносяться.
В назві вказати одиниці вимірювання, якщо вони однакові для всіх табличних клітин. Якщо неоднакові, то вони вказуються в заголовках граф або рядків. Якщо кожний рядок має свою особливу одиницю вимірювання, то для їх позначення слід відводити спеціальну графу.
Бажано давати нумерацію граф. Це полегшує користування таблицею і дозволяє показати спосіб розрахунку цифр в графах. Наприклад, в заголовку 3-ї графи може бути вказано (гр.1 + гр.2).
Перша графа призначається для бічних заголовків і тому в нумерацію не входить. Вона позначається буквою «А».
Статистична таблиця, як правило, повинна мати підсумки по графах і рядках - «разом» або «всього».
Округлення чисел у всіх графах і рядках слід проводити з однаковою точністю.
В кожній клітині таблиці повинне стояти яке-небудь число. Якщо число чомусь відсутнє, то це повинне бути пояснено наступним умовним чином:
якщо клітина взагалі не підлягає заповненню, то в ній ставлять знак «х»;
якщо відомості відсутні, (.), чи «нема від.»;
якщо відсутнє саме явище (сам факт), то ставлять тире (-);
якщо числове значення менше прийнятої в таблиці точності, то ставлять «0,0» або «0,00».
У разі потреби в таблиці робляться зноски та примітки, які треба взяти до уваги при читанні таблиці. Так, якщо поряд з якимсь числом стоїть знак (*), це значить, що дані є попередніми, або вказати джерело інформації звідки вони взяті.
Поняття статистичного графіка, його призначення та основні елементи.
Статистичний графік є умовним зображенням статистичних величин за допомогою ліній, геометричних фігур, рисунків або схематичних географічних карт. Графік, на відміну від таблиці, створює свого роду готовий образ явища, що вивчається, і дозволяє відразу помітити особливості, взаємозв'язки і закономірності, що містяться в цифровому матеріалі. За допомогою графіків можна зробити висновки, які на основі таблиць були б скрутні.
Головна задача графіків - наочне представлення фактів соціально-економічного життя. Вони знаходять широке вживання для популяризації різних статистичних даних і виконують важливу контрольну функцію, виявляючи різного роду помилки і неточності в цифровому матеріалі. Разом з тим, їх вживання має деякі обмеження:
Графік не може включити стільки даних, скільки їх може містити таблиця.
Графік часто використовується для зображення загальної ситуації, а не деталей, тому представляє, як правило, округлені, не зовсім точні дані.
Побудова графіка більш трудомістка ніж побудова таблиці.
Статистичний графік відрізняється від всіх інших графічних зображень тим, що він завжди зображає тільки статистичні показники.
Існують наступні основні вимоги до статистичних графіків:
графік повинен точно відображати початкові дані, представлені в таблиці;
графік повинен бути наочним, зрозумілим і легко читатись;
графік повинен бути, по можливості, художньо оформленим.
До основних елементів статистичного графіка відносяться:
графічне зображення (основа графіка) - це геометричні фігури, лінії, сукупність точок, за допомогою яких зображаються статистичні величини;
поле графіка - місце розташовує графічних зображень;
просторові орієнтири - це координатна сітка, на основі якої будується графік;
масштабні орієнтири - це розташована по осях координат масштабна шкала, на якій зліва направо і від низу до верху наносяться показники;
експлікація графіка - словесне пояснення змісту графіка.
Графічне зображення - його вибір має важливе значення при побудові графіка. Воно повинне відповідати меті графіка і найбільш точно і виразно зображати статистичні дані.
Залежно від вживаних графічних зображень графіки бувають:
точкові - застосовується сукупність точок;
лінійні - коли застосовуються лінії;
площинні: стовпчикові, квадратні, кругові і т.д.
Крім того, графіки можуть бути і у вигляді негеометричних фігур - рисунків, окремих предметів, силуетів і т.д. Такі графіки називаються фігурними.
Поле графіка - характеризується певними розмірами і пропорціями.
Розмір поля залежить від призначення графіка. Що ж до пропорцій, то вважається, що найзручнішої для сприйняття оком людини пропорцією є прямокутник із співвідношенням сторін 1:, тобто 1:1,414 або приблизно 5 : 7.
Це співвідношення прийнято і в стандарті паперу для письма. Хоча можуть бути і інші пропорції: 3 : 5; 5 : 8 і т.д. Приблизно такі ж пропорції повинні бути витримані і в розмірах більшої частини графічних зображень, розміщуваних в координатній сітці. При цьому більш довга сторона графіка (сітки) може бути розташована як по вертикалі (високий графік), так і по горизонталі (широкий графік), залежно від кількості відповідних показників.
Масштабна шкала - тобто лінія на яку наносяться показники (числа) в певному масштабі, що переводить числові величини в графічні і навпаки. Масштаби вибираються так, щоб помістилися всі статистичні показники, що зображаються. В статистичних графіках звичайно застосовуються прямолінійні масштабні шкали, які розташовуються по осях координат. Але можуть бути і криволінійні (наприклад, коло, розділене на 360°). Масштабні шкали бувають рівномірними і нерівномірними .
Експлікація графіка - включає назву (заголовок) графіка, підписи вздовж масштабних шкал, пояснення до окремих частин графіка, посилання на джерела даних, цифри масштабу, умовні позначення і т.д.
Класифікація графіків та правила їх побудови.
Існує безліч видів графічних зображень статистичних даних. Їх класифікація заснована на таких ознаках як:
спосіб побудови графічного образу;
геометричні знаки, що зображають статистичні показники;
задачі, вирішувані за допомогою графіків тощо.
За способом побудови графіки підрозділяються на діаграми, картограми і картодіаграми.
Найпоширенішим способом графічного зображення статистичних даних є діаграми. Вони бувають різних видів: лінійні, площинні, точкові, об'ємні, фігурні. Розглянемо найважливіші з них.
Стовпчикові діаграми - є найпростішими, наочними і тому частіше всього вживаються зі всіх графічних зображень. Особливо широко вони використовуються для порівняльної характеристики явищ у просторі та часі.Стовпчикові діаграми є графіком, в якому різні величини представлені розташованими вертикально прямокутниками (стовпчиками). При побудові стовпчикової діаграми використовують прямокутну систему координат і лише одну масштабну шкалу, розташовану на осі ординат. Ця шкала визначає висоту кожного стовпчика, тобто величину кожного показника. Стовпчики повинні бути з однаковими основами, розташованими на осі абсцис. Число стовпчиків рівне числу показників, відстань між ними однакова. Іноді стовпчики розташовують впритул один до одного. На масштабній шкалі записуються лише круглі або округлені числові значення. Проти цих значень іноді проводиться пунктир. Тут же вказується й одиниця вимірювання. При виборі масштабу треба виходити з того, щоб максимальна величина показника розмістилася на графіку.
Стрічкові діаграми в порівнянні зі стовпчиковими мають одну перевагу: в них кожну стрічку зручніше забезпечити відповідним надписом.Стовпчикові діаграми кращі в тих випадках, коли величини, що зображаються, виражають ідею висоти (рівень, зростання показників).Стрічкові - якщо в статистичних даних виражена ідея протяжності (довжина залізниць, річок і т.д.)
Фігурні діаграми - є деякою зміною стрічкової діаграми. В цих діаграмах смуга ділиться на рівні прямокутники, в яких показники зображаються схематичними фігурами, що відображають зміст показника.
НАПРИКЛАД, при характеристиці динаміки виробництва автомобілів зображається автомобіль.
Якщо треба графічно представити два показники, один з яких наполовину менше іншого, то менший показник зображається половиною символу (половина автомобіля). На фігурних діаграмах порівнюється не тільки кількість фігур, але і довжина смуг (стрічок).
Фігурні діаграми використовуються частіше за все як наочна агітація, ілюстрація яких-небудь показників. Вони звичайно барвисті, дохідливі і зрозумілі, привертають до себе увагу, оскільки виконуються частіше за все художником-оформлювачем.
Площинні діаграми підрозділяються на:
квадратні;
кругові;
знаки Варзара.
Квадратні і кругові діаграми є різними за розміром квадратами або кругами, площі яких пропорційні величині статистичних даних, що зображаються.
Для того, щоб побудувати, наприклад, квадратну діаграму, що характеризує валовий збір зернових в районах області, треба з показника взяти корінь квадратний і ця величина служитиме стороною квадрата, що зображає валовий збір.
Кругові діаграми будуються так само, тільки площі кіл будуються на основі радіусів, що є коренем квадратним із значень величин, що зображаються. Квадрати і кола також будуються на однаковій відстані один від одного.
Знаки Варзара застосовуються для характеристики трьох взаємозв'язаних величин. Названі на честь відомого російського статистика професори В.Є. Варзара, який їх запропонував. Вони засновані також на порівнянні площ прямокутників, в яких основою є один показник, а висотою прямокутника інший.
НАПРИКЛАД, той же валовий збір зерна характеризується добутком врожайності на площу. Тоді на осі абсцис відкладають площу, а на осі ординат - значення врожайності.
Їх добуток і дасть площу прямокутника, що характеризує валовий збір. Це і буде діаграма Варзара.
Нерідко склад, структура того або іншого явища зображається за допомогою кіл, розділених на сектори, пропорційні довжині (питомій вазі) частин явищ. Тобто секторна діаграма є колом, розділеним радіусами на окремі секторы. Кожний сектор і характеризує питому вагу показників, що зображаються, в загальній площі круга, рівній 100 %, тобто 1 % рівний куту 3,6°.
Будується секторна діаграма таким чином:
Будується круг довільного розміру.
В середині нього викреслюється маленький круг, в якому пишеться підсумкова цифра або 100 %.
Встановлюється початкова лінія, що прямовисно йде від кола малого круга до великого, що дає початкову точку.
Починаючи від цієї початкової точки по колу наносять процентну шкалу шляхом розподілу кола на 8 рівних частин (якщо немає транспортира або циркуля).
Починаючи від початкової точки на колі роблять відмітки, відповідні питомій вазі показників, проводять до них радіуси і одержують сектори.
Радіальні діаграми - служать для зображення явищ, що періодично змінюються в часі, частіше всього для ілюстрації сезонних коливань. Будуються на базі полярних координат, в яких за вісь ординат приймаються радіуси, за вісь абсцис - коло. Радіальні діаграми можуть бути замкнутими і спіральними .
Замкнуті відображають внутрішньорічні сезонні коливання одного року, спіральні - внутрішньорічні коливання за ряд років. Радіальні діаграми можуть бути побудовані двома способами залежно від того, що прийнято як пункт відліку - центр круга (полюс), або коло. Звичайно приймається пунктом відліку центр круга.
Замкнуті радіальні діаграми будуються таким чином:
викреслюється круг, радіус якого в масштабі рівний середньомісячному показнику;
потім круг ділиться на 12 частин (місяців) за прикладом годинного циферблата;
на кожному з одержаних 12ти радіусів згідно масштабу відкладаються відповідні місячні дані (якщо дані перевищують середньомісячні значення вони відкладаються на продовженні радіусів за межами круга);
з'єднавши кінці відрізків на радіусах одержимо замкнуту радіальну діаграму, що характеризує сезонні коливання.
Побудова спіральних діаграм відрізняється від замкнутих тим, що в них січень одного року з'єднується не з січнем того ж року, а з січнем наступного року. Це дозволяє зобразити сезонні коливання за ряд років у вигляді спіралі.
Статистичні ламані (лінійні графіки) - найбільш часто застосовуються при характеристиці розвитку явищ в часі, тобто динаміки явищ. Для їх побудови використовується прямокутна система координат. На осі абсцис відкладаються відрізки (періоди) часу, на осі ординат - показники. Шкали, масштаби наносяться способами, розглянутими вище.
Картограми і картодіаграми - застосовуються для зображення географічної характеристики явищ, що вивчаються.
Вони показують розміщення, розповсюдження і інтенсивність явища, що вивчається, на певній території - району, області, регіоні і т.д.
На картограмі розподіл явища, що вивчається, по території зображається точками, штрихуванням, різним забарвленням і т.д. Виходячи з цього вони точкові і фонові. (Кожній точці відповідає певне, прийняте числове значення. Наприклад, одна точка рівна 10 тис. чіл. Населення).
Тобто, картограма - це схематична географічна карта, на якій точками, штрихуванням або кольором різного ступеня насиченості показана порівняльна інтенсивність розподілу якого-небудь явища на певній території (щільність населення по районах, розподіл районів по врожайності зернових і т.д.).
Картодіаграма - це поєднання географічної карти з діаграмою.В якості образотворчих знаків в картограмах використовуються різні геометричні фігури, що характеризують порівнювані показники.
Суть, види та функції статистичних показників. Абсолютні та відносні величини, їх різновиди, обчислення та форми вираження.
Статистичний показник - це узагальнююча характеристика якої-небудь властивості сукупності в цілому або її окремої частини (групи).
НАПРИКЛАД, середній вік студентів університету - статистичний показник, а вік кожного з них - ознака.
Між ознакою і статистичним показником існує певний взаємозв'язок і співвідношення:
ознака, перш за все, визначає якісний зміст показника, є його об'єктивною основою;
ознаки різних об'єктів існують незалежно від того, пізнає їх статистика чи ні.
абсолютні величини- це статистичні показники, що характеризують або сумарне число одиниць сукупності (об'єкту), або її сумарну властивість - розмір, обсяг, вага, рівень.
НАПРИКЛАД, обсяг продукції в поточному році, кількість студентів економічного факультету, посівна площа зернових в області і т.д.
Абсолютні величини виражаються, як правило, іменованими величинами:
в натуральних одиницях вимірювання - тоннах, штуках, літрах, гектарах тощо;
в умовних одиницях - умовному паливі, нормо-змінах, тонно-кілометрах тощо;
у вартісних одиницях - гривнях, доларах, євро та ін.
Таким чином, абсолютні величини характеризують, як правило, суму значень ознак об'єкту (сукупності). Абсолютні величини також служать основою для розрахунку відносних і середніх величин, широко вживаних статистикою.
Відносні величини - це статистичні показники, що характеризують кількісне співвідношення двох порівнюваних величин. Інакше кажучи, це результат співвідношення двох статистичних показників.
За способом розрахунку відносні величини є дробом, в чисельнику якого - порівнювана величина, а в знаменнику - величина, з якою проводиться порівняння - база порівняння. Залежно від бази порівняння відносні величини (ВВ) можуть бути виражені у формі:
коефіцієнтів (база приймається за одиницю);
відсотків (база приймається за 100%);
промілле (база приймається за 1000 - %);
продецимілле (база приймається за 10000 - %).
За призначенням і сутністю висловлюваних співвідношень розрізняють наступні види ВВ: структури, координації, динаміки, порівняння (наочності), інтенсивності, виконання плану (договірних зобов'язань); планового завдання.
ВВ структури - характеризують структуру (склад) сукупності, що вивчається. Обчислюють відношенням величини кожної одиниці сукупності до сумарної величини всієї сукупності. Інакше кажучи, це питома вага кожної одиниці сукупності у всій сукупності. Наприклад, частка відмінників в загальній чисельності студентів факультету.
ВВ координації - характеризують співвідношення між окремим частинам сукупності. Показують в скільки разів порівнювана частина сукупності більше, або менше за ту частину, з якою проводять порівняння. Як правило, як база порівняння вибирається та частина сукупності, яка має найбільшу питому вагу в сукупності або є пріоритетною в економічному або соціальному плані. В результаті можна встановити, скільки одиниць порівнюваної частини припадає на 1 одиницю базисної частини. Наприклад, скільки хорошистів припадає на одного відмінника в академічній групі і т.д.
ВВ динаміки - характеризують зміну явищ в часі (інтенсивність розвитку явища). Це відношення одного і того ж показника за два і більше тимчасових періоди. Залежно від бази порівняння бувають ланцюговими і базисними. В ланцюгових - база порівняння змінна, тобто показник кожного наступного періоду порівнюється з попереднім. В базисних - база порівняння постійна, тобто показник кожного наступного періоду порівнюється з початковим. Можуть бути виражені або коефіцієнтами або відсотками:
;
ВВ інтенсивності - характеризує співвідношення однойменних показників, що відносяться до різних обсягів або регіонів і т.д.:
ВВ інтенсивності - характеризує ступінь розповсюдження явища, що вивчається, в певному середовищі. Звичайно це відношення двох різнойменних, але пов'язаних між собою, абсолютних величин.
ВВ виконання плану - характеризують ступінь виконання плану або зобов'язань за певний період. Обчислюються відношенням фактично досягнутого рівня до запланованого рівня:
Середні величини, їх різновиди, умови застосування та способи обчислення.
Середньою величиною в статистиці називається показник, що характеризує узагальнене значення варіюючої ознаки одиниць сукупності.
Головне значення середніх величин полягає в їх узагальнюючій функції, тобто в заміні безлічі різних індивідуальних значень ознаки їх середньою величиною, що характеризує всю сукупність.
В статистиці застосовуються різні види середніх величин: середня арифметична, середня геометрична, середня гармонійна, середня квадратична, кубічна, біквадратична та ін. степеней, оскільки відноситься до класу степеневих. Кожний вид середньої має свої властивості, які відповідають вирішенню певної задачі. Тому вибір виду середньої має важливе значення і визначається, як правило, економічною сутністю усереднюваної ознаки. Найпоширенішою в економічних розрахунках і соціально-економічному аналізі є середня арифметична. Середня арифметична поділяється на просту і зважену.
Середня арифметична проста застосовується в тих випадках, коли кожне індивідуальне значення ознаки (числовий варіант) зустрічається один раз або однакове число раз.
Середня арифметична зважена застосовується в тих випадках, коли значення ознаки в сукупності зустрічаються багато раз і неоднакове число раз. Тобто коли варіанти варіюючої ознаки мають різні частоти. В подібних випадках ми маємо справу, як нам вже відомо, із згрупованими даними або з варіаційними рядами розподілу.
1. Якщо ряд дискретний і частота кожного варіанту різна, то для підрахунку середньої арифметичної необхідно:
- помножити кожний варіант на його частоту;
- знайти суму одержаних добутків варіантів на частоти;
- знайти суму частот (якщо вона невідома);
- суму добутків варіантів на частоти розділити на суму частот.
2. Якщо ряд інтервальний, то обчислення середньої арифметичної має одну особливість. Вона полягає в тому, що в стовпчики варіантів значення ознак представлені не одним числом, а певним інтервалом - нижньою і верхньою межами. Для того, щоб розрахувати середню арифметичну інтервального ряду необхідно:
- визначити середню величину кожного інтервалу (його середину) як напівсуму верхньої і нижньої меж;
- визначити середню для всього ряду в тій послідовності, що і для дискретного варіаційного ряду.
2.1 Якщо інтервальний ряд має відкриті інтервали в першій і останній групі, то спочатку треба визначити невідомі межі інтервалів.
А) Вони визначаються або експертним шляхом виходячи з сутності ознаки в сукупності;
Б) або величина інтервалу в першій групі приймається рівною інтервалу наступної групи, а величина інтервалу в останній групі рівна інтервалу попередньої групи.
Середня геометрична знаходить в статистиці дуже обмежене вживання. Вона використовується, в основному, при обчисленні середніх темпів зростання якого-небудь показника (продукції, населення і т.д.).
Середня гармонійна звичайно застосовується у випадках, коли усереднюванню підлягають не самі варіанти, а зворотні їм числа або коли є дані про загальний обсяг явища й індивідуальні значення ознаки, але немає відомостей про кількість одиниць даного явища (частотах).
Знаходять середню арифметичну зі зворотних величин:
Величина, зворотна отриманій середній арифметичній і буде середньою гармонійною:
Слід зазначити, що в теорії статистики немає більш заплутаного і по-різному трактованого питання, ніж питання про середню гармонійну.
Середня квадратична застосовується у випадках, коли усереднюванню (узагальненню) підлягають величини, виражені у вигляді квадратних функцій.
Поняття медіани та моди в статистиці, їх призначення та способи обчислення.
Ме - значення варіюючої ознаки, розташованої в середині ранжируваної сукупності і розділяє сукупність на дві рівні частини - із значеннями ознаки менше і більше медіани.
Щоб визначити медіану необхідно:
на основі даної сукупності побудувати ранжируваний ряд і пронумерувати його члени;
якщо число членів ряду непарне - додати до цього числа одиницю і розділити на 2, тобто .
результаті одержимо порядковий номер члена ряду із значенням ознаки рівним медіані.
якщо ж число членів ряду парне, то медіану визначають як середню арифметичну з 2-х центральних елементів ряду.
Для дискретного ряду Ме визначається без особливих розрахунків в наступній послідовності:
Визначаються накопичені частоти, тобто додатково будується стовпчик накопичених частот.
Розділивши суму частот на 2, визначаємо порядковий номер Ме.
В стовпчику накопичених частот шукаємо накопичену частоту, рівну номеру Ме. Їй і відповідатиме в стовпці варіантів значення варіанту, рівне Ме.
Для інтервального ряду порядок знаходження Ме наступний:
По сумі частот визначається порядковий номер Ме .
По накопичених частотах визначається медіанний інтервал, тобто інтервал, в якому знаходиться Ме .
По формулі визначається медіана:
Ме, як видно із способів її підрахунку, не залежить від двох крайніх значень ряду.
Мода - це найтиповіше, характерне для даної сукупності значення ознаки (варіанту).
Таким чином, для дискретного ряду, як в нашому прикладі, мода - це варіант, що має найбільшу частоту, тобто частіше всього що зустрічається. Визначення її проводиться без жодних обчислень, шляхом простого перегляду стовпчика частот. Дивлячись на цей стовпчик, слід лише знайти найбільше число в ньому. Йому і відповідає значення варіанту (ознаки), яке і є модою.
У випадку ж з інтервальним рядом, визначення моди вимагає обчислень і здійснюється в наступній послідовності:
Шляхом проглядання стовпчика частот визначають інтервал, в якому знаходиться мода, тобто модальний інтервал. При цьому, у варіаційному ряді з рівними інтервалами модальний інтервал визначається за найбільшою частотою. В рядах з нерівними інтервалами - за найбільшою щільністю розподілу. Тобто, в цьому випадку необхідно розрахувати ще стовпчик щільності розподілу.
Щільність розподілу, як нам вже відомо, розраховується шляхом ділення частоти на величину відповідного інтервалу, тобто .
За формулою визначається мода:
Мо, перш за все, відповідає на питання про те, яке значення ознаки, що вивчається, найбільш вірогідне. Якщо в якомусь розподілі 2 варіанти виділяються відносно великими (рівними) частотами, то такий розподіл має дві моди і називається двомодальним .
При розв'язанні практичних задач Мо використовується, наприклад, при:
плануванні обсягу виробництва того або іншого товару (облік попиту).
Поняття варіації, її основні показники та способи їх обчислення. Властивості дисперсії та її різновиди.
Варіацією, тобто коливанням, зміною ознаки називається різниця його значень у різних одиниць сукупності в один і той же момент або період часу.
Показниками варіації в статистиці є:
Варіаційний розмах (амплітуда коливань).
Середнє лінійне відхилення.
Середній квадрат відхилень (дисперсія).
Середнє квадратичне відхилення (стандартне відхилення).
Коефіцієнт варіації.
Варіаційний розмах (амплітуда коливань) є найпростішим показником варіації ознаки. Обчислюється як різниця між найбільшим і найменшим значеннями кількісної ознаки в деякій сукупності.
Простота підрахунку розмаху варіації сприяє його широкому застосуванню в теоретичних дослідженнях і практичних розрахунках. Разом з тим, цей показник має істотний недолік: він не дає уявлення про ступінь коливання ознаки всередині сукупності, оскільки обчислюється на основі тільки двох крайніх значень ознаки, які не завжди характерні і можуть носити випадковий характер. Тому існує інший показник, який дає більш точну характеристику коливанню ознаки, оскільки порівнює всі наявні його значення з середньою величиною. Цей показник називається середнє лінійне відхилення . Воно є середньою арифметичною з відхилень окремих абсолютних значень ознаки від їх середнього значення. Може бути простим і зваженим.
Дисперсія є середньою величиною з квадратів відхилень окремих значень ознаки від їх середньої арифметичної. Дисперсія визначається за наступними формулами:
Таким чином, дисперсія виражає міру ступеня коливання ознаки, що вивчається. Вона враховує знак відхилення і на відміну від СЛВ не має розмірності.
Середнє квадратичне відхилення є коренем квадратним з дисперсії.
Необхідність його підрахунку зв'язана з тим, що розмір дисперсії дорівнює квадрату розміру ознаки, що вивчається. Це робить її не завжди придатною і зручною при визначенні міри ступеня коливання ознаки, для чого і використовується СКВ.
Смисловий зміст СКВ такий же, як і СЛВ - чим менше , тим більш однорідна сукупність, тим більш типова середня, тим більш стійке явище і процес.
Для підрахунку дисперсії і СКВ зручно користуватися наступними математичними властивостями дисперсії:
Якщо всі варіюючі значення ознаки зменшити на постійну величину, дисперсія не зміниться.
Якщо всі значення варіантів зменшити в раз, дисперсія зменшиться в 2 раз.
Дисперсія дорівнює середній з квадратів варіантів мінус квадрат середньої:
Для порівняння варіації ознак в різних сукупностях (коли показники варіації виражені в різних одиницях) використовується відносний показник, так званий коефіцієнт варіації .
Він є процентним відношенням середнього квадратичного відхилення до середньої арифметичної:
Коефіцієнт варіації характеризує коливання ознаки у відносних одиницях вимірювання.
За допомогою цього коефіцієнта можна порівнювати варіацію таких різних ознак як продуктивність праці, врожайність, продуктивність тваринництва і т.д.
Закономірність розподілу та характеристики його форм.
Аналіз закономірностей розподілу передбачає оцінювання ступеня однорідності сукупності, асиметрії та ексцесу розподілу.
Однорідність сукупності — передумова використання інших статистичних методів (середніх величин, регресійного аналізу тощо). Однорідними вважаються такі сукупності, елементи яких мають спільні властивості і належать до одного типу, класу. При цьому однорідність означає не повну тотожність властивостей елементів, а лише наявність у них спільного в істотному, головному.
В однорідних сукупностях розподіли одновершинні (одномодальні). Багатовершинність свідчить про неоднорідний склад сукупності, про різнотиповість окремих складових. У такому разі необхідно перегрупувати дані, виокремити однорідні групи. Критерієм однорідності сукупності вважається квадратичний коефіцієнт варіації, який завдяки властивостям в симетричному розподілі становить . Згідно з цим критерієм сукупність домогосподарств за рівнем забезпеченості житлом практично однорідна ().
З-поміж одновершинних розподілів є симетричні та асиметричні (скошені), гостро- та плосковершинні. У симетричному розподіліасиметричному — вершина розподілу зміщена. Напрям асиметрії протилежний напряму зміщення вершини. Якщо вершина зміщена ліворуч, маємо правосторонню асиметрію, і навпаки. Зазначимо, що асиметрія виникає внаслідок обмеженої варіації в одному напрямі або під впливом домінуючої причини розвитку, яка призводить до зміщення центра розподілу. Ступінь асиметрії різний — від помірного до значного. рівновіддалені від центра значення ознаки мають однакові частоти, в
Як уже зазначалося, у симетричному розподілі характеристики центра — середня, мода, медіана — мають однакові значення, в асиметричному між ними існують певні розбіжності. У разі правосторонньої асиметрії , а в разі лівосторонньої, навпаки, . Чим більша асиметрія, тим більше відхилення (). Очевидно, найпростішою мірою асиметрії є відносне відхилення , яке характеризує напрям і міру скошеності в середині розподілу; при правосторонній асиметрії , при лівосторонній — .
Теоретично коефіцієнт асиметрії не має меж, проте на практиці його значення не буває надто великим і в помірно скісних розподілах не перевищує одиниці. Так, за даними ряду розподілу (див. табл. 5.4) середній рівень забезпеченості населення житлом становить 9 м2, мода дорівнює 8,1, . Міра скошеності свідчить про помірну правосторонню асиметрію розподілу. Такого самого висновку можна дійти на основі співвідношення середнього квадратичного та середнього лінійного відхилень: .
Іншою властивістю одновершинних розподілів є ступінь зосередженості елементів сукупності навколо центра розподілу. Цю властивість називають ексцесом розподілу.
17. Вибірковий метод, його суть, переваги, умови застосування та особливості.
Статистичне спостереження за охопленням одиниць обстеження сукупності поділяють на суцільне і несуцільне. З усіх видів несуцільного спостереження в практиці статистичних досліджень найбіьше визнання і застосування дістало вибіркове спостереження.
Вибіркове спостереження це такий вид несуцільного спос- зсження, при якому обстежуються не всі елементи сукупності, іцо і:вчасться, а лише певним чином відібрана їх частина. Сукупність, якої вибирають елеменги дія обстеження, називають генеральною, а сукупність, яку безпосередньо обстежують, — вибірковою. катистичні характеристики вибіркової сукупності розглядаються оцінка відповідних характеристик генеральної сукупності.
Безумовно, що суцільне спостереження забезпечує най- і іьш повну інформацію про загальну кількість одиниць, про се- :дні і відносні показники досліджуваної сукупності. Однак на практиці є чимало випадків, коли суцільне спостереження невільне або зовсім неможливе. При вивченні певного кола сціально-економічних явищ вибіркове спостереження єдино можливе. Це стосується передусім перевірки якості продукції. Часом вибіркове спостереження поєднується із суцільним. Наприклад, при перепису населення певна його частина обстежується за більш широкою програмою, ніж основна маса. Крім того, вибірковий метод використовують для прискореної обробки матеріалів суцільного спостереження та перевірки правильності даних переписів і одноразових обстежень. До вибіркового спостереження статистика вдається у випадках, коли треба у стислі терміни та з мінімальними затратами праці і коштів треба одержати кількісні характеристики досліджуваної сукупності, або коли не можна чи недоцільно здійснювати суцільне спостереження.
Таким чином, основні причини, що зумовлюють перевагу вибіркового методу, зводяться до наступного:
економія часу і коштів;
зведення до мінімуму псування або навіть знищення досліджуваних об'єктів;
необхідність поглибленого вивчення кожної одиниці спостереження при неможливості дослідити за такою програмою всі одиниці сукупності;
досягнення більшої точності результатів дослідження за- вдяки скороченню помилок, що мають місце при реєстрації;
застосування вибіркового спостереження як засобу контролю даних суцільного спостереження.
Вибірковий метод дозволяє через вивчення частини спеціально відібраних одиниць охарактеризувати масове явище в цілому. Теорія і практика вибіркового спостереження показує, що воно за правильної організації дає достовірні відомості, цілком придатні для практичного використання
Основними етапами вибіркового спостереження є:
обгрунтування мети вибіркового спостереження;
складання програми спостереження і розробка відповідних даних;
вирішення організаційних питань щодо спостереження;
визначення частки і способу відбору одиниць у вибіркову укупність;
здійснення відбору;
реєстрація ознак досліджуваних одиниць;
узагальнення даних спостереження та визначення ибіркових характеристик;
обчислення похибок вибірки;
поширення кількісних характеристик вибіркового спосте- еження на всю сукупність.
Переваги вибіркового спостереження над суцільним рс- пзуються лише при дотриманні наукових принципів його ор- інізаціїі проведення, насамперед нсупереджеиого. випадкового бору елементів для обстеження. Принцип випадковості відбо- N забезпечує всім елементам генеральної сукупності рівні мож- вості попасти у вибірку.
Так. якщо генеральна сукупність містить N елементів, а для стеження треба відібрати п. то число можливих вибірок мож- обчислити за формулою: С
Усі вони мають однакову ймовірність . а кожна з них і се в собі певну похибку, що відображає факту випадковості ви- - ру. Оскільки вибіркова сукупність не точно відтворює склад і іеральної сукупності, то й вибіркові оцінки не збігаються з і (Повідними характеристиками генеральної сукупності. Розбіж- істі між ними називають помітками (похибками) репрезентативні ті. Так для середньої величини вона являє собою різницю між г іеральною і вибірковою середніми, для частки між генераль- н о і вибірковою частками, для дисперсії — відношення гене- п>ної і вибіркової дисперсій тощо.
Точність результатів вибіркового спостереження залежить способу відбору одиниць, ступеня коливання ознаки в сукупні та від кількості відібраігих одиниць.
Способи формування вибірки. Помилки вибірки та методи їх обчислення.
Формування вибірки — не безладний процес, він здійснюється за певними правилами. Насамперед, визначають основу вибірки. Залежно від специфіки об'єкту одиницею ^основи вибірки можуть бути окремі одиниці (індивідуальний відбір), або якісно однорідні групи (серії) досліджуваних одиниць (груповий відбір), або комбінація індивідуального і групового відбору.
Від основи вибірки залежить спосіб відбору елементів сукупності дня обстеження. Найчастіше використовують такі способи відбору: простий випадковий, систематичний (механічний), типовий (районований), серійний.
Простий випадковий відбір полягає в тому, що вибіркова сукупність утворюється в результаті випадкового неупереджено- го відбору окремих одиниць із генеральної сукупності. При цьому кількість відібраних у вибіркову сукупність одиниць визначається на основі прийнятої частки (питомої ваги) вибірки. Так при 5% вибірки із партії товару у 2000 одиниць чисельність вибірки становитиме 100 од. (2000 • 5 : 100), а при 20% вибірки вона становитиме 400 од. (2000 • 20 : 100).
Важливою умовою репрезентативності простого випадкового вщбору є те, що кожна одиниця генеральної сукупності має однакові можливості попасти до вибіркової сукупності. Саме принцип випадковості попадання кожної одиниці генеральної сукупності у вибірку попереджає виникнення систематичних (тенденційних) помилок вибірки. Формування простої випадкової вибірки може здійснюватись жеребкуванням або за допомогою таблиць випадкових чисел.
Систематичний (механічний) відбір передбачає, що основою вибірки є упорядкована чисельність елементів сукупності. Вибір елементів здійснюється через рівні інтервали. Крок (розмір) інтервалу обчислюють діленням обсягу сукупності N на передбачений обсяг вибірки п. Початковий елемент відбору визначають як випадкове число у першому інтервалі елементів сукупності, другий елемент залежить від початкового числа і кроку інтервалу.
Типова, або районована вибірка організовується таким чи- ом: генеральна сукупність розбивається на однорідні типові рупи, райони, дільниці за певною ознакою, а потім з кожної та- ої групи відбирається певна кількість одиниць спостереження, ропорційно питомій вазі групи у генеральній сукупності. Пере- лгою типової вибірки є те, що, створюючи групи і відбираючи з их певну кількість одиниць спостережешія, у неї попадуть пред-
авники різних типових груп і вибіркові характеристики, визнані на їх базі, будуть максимально наближені до генеральних ха-
ктеристик. Вибірка стає вірогіднішою.
Серійна вибірка (гніздова) полягає в тому, що відбираються окремі одиниці, а цілі групи (серії, гнізда) випадковим або ме- нічним методом. У відібраних серіях обстежують всі одиниці з винятку, а результат розповсюджують на всю сукупність.
Вибірка елементів для вибіркового спостереження може йснюватись способом повторного і безповторного відбору.
Повторним відбором називають такий відбір, при якому жна обстежувана одиниця знову повертається до генеральної • «супності, продовжує брати участь у подальшому відборі і мо- потрапити повторно у вибірку для обстеження.
Безповторним називається такий відбір, при якому один І з описані одиниці спостереження у подальшому відборі участі беруть. Безповторний відбір, як правило, дає точніші резуль- іИ, ніж повторний.
Як відомо із математичної статистики, всі види відбору (лм механічного) можуть бути повторними і без повторними, ханічний відбір завжди безповторний.
Застосування того чи ііппого способу формування вибірко- сукупності залежить від мети вибіркового обстеження, мож- івостей його організації і проведення. Найбільш поширеними є <�мбіновані вибірки, які поєднують різні способи відбору: систе- іичний і серійний, районований і систематичний, простий висковий і серійний. Поєднання способів відбору забезпечує ви- :у репрезентативність результатів з найменшими трудовими і міновими витратами на організацію і проведення досліджень.
Середня похибка вибірки при різних комбінаціях її видів і способів визначається по-різному, залежно від ступінчатої вибірки.
Залежно від того, як змінюється одиниця відбору, при послідовному проведенні кількох вибірок розрізняють одноступінча- стіш і багатоступінчастий відбір одиниць у вибіркову сукупність.
Одноступінчаста вибірка передбачає, що з досліджуваної сукупності відразу відбираються одиниці або серії одиниць для безпосереднього обстеження.
Багатоступінчаста вибірка припускає поступове вилучення із генеральної сукупності спочатку збільшених іруп одиниць, потім груп, менших за обсягом і доти, доки не відберуть відповідні групи або окремі одиниці для подальшого дослідження. Вибірка може бути дво-, триступінчастою і більше. Однак треба уникати великого числа ступенів, детально плануючи організацію вибіркового спостереження. У багатоступінчастому відборі поєднуються різні способи. Наприклад, під час бюджетних обстежень сімей можна застосувати чотириступінчасту вибірку. Відбір населених пунктів можна здійснювати типовим (районованим) способом, вулиці в населених пунктах — випадковим, будинки механічним, а конкретну сім'ю — знову випадковим. Як видно з прикладу, в багатоступінчастій вибірні одиниці відбору на кожному ступені вибірки різні, а досліджують тільки одиниці, відібрані на останньому ступені.
Особливим видом вибіркового спостереження є моментне спостереження, суть якого полягає в тому, що на встановлені моменти часу фіксують окремі елементи процесу досліджуваного явища.
Моменте спостереження застосовують для вивчення використання робочого часу робітниками або часу роботи устаткування. У кожний момент спостереження фіксують, чи перебував робітник (чи верстат) у стані роботи, якщо ні, то з яких причин. Моментне спостереження охоплює роботу всіх робітників (або верстатів) цеху, а тому у цьому розумінні воно є суцільним. Вибірковим його вважають через те, що воно охоплює не весь час роботи цеху, а лише певні моменти часу, коли здійснюють контроль за роботою робітників чи устаткування. За допомогою мо- ментного спостереження отримують потрібну інформацію скоріше та з меншими затратами, ніж при суцільному спостереженні.
Вибіркова сукупність мас пізнавальне значення, оскільки є уявлення (з певною ймовірністю) про показники і еиеральної купності. Але. як уже зазначаюсь, при вибірковому спостере- нні можуть виникати помилки спостереження. У разі нецільного спостереження, зокрема вибіркового, крім помилок >сстрації можливі гак звані помилки вибірки, або репрезента- зності (відповідності), які виникають у зв'язку з тим, ІЦО іібрана частина сукупності мас за досліджуваною ознакою де- відмінну структуру порівняно з усією сукупністю.
Помилки реєстрації, як і при суцільному спостереженні, розходження між записаними даними в процесі спостереження йсними даними. Виникають вони внаслідок недбалого ставня, неточності вимірювальних приладів, випадкової описки, іого розуміння тих чи інших положень інструкції чи статис- ного формуляра.
Помилки репрезентативності — це розходження між се- німи величинами або частками ознаки вибіркової і генераль- сукупностей. Помилки репрезентативності можуть бути С1ІС- хатичними і випадковими.
Систематичні помилки репрезентативності виникають : слідок порушення принципів проведення вибіркового спосге- ; ення. Вони мають тенденційний характер викривлення вели- ііи досліджуваної ознаки в бік її збільшення або зменшення.
Випадкові помилки репрезентативності зумовлені тим, що і іркова сукупність не відтворює точно середні і відносні показ- і.и генеральної сукупності.
При організації вибіркового обстеження важливо уникнути »тематичних помилок. Властиві вибірковому спостереженню і їдкові помилки усунути неможливо, проте теорія вибірково- етоду дає математичну основу для обчислення розміру і виз- іення напрямів зменшення їх. Завдання полягає в тому, щоб ісимально наблизити показники вибіркової сукупності до по- з іиків генеральної сукупності і знайти можливі межі відхилень і показників, тобто найти помилку вибірки.
В теорії статистики розрізняють середню і граничну помилку.
Середня помилка для випадкового і механічного відбору: повторний - , без повторний - , повторний для частки -, без повторний -
Щоб обрахувати граничну помилку, вводять коефіцієнт довіри.
За допомогою формул граничної похибки вибірки визначають:
довірчі межі генеральної середньої і частки з певною ймовірністю;
ймовірність того, що відхилення між вибірковими і генеральними характеристиками не перевищує визначену величину;
необхідну чисельність вибірки, яка із заданою ймовірністю забезпечує очікувану точність вибіркових показників.
Визначення необхідного обсягу вибірки та поширення її результатів на генеральну сукупність.
Під час вибіркового спостереження важливо правильно значити необхідну чисельність обсягу вибірки, яка з дповідною ймовірністю забезпечує встановлену точність ре- іьгатів спостереження. Надмірна чисельність вибірки призво- іть до затягнення сірсків дослідження, зайвих витрат часу і штів, недостатня ж дає результати з великою похибкою репре- ітативності.
Визначення необхідної чисельності вибірки залежить від ал- »раїчного перетворення формул граничної похибки вибірки і різних способах відбору.
Повторний: , без повторний , повторний для частки
Кінцевою метою будь-якого вибіркового спостереження є по- лшя його характеристик на генеральну сукупність. На прак- застосовують різні способи поширення вибіркових даних.
Спосіб прямого перерахунку використовують у тому випад- оли метою вибіркового обстеження є визначення обсягу оз- ! в генеральній сукупності.
Яісщо вибіркове спостереження проводять з метою уточ- ія результатів суцільного спостереження, застосовують б поправочних коефіцієнтів
Наприклад, після проведення перепису худоби, що належить насе- іЬ, провели 10%-й вибірковий контроль, під час якого визначили
відсоток недообліку худоби. Згідно з даними перепису в господарствах, які попали у вибірку, поголів'я худоби становить 200 голів, а за даними вибірки 205. Огже, недооблік худоби становитиме (5: 200) 100 = 2,5 % Це той коефіцієнт, який слід розповсюдити на всю генеральну сукупність. Дані перепису худоби N = 10 000 відповідно коригуються: 10 000 1,025 = = 10250 голів.
Види і форми зв’язку між явищами та методи виявлення зв’язку.
Одним із найзагальніших законів об'єктивного світу є за- ;он загального зв'язку і залежності між явищами суспільного киття. Усі явища суспільного життя існують не ізольовано, а у іерозривному взаємозв'язку, тобто залежать одне від одного, то- му вивчення будь-якого явища буде неповним, якщо не дослід¬жені його зв'язки з іншими явищами і процесами. Статистичне дослідження взаємозв'язків дас можливість виявити не тільки на¬ївність і напрямок зв'язку, але дозволяє кількісно оцінити і вира¬зити його аналітично.
Визначення зв'язків між явищами дас змогу перейти від сонстатації фактів до пояснення і використання їх на практиці. ~ак, при вивченні урожайності сільськогосподарських культур южна визначити кількісні характеристики впливу багатьох фак- орів на урожайність. Це дозволяє виявити резерви зростання рожайності, встановити ступінь залежності їх як від об'єктивних ричин, так і від умов діяльності сільськогосподарських підпри- мств. Визначення взаємозв'язків дозволяє проводити науково бгрунтовані прогнози.
Зв'язки між явищами, окремими їх ознаками досить різнома- ітні, однак у будь-якому випадку одні ознаки виступають як фак- зри, що впливають на інші і зумовлюють їх зміну, інші — як рс- /льтати дії цих факторів. Одні із них є причиною, інші наслідком.
Якщо перші прийнято називати ознаками-факторами, або факторними (причинними) ознаками, то другі результативни¬ми (наслідковими) ознаками.
Різноманітність зв'язків, в яких перебувають явища, зумов¬лює необхідність їх класифікації, зведення зв'язків до певних типів, форм за їх істотними рисами і властивостями.
В основу класифікації зв'язків у статистиці покладено від¬мінність і подібність зв'язків за такими їх особливостями, як сту¬пінь тісноти, спрямованість, аналітичне вираження, одиничність або множинність факторів. Відповідно до цього розрізняють зв'язки функціональні і кореляційні, прямі і обернені. прямолінійні і криволінійні, однофакторні і багатофакторні.
За статистичною природою зв'язки поділяють на функціо¬нальні і стохастичні. При функціональному зв'язку кожному мож¬ливому значенню факторної ознаки л* відповідає чітко визначене значення результативної ознаки - у, тобто функціональні зв'яз¬ки характеризуються повною відповідністю між причиною'і наслідком, факторною і результативною ознаками. Така за¬лежність притамана фізичним, хімічним явищам тощо. У суспільних процесах це найчастіше зв'язок складових елементів 4 розрахункових формул відповідних показників, наприклад, за¬лежність валового збору від урожайності сільськогосподарської культури і розміру посівної площі.
На відміну від функціональних, стохастичні зв'язки неод-нозначні. Стохастичні зв'язки проявляються як узгодженість варіації двох чи більше ознак. У ланці зв'язку "х ->у" кожному значенню ознаки д: відповідає певна множина значень ознаки у, які утворюють так званий умовний розподіл. Стохастичний зв'язок, відбиваючи множинність причин і наслідків, виявляється в зміні умовних розподілів.
Якщо умовні розподіли замінюються одним параметром середньою у„ то такий зв'язок називають кореляційним. Отже, кореляційний зв'язок є різновидом стохаєтичного і виявляється в зміні середніх умовних розподілів, що схематично ілюструє габл. 10.1.
За напрямком дії (спрямованістю) розрізняють зв'язок прямий і обернений. Гірший — це такий зв'язок, при якому зі збільшенням або зменшенням значень факторної ознаки відповідно збільшу¬ється або зменшується значення результативної ознаки, тобто фак¬торна і результативна ознаки змінюються в одному напрямку. 248
Прикладом прямого зв'язку може бути зв'язок між фондо-озброєністю і продуктивністю праці, між собівартістю продукції і рівнем рентабельності.
Оберненим зв'язком називають такий, при якому значення результативної ознаки змішосться в протилежному напрямку відносно зміни значення факторної ознаки. Прикладом такого зв'язку може бути продуктивність праці і собівартість продукції.
Слід маги на увазі, що прямий і обернений зв'язки можуть переходити один в інший. Так, прямий зв'язок після досягнення факторною ознакою певног о рівня в деяких випадках себе вичер¬пує і потім робиться оберненим, тобто з наступним збільшенням значення факторної ознаки значення результативної ознаки зменшується.
За формою аналітичного вираження в загальній кла¬сифікації виділяють зв'язки прямолінійні та криволінійні. Якщо певний зв'язок явиш можна точно або наближено зобразити рівнянням будь-якої прямої лінії, то його називають лінійним (прямолінійним) зв'язком, а якщо рівнянням будь-якої кривої лінії (параболи, гіперболи і т.п.) — нелінійним (криволінійним).
Аналітичним рівнянням можна описувати лише функціональні зв'язки. Кореляційні зв'язки описуються рівнян¬ням лише наближено. Однак, наві ть наближене описування за до¬помогою аналітичних рівнянь кореляційних зв'язків суспільних явищ дає можливість отримати результати, цілком придатні для наукових і практичних потреб.
Для відповіді на питання про наявність або відсутність ко-реляційного зв'язку використовують ряд специфічних методів:
• елементарні прийоми (паралельне порівняння рядів зна¬чень факторної і результативної ознак, балансовий метод, графічне зображення, метод аналітичного групування);
• дисперсійний аналіз;
• кореляційно-регресійний аналіз.
Елементарним способом виявлення зв'язку є паралельне порівняння ряду значень факторної ознаки і відповідних значень результативної ознаки. Значення факторної ознаки розташову¬ють у порядку зростання і потім відслідковують напрям зміни ве¬личини результативної ознаки. В тих випадках, коли збільшення величини факторної ознаки призводить до збільшення результа¬тивної ознаки, можна стверджувати про можливу наявність пря¬мого кореляційного зв'язку. Якщо ж із збільшенням факторної ознаки, величина результа тивної ознаки має тенденцію до змен¬шення, то можна передбачати обернений зв'язок між ознаками.
Однак, наявність великої кількості різних значень результа¬тивної ознаки, що відповідають одному і тому ж значенню фак- торної ознаки, ускладнює сприйняття таких паралельних рядів особливо при великій кількості одиниць досліджуваної сукуп¬ності. В таких випадках для встановлення факту наявності зв'яз¬ку доцільно скористатися графічним або табличним методами наочного зображення і аналізу статистичних даних.
Найбільш поширеним і простим методом дослідження взаємозв'язків у статистиці є метод аналітичного групування і по¬будова кореляційних таблиць.
Метод аналітичного групування полягає в тому, що всі еле- 1 менти сукупності групують, як правило, за факторною ознакою х і в кожній групі обчислюють середні значення результативної оз¬наки у, гоб го лінія регресії оцінюється лише в окремих точках, які відповідають певному значенню л:.
На першому етапі аналізу кореляційного зв'язку при обгрун-туванні моделі постають два питання: вибір факторних ознак і виз-начення числа груп і меж інтервалів.
На другому етапі проводиться оцінка лінії регресії — у кожній групі за факторною ознакою обчислюють середні значення результативної та факторної ознак.
Третій етап аналітичного ірупування — вимірювання тісноти зв'язку за допомогою дисперсійного аналізу.
Основною метою дисперсійного аналізу є виявлення впливу окремих факторів чи умов, які визначають варіацію ознаки. В основі дисперсійного аналізу лежить закон розкладання загальної дисперсії на складові; згідно з яким загальна дисперсія
результативної ознаки
|