До розряду модельних може бути віднесена похибка зважування на важільній вазі. Відповідно до закону Архімеда вага тіла і гир зменшується через дію сили повітря, що виштовхує. Нагадаємо, що 1 м3 повітря важить приблизно 10 Н. Для того, щоб правильно знайти масу тіла, що зважується, знову ж, потрібно увести поправку на утрату ваги гирями і самим тілом. Разом з тим, як і при будь-яких вимірах, тут необхідний розумний підхід. Наприклад, при роботі з грубими технічними вагами безглуздо вводити поправку на Архімедову силу, тому що вона виявиться набагато
Слід особливо зазначити, що модельні похибки є найбільш складними для аналізу й врахування.
2.3. Випадкові похибки.
Із самої назви випливає, що при повторних вимірах похибки цього типу демонструють свою випадкову природу. Виникають вони внаслідок безлічі причин, спільний вплив яких на кожен окремий вимір неможливо врахувати чи заздалегідь установити. Такими причинами можуть виявитися, приміром, незначні коливання температури різних деталей і вузлів установки, стрибки напруги, вібрації, турбулентні рухи повітря, тертя в механізмах, помилки зчитування показів приладів і т. п. Єдино можливий спосіб об’єктивного врахування випадкових похибок складається у визначенні їхніх статистичних закономірностей, що виявляються в результатах багаторазових вимірів. Розраховані статистичні оцінки вносять в остаточний результат виміру.
3. Статистичний розподіл випадкової величини
Основним типом похибок, вивченню яких присвячено наступний виклад, є випадкові похибки. Вони піддаються строгому математичному опису, що дозволяє робити висновки про якість вимірів, у яких вони присутні. Похибки інших типів більш складні для аналізу, їх виявляють і аналізують тільки в умовах конкретного експерименту. Щоб знати, як слід працювати з випадковими похибками, спочатку розглянемо прийоми статистичного опису випадкових величин.
3.1. Одержання розподілу випадкової величини і його опис
Розгляд почнемо з передбачуваного експерименту, у якому виконують багаторазові прямі виміри якоїсь випадкової фізичної величини, проведені без зміни умов експерименту. Закономірності в поводженні величини видні з гістограми. Гістограма – східчаста діаграма, що показує як часто при вимірах з’являються результати, що попадають у той чи інший інтервал DX між найменшим Xmin і найбільшим Xmax з обмірюваних значень величини x. Гістограму будують у наступних координатах: по осі абсцис відкладають вимірювану величину x, по осі ординат – Dn/(nDx)(рис.3.1). Тут n – повна кількість проведених вимірів, Dn – кількість результатів, що потрапили в інтервал[x, x+Dx] .
Рисунок 3.1 – Гістограма
Відношення Dn/n є частка результатів, що виявились в зазначеному інтервалі. Воно має сенс імовірності попадання результату окремого виміру в даний інтервал. Вираз Dn/(nDx), одержуваний після розподілу Dn/n на ширину інтервалу Dx, набуває змісту щільності імовірності.
При дуже великій кількості вимірів () весь діапазон зміни величини x можна розбити на нескінченно малі інтервали dx, як це робиться в математиці, і знайти кількість результатів dn у кожнім з них. У цьому випадку гістограма перетвориться в плавну криву – графік функції
. (3.1)
Таку функцію називають Щільністю імовірності, чи Розподілом імовірності, іноді – просто розподілом величини x. Приклади конкретних розподілів можна знайти на рис.3.2.
Розподіл виступає в ролі вичерпної характеристики випадкової величини. Закон розподілу можна задати у вигляді функціонального виразу, графіка, таблиці чи якимсь іншим способом. При будь-якому варіанті задання встановлюється зв’язок між імовірністю того, що результат однократного виміру випадкової величини потрапить у заданий інтервал можливих значень, і шириною цього інтервалу.
Розподіл містить найбільш повну інформацію про випадкову величину, однак користатися ним не завжди зручно. Оперуючи результатами проведеного експерименту, замість функції розподілу краще мати звичні числові величини – ними є Середнє значення і дисперсія.
Середнє значення вимірюваної величини x указує центр розподілу, біля якого групуються результати окремих вимірів
. (3.2)
Дисперсію вводять як середній квадрат відхилення окремих результатів від середнього значення випадкової величини
. (3.3)
Середнє квадратичне відхилення, що називають також Стандартним, визначають як квадратний корінь з дисперсії
(3.4)
Як випливає зі способу обчислення, ця величина характеризує розкид результатів окремих вимірів навколо середнього значення, одержуваного після обробки всіх даних багаторазового виміру. Звичайно, точні значення s і Є граничними величинами, тому що можуть бути отримані лише тоді, коли повна кількість проведених вимірів досить велика, у границі при . При кінцевих n вірніше використовувати термін Експериментальна оцінка, що в однаковій мірі відноситься і до середнього значення, і до дисперсії.
Звернемо увагу на знаменник виразів (3.3) і (3.4), що перетворюється в нуль при n=1. Наскільки це правильно? Адже у цьому випадку, здавалося б, s2 і sстають нескінченно великими. Звернемося до реальної ситуації, що відповідає n=1, тобто до експерименту, у якому виконано тільки один вимір x1 величини x. Його недостатньо, щоб побудувати гістограму і знайти з неї s2.Виходить, s2 і sвиявляються цілком невизначеними внаслідок недостатності експериментальної інформації. Вирази (3.2) – (3.4) враховують приведені поняття: якщо n=1 , з (3.2) отримують І, як наслідок, чисельник і знаменник у (3.3) і (3.4) одночасно перетворюються в нуль. Це свідчить про очікувану невизначеність значення x. Строге обґрунтування справедливості приведених виразів робиться в математичній статистиці.
Відзначимо, що середнє значення випадкової величини не можна розцінювати як однозначний результат виміру. Інакше треба було б думати, що випадкова величина завжди має тільки одне постійне значення, чого не може бути в дійсності через її випадкову природу. Випадкові фактори, що характеризують форму розподілу випадкової величини, не зв’язані тільки з можливою неточністю вимірювальних приладів, а виходить, середнє квадратичне відхилення σ, що описує форму розподілу, об’єктивно відбиває характер поведінки досліджуваної випадкової величини.
3.2. Нормальний розподіл
Якщо, крім характерних для розподілу значень величин І s, відомий функціональний вид розподілу випадкової величини, то можна одержати повну інформацію про імовірність реалізації випадкової величини в будь-якому заданому інтервалі значень. Розглянемо це на прикладі нормального, чи Гаусового розподілу, що відображає ситуацію, що найбільше часто зустрічається в природі. Як наслідок, йому характерна особлива роль, що пояснюється тим, що при обробці даних вимірів у науці і техніці звичайно припускають нормальний закон розподілу випадкових похибок вимірів.
На користь застосування нормального розподілу є вагомі підстави. А саме, він завжди виявляється тоді, коли сумарна похибка є результатом неврахованого спільного впливу цілого ряду причин, кожна з яких дає малий внесок у похибку. Причому зовсім неважливо, за яким законом розподілений кожний із внесків окремо.
Нормально розподілена випадкова величина має наступні властивості:
1. Вона може набувати вигляду суцільного ряду значень від – ¥ до + ¥.
2. Центр розподілу випадкової величини одночасно є центром симетрії, тобто однакові відхилення результатів виміру в меншу і більшу сторони від центра зустрічаються однаково часто.
3. Малі відхилення зустрічаються частіше великих, іншими словами, реалізуються з більшою імовірністю.
Відповідний функціональний вираз для розподілу задає формула Гауса
, (3.5)
Деі σ відповідають використаним у (3.2) – (3.4), вираз exp(y) = e y – експонента, у якій e = 2,71828 – основа натуральних логарифмів. Криві нормального розподілу для трьох значень s (1; 0,5 і 0,25) і однакового =3 приведені на рис.3.2.
Рисунок 3.2 – Нормальний розподіл для = 3; s = 0,25; 0,5 і 1
Розподіл, що задається функцією Гауса, симетричний щодо максимуму, що знаходиться при x = . Значення функції у максимумі
. (3.6)
Значення аргументу x, при якому щільність імовірності максимальна, є найбільш ймовірним при реалізації випадкової величини. Отже, – оцінка найбільш ймовірного значення випадкової величини, розподіленої по нормальному закону. Згідно з (3.6) значення функції Гауса в максимумі зменшується зі збільшенням σ. Одночасно криві на графіку стають більш пологими, але повна площа під кривою залишається при цьому незмінною.
Скористаємося виразом (3.1) і одержимо з нього
Це співвідношення означає, що імовірність попадання результату окремого виміру в нескінченно малий проміжок dx дорівнює площі під кривою розподілу на цьому проміжку. Якщо розширити проміжок до скінченої величини[x1, x2], то площа під кривою дасть імовірність p попадання результату виміру уже в кінцевий проміжок. Імовірність, як площа, математично виражається інтегралом
. (3.7)
У дужках після p зазначена подія, для якої обчислена імовірність. При розсовуванні границь проміжку в обидва боки до нескінченності інтеграл від функції розподілу
Зміст цієї рівності полягає в тім, що імовірність достовірної події дорівнює одиниці. Достовірною подією в розглянутій ситуації є реалізація якогось значення випадкової величини (від -∞ до +∞) у результаті її однократного вимірювання. Інтеграли від функції Гауса для різних меж інтегрування обчислені і задані у вигляді детальних таблиць. Для проведення аналізу розподілу звичайно використовують симетричний відносно інтервал-Dx, +Dx, де Dx– довільне відхилення від середнього. У табл.1 Додатків цей інтервал уведений через e – величину відношення півширини інтервалу Dx до середньоквадратичного відхилення σ:
. (3.8)
У таблиці зазначена імовірність a
. (3.9)
Її можна розрахувати по наближеному виразу, отриманому з (3.7):
.
Однак простіше запам’ятати декілька корисних цифр.
При e = 1 |
A = 0,68 (чи 68%). |
При e = 2 |
A = 0,95 (чи 95%).(3.10) |
При e = 3 |
A = 0,997 (чи 99,7%). |
Зміст співвідношень (3.10) полягає у встановленні зв’язку між шириною інтервалу ± Dx навколо Та імовірністю влучення обмірюваного значення випадкової величини в цей інтервал, якщо величина розподілена за нормальним законом. Так, результат виміру з імовірністю 68% потрапить в інтервал[– σ, +σ], тобто приблизно кожен третій вимір дасть результат за межами цього інтервалу. За межами інтервалу[-2σ, +2σ] виявиться один результат із двадцяти, а для інтервалу–3σ, +3σ – тільки один із трьохсот. Виходить, інтервал ±3σ завжди є майже достовірним, тому що переважна більшість окремих результатів багаторазового виміру випадкової величини виявиться зосередженою саме в ньому. Випереджаючи хід викладу, помітимо, що часто використовуване при вимірах правило 3σ, чи правило трьох стандартів, засновано на зазначеній властивості нормального розподілу. З врахуванням проведеного вище аналізу, можна установити наявність промаху в результаті окремого виміру, а виходить, відкинути його, якщо результат виміру більше ніж на 3σ відрізняється від обмірюваного середнього значення випадкової величини.
Ви прочитали: "Первинна обробка даних – №3"Читати далі