ТЕОРИЯ ВЕРОЯТНОСТЕЙ ИСТОРИЧЕСКИЙ ОЧЕРК
Распределение случайных ошибок
При любом измерении возникают случайные ошибки. Над вопросом о том, как их избежать или учесть, ученые работалняочень давно. Но только с привлечением теории вероятностей эту проблему можно было решить удовлетворительно. Она была рассмотрена с достаточной полнотой в начале XIX в.
Два математика, независимо друг от друга, почти одновременно получили один и тот же основной результат, состоящий в выводе нормального закона распределения случайных ошибок. Один из этих математиков — великий немецкий ученый К. Ф. Гаусс (1777—1855 гг.), другой — малоизвестный математик из Америки Р. Эд- рейн (1775—1843 гг.). К своему результату они пришли разными путями. Эдрейн решал частную задачу и в виде ее обобщения получил распределение случайных ошибок. Гаусс разрабатывал теорию ошибок измерений, и нормальное распределение случайных ошибок было необходимой и одной из важнейших частей этой теории. Вывод закона распределения случайных ошибок измерений у Гаусса был не только итогом, но и основой дальнейшей разработки теории ошибок. И хотя Эдрейн опубликовал свою работу несколько ранее Гаусса, их роль в выводе этого закона различна.
Работа Эдрейна была опубликована в 1808 г. (77]. В этой статье наибольший интерес представляют два вывода нормального закона распределение случайных ошибок измерений.
Пусть АВ— истинное значение измеряемой величины, например некоторой длины. Измеренное значение этой величины пусть будет АЬ, а погрешность ЬВ (рис. 8).
А о 0
1___________ I_____ I
Рис. 8
Пусть АВ, ВС...— несколько последовательных расстояний, измеренные значения которых АЬ, Ъс. Полная ошибка будет сС. Пусть АЬ, Ъс, сС даны (рис. 9). Принимается как очевидное, что погрешности в измерении АВ, ВС пропорциональны их длинам. Введем обозначения: Ab = a, Ьс=Ь, Сс=с; погрешности измерения АЬ обозначим через х, погрешности измерения Ьс — через у. Тогда для наибольшей вероятности получаем уравнение x/a=y/b. Пусть X я Y будут вероятности того, что в расстояниях а и Ь имеются погрешности х я у. Вероятность совместного осуществления этих, погрешностей будет XY.
Необходимо найти X и У при условии, что вероятность XY максимальна.
Введем обозначения: f(x) = lnX; <p(y) = lnY. Тогда максимуму XY соответствует f(x)+<p(y) =max. Продифференцируем последнее соотношение[1].
. р (х) х’ + ф' (у) у’ =0; /' (х) х' = — ф' (у) у'.
Но для наибольшей вероятности x+t/=const и х'+у'=0; х'=—у'. Разделим полученные уравнения друг на друга:
А 6 В - С
I________ 1 I------------ J---- 1
Рис. 9
f'(x) = ц>'(у). Это уравнение должно быть эквивалентно х[а=у/Ь. В простейшей форме это выполняется, если
а а
Рассмотрим первое соотношение:
/'(*) = —; а
df (X) = ™dx-,\ df (х) = С^ dx; f(x) = а,+
CL щ) Cl
, mx*
f(x)=lnX^a1 + ^-, X = e' “
. mx*
Функция jj _ £ la названа Эдреином «общим урав-
нением кривой вероятностей» [77, стр. 94].
Далее доказывается, что т<0 [77, стр. 95].
В этой же статье Эдрейн дает второй вывод закона распределений случайных ошибок измерений. В этом выводе он рассматривает измерение отрезка АВ с погрешностями как по длине, так и по азимуту. Эдрейн [2] предполагает, что геометрическое место равной вероятности положения • точки В, определенной измерениями длины и азимута АВ, должно представлять собой простейшую фигуру, т. е. это должна быть окружность с центром в точке В. В этих условиях он приходит к выводу, что вероятности погрешностей соответственно равны ес+пх*/г и ec+nv*/2) где х и у есть соответствующие ошибки: Вт—х, тп—у, с—const (рис. 10) *.
Рис, 10
В статье Эдрейна, кроме этого, содержится вывод принципа наименьших квадратов и принципа среднего арифметического, определение вероятнейшего положения судна и другие задачи {78].
К. Ф. Гаусс опубликовал свой вывод нормального закона распределения случайных ошибок наблюдений в 1809 г. в работе «Теория движения» {80].
Занятия астрономией и геодезией привели его к разработке методов обработки результатов наблюдений. В астрономии и геодезии производятся многочисленные измерения в различных местах, различными инструментами, различными наблюдателями. Результаты этих измерений подвержены влиянию ошибок. Поэтому возникает проблема установления наиболеё вероятного значения искомой величины. Эти вопросы привели Гаусса к созданию теории ошибок измерений, которая непосредственно связана с идеями и понятиями теории вероятностей.
И. М. Виноградов говорил, что «обширные приближенные вычисления, которые приходилось практически производить лично Гауссу при решении задач, относящихся к астрономии и к геодезии, привели его к более глубокой разработке способа наименьших квадратов и к 1 выяснению центрального значения нормальной кривой распределения в вопросах, связанных с теорией вероятностей» [79, стр. 9].
Наряду с необыкновенно широким диапазоном творчества характерной особенностью исследований Гаусса является глубокая связь между теоретическими и прикладными вопросами. Общие математические идеи у него часто появлялись в результате решения конкретных задач. Это относится к к вопросам теории вероятностей.
Хотя работы Гаусса по теории вероятностей были связаны с приложениями, но они не ограничивались только ими. Работы Гаусса сыграли значительную роль в развитии ряда разделов теории вероятностей. Так, например, теория ошибок наблюдений, разработанная Гауссом, потребовала выяснения условий применимости нормального закона распределения. После работ Гаусса встала задача оценки параметров нормального закона распределения. Гаусс обосновал способ наименьших квадратов с помощью теории вероятностей, приняв за аксиому начало арифметической середины.
Первой работой Гаусса, имеющей отношение к теории вероятностей, была «Теория движения небесных тел, обращающихся около Солнца по коническим сечениям» (1809 г.). В последней части работы «Определение орбиты, возможно точно удовлетворяющей любому числу наблюдений» Гаусс впервые изложил теорию ошибок наблюдений.
К этой части примыкают две другие работы: «Исследование об эллиптических элементах. Паллады на основании противостояний 1803, 1804, 1805, 1807,1808,1809 годов» и «Определение точности наблюдений» (1816 г.).
Эти работы были обобщены и дополнены в труде «Теория комбинации наблюдений, подверженных наименьшим ошибкам» (1823 г.). В 1828 г. выходит «Дополнение к теории комбинации наблюдений, подверженных наименьшим ошибкам».
В 1845—1851 гг. Гаусс написал «Приложение теории вероятностей для определения баланса вдовьих касс» и рассчитал «Таблицы для определения значений времени однократной прожиточной ренты и связанной ренты» *.
1 Все эти работы теперь опубликованы в [89].
Большое значение для теории вероятностей имеют также его заметки и письма.
В XVIII в. стала актуальной задача о наиболее целесообразном сочетании результатов измерений для получения надежных результатов.
Еще Тихо де Браге в 80-х годах XVI в. для устранения ошибок производил наблюдения одного и того же объекта в видоизмененных условиях и, комбинируя эти наблюдения, стремился избавиться от случайных ошибок. Эта проблема всегда интересовала исследователей.
А. Лежандр в работе «Новые методы для определения орбит комет», в приложении «О методе наименьших квадратов» предложил метод наименьших квадратов. Он писал: «Из всех принципов, которые можно предложить для этой цели, не существует более простого, чем тот, которым мы пользовались в предыдущем изложении: он состоит в том, чтобы обратить в минимум сумму квадратов погрешностей». Лежандр четко и ясно сформулировал основные принципы и правила этого способа. «Когда все условия задачи выражены соответствующим образом, следует так определять коэффициенты, чтобы ошибки были возможно меньше. Метод, который кажется мне наиболее подходящим для этой цели, состоит в том, чтобы приводить сумму квадратов ошибок к минимуму. При этом получается ровно столько же уравнений, сколько имеется неизвестных... Способ, который я называю способом наименьших квадратов, сможет, вероятно, принести большую пользу во всех вопросах физики и астрономии, где требуется получить из наблюдений возможно более точные результаты» (80, стр. 7—8].
Гаусс впервые изложил метод наименьших квадратов в работе 1809 г. Но он пишет: «Впрочем, наш принцип, которым мы пользуемся с 1795 г., еще недавно был изложен известным Лежандром в его труде «Nouvelles methodes pour la determination des orbites des cometes, Paris, 1806» («Новые способы определения орбит комет») [80, стр. 104]. Эту же дату, 1795 г., Гаусс указывает и в письме к Лапласу от 30.1.1812 г.
Гаусс неоднократно возвращается к этому вопросу. Так, например, в письме к Ольберсу он пишет: «Принцип, которым я пользуюсь с 1794 г., а именно, для того, чтобы наилучшим образом представить несколько величин, которым нельзя дать точных знаний, нужно привести к минимуму сумму квадратов ошибок; применяется также и в работе Лежандра и излагается в ней весьма основательно» (80, стр. 8J.
Гаусс указывает две даты: 1794 г. и 1795 г. Современные исследователи склонны считать, что верная дата — это 1794 г.
В начале работы Гаусс делает ряд общих интересных замечаний. «Так как в действительности все наши измерения и наблюдения представляют собой только приближения к истине, и то же самое можно предполагать о всех основанных на них вычислениях, то окончательную цель этих вычислений сложных явлений следует видеть в том, чтобы возможно ближе подойти к истине. Этого можно достигнуть только целесообразной комбинацией большого числа наблюдений, что обязательно требуется для определения неизвестных величин» [80, стр. 89].
Далее он пишет о том, чтобы результаты выводились не из отдельных наблюдений, а из комбинированных, так, чтобы случайные ошибки по возможности уничтожались.
После этого Гаусс рассматривает следующую задачу. При равноточных измерениях некоторой величины случайные ошибки имеют дифференциальную плотность распределения вероятностей <р(Д). Требуется определить ф(А), если наиболее вероятное значение измеряемой величины равно среднему арифметическому из наблюдаемых значений. Приведем слова Гаусса.
«Предположим..., что нет никаких оснований считать, почему бы одно наблюдение было менее точным, чем другое, и что одинаковые по величине ошибки у отдельных наблюдений следует принимать за равновероятные. Итак, вероятность, приписываемая любой ошибке Д, выразится функцией от Д, которую мы будем обозначать <р(Д)... Мы можем утверждать, что ее максимум получится, когда Д=0, и что в большинстве случаев она одинакова для равных противоположных по знаку значений Д. ф(Д) должна быть составлена так, чтобы от значения Д=0 в обе стороны она асимптотически приближалась к
нулю» [80, стр. 83]. В этих предположениях Гаусс прихо-
h —л*д*
дит к выводу: ф(Д)«-"р:в . Величину п Гаусс рас-
сматривает как меру точности наблюдений.
Гаусс в качестве следствия вывел утверждение о том, что плотность вероятности данной совокупности наблюдений достигает максимального вначения при условии, что сумма квадратов уклонений наблюдаемых значений от истинного значения измеряемой величины обращается в минимум. Этот же принцип распространен и на неравноточные наблюдения. Гаусс считает, что этот принцип должен считаться аксиомой, так же как должно считаться за аксиому и то, что среднее арифметическое из многих наблюденных значений одной и той же величины принимается за наиболее вероятное ее значение.
Получив нормальный закон распределения случайных
Гаусс указывает на недо- статок, которым, с его точки зрения, обладает этот закон. В соответствии с этим законом возможны в принципе погрешности любой величины. «Полученная таким образом функция, очевидно, не может со всей строгостью выразить вероятности ошибок. Так как возможные ошибки всегда заключаются в известных пределах, то вероятность более крупной ошибки (лежащей вне этих пределов) всегда должна равняться нулю, а между тем наша формула всегда дает некоторое конечное число» {80, стр. 96].
Следует иметь в виду, что Гаусс при выводе нормального распределения существенно использовал принцип среднего арифметического, который он формулировал следующим образом: «Конечно, как аксиома должна быть принята гипотеза: если какая-нибудь величина будет определена из многих непосредственных наблюдений, произведенных при одинаковых обстоятельствах и с одинаковой тщательностью, то среднее арифметическое из всех наблюдавшихся значений окажется наиболее вероятным значением, если и не абсолютно точно, то по крайней мере очень близко к этому, так что всегда будет наиболее надежным придерживаться именно такого значения». Эта аксиома привлекла к себе большое внимание. Ряд авторов старался ее доказать, сведя к другим, на их взгляд, более простым положением. Обзор таких доказательств приведен в [158].
Нормальный закон длительное время считался универсальным, и это задержало появление количественных
критериев отбраковки измерений, так как этот закон допускает возможность погрешностей любой величины, что привело к убеждению в необходимости удерживать результаты всех измерений, ничего не отбрасывая. Это мнение господствовало до середины XIX в., когда стали появляться первые вероятностные критерии отбраковки измерений.
[1] По атому вопросу см. подробнее [78, 140].
[2] Эдрейн нигде не говорит, по какому переменному он дифференцирует. Более того, он не останавливается даже на вопросе, что является аргументом его функций. Все это, конечно, является недостатком его работы.