Элементы теории вероятностей
Случайные события и вероятность. Случайная величина. Дискретные случайные величины. Статистическое среднее и среднее арифметическое. Распределение Пуассона. Непрерывные случайные величины. Плотность вероятности. Распределение Гаусса. Центральная предельная теорема. Двумерная плотность вероятности. Преобразование распределений вероятности.
При описании излучения реальных источников света мы сталкиваемся с необходимостью оценить совокупное действие огромного числа элементарных излучателей — атомов. Адекватный подход к решению этой задачи — использование теории вероятностей. Ниже коротко излагаются основные понятия этой теории, применяемые в оптике Для более глубокого знакомства с этой проблематикой рекомендуем книгу [1].
Случайные события и вероятность. Случайным называется событие, исход которого заранее неизвестен и которое может быть повторено много раз при неизменных условиях. Закономерности, присущие случайным событиям, могут быть установлены именно благодаря возможности их многократного повторения, т. е. при наличии серии испытаний или ансамбля реализаций события. Например, подбрасывая монету, мы не можем заранее предсказать какая из ее сторон (“орел” или “решка”) окажется при падении верхней в данном конкретном испытании, однако повторяя испытание многократно, можно заметить статистическую закономерность состоящую в том, что число выпадания обеих сторон примерно одинаково.
Вероятностью случайного события называется предел отношения числа появлений события А в серии испытаний к полному числу испытаний:
Р{А) = Ига —. (Д7.1)
П—ЮО ТІ
Пусть есть два случайных события. Тогда если эти события несовместимы, то вероятность наступления одного из них Р(А + В) равна сумме вероятностей этих событий (“аксиома сложения вероятностей”):
Р(А + В) = Р( А) + Р(В). (Д7.2)
Так, при бросании монеты вероятность выпадения “орла” или “решки” равна единице: Р(А + В) = 1/2 + 1/2 = 1. Если случайные события совместимы (например, выпадение “орлов” при бросании двух монет или выпадение четных чисел при бросании двух игральных костей), то вероятность наступления обоих событий Р(АВ) такова:
Р(АВ) = Р(А)Ра(В) = Р(В)Рв(А), (Д7.3)
где Ра(В) — условная вероятность события В, т. е. вероятность наступле
(Д7.4) |
ния события В при условии, что событие А уже произошло. Если случайные события независимы (например, бросание двух монет или двух игральных костей), то
РВ{А) = Р(А), РА(В) = Р(В).
9 Зак. 350
Рис. Д7.1. Сосуд с газом, молекулы которого совершают беспорядочное тепловое движение
В этом случае вероятность совместного наступления событий равна произведению их вероятностей:
Р(АВ) = Р(А)Р(В) (Д7.5)
(“аксиома умножения вероятностей”). Формулы (Д7.2) и (Д7.5) не доказываются, а проверяются экспериментально (путем проведения серии статистических испытаний). Поэтому устанавливаемые ими соотношения называют иногда аксиомами теории вероятностей. Что же касается формулы (Д7.3), то ее можно рассматривать как определение условной вероятности.
Как применить вероятностные представления к задаче об излучении ансамбля осцилляторов? Понятие случайного события здесь не совсем удобно, хотя можно говорить о событии, состоящем, например, в том, что в некоторый момент времени напряженность электрического поля световой волны в точке наблюдения превысит некоторую наперед заданную величину: E(to) > Ао - Однако для физики удобнее ввести понятие случайной величины.
Случайная величина. Пусть мы проводим серию испытаний (опытов) и измеряем некоторую физическую величину. Назовем эту величину случайной, если ее значение в каждом конкретном опыте непредсказуемо, а сами опыты допускают многократное повторение при неизменных условиях. Случайной величиной является, например, смещение броуновской частицы за некоторый фиксированный промежуток времени. Различают дискретные и непрерывные случайные величины. Дискретной называется случайная величина, которая может принимать конечное или бесконечное, но счетное множество значений. Все эти значения можно перенумеровать: Х,Х2, ■ • ., хп. Непрерывной называется случайная величина, которая может принимать бесконечное и несчетное множество значений из некоторого интервала (например, 0 < х < 1).
Дискретные случайные величины. Рассмотрим сосуд с газом. Частицы газа (атомы или молекулы) совершают беспорядочное тепловое движение (рис. Д7.1). Пусть объем сосуда равен V, а полное число частиц N. Выделим мысленно часть сосуда объемом v (рис. Д7.2). Поставим вопрос: сколько частиц п находится в объеме г? Ясно, что число частиц в выделенной части сосуда случайно. Оно может принимать значения 0 < п < N и меняется с течением времени. Вычислим вероятность попадания в объем v заданного числа частиц п.
V. N * |
У N / •
[v, n)
ч_______________________________________
Рис. Д7.2. К выводу распределений Бернулли и Пуассона
Рассмотрим сначала одну молекулу. Вероятность ее попадания в часть сосуда объемом v равна
р — v V. |
(Д7.6)
Формула (Д7.6) — аксиома для случая невзаимодействующих частиц и отсутствия внешних силовых полей. Данная формула является исходной для расчета интересующего нас распределения вероятностей. Вообще в статистической физике нужно задавать исходные вероятности, которые очевидны или следуют из опыта. Именно так мы поступаем в данном случае.
Какова вероятность попадания в выделенную часть сосуда п молекул газа? Чтобы вычислить ее, представим себе, что мы каким-то образом пометили п молекул газа. Тогда вероятность того, что все эти молекулы одновременно окажутся в части сосуда объемом v равна
рп = (v/V)n. ^ « *-■ (Д7.7)
Формула (Д7.7) получена в предположении, что отдельные молекулы независимы. Тогда вероятность осуществления сразу нескольких случайных событий равна произведению их вероятностей (аксиома умножения вероятностей). Кроме того, нужно, чтобы остальные (непомеченные) N — п молекул не попали в объем v, т. е. остались бы в части сосуда объемом V — и. Вероятность этого события подсчитывается аналогично. Она равна
(^)N П = (1-Р)"-". (Д7.8)
Вероятность того, что произойдут оба указанных события одновременно (все помеченные молекулы газа соберутся в объеме и, а остальные останутся за его пределами) равна произведению вероятностей (Д7.7) и (Д7.8):
pn(l-p)N~n.
Теперь учтем, что такая ситуация может осуществиться многими способами, а именно, числом способов С]у, где 0% — число сочетаний из N по п. Именно таким числом способов можно выбрать п молекул из N. Однако все такие
Рис. Д7.3. Биномиальное распределение вероятности. Показан пример распределения Рлг(п) при N = 10, р = 1/3 |
возможности взаимно исключают друг друга. Поэтому вероятность того, что произойдет какое-то одно из этих событий, равна сумме их вероятностей:
JV-n
QP"(1 - Р)
(аксиома сложения вероятностей). Это и есть искомая вероятность попадания п любых молекул в выделенную часть сосуда объемом ь:
N-n |
(Д7.9) |
Рм{п) = СЪрп{-р)
Здесь величина р определяется формулой (Д7.6).
Из рассмотренного примера видно, что сила и смысл теории вероятностей заключаются в том, что она позволяет по известной простой вероятности р (известной из опыта или очевидной) находить вероятности более сложных событий.
Распределение вероятности (Д7.9) называется биномиальным распределением или распределением Бернулли. Коэффициенты этого распределения С% определяются формулой
СП ____ N — |
(Д7.10) |
пі |
n(N — п)! ’ |
N |
Вид биномиального распределения показан на рис. Д7.3.
Распределение вероятности удовлетворяет условию нормировки
N
(Д7.11) |
Y^PN{n) = 1.
п=0
Математически формула (Д7.11) вытекает из формулы (Д7.9) и формулы бинома Ньютона. С точки зрения физики сумма (Д7.11) есть вероятность того, что в объем v попадает любое число молекул п от 0 до N. Поскольку такое событие является достоверным, его вероятность равна единице. В этом состоит физический смысл условия нормировки.
Среднее значение случайной величины п вычисляется по формуле
N
п = £пР*(п). (Д7.12)
п=0
Формула (Д7.12) имеет простой физический смысл: среднее статистическое значение случайной величины равно ее среднему арифметическому значению в
серии испытаний. Заметим, что именно средние значения случайных величин
представляют первоочередной интерес дня физики. Аналогичным образом вычисляются и другие средние. Например, среднее значение квадрата случайной величины п равно
N
п2 = (п2) = ^ n2PN(n) (Д7.13)
п=0
и т. д. Покажем теперь, что статистическое среднее имеет смысл среднего арифметического.
Статистическое среднее и среднее арифметическое. Пусть есть случайная величина х, которую мы измерили т раз. Получили значения
г/i раз : значение Xi, г/2 раз : значение х2,
vn раз : значение хп.
Вычислим среднее арифметическое значение величины х:
(х) = + ' - + ^„
ш
Это выражение можно переписать следующим образом:
(х) = xi—+ х2—+ --- + х„—, (Д7.15)
mm т
где величина щ/т равна отношению числа появлений величины х* к полному числу испытаний. Следовательно, Vi/m есть вероятность того, что случайная величина х принимает значение х = Xj. Итак,
i/j/m = Р(х«), если m -> оо. (Д7.16)
Поэтому
(х) = 5>іР(хі)=ї, (Д7.17)
І
т. е. среднее статистическое совпадает со средним арифметическим. Точнее, среднее статистическое значение случайной величины есть предел среднего арифметического значения при числе испытаний, стремящемся к бесконечности.
Распределение Пуассона. Одним из важнейших распределений вероятности, которому подчиняются многие дискретные случайные величины, является распределение Пуассона
Р{п)=е~а^-г, а = п, п = 0,1,2,.... (Д7.18)
п!
Это распределение может быть получено из распределения Бернулли (Д7.9) в предельном случае
N —^ оо, pCl, Np - конечно. (Д7.19)
Помимо среднего значения, важнейшей статистической характеристикой любой случайной величины является дисперсия (“разброс”). Дисперсия определяется как средний квадрат отклонения случайной величины от ее среднего значения. Например, для дискретной случайной величины п
Dn = ((п - п)2) (Д7.20)
или, подробнее,
ЛГ
Dn~ £(n-n)2PN(n). (Д7.21)
n=0
В силу того, что операция усреднения линеЯна, она коммутирует (т. е. допускает перестановку местами) с любой другой линейной операцией (сложением, умножением на константу и т. п.). Поэтому в общем случае
Dn — ({п2 - 2пп + п2)^ —п2- п2. (Д7.22)
Нетрудно показать, что для пуассоновской случайной величины дисперсия равна среднему значению
Dn = п. (Д7.23)
Это свойство распределения Пуассона доказывается путем простых операций с числовыми рядами.
Непрерывные случайные величины. Пусть в некотором опыте измеряется непрерывная физическая величина х — например, амплитуда или фаза колебаний. Если при многократном повторении опыта в неизменных условиях измеренные значения х не совпадают одно с другим, то величина х является случайной.
Пусть есть непрерывная случайная величина х, которая может принимать любые вещественные значения (например, напряженность электрического поля световой волны), т. е. —оо < х < оо. Количественной характеристикой непрерывной случайной величины может служить вероятность попадания этой величины в небольшую область значений в окрестности заданной точки, скажем, вероятность попадания х в интервал х < х < Х + dx (рис. Д7.4). Обозначим эту вероятность
P{xi < х < xi + dx).
Xj+ dx ®
Рис. Д7.4. К определению плотности вероятности
Как определить эту вероятность? Это можно сделать экспериментально, проведя серию испытаний (измерений) и вычислив вероятность по формуле
Р(®i < х < Т! 4- dx) = lim —, (Д7.24)
т—юо т
где п — число испытаний, в которых измеренное значение попало в заданную область, т — полное число испытаний. Если предел в (Д7.24) существует и не зависит от процедуры испытаний, то он дает искомую вероятность. Введем теперь понятие плотности вероятности.
Плотность вероятности. Если в формуле (Д7.24) выбирать интервал dx достаточно малым, то естественно ожидать, что вероятность попадания случайной величины в этот интервал будет пропорциональна его величине, т. е.
Р(хі < х < xi + dx) = w(xi)dx. (Д7.25)
Коэффициент пропорциональности в этой формуле может зависеть от выбора точки *i, в окрестности которой взят интервал наблюдения, поскольку разные значения х, вообще говоря не равновероятны. Функция w(x), отражающая статистические свойства случайной величины х, называется плотностью вероятности. Она равна пределу отношения вероятности попадания случайной величины в заданный интервал к величине этого интервала
, . Р(хі < х < xi + Ах)
w(xi) = lim —— ~ -- (Д7.26)
Ди-щ Да: v-л /
Формула (Д7.26) является определением плотности вероятности. Из определения следует, что плотность вероятности неотрицательна
w(x) > 0. (Д7.27)
Если функция w(x) известна, то можно вычислить вероятность попадания случайной величины х в любую наперед заданную область по формуле
6
Р( a <x<b) = J w(x) dx. (Д7.28)
а
Формула (Д7.28) доказывается путем деления отрезка [а, 6] на бесконечно малые интервалы и применения аксиомы о сложении вероятностей. В частности, интеграл от плотности вероятности по всей области возможных значений х имеет смысл вероятности того, что величина х примет какое-либо одно из всех своих возможных значений. Поскольку такое событие является достоверным, его вероятность равна единице:
О *0 х Рис. Д7.5. Гауссово распределение вероятности |
оо
J w{x)dx = 1. (Д7.29)
—ОО
Формула (Д7.29) называется условием нормировки. Любое распределение вероятности должно удовлетворять этому условию.
ОО х = J xw(x) dx |
Зная распределение плотности вероятности, можно находить различные средние. Например, среднее значение самой случайной величины
(Д7.30)
или ее дисперсию
00
Dx = ((х — х)2) = J (х — x)2iv(x) dx. (Д7.31)
— 00
Среднее значение произвольной функции /(х) случайной переменной х вычисляется по формуле
00
{/(я)) = J f(x)w(x) dx. (Д7.32)
— ОО
Распределение Гаусса. Закон распределения многих случайных физиче
ских величин имеет вид
w(x) = |
(Д7.33) |
ехр |
(х - х0)2 |
2ег2 |
где случайная величина х может принимать любые вещественные значения —оо < х < оо, хо и а — постоянные параметры. Распределение вероятности (Д7.33) называется гауссовы^ или нормальным. Вид этого распределения показан на рис. Д7.5. Нетрудно показать, что
w(x) dx = 1,
оо / |
«7.34) «7.35) (Д7.36) |
— ОО ОО
х = j xw(x) dx = xq,
—ОО
ОО
Dx = J (х — x)2w(x) dx = о3.
Таким образом, плотность вероятности (Д7.33) является нормированной. Параметры жо и с2 в формуле (Д7.33) имеют смысл среднего значения и дисперсии гауссовой случайной величины (рис. Д7.5).
Центральная предельная теорема. В теории вероятностей доказывается следующая теорема, носящая название центральной предельной теоремы теории вероятностей: сумма большого числа независимых случайных величин имеет гауссово распределение вероятности. Заметим, что именно в силу этой теоремы большинство случайных величин в физике являются гауссовыми (нормальными) случайными величинами.
Двумерная плотность вероятности. Если есть две случайные величины хі и Х2, то можно ввести двумерную (совместную) плотность вероятности
Ц£ь6) = lim Ахі —►О д*2—►О |
(Д7.37) |
Р(6 < хі 5= £і + Ажіі&і — 12 — & + Ахг) ДжіДжг
Эта функция характеризует вероятность того, что случайная величина хі попадает в малую окрестность точки, а величина х? — в малую окрестность точки £2 • Из определения вытекают следующие свойства двумерной плотности вероятности:
(Д7.38) (Д7.39) «7.40) (Д7-41) (Д7.42) |
™(жі, ж2) > 0.
6} Ьз
Р(оі < х < Ьі;а2 < ж2 < Ь2) = J dx i J dx2w(xi, X2),
аг аг
00 оо
/ / w{X,X2)dX dx2 = 1,
—ОО —оо
оо оо
W(Xі) = J w(Xi, X2)dl2, Щ(Ж2) = J U)(Xi, X2)dXi.
-оо -00
Наконец, если случайные величины хі и ж2 независимы, то
w(xi, x2) = w{x і)щ(ж2).
Рис. Д7.6. К выводу формулы преобразования распределения вероятности |
Преобразование распределений вероятности. Пусть есть случайная величина х, имеющая распределение плотности вероятности w(x), и другая случайная величина у, связанная с величиной х известным функциональным соотношением
У = У(х), х = х{у). (Д7.43)
Каким будет распределение плотности вероятности для случайной величи
ны у? Ответ на этот вопрос можно дать в общем виде. Нарисуем зависимость у{х) (рис. Д7.6). Из рисунка видно, что если величина х попадает в область [я, х + dx], то величина у попадает в область [у, у + dy. Следовательно, вероятности этих случайных событий совпадают:
Р(х < х < х + dx) — Р(у <у<у + dy).
Теперь выразим эти вероятности через функции распределения плотности вероятности величин х и у. Получим
w(x)dx = w{y)dy,
откуда
w(y) = w(x{y))^^-. (Д7.44)
Аналогичным образом можно получить формулу преобразования двумерной
плотности вероятности:
w{.yi, y2) = w(x1(y1,y2);x2(уі, у2)) ^ • (Д7.45)
Итак, для того чтобы перейти к новой переменной (переменным) в распределении вероятности, нужно, во-первых, сделать замену переменной в самой функции распределения вероятности и, во-вторых, умножить ее на производную (якобиан преобразования) от старых переменных к новым. Для того чтобы полученная таким образом плотность вероятности была неотрицательной, производную (якобиан) следует взять по абсолютной величине:
dx(y) |
(Д7.46) |
dy |
w(y) = w(x(y)) в одномерном случае и |
D(x i, x2) |
(Д7.47) |
D{Vi, y2) |
и>(Уі, У2) = ’ш(хі(уі, у2);х2(уі, У2)^ |
(Д7.48) |
в двумерном случае. Напомним, что якобианом преобразования называется определитель, составленный из производных:
дхі |
дхі |
|
D(x i, x2) |
дуі |
ду2 |
D{yi, y2) |
дх2 |
дх2 |
дуі |
ду2 |
Примеры использования статистических понятий в оптике даны в лекции 6.