Оценки математического ожидания и дисперсии, их свойства. Примеры. Точечные оценки математического ожидания. Точечные оценки дисперсии. Точечная оценка вероятности события - Лабораторная работа

Необходимость оценивания математического ожидания по результатам испытаний появляется в задачах, когда результат эксперимента описывается случайной величиной и показателем качества исследуемого объекта принято математическое ожидание этой случайной величины. Например, в качестве показателя надежности может быть принято математическое ожидание времени безотказной работы какой-либо системы, а при оценивании эффективности производства продукции - математическое ожидание числа годных изделий и т. д.

Задача оценивания математического ожидания формулируется следующим образом. Предположим, что для определения неизвестного значения случайной величины X предполагается произвести п независимых и свободных от систематических ошибок измерений X v Х 2 ,..., Х п. Требуется выбрать наилучшую оценку математического ожидания.

Наилучшей и наиболее распространенной на практике оценкой математического ожидания является среднее арифметическое результатов испытаний

называемое также статистическим или выборочным средним.

Покажем, что оценка т х удовлетворяет всем требованиям, предъявляемым к оценке любого параметра.

1. Из выражения (5.10) следует, что

т. е. оценка т" х - несмещенная оценка.

2. Согласно теореме Чебышева среднее арифметическое результатов испытаний сходится по вероятности к математическому ожиданию, т. е.

Следовательно, оценка (5.10) есть состоятельная оценка математического ожидания.

3. Дисперсия оценки т х, равная

с ростом объема выборки п неограниченно убывает. Доказано, что если случайная величина X подчинена нормальному закону распределения, то при любом п дисперсия (5.11) будет минимально возможной, а оценка т х - эффективной оценкой математического ожидания. Знание дисперсии оценки позволяет вынести суждение относительно точности определения неизвестного значения математического ожидания с помощью этой оценки.

В качестве оценки математического ожидания среднее арифметическое используется в том случае, если результаты измерений равноточные (дисперсии D, i = 1, 2, ..., п одинаковы в каждом измерении). Однако на практике приходится сталкиваться с задачами, в которых результаты измерений неравноточные (например, в процессе испытаний измерения производятся различными приборами). В этом случае оценка для математического ожидания имеет вид

где - вес г-го измерения.

В формулу (5.12) результат каждого измерения включается со своим весом С .. Поэтому оценку результатов измерений т х называют средневзвешенной.

Можно показать, что оценка (5.12) является несмещенной, состоятельной и эффективной оценкой математического ожидания. Минимальная дисперсия оценки определяется выражением


При проведении экспериментов с моделями на ЭВМ подобные задачи возникают в том случае, когда оценки находят по результатам нескольких серий испытаний и число испытаний в каждой серии различно. Например, проведены две серии испытаний объемом п 1 и п 2 , по результатам которых получены оценки т хi и т х _. С целью повышения точности и достоверности определения математического ожидания результаты этих серий испытаний объединяют. Для этого следует воспользоваться выражением (5.12)

При вычислении коэффициентов С вместо дисперсий D подставляют их оценки, полученные по результатам испытаний в каждой серии.

Аналогичный подход используют и при определении вероятности наступления случайного события по результатам серий испытаний.

Для оценивания математического ожидания случайной величины X, кроме выборочного среднего, могут использоваться и другие статистики. Чаще всего для этих целей используют члены вариационного ряда, т. е. порядковые статистики , на базе которых строят оценки,

удовлетворяющие основным из предъявляемых требований, а именно состоятельности и несмещенности.

Предположим, что вариационный ряд содержит п = 2к членов. Тогда в качестве оценки математического ожидания может быть принято любое из средних:

При этом к-е среднее

есть не что иное, как статистическая медиана распределения случайной величины X, поскольку имеет место очевидное равенство

Преимущество статистической медианы состоит в том, что она свободна от влияния аномальных результатов наблюдений, неизбежного при использовании первого среднего, т. е. среднего из наименьшего и наибольшего числа вариационного ряда.

При нечетном объеме выборки п = - 1 статистической медианой является ее средний элемент, т. е. к -й член вариационного ряда Me = х к.

Существуют распределения, у которых среднее арифметическое не является эффективной оценкой математического ожидания, например, распределение Лапласа. Можно показать, что для распределения Лапласа эффективной оценкой математического ожидания является выборочная медиана.

Доказано, что если случайная величина X имеет нормальное распределение, то при достаточно большом объеме выборки закон распределения статистической медианы близок к нормальному с числовыми характеристиками

Из сравнения формул (5.11) и (5.14) следует, что дисперсия статистической медианы в 1,57 раза больше дисперсии среднего арифметического. Следовательно, среднее арифметическое как оценка математического ожидания во столько же раз эффективнее статистической медианы. Однако из-за простоты вычислений, нечувствительности к аномальным результатам измерений (“засоренности” выборки) на практике в качестве оценки математического ожидания тем не менее используют статистическую медиану.

Следует отметить, что для непрерывных симметричных распределений математическое ожидание и медиана совпадают. Поэтому статистическая медиана может служить хорошей оценкой математического ожидания лишь при симметричном распределении случайной величины.

Для несимметричных распределений статистическая медиана Me имеет существенное смещение относительно математического ожидания, поэтому для его оценивания непригодна.

Математическое ожидание - это распределение вероятностей случайной величины

Математическое ожидание, определение, математическое ожидание дискретной и непрерывной случайных величин, выборочное, условное матожидание, расчет, свойства, задачи, оценка матожидания, дисперсия, функция распределения, формулы, примеры расчета

Развернуть содержание

Свернуть содержание

Математическое ожидание - это, определение

Одно из важнейших понятий в математической статистике и теории вероятностей, характеризующее распределение значений или вероятностей случайной величины. Обычно выражается как средневзвешенное значение всех возможных параметров случайной величины. Широко применяется при проведении технического анализа, исследовании числовых рядов, изучении непрерывных и продолжительных процессов. Имеет важное значение при оценке рисков, прогнозировании ценовых показателей при торговле на финансовых рынках, используется при разработке стратегий и методов игровой тактики в теории азартных игр.

Математическое ожидание - это среднее значение случайной величины, распределение вероятностей случайной величины рассматривается в теории вероятностей.

Математическое ожидание – это мера среднего значения случайной величины в теории вероятности. Математическое ожидание случайной величины x обозначается M(x) .

Математическое ожидание – это

Математическое ожидание – это в теории вероятности средневзвешенная величина всех возможных значений, которые может принимать эта случайная величина.

Математическое ожидание – это сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Математическое ожидание – это средняя выгода от того или иного решения при условии, что подобное решение может быть рассмотрено в рамках теории больших чисел и длительной дистанции.


Математическое ожидание – это в теории азартных игр сумма выигрыша, которую может заработать или проиграть игрок, в среднем, по каждой ставке. На языке азартных игроков это иногда называется «преимуществом игрока» (если оно положительно для игрока) или «преимуществом казино» (если оно отрицательно для игрока).

Математическое ожидание – это процент прибыли на выигрыш, умноженный на среднюю прибыль, минус вероятность убытка, умноженная на средний убыток.


Математическое ожидание случайной величины в математической теории

Одной из важных числовых характеристик случайной величины является математическое ожидание. Введем понятие системы случайных величин. Рассмотрим совокупность случайных величин, которые являются результатами одного и того же случайного эксперимента. Если - одно из возможных значений системы, то событию соответствует определенная вероятность удовлетворяющая аксиомам Колмогорова. Функция, определенная при любых возможных значениях случайных величин, называется совместным законом распределения. Эта функция позволяет вычислять вероятности любых событий из. В частности, совместный закон распределения случайных величин и, которые принимают значения из множества и, задается вероятностями.


Термин «математическое ожидание» введён Пьером Симоном маркизом де Лапласом (1795) и произошёл от понятия «ожидаемого значения выигрыша», впервые появившегося в 17 веке в теории азартных игр в трудах Блеза Паскаля и Христиана Гюйгенса. Однако первое полное теоретическое осмысление и оценка этого понятия даны Пафнутием Львовичем Чебышёвым (середина 19 века).


Закон распределения случайных числовых величин (функция распределения и ряд распределения или плотность вероятности) полностью описывают поведение случайной величины. Но в ряде задач достаточно знать некоторые числовые характеристики исследуемой величины (например, ее среднее значение и возможное отклонение от него), чтобы ответить на поставленный вопрос. Основными числовыми характеристиками случайных величин являются математическое ожидание, дисперсия, мода и медиана.

Математическим ожиданием дискретной случайной величины называется сумма произведений ее возможных значений на соответствующие им вероятности. Иногда математическое ожидание называют взвешенным средним, так как оно приближенно равно среднему арифметическому наблюдаемых значений случайной величины при большом числе опытов. Из определения математического ожидания следует, что его значение не меньше наименьшего возможного значения случайной величины и не больше наибольшего. Математическое ожидание случайной величины есть неслучайная (постоянная) величина.


Математическое ожидание имеет простой физический смысл: если на прямой разместить единичную массу, поместив в некоторые точки некоторую массу (для дискретного распределения), или «размазав» её с определенной плотностью (для абсолютно непрерывного распределения), то точка, соответствующая математическому ожиданию, будет координатой «центра тяжести» прямой.


Среднее значение случайной величины есть некоторое число, являющееся как бы её «представителем» и заменяющее её при грубо ориентировочных расчетах. Когда мы говорим: «среднее время работы лампы равно 100 часам» или «средняя точка попадания смещена относительно цели на 2 м вправо», мы этим указываем определенную числовую характеристику случайной величины, описывающую её местоположение на числовой оси, т.е. «характеристику положения».

Из характеристик положения в теории вероятностей важнейшую роль играет математическое ожидание случайной величины, которое иногда называют просто средним значением случайной величины.


Рассмотрим случайную величину Х , имеющую возможные значения х1, х2, …, хn с вероятностями p1, p2, …, pn . Нам требуется охарактеризовать каким-то числом положение значений случайной величины на оси абсцисс с учетом того, что эти значения имеют различные вероятности. Для этой цели естественно воспользоваться так называемым «средним взвешенным» из значений xi , причем каждое значение xi при осреднении должно учитываться с «весом», пропорциональным вероятности этого значения. Таким образом, мы вычислим среднее случайной величины X , которое мы обозначим M |X| :


Это среднее взвешенное значение и называется математическим ожиданием случайной величины. Таким образом, мы ввели в рассмотрении одно из важнейших понятий теории вероятностей – понятие математического ожидания. Математическим ожиданием случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Х связано своеобразной зависимостью со средним арифметическим наблюденных значений случайной величины при большом числе опытов. Эта зависимость того же типа, как зависимость между частотой и вероятностью, а именно: при большом числе опытов среднее арифметическое наблюденных значений случайной величины приближается (сходится по вероятности) к ее математическому ожиданию. Из наличия связи между частотой и вероятностью можно вывести как следствие наличие подобной же связи между средним арифметическим и математическим ожидание. Действительно, рассмотрим случайную величину Х , характеризуемую рядом распределения:


Пусть производится N независимых опытов, в каждом из которых величина X принимает определенное значение. Предположим, что значение x1 появилось m1 раз, значение x2 появилось m2 раз, вообще значение xi появилось mi раз. Вычислим среднее арифметическое наблюденных значений величины Х, которое, в отличие от математического ожидания М|X| мы обозначим M*|X|:

При увеличении числа опытов N частоты pi будут приближаться (сходиться по вероятности) к соответствующим вероятностям. Следовательно, и среднее арифметическое наблюденных значений случайной величины M|X| при увеличении числа опытов будет приближаться (сходится по вероятности) к её математическому ожиданию. Сформулированная выше связь между средним арифметическим и математическим ожиданием составляет содержание одной из форм закона больших чисел.

Мы уже знаем, что все формы закона больших чисел констатируют факт устойчивости некоторых средних при большом числе опытов. Здесь речь идет об устойчивости среднего арифметического из ряда наблюдений одной и той же величины. При небольшом числе опытов среднее арифметическое их результатов случайно; при достаточном увеличении числа опытов оно становится «почти не случайным» и, стабилизируясь, приближается к постоянной величине – математическому ожиданию.


Свойство устойчивости средних при большом числе опытов легко проверить экспериментально. Например, взвешивая какое-либо тело в лаборатории на точных весах, мы в результате взвешивания получаем каждый раз новое значение; чтобы уменьшить ошибку наблюдения, мы взвешиваем тело несколько раз и пользуемся средним арифметическим полученных значений. Легко убедиться, что при дальнейшем увеличении числа опытов (взвешиваний) среднее арифметическое реагирует на это увеличение все меньше и меньше и при достаточно большом числе опытов практически перестает меняться.

Следует заметить, что важнейшая характеристика положения случайной величины – математическое ожидание – существует не для всех случайных величин. Можно составить примеры таких случайных величин, для которых математического ожидания не существует, так как соответствующая сумма или интеграл расходятся. Однако для практики такие случаи существенного интереса не представляют. Обычно случайные величины, с которыми мы имеем дело, имеют ограниченную область возможных значений и, безусловно, обладают математическим ожиданием.


Кроме важнейшей из характеристик положения случайной величины – математического ожидания, - на практике иногда применяются и другие характеристики положения, в частности, мода и медиана случайной величины.


Модой случайной величины называется её наиболее вероятное значение. Термин «наиболее вероятное значение», строго говоря, применим только к прерывным величинам; для непрерывной величины модой является то значение, в котором плотность вероятности максимальна. На рисунках показана мода соответственно для прерывной и непрерывной случайных величин.


Если многоугольник распределения (кривая распределения) имеет более одного максимума, распределение называется «полимодальным».



Иногда встречаются распределения, обладающие посередине не максимумом, а минимумом. Такие распределения называют «антимодальными».


В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, когда распределение является симметричным и модальным (т.е. имеет моду) и существует математическое ожидание, то оно совпадает с модой и центром симметрии распределения.

Часто применяется еще одна характеристика положения – так называемая медиана случайной величины. Этой характеристикой пользуются обычно только для непрерывных случайных величин, хотя формально можно её определить и для прерывной величины. Геометрически медиана – это абсцисса точки, в которой площадь, ограниченная кривой распределения, делится пополам.


В случае симметричного модального распределения медиана совпадает с математическим ожиданием и модой.

Математическое ожидание представляет собой среднее значение, случайной величины - числовая характеристика распределения вероятностей случайной величины. Самым общим образом математическое ожидание случайной величины Х(w) определяется как интеграл Лебега по отношению к вероятностной мере Р в исходном вероятностном пространстве:


Математическое ожидание может быть вычислено и как интеграл Лебега от х по распределению вероятностей рх величины X :


Естественным образом можно определить понятие случайной величины с бесконечным математическим ожиданием. Типичным примером служат времена возвращения в некоторых случайных блужданиях.

С помощью математического ожидания определяются многие числовые и функциональные характеристики распределения (как математическое ожидание соответствующих функций от случайной величины), например, производящая функция, характеристическая функция, моменты любого порядка, в частности дисперсия, ковариация.

Математическое ожидание есть характеристика расположения значений случайной величины (среднее значение ее распределения). В этом качестве математическое ожиддание служит некоторым "типичным" параметром распределения и его роль аналогична роли статического момента - координаты центра тяжести распределения массы - в механике. От прочих характеристик расположения, с помощью которых распределение описывается в общих чертах,- медиан, мод, математическое ожидание отличается тем большим значением, которое оно и соответствующая ему характеристика рассеяния - дисперсия - имеют в предельных теоремах теории вероятностей. С наибольшей полнотой смысл математического ожидания раскрывается законом больших чисел (неравенство Чебышева) и усиленным законом больших чисел.

Математическое ожидание дискретной случайной величины

Пусть есть некоторая случайная величина, которая может принять одно из нескольких числовых значений (допустим, количество очков при броске кости может быть 1, 2, 3, 4, 5 или 6). Часто на практике для такой величины возникает вопрос: а какое значение она принимает "в среднем" при большом количестве тестов? Каков будет наш средний доход (или убыток) от каждой из рискованных операций?


Скажем, есть какая-то лотерея. Мы хотим понять, выгодно или нет в ней поучаствовать (или даже участвовать неоднократно, регулярно). Допустим, выигрышный каждый четвёртый билет, приз составит 300 руб., а цена любого билета - 100 руб. При бесконечно большом количестве участий получается вот что. В трёх четвертях случаев мы проиграем, каждые три проигрыша обойдутся в 300 руб. В каждом четвёртом случае мы выиграем 200 руб. (приз минус стоимость), то есть за четыре участия мы в среднем теряем 100 руб., за одно - в среднем 25 руб. Итого в среднем темпы нашего разорения составят 25 руб./билет.

Кидаем игральную кость. Если она не жульническая (без смещения центра тяжести и т.д.), то сколько мы в среднем будем иметь очков за раз? Поскольку каждый вариант равновероятен, берём тупо среднее арифметическое и получаем 3,5. Поскольку это СРЕДНЕЕ, то незачем возмущаться, что 3,5 очков никакой конкретный бросок не даст - ну нет у этого куба грани с таким числом!

Теперь обобщим наши примеры:


Обратимся к только что приведённой картинке. Слева табличка распределения случайной величины. Величина X может принимать одно из n возможных значений (приведены в верхней строке). Никаких других значений не может быть. Под каждым возможным значением снизу подписана его вероятность. Справа приведена формула, где M(X) и называется математическим ожиданием. Смысл этой величины в том, что при большом количестве испытаний (при большой выборке) среднее значение будет стремиться к этому самому математическому ожиданию.

Вернёмся опять к тому же самому игральному кубу. Математическое ожидание количества очков при броске равно 3,5 (посчитайте сами по формуле, если не верите). Скажем, вы кинули его пару раз. Выпали 4 и 6. В среднем получилось 5, то есть далеко от 3,5. Кинули ещё разок, выпало 3, то есть в среднем (4 + 6 + 3)/3 = 4,3333... Как-то далеко от математического ожидания. А теперь проведите сумасшедший эксперимент - киньте куб 1000 раз! И если в среднем и не будет ровно 3,5, то будет близко к тому.

Посчитаем математическое ожидание для выше описанной лотереи. Табличка будет выглядеть вот так:


Тогда математическое ожидание составит, как мы установили выше.:


Другое дело, что так же "на пальцах", без формулы, было бы трудновато, если бы имелось больше вариантов. Ну скажем, имелось бы 75% проигрышных билетов, 20% выигрышных билетов и 5% особо выигрышных.

Теперь некоторые свойства математического ожидания.

Доказать это просто:


Постоянный множитель допускается выносить за знак математического ожидания, то есть:


Это является частным случаем свойства линейности математического ожидания.

Другое следствие линейности математического ожидания:

то есть математическое ожидание суммы случайных величин равно сумме математических ожиданий случайных величин.

Пусть X, Y - независимые случайные величины , тогда:

Это тоже несложно доказать) Произведение XY само представляет собой случайную величину, при этом если исходные величины могли принимать n и m значений соответственно, то XY может принимать nm значений. Вероятность каждого из значений вычисляется исходя из того, что вероятности независимых событий перемножаются. В итоге получаем вот что:


Математическое ожидание непрерывной случайной величины

У непрерывных случайных величин есть такая характеристика, как плотность распределения (плотность вероятности). Она, по сути характеризует ситуацию, что некоторые значения из множества действительных чисел случайная величина принимает чаще, некоторые - реже. Например, рассмотрим вот какой график:


Здесь X - собственно случайная величина, f(x) - плотность распределения. Судя по данному графику, при опытах значение X часто будет числом, близким к нулю. Шансы же превысить 3 или оказаться меньше -3 скорее чисто теоретические.


Пусть, например, есть равномерное распределение:



Это вполне соответствует интуитивному пониманию. Скажем, если мы получаем при равномерном распределении много случайных действительных чисел, каждое из отрезка |0; 1| , то среднее арифметическое должно быть около 0,5.

Свойства математического ожидания - линейность и т.д., применимые для дискретных случайных величин, применимы и здесь.

Взаимосвязь математического ожидания с другими статистическими показателями

В статистическом анализе наряду с математическим ожиданием существует система взаимозависимых показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных. Исключением является коэффициент вариации, который характеризует однородность данных, что является ценной статистической характеристикой.


Степень изменчивости или устойчивости процессов в статистической науке может измеряться с помощью нескольких показателей.

Наиболее важным показателем, характеризующим изменчивость случайной величины, является Дисперсия , которая самым тесным и непосредственным образом связана с математическим ожиданием. Этот параметр активно используется в других видах статистического анализа (проверка гипотез, анализ причинно-следственных связей и др.). Как и среднее линейное отклонение, дисперсия также отражает меру разброса данных вокруг средней величины.


Язык знаков полезно перевести на язык слов. Получится, что дисперсия - это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Разгадка магического слова «дисперсия» заключается всего в трех словах.

Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который используется для других видов статистического анализа. У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных.

Пусть мы измеряем случайную величину N раз, например, десять раз измеряем скорость ветра и хотим найти среднее значение. Как связано среднее значение с функцией распределения?

Или будем кидать игральный кубик большое количество раз. Количество очков, которое выпадет на кубике при каждом броске, является случайной величиной и может принимать любые натуральные значения от 1 до 6. Среднее арифметическое выпавших очков, подсчитанных за все броски кубика, тоже является случайной величиной, однако при больших N оно стремится ко вполне конкретному числу – математическому ожиданию Mx . В данном случае Mx = 3,5.

Каким образом получилась эта величина? Пусть в N испытаниях n1 раз выпало 1 очко, n2 раз – 2 очка и так далее. Тогда количество исходов, в которых выпало одно очко:


Аналогично для исходов, когда выпало 2, 3, 4, 5 и 6 очков.


Предположим теперь, что мы знаем закон распределения случайной величины x, то есть знаем, что случайная величина x может принимать значения x1, x2, ..., xk с вероятностями p1, p2, ..., pk.

Математическое ожидание Mx случайной величины x равно:


Математическое ожидание не всегда является разумной оценкой какой-нибудь случайной величины. Так, для оценки средней заработной платы разумнее использовать понятие медианы, то есть такой величины, что количество людей, получающих меньшую, чем медиана, зарплату и большую, совпадают.

Вероятность р1 того, что случайная величина х окажется меньшей х1/2, и вероятность р2 того, что случайная величина x окажется большей х1/2, одинаковы и равны 1/2. Медиана определяется однозначно не для всех распределений.


Стандартным или Среднеквадратическим отклонением в статистике называется степень отклонения данных наблюдений или множеств от СРЕДНЕГО значения. Обозначается буквами s или s. Небольшое стандартное отклонение указывает на то, что данные группируются вокруг среднего значения, а значительное - что начальные данные располагаются далеко от него. Стандартное отклонение равно квадратному корню величины, называемой дисперсией. Она есть среднее число суммы возведенных в квадрат разностей начальных данных, отклоняющихся от среднего значения. Среднеквадратическим отклонением случайной величины называется корень квадратный из дисперсии:


Пример. В условиях испытаний при стрельбе по мишени вычислить дисперсию и среднеквадратическое отклонение случайной величины:


Вариация - колеблемость, изменяемость величины признака у единиц совокупности. Отдельные числовые значения признака, встречающиеся в изу¬чаемой совокупности, называют вариантами значений. Недостаточность средней величины для полной характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Коэффициент вариации вычисляют по формуле:


Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности. Этот показатель дает самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Зависимость от крайних значений признака придает размаху вариации неустойчивый, случайный характер.


Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины:


Математическое ожидание в теории азартных игр

Математическое ожидание – это среднее количество денег, которое игрок в азартные игры может выиграть или проиграть на данной ставке. Это очень существенное понятие для игрока, потому что оно является основополагающим для оценки большинства игровых ситуаций. Математическое ожидание – это также оптимальный инструмент для анализа основных карточных раскладов и игровых ситуаций.

Допустим, вы играете с другом в монетку, каждый раз делая ставку поровну по $1 независимо оттого, что выпадет. Решка – вы выиграли, орел – проиграли. Шансы на то, что выпадет решка один к одному, и вы делаете ставку $1 к $1. Таким образом, математическое ожидание у вас равно нулю, т.к. с точки зрения математики вы не можете знать будете вы вести или проигрывать после двух бросков или после 200.


Ваш часовой выигрыш равен нулю. Часовой выигрыш – это то количество денег, которое вы ожидаете выиграть за час. Вы можете кидать монету 500 раз в течение часа, но вы не выиграете и не проиграете, т.к. ваши шансы ни положительны, ни отрицательны. Если смотреть, с точки зрения серьезного игрока такая система ставок неплоха. Но это попросту потеря времени.

Но предположим, кто-то хочет поставить $2 против вашего $1 в эту же игру. Тогда вы сразу же обладаете положительным матожиданием в 50 центов с каждой ставки. Почему 50 центов? В среднем одну ставку вы выигрываете, вторую проигрываете. Поставите первый доллар – и потеряете $1, ставите второй – выиграете $2. Вы два раза сделали ставку по $1 и идете впереди на $1. Таким образом, каждая из ваших однодолларовых ставок дала вам 50 центов.


Если за один час монета выпадет 500 раз, ваш часовой выигрыш составит уже $250, т.к. в среднем вы потеряли по одному доллару 250 раз и выиграли по два доллара 250 раз. $500 минус $250 равно $250, что и составляет суммарный выигрыш. Обратите внимание, что матожидание, являющиеся суммой, которую в среднем вы выиграли на одной ставке, равняется 50 центам. Вы выиграли $250, делая ставку по доллару 500 раз, что равняется 50 центам со ставки.

Математическое ожидание не имеет ничего общего с кратковременным результатом. Ваш оппонент, который решил ставить против вас $2 мог обыграть вас на первых десяти бросках подряд, но вы, обладая преимуществом ставок 2 к 1 при прочих равных, в любых обстоятельствах зарабатываете 50 центов с каждой ставки в $1. Нет разницы, выигрываете вы либо проигрываете одну ставку или несколько ставок, но только при условии, что у вас хватит наличности, чтобы спокойно компенсировать затраты. Если вы будете продолжать ставить так же, то за длительный период времени ваш выигрыш подойдет к сумме матожиданий в отдельных бросках.


Каждый раз, делая ставку с лучшим исходом (ставка, которая может оказаться выгодной на длинной дистанции), когда шансы в вашу пользу, вы обязательно что-то выигрываете на ней, и не важно теряете ли вы ее или нет в данной раздаче. И напротив, если вы сделали ставку с худшим исходом (ставка, которая невыгодна на длинной дистанции), когда шансы не в вашу пользу, вы что-то теряете независимо от того, выиграли вы или проиграли в данной раздаче.

Вы делаете ставку с лучшим исходом, если матожидание у вас положительно, а оно является положительным, если шансы на вашей стороне. Делая ставку с худшим исходом, у вас отрицательное матожидание, которое бывает, когда шансы против вас. Серьезные игроки делают ставки только с лучшим исходом, при худшем – они пасуют. Что означает шансы в вашу пользу? Вы можете в итоге выиграть больше, чем приносят реальные шансы. Реальные шансы на то, что выпадет решка 1 к 1, но у вас выходит 2 к 1 за счет соотношения ставок. В данном случае шансы в вашу пользу. Вы точно получаете лучший исход с положительным ожиданием в 50 центов за одну ставку.


Вот более сложный пример математического ожидания. Приятель пишет цифры от одного до пяти и делает ставку $5 против вашего $1 на то, что вы не определите загаданную цифру. Соглашаться ли вам на такое пари? Какое здесь матожидание?

В среднем четыре раза вы ошибетесь. Исходя из этого, шансы против того, что вы отгадаете цифру, составят 4 к 1. Шансы за то, что при одной попытке вы лишитесь доллара. Тем не менее, вы выигрываете 5 к 1, при возможности проиграть 4 к 1. Поэтому шансы в вашу пользу, вы можете принимать пари и надеяться на лучший исход. Если вы сделаете такую ставку пять раз, в среднем вы проиграете четыре раза по $1 и один раз выиграете $5. Исходя из этого, за все пять попыток вы заработаете $1 с положительным математическим ожиданием в 20 центов за одну ставку.


Игрок, который собирается выиграть больше, чем ставит, как в примере выше, – ловит шансы. И напротив, он губит шансы, когда предполагает выиграть меньше, чем ставит. Игрок, делающий ставку может иметь либо положительное, либо отрицательное матожидание, которое зависит от того, ловит он или губит шансы.

Если вы поставите $50 для того, чтобы выиграть $10 при вероятности выигрыша 4 к 1, то вы получите отрицательное матожидание $2, т.к. в среднем вы выиграете четыре раза по $10 и один раз проиграете $50, из чего видно, что потеря за одну ставку составит $10. Но вот если вы поставите $30 для того, чтобы выиграть $ 10, при тех же шансах выигрыша 4 к 1, то в данном случае вы имеете положительное ожидание $2, т.к. вы вновь выигрываете четыре раза по $10 и один раз проигрываете $30, что составит прибыль в $10. Данные примеры показывают, что первая ставка плохая, а вторая – хорошая.


Математическое ожидание является центром любой игровой ситуации. Когда букмекер призывает футбольных болельщиков ставить $11, чтобы выиграть $10, то он имеет положительное матожидание с каждых $10 в размере 50 центов. Если казино выплачивает равные деньги с пасовой линии в крепсе, то положительное ожидание казино составит приблизительно $1.40 с каждых $100, т.к. эта игра построена так, что каждый, кто поставил на эту линию, в среднем проигрывает 50.7% и выигрывает 49.3% общего времени. Бесспорно, именно это вроде бы минимальное положительное матожидание и приносит колоссальные прибыли владельцам казино по всему миру. Как заметил хозяин казино Vegas World Боб Ступак, «одна тысячная процента отрицательной вероятности на достаточно длинной дистанции разорит богатейшего человека в мире».


Математическое ожидание при игре в Покер

Игра в Покер является наиболее показательным и наглядным примером с точки зрения использования теории и свойств математического ожидания.


Математическое ожидание (англ. Expected Value) в Покере – средняя выгода от того или иного решения при условии, что подобное решение может быть рассмотрено в рамках теории больших чисел и длительной дистанции. Успешная игра в покер заключается в том, чтобы всегда принимать ходы только с положительным математическим ожиданием.

Математический смысл математического ожидания при игре в покер заключается в том, что мы часто сталкиваемся со случайными величинами при принятии решения (мы не знаем, какие именно карты на руках у оппонента, какие карты придут на последующих кругах торговли). Мы должны рассматривать каждое из решений с точки зрения теории больших чисел, которая гласит, что при достаточно большой выборке среднее значение случайной величины будет стремиться к её математическому ожиданию.


Среди частных формул для вычисления математического ожидания, в покере наиболее применима следующая:

При игре в покер математическое ожидание можно рассчитывать как для ставок, так и для коллов. В первом случае во внимание следует принимать фолд-эквити, во втором - собственные шансы банка. При оценке математического ожидания того или иного хода следует помнить, что фолд всегда имеет нулевое матожидание. Таким образом, сброс карт будет всегда более выгодным решением, чем любой отрицательный ход.

Ожидание говорит вам о том, что вы можете ожидать (прибыль или убыток) на каждый рискуемый вами доллар. Казино зарабатывают деньги, поскольку математическое ожидание от всех игры, которые практикуются в них, в пользу казино. При достаточно длинной серии игры можно ожидать, что клиент потеряет свои деньги, поскольку «вероятность» в пользу казино. Однако профессиональные игроки в казино ограничивают свои игры короткими промежутками времени, тем самым увеличивая вероятность в свою пользу. То же самое касается и инвестирования. Если ваше ожидание является положительным, вы можете заработать больше денег, совершая много сделок в короткий период времени. Ожидание это ваш процент прибыли на выигрыш, умноженный на среднюю прибыль, минус ваша вероятность убытка, умноженная на средний убыток.


Покер также можно рассмотреть с точки зрения математического ожидания. Вы можете предположить, что определенный ход выгоден, но в некоторых случаях он может оказаться далеко не лучшим, потому что выгоднее другой ход. Допустим, вы собрали фулл-хаус в пятикарточном покере с обменом. Ваш соперник делает ставку. Вы знаете, что если повысите ставку, он ответит. Поэтому повышение выглядит лучшей тактикой. Но если вы все же поднимите ставку, оставшиеся двое игроков, точно сбросят карты. Но если вы уравняете ставку, то будете полностью уверены, что двое других игроков после вас поступят также. При повышении ставки вы получаете одну единицу, а просто уравнивая – две. Таким образом, уравнивание дает вам более высокое положительное математическое ожидание, и будет являться наилучшей тактикой.

Математическое ожидание также может дать понятие о том, какая в покере тактика менее выгодна, а какая – более. К примеру, играя на определенной руке, вы полагаете, что ваши потери в среднем составят 75 центов, включая анте, то такую руку следует играть, т.к. это лучше, чем сброситься, когда анте равно $1.


Другой важной причиной для понимания сути математического ожидания является то, что оно дает вам чувство спокойствия независимо от того, выиграли вы ставку или нет: если вы сделали хорошую ставку или вовремя спасовали, вы будете знать, что вы заработали или сберегли определенное количество денег, которое игрок слабее не смог уберечь. Гораздо сложнее сбросить карты, если вы расстроены тем, что соперник на обмене собрал более сильную комбинацию. При всем при этом, деньги, которые вы сберегли, не играя, вместо того, чтобы ставить, прибавляются к вашему выигрышу за ночь или за месяц.

Просто помните, что если поменять ваши руки, ваш соперник ответил бы вам, и как вы увидите в статье «фундаментальная теорема покера» это лишь одно из ваших преимуществ. Вы должны радоваться, когда это случится. Вам даже можно научиться получать удовольствие от проигранной раздачи, потому что вы знаете, что другие игроки на вашем месте проиграли бы гораздо больше.


Как говорилось в примере с игрой в монетку в начале, часовой коэффициент прибыли взаимосвязан с математическим ожиданием, и данное понятие особенно важно для профессиональных игроков. Когда вы собираетесь играть в покер, вы должны мысленно прикинуть, сколько вы сможете выиграть за час игры. В большинстве случаев вам необходимо будет основываться на вашей интуиции и опыте, но вы также можете пользоваться и некоторыми математическими выкладками. К примеру, вы играете в лоуболл с обменом, и наблюдаете, что три участника делают ставки по $10, а затем меняют две карты, что является очень плохой тактикой, вы можете посчитать для себя, что каждый раз, когда они ставят $10, они теряют около $2. Каждый из них делает это восемь раз в час, а значит, все трое теряют в час примерно $48. Вы один из оставшихся четырех игроков, которые приблизительно равны, соответственно эти четыре игрока (и вы среди них) должны разделить $48, и прибыль каждого составит $12 в час. Ваш часовой коэффициент в этом случае попросту равен вашей доли от суммы денег, проигранной тремя плохими игроками за час.

За большой промежуток времени суммарный выигрыш игрока составляет сумму его математических ожиданий в отдельных раздачах. Чем больше вы играете с положительным ожиданием, тем больше выигрываете, и наоборот, чем больше раздач с отрицательным ожиданием вы сыграете, тем больше вы проиграете. Вследствие этого, следует отдавать предпочтение игре, которая сможет максимально увеличить ваше положительное ожидание или сведет на нет отрицательное, чтобы вы смогли поднять до максимума ваш часовой выигрыш.


Положительное математическое ожидание в игровой стратегии

Если вы знаете, как считать карты, у вас может быть преимущество перед казино, если они не заметят этого и не выкинут вас вон. Казино обожают пьяных игроков и не переносят считающих карты. Преимущество позволит вам со временем выиграть большее число раз, чем проиграть. Хорошее управление капиталом при использовании расчетов математического ожидания может помочь извлечь больше прибыли из вашего преимущества и сократить потери. Без преимущества вам лучше отдать деньги на благотворительность. В игре на бирже преимущество дает система игры, создающая большую прибыль, чем потери, разница цен и комиссионные. Никакое управление капиталом не спасет плохую игровую систему.

Положительное ожидание определяется значением, превышающим ноль. Чем больше это число, тем сильнее статис¬тическое ожидание. Если значение меньше нуля, то математическое ожидание также будет отрицательным. Чем больше модуль отрица¬тельного значения, тем хуже ситуация. Если результат равен нулю, то ожидание является безубыточным. Вы можете выиграть только тогда, когда у вас положительное математическое ожидание, разумная система игры. Игра по интуиции приводит к катастрофе.


Математическое ожидание и биржевая торговля

Математическое ожидание – достаточно широко востребованный и популярный статистический показатель при осуществлении биржевых торгов на финансовых рынках. В первую очередь данный параметр используют для анализа успешности торговли. Не сложно догадаться, что чем больше данное значение, тем больше оснований считать изучаемую торговлю успешной. Конечно, анализ работы трейдера не может производиться только лишь с помощью данного параметра. Тем не менее, вычисляемое значение в совокупности с другими способами оценки качества работы, может существенно повысить точность анализа.


Математическое ожидание часто вычисляется в сервисах мониторингов торговых счетов, что позволяет быстро оценивать работу, совершаемую на депозите. В качестве исключений можно привести стратегии, в которых используется “пересиживание” убыточных сделок. Трейдеру может некоторое время сопутствовать удача, а потому, в его работе может не оказаться убытков вообще. В таком случае, ориентироваться только по матожиданию не получится, ведь не будут учтены риски, используемые в работе.

В торговле на рынке математическое ожидание чаще всего применяют при прогнозировании доходности какой-либо торговой стратегии или при прогнозировании доходов трейдера на основе статистических данных его предыдущих торгов.

В отношении управления капиталом очень важно понимать, что при совершении сделок с отрицательным ожиданием нет схемы управления деньгами, которая может однозначно принести высокую прибыль. Если вы продолжаете играть на бирже в этих условиях, то независимо от способа управления деньгами вы потеряете весь ваш счет, каким бы большим он ни был в начале.

Эта аксиома верна не только для игры или сделок с отрицательным ожиданием, она истинна также для игры с равными шансами. Поэтому единственный случай, когда у вас есть шанс получить выгоду в долгосрочной перспективе, - это заключение сделок с положительным математическим ожиданием.


Различие между отрицательным ожиданием и положительным ожиданием - это различие между жизнью и смертью. Не имеет значения, насколько положительное или насколько отрицательное ожидание; важно только то, положительное оно или отрицательное. Поэтому до рассмотрения вопросов управления капиталом вы должны найти игру с положительным ожиданием.

Если у вас такой игры нет, тогда никакое управление деньгами в мире не спасет вас. С другой стороны, если у вас есть положительное ожидание, то можно, посредством правильного управления деньгами, превратить его в функцию экспоненциального роста. Не имеет значения, насколько мало это положительное ожидание! Другими словами, не имеет значения, насколько прибыльна торговая система на основе одного контракта. Если у вас есть система, которая выигрывает 10 долларов на контракт в одной сделке (после вычета комиссионных и проскальзывания), можно использовать методы управления капиталом таким образом, чтобы сделать ее более прибыльной, чем систему, которая показывает среднюю прибыль 1000 долларов за сделку (после вычета комиссионных и проскальзывания).


Имеет значение не то, насколько прибыльна система была, а то, насколько определенно можно сказать, что система покажет, по крайней мере, минимальную прибыль в будущем. Поэтому наиболее важное приготовление, которое может сделать трейдер, - это убедиться в том, что система покажет положительное математическое ожидание в будущем.

Для того чтобы иметь положительное математическое ожидание в будущем, очень важно не ограничивать степени свободы вашей системы. Это достигается не только упразднением или уменьшением количества параметров, подлежащих оптимизации, но также и путем сокращения как можно большего количества правил системы. Каждый параметр, который вы добавляете, каждое правило, которое вы вносите, каждое мельчайшее изменение, которое вы делаете в системе, сокращает число степеней свободы. В идеале, вам нужно построить достаточно примитивную и простую систему, которая постоянно будет приносить небольшую прибыль почти на любом рынке. И снова важно, чтобы вы поняли, - не имеет значения, насколько прибыльна система, пока она прибыльна. Деньги, которые вы заработаете в торговле, будут заработаны посредством эффективного управления деньгами.

Торговая система - это просто средство, которое дает вам положительное математическое ожидание, чтобы можно было использовать управление деньгами. Системы, которые работают (показывают, по крайней мере, минимальную прибыль) только на одном или нескольких рынках или имеют различные правила или параметры для различных рынков, вероятнее всего, не будут работать в режиме реального времени достаточно долго. Проблема большинства технически ориентированных трейдеров состоит в том, что они тратят слишком много времени и усилий на оптимизацию различных правил и значений параметров торговой системы. Это дает совершенно противоположные результаты. Вместо того, чтобы тратить силы и компьютерное время на увеличение прибылей торговой системы, направьте энергию на увеличение уровня надежности получения минимальной прибыли.

Зная, что управление капиталом - это всего лишь числовая игра, которая требует использования положительных ожиданий, трейдер может прекратить поиски "священного Грааля" биржевой торговли. Вместо этого он может заняться проверкой своего торгового метода, выяснить, насколько этот метод логически обоснован, дает ли он поло¬жительные ожидания. Правильные методы управления капиталом, применяемые по отношению к любым, даже весьма посредственным методам ведения торговли, сами сделают всю остальную работу.


Любому трейдеру для успеха в своей работе необходимо решить три самые важные задачи: . Добиться, чтобы число удачных сделок превышало неизбежные ошибки и просчеты; Настроить свою систему торговли так, чтобы возможность заработка была как можно чаще; Достичь стабильности положительного результата своих операций.

И здесь нам, работающим трейдерам, неплохую помощь может оказать математическое ожидание. Данный термин в теории вероятности является одним из ключевых. С его помощью можно дать усредненную оценку некоторому случайному значению. Математическое ожидание случайной величины подобно центру тяжести, если представить себе все возможные вероятности точками с различной массой.


Применительно к торговой стратегии для оценки ее эффективности чаще всего используют математическое ожидание прибыли (либо убытка). Этот параметр определяют, как сумму произведений заданных уровней прибыли и потерь и вероятности их появления. К примеру, разработанная стратегия торговли предполагает, что 37% всех операций принесут прибыль, а оставшаяся часть – 63% - будет убыточной. При этом, средний доход от удачной сделки составит 7 долларов, а средний проигрыш будет равен 1,4 доллара. Рассчитаем математическое ожидание торговли по такой системе:

Что означает данное число? Оно говорит о том, что, следуя правилам данной системы, в среднем мы будет получать 1,708 доллара от каждой закрытой сделки. Поскольку полученная оценка эффективности больше нуля, то такую систему вполне можно использовать для реальной работы. Если же в результате расчета математическое ожидание получится отрицательным, то это уже говорит о среднем убытке и такая торговля приведет к разорению.

Размер прибыли на одну сделку может быть выражен также и относительной величиной в виде %. Например:

– процент дохода на 1 сделку - 5%;

– процент успешных торговых операций - 62%;

– процент убытка в расчете на 1 сделку - 3%;

– процент неудачных сделок - 38%;

То есть, средняя сделка принесет 1,96%.

Можно разработать систему, которая несмотря на преобладание убыточных сделок будет давать положительный результат, поскольку ее МО>0.

Впрочем, одного ожидания мало. Сложно заработать, если система дает очень мало торговых сигналов. В этом случае ее доходность будет сопоставима с банковским процентом. Пусть каждая операция дает в среднем всего лишь 0,5 доллара, но что если система предполагает 1000 операций в год? Это будет очень серьезная сумма за сравнительно малое время. Из этого логически вытекает, что еще одним отличительным признаком хорошей торговой системы можно считать короткий срок удержания позиций.


Источники и ссылки

dic.academic.ru – академический интернет-словарь

mathematics.ru – образовательный сайт по математике

nsu.ru – образовательный веб-сайт Новосибирского государственного университета

webmath.ru – образовательный портал для студентов, абитуриентов и школьников.

exponenta.ru образовательный математический сайт

ru.tradimo.com – бесплатная онлайн школа трейдинга

crypto.hut2.ru – многопрофильный информационный ресурс

poker-wiki.ru – свободная энциклопедия покера

sernam.ru – Научная библиотека избранных естественно-научных изданий

reshim.su – интернет сайт РЕШИМ задачи контрольные курсовые

unfx.ru – Forex на UNFX: обучение, торговые сигналы, доверительное управление

slovopedia.com – Большой Энциклопедический словарь Словопедия

pokermansion.3dn.ru – Ваш гид в мире покера

statanaliz.info – информационный блог «Статистический анализ данных»

форекс-трейдер.рф – портал Форекс-Трейдер

megafx.ru – актуальная аналитика Форекс

fx-by.com – всё для трейдера

Пусть имеется случайная величина X, и ее параметры математическое ожидание а и дисперсия неизвестны. Над величиной X произведеноn независимых опытов, давших результаты x 1, x 2, x n .

Не уменьшая общности рассуждений, будем считать эти значения случайной величины различными. Будем рассматривать значения x 1, x 2, x n как независимые, одинаково распределенные случайные величины X 1, X 2, X n .

Простейший метод статистического оценивания - метод подстановки и аналогии - состоит в том, что в качестве оценки той или иной числовой характеристики (среднего, дисперсии и др.) генеральной совокупности берут соответствующую характеристику распределения выборки - выборочную характеристику.

По методу подстановки в качестве оценки математического ожидания а надо взять математическое ожидание распределения выборки - выборочное среднее. Таким образом, получаем

Чтобы проверить несмещенность и состоятельность выборочного среднего как оценки а , рассмотрим эту статистику как функцию выбранного вектора (X 1, X 2, X n). Приняв во внимание, что каждая из величин X 1, X 2, X n имеет тот же закон распределения, что и величина X, заключаем, что и числовые характеристики этих величин и величины X одинаковые: M(X i ) = M(X) = a , D(X i ) = D(X) = , i = 1, 2, n, причем X i - независимые в совокупности случайные величины.

Следовательно,

Отсюда по определению получаем, что - несмещенная оценка а , и так как D()®0 при n®¥, то в силу теоремы предыдущего параграфа является состоятельной оценкой математического ожидания а генеральной совокупности.

Эффективность или неэффективность оценки зависит от вида закона распределения случайной величины X. Можно доказать, что если величина X распределена по нормальному закону, то оценка является эффективной. Для других законов распределения это может быть не так.

Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия

,

Так как , где - генеральная дисперсия. Действительно,

Оценка s -- 2 для генеральной дисперсии является также и состоятельной, но не является эффективной. Однако в случае нормального распределения она является «асимптотически эффективной», то есть при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице.

Итак, если дана выборка из распределения F(x ) случайной величины X с неизвестным математическим ожиданием а и дисперсией , то для вычисления значений этих параметров мы имеем право пользоваться следующими приближенными формулами:

a ,

.

Здесь x- i - - варианта выборки, n- i - - частота варианты x i , - - объем выборки.
Для вычисления исправленной выборочной дисперсии более удобна формула


.

Для упрощения расчета целесообразно перейти к условным вариантам (в качестве с выгодно брать первоначальную варианту, расположенную в середине интервального вариационного ряда). Тогда

, .

Интервальное оценивание

Выше мы рассмотрели вопрос об оценке неизвестного параметра а одним числом. Такие оценки мы назвали точечными. Они имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки.

Пусть во выборке для параметра q найдена точечная оценка q * . Обычно исследователи заранее задаются некоторой достаточно большой вероятностью g (например, 0,95; 0,99 или 0,999) такой, что событие с вероятностью g можно считать практически достоверным, и ставят вопрос об отыскании такого значения e > 0, для которого

.

Видоизменив это равенство, получим:

и будем в этом случае говорить, что интервал ]q * - e; q * + e[ покрывает оцениваемый параметр q с вероятностью g.

Интервал ]q * -e; q * +e [ называется доверительным интервалом .

Вероятность g называется надежностью (доверительной вероятностью) интервальной оценки.

Концы доверительного интервала, т.е. точки q * -e и q * +e называются доверительными границами .

Число e называется точностью оценки .

В качестве примера задачи об определении доверительных границ, рассмотрим вопрос об оценке математического ожидания случайной величины Х, имеющей нормальный закон распределения с параметрами а и s, т.е. Х = N(a , s). Математическое ожидание в этом случае равно а . По наблюдениям Х 1 , Х 2 , Х n вычислим среднее и оценку дисперсии s 2 .

Оказывается, что по данным выборки можно построить случайную величину

которая имеет распределение Стьюдента (или t-распределение) с n = n -1 степенями свободы.

Воспользуемся таблицей П.1.3 и найдем для заданных вероятности g и числа n число t g такое, при котором вероятность

P(|t(n)| < t g) = g,

.

Сделав очевидные преобразования получим,

Порядок применения F-критерия следующий:

1. Принимается предположение о нормальности распределения генеральных совокупностей. При заданном уровне значимости a формулируется нулевая гипотеза Н 0: s х 2 = s y 2 о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Н 1: s х 2 > s y 2 .

2. Получают две независимые выборки из совокупностей Х и Y объемом n x и n y соответственно.

3. Рассчитывают значения исправленных выборочных дисперсий s х 2 и s y 2 (методы расчета рассмотрены в §13.4). Большую из дисперсий (s х 2 или s y 2) обозначают s 1 2 , меньшую - s 2 2 .

4. Вычисляется значение F-критерия по формуле F набл = s 1 2 / s 2 2 .

5. По таблице критических точек распределения Фишера - Снедекора, по заданному уровню значимости a и числом степеней свободы n 1 = n 1 - 1, n 2 = n 2 - 1 (n 1 - число степеней свободы большей исправленной дисперсии), находится критическая точка F кр (a, n 1 , n 2).

Отметим, что в таблице П.1.7 приведены критические значения одностороннего F-критерия. Поэтому, если применяется двусторонний критерий (Н 1: s х 2 ¹ s y 2), то правостороннюю критическую точку F кр (a/2, n 1 , n 2) ищут по уровню значимости a/2 (вдвое меньше заданного) и числам степеней свободы n 1 и n 2 (n 1 - число степеней свободы большей дисперсии). Левостороннюю критическую точку можно и не отыскивать.

6. Делается вывод: если вычисленное значение F-критерия больше или равно критическому (F набл ³ F кр), то дисперсии различаются значимо на заданном уровне значимости. В противном случае (F набл < F кр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.

Задача 15.1 . Расход сырья на единицу продукции по старой технологии составил:

По новой технологии:

Предположив, что соответствующие генеральные совокупности X и Y имеют нормальные распределения, проверить, что по вариативности расход сырья по новой и старой технологиям не отличаются, если принять уровень значимости a = 0,1.

Решение . Действуем в порядке, указанном выше.

1. Будем судить о вариативности расхода сырья по новой и старой технологиям по величинам дисперсий. Таким образом, нулевая гипотеза имеет вид Н 0: s х 2 = s y 2 . В качестве конкурирующей примем гипотезу Н 1: s х 2 ¹ s y 2 , поскольку заранее не уверены в том, что какая-либо из генеральных дисперсий больше другой.

2-3. Найдем выборочные дисперсии. Для упрощения вычислений перейдем к условным вариантам:

u i = x i - 307, v i = y i - 304.

Все вычисления оформим в виде следующих таблиц:

u i m i m i u i m i u i 2 m i (u i +1) 2 v i n i n i v i n i v i 2 n i (v i +1) 2
-3 -3 -1 -2
å -
å -

Контроль: å m i u i 2 + 2å m i u i + m i = Контроль: å n i v i 2 + 2å n i v i + n i = 13 + 2 + 9 = 24 = 34 + 20 + 13 = 67

Найдем исправленные выборочные дисперсии:

4. Сравним дисперсии. Найдем отношение большей исправленной дисперсии к меньшей:

.

5. По условию конкурирующая гипотеза имеет вид s х 2 ¹ s y 2 , поэтому критическая область двусторонняя и при отыскании критической точки следует брать уровни значимости, вдвое меньше заданного.

По таблице П.1.7 по уровню значимости a/2 = 0,1/2 = 0,05 и числам степеней свободы n 1 = n 1 - 1 = 12, n 2 = n 2 - 1 = 8 находим критическую точку F кр (0,05; 12; 8) = 3,28.

6. Так как F набл. < F кр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.

Выше при проверке гипотез предполагалось нормальность распределения исследуемых случайных величин. Однако специальные исследования показали, что предложенные алгоритмы весьма устойчивы (особенно при больших объемах выборок) по отношению к отклонению от нормального распределения.

Пусть над случайной величиной с неизвестными математическим ожиданием и дисперсией произведено независимых опытов, давших результаты – . Вычислим состоятельные и несмещенные оценки для параметров и .

В качестве оценки для математического ожидания возьмем среднее арифметическое опытных значений

. (2.9.1)

Согласно закону больших чисел эта оценка является состоятельной , при величина по вероятности. Эта же оценка является и несмещенной , поскольку

. (2.9.2)

Дисперсия этой оценки равна

. (2.9.3)

Можно показать, что для нормального закона распределения эта оценка является эффективной . Для других законов это может быть и не так.

Оценим теперь дисперсию. Выберем сначала для оценки формулу для статистической дисперсии

. (2.9.4)

Проверим состоятельность оценки дисперсии. Раскроем скобки в формуле (2.9.4)

.

При первое слагаемое сходится по вероятности к величине , в второе – к . Таким образом наша оценка сходится по вероятности к дисперсии

,

следовательно, она является состоятельной .

Проверим несмещенность оценки для величины . Для этого подставим в формулу (2.9.4) выражение (2.9.1) и учтем, что случайные величины независимы

,

. (2.9.5)

Прейдем в формуле (2.9.5) к флуктуациям случайных величин

Раскрывая скобки, получим

,

. (2.9.6)

Вычислим математическое ожидание величины (2.9.6), учитывая, что

. (2.9.7)

Соотношение (2.9.7) показывает, что величина , вычисленная по формуле (2.9.4) не является несмещенной оценкой для дисперсии . Ее математическое ожидание не равно, а несколько меньше . Такая оценка приводит к систематической ошибке в сторону уменьшения. Для ликвидации такого смещения нужно ввести поправку, умножив не величину . Тогда такая исправленная статистическая дисперсия может служить несмещенной оценкой для дисперсии

. (2.9.8)

Эта оценка является состоятельной также как и оценка , поскольку при величина .

На практике, вместо оценки (2.9.8) иногда удобнее применять эквивалентную оценку, связанную со вторым начальным статистическим моментом

. (2.9.9)

Оценки (2.9.8), (2.9.9) не являются эффективными. Можно показать, что в случае нормального закона распределения они будут асимптотически эффективными (при будут стремиться к минимально возможному значению).

Таким образом, можно сформулировать следующие правила обработки ограниченного по объему статистического материала. Если в независимых опытах случайная величина принимает значения с неизвестными математическим ожиданием и дисперсией , то для определения этих параметров следует пользоваться приближенными оценками

(2.9.10)

Конец работы -

Эта тема принадлежит разделу:

Конспект лекций по математике теория вероятностей математическая статистика

Кафедра высшей математики и информатики.. конспект лекций.. по математике..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Теория вероятностей
Теория вероятностей – раздел математики, в котором изучаются закономерности случайных массовых явлений. Случайным называется явление, которо

Статистическое определение вероятности
Событием называется случайное явление, которое в результате опыта может появится или не появится (двузначное явление). Обозначают события большими латинскими буквами

Пространство элементарных событий
Пусть с некоторым опытом связано множество событий, причем: 1) в результате опыта появляется одно и только одно

Действия на событиями
Суммой двух событий и

Перестановки
Число различных перестановок из элементов обозначается

Размещения
Размещением из элементов по

Сочетания
Сочетанием из элементов по

Формула сложения вероятностей для несовместных событий
Теорема. Вероятность суммы двух несовместных событий равна сумме вероятностей этих событий. (1

Формула сложения вероятностей для произвольных событий
Теорема. Вероятность суммы двух событий равна сумме вероятностей этих событий без вероятности их произведения.

Формула умножения вероятностей
Пусть даны два события и. Рассмотрим событие

Формула полной вероятности
Пусть – полная группа несовместных событий, их называют гипотезами. Рассмотрим некоторое событие

Формула вероятностей гипотез (Байеса)
Рассмотрим снова – полную группу несовместных гипотез и событие

Асимптотическая формула Пуассона
В тех случаях, когда число испытаний велико, а вероятность появления события

Случайные дискретные величины
Случайной называется величина, которая при повторении опыта может принимать неодинаковые числовые значения. Случайная величина называется дискретной,

Случайные непрерывные величины
Если в результате опыта случайная величина может принимать любое значение из некоторого отрезка или всей действительной оси, то она называется непрерывной. Законо

Функция плотности вероятности случайной непрерывной величины
Пусть. Рассмотрим точку и дадим ей приращени

Числовые характеристики случайных величин
Случайная дискретная или непрерывная величины считаются полностью заданными, если известны их законы распределения. В самом деле, зная законы распределения можно всегда вычислить вероятность попада

Квантили случайных величин
Квантилем порядка случайной непрерывной величины

Математическое ожидание случайных величин
Математическое ожидание случайной величины характеризует ее среднее значение. Все значения случайной величины группируются вокруг этого значения. Рассмотрим сначала случайную дискретную величину

Среднеквадратичное отклонение и дисперсия случайных величин
Рассмотрим сначала случайную дискретную величину. Числовые характеристики мода, медиана, квантили и математическое ожида

Моменты случайных величин
Кроме математического ожидания и дисперсии в теории вероятностей используются числовые характеристики более высоких порядков, которые называются моментами случайных величин.

Теоремы о числовых характеристиках случайных величин
Теорема 1. Математическое ожидание неслучайной величины равно самой этой величине. Доказательство:Пусть

Биномиальный закон распределения

Закон распределения Пуассона
Пусть случайная дискретная величина, принимающая значения

Равномерный закон распределения
Равномерным законом распределения случайной непрерывной величины называется закон функция плотности вероятности, которого

Нормальный закон распределения
Нормальным законом распределения случайной непрерывной величины называется закон функция плотност

Экспоненциальный закон распределения
Экспоненциальное или показательное распределение случайной величины применяется в таких приложениях теории вероятностей, как теория массового обслуживания, теория надежности

Системы случайных величин
На практике в приложениях теории вероятностей часто приходиться сталкиваться с задачами, в которых результаты эксперимента описываются не одной случайной величиной, а сразу несколькими случайными в

Система двух случайных дискретных величин
Пусть две случайные дискретные величины образуют систему. Случайная величина

Система двух случайных непрерывных величин
Пусть теперь систему образуют две случайные непрерывные величины. Законом распределения этой системы называется вероятно

Условные законы распределения
Пусть и зависимые случайные непрерывные велич

Числовые характеристики системы двух случайных величин
Начальным моментом порядка системы случайных величин

Система нескольких случайных величин
Полученные результаты для системы их двух случайных величии могут быть обобщены на случай систем, состоящих из произвольного числа случайных величин. Пусть система образована совокупностью

Нормальный закон распределения системы двух случайных величин
Рассмотрим систему двух случайных непрерывных величин. Законом распределения этой системы является нормальный закон расп

Предельные теоремы теории вероятностей
Основной целью дисциплины теория вероятностей является изучение закономерностей случайных массовых явлений. Практика показывает, что наблюдение массы однородных случайных явлений обнаружив

Неравенство Чебышева
Рассмотрим случайную величину с математическим ожиданием

Теорема Чебышева
Если случайные величины попарно независимы и имеют конечные ограниченные в совокупности дисперсии

Теорема Бернулли
При неограниченном увеличении числа опытов частота появления события сходится по вероятности к вероятности события

Центральная предельная теорема
При сложении случайных величин с любыми законами распределения, но с ограниченными в совокупности дисперсиями, закон расп

Основные задачи математической статистики
Рассмотренные выше законы теории вероятностей представляют собой математическое выражение реальных закономерностей, фактически существующих в различных случайных массовых явлениях. Изучая

Простая статистическая совокупность. Статистическая функция распределения
Рассмотрим некоторую случайную величину, закон распределения которой неизвестен. Требуется на основании опытных данных о

Статистический ряд. Гистограмма
При большом числе наблюдений (порядка сотен) генеральная совокупность становится неудобной и громоздкой для записи статистического материала. Для наглядности и компактности статистический материал

Числовые характеристики статистического распределения
В теории вероятностей рассматривались различные числовые характеристики случайных величин: математическое ожидание, дисперсию, начальные и центральные моменты различных порядков. Аналогичные числов

Выбор теоретического распределения по методу моментов
Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с ограниченностью числа наблюдений. При большом числе наблюдений эти элементы случайности сглаживаются,

Проверка правдоподобия гипотезы о виде закона распределения
Пусть заданное статистическое распределение аппроксимировано некоторой теоретической кривой или

Критерии согласия
Рассмотрим один из наиболее часто применяемых критериев согласия – так называемый критерий Пирсона. Предположи

Точечные оценки для неизвестных параметров распределения
В п.п. 2.1. – 2.7 мы подробно рассмотрели способы решения первой и второй основных задач математической статистики. Это задачи определения законов распределения случайных величин по опытным данным

Доверительный интервал. Доверительная вероятность
На практике при малом числе опытов над случайной величиной приближенная замена неизвестного параметра

Основные свойства точечных оценок

Для того чтобы оценка имела практическую ценность, она должна обладать следующими свойствами.

1. Оценка параметра называется несмещенной, если ее математическое ожидание равно оцениваемому параметру, т.е.

Если равенство (22.1) не выполняется, то оценка может либо завышать значение (М>), либо занижать его (М <) . Естественно в качестве приближенного неизвестного параметра брать несмещенные оценки для того, чтобы не делать систематической ошибки в сторону завышения или занижения.

2. Оценка параметра называется состоятельной, если она подчиняется закону больших чисел, т.е. сходится по вероятности к оцениваемому параметру при неограниченном возрастании числа опытов (наблюдений) и, следовательно, выполняется следующее равенство:

где > 0 сколько угодно малое число.

Для выполнения (22.2) достаточно, чтобы дисперсия оценки стремилась к нулю при, т.е.

и кроме того, чтобы оценка была несмещенной. От формулы (22.3) легко перейти к (22.2) , если воспользоваться неравенством Чебышева.

Итак, состоятельность оценки означает, что при достаточно большом количестве опытов и со сколько угодно большой достоверностью отклонение оценки от истинного значения параметра меньше любой наперед заданной величины. Этим оправдано увеличение объема выборки.

Так как - случайная величина, значение которой изменяется от выборки к выборке, то меру ее рассеивания около математического ожидания будем характеризовать дисперсией D. Пусть и - две несмещенные оценки параметра, т.е. M = и M = , соответственно D и D и, если D < D , то в качестве оценки принимают.

3. Несмещенная оценка, которая имеет наименьшую дисперсию среди всех возможных несмещенных оценок параметра, вычисленных по выборкам одного и того же объема, называется эффективной оценкой.

На практике при оценке параметров не всегда удается удовлетворить одновременно требованиям 1, 2, 3. Однако выбору оценки всегда должно предшествовать ее критическое рассмотрение со всех точек зрения. При выборке практических методов обработки опытных данных необходимо руководствоваться сформулированными свойствами оценок.

Оценка математического ожидания и дисперсии по выборке

Наиболее важными характеристиками случайной величины являются математическое ожидание и дисперсия. Рассмотрим вопрос о том, какие выборочные характеристики лучше всего оценивают математическое ожидание и дисперсию в смысле несмещенности, эффективности и состоятельности.

Теорема 23.1. Арифметическая средняя, вычисленная по n независимым наблюдениям над случайной величиной, которая имеет математическое ожидание M = , является несмещенной оценкой этого параметра.

Доказательство.

Пусть - n независимых наблюдений над случайной величиной. По условию M = , а т.к. являются случайными величинами и имеют тот же закон распределения, то тогда. По определению средняя арифметическая

Рассмотрим математическое ожидание средней арифметической. Используя свойство математического ожидания, имеем:

т.е. . В силу (22.1) является несмещенной оценкой. ?

Теорема 23.2 . Арифметическая средняя, вычисленная по n независимым наблюдениям над случайной величиной, которая имеет M = и, является состоятельной оценкой этого параметра.

Доказательство.

Пусть - n независимых наблюдений над случайной величиной. Тогда в силу теоремы 23.1 имеем M = .

Для средней арифметической запишем неравенство Чебышева:

Используя свойства дисперсии 4,5 и (23.1), имеем:

т.к. по условию теоремы.

Следовательно,

Итак, дисперсия средней арифметической в n раз меньше дисперсии случайной величины. Тогда

а это значит, что является состоятельной оценкой.

Замечание : 1 . Примем без доказательства весьма важный для практики результат. Если N (a,), то несмещенная оценка математического ожидания a имеет минимальную дисперсию, равную, поэтому является эффективной оценкой параметра а. ?

Перейдем к оценке для дисперсии и проверим ее на состоятельность и несмещенность.

Теорема 23.3 . Если случайная выборка состоит из n независимых наблюдений над случайной величиной с

M = и D = , то выборочная дисперсия

не является несмещенной оценкой D - генеральной дисперсии.

Доказательство.

Пусть - n независимых наблюдений над случайной величиной. По условию и для всех. Преобразуем формулу (23.3) выборочной дисперсии:


Упростим выражение

Принимая во внимание (23.1), откуда