Теория вероятностей и математическая статистика. Центральная предельная теорема

Центральная предельная теорема (ЦПТ) — один из тех фундаментальных результатов, которые на первый взгляд кажутся абстрактной математикой, но на практике объясняют сотни повседневных явлений: почему средняя температура в течение месяца ведёт себя предсказуемо, почему погрешности измерений складываются в «колокол», почему мы умеем строить доверительные интервалы и проводить тесты гипотез. Для студента физико-математического факультета ЦПТ — это не просто формула, это инструмент мышления: научиться «видеть нормальное распределение» там, где его не ожидают, и понимать, когда приближение нормой уместно, а когда — нет.

Представьте себе большой мешок с разноцветными камушками. Каждый камушек — это результат одного случайного эксперимента: рост случайного студента в группе, число успехов при бросании монетки, ошибка одной электронной схемы. Если вы вытаскиваете по одному камушку и измеряете что-то (например, вес), отдельные измерения могут сильно колебаться. Но если вы берёте по 30–100 камушков и считаете средний вес каждой группы, то распределение этих средних начинает напоминать знакомую «колоколообразную» форму — это и есть проявление ЦПТ: при широких условиях сумма или среднее большого числа независимых случайных величин стремится к нормальному закону, независимо от исходного распределения каждой отдельной величины.

Формулировка в простой форме: пусть X1, X2, …, Xn — независимые и одинаково распределённые случайные величины с конечным математическим ожиданием μ и дисперсией σ^2. Тогда при большом n распределение стандартизированной суммы S_n = (Σ Xi − nμ)/(σ√n) стремится к нормальному N(0,1). Иными словами, сумма ≈ nμ + σ√n·Z, где Z ~ N(0,1) при большом n. Эта формула — рабочая лошадка: она позволяет переходить от «конкретной» случайной величины к «универсальному» нормальному приближению.

Чтобы почувствовать смысл, рассмотрим несколько конкретных демонстраций и приложений, которые каждый студент может легко проверить руками или на простом коде.

1) Монеты и биномиальное приближение. Пусть бросаем честную монету n = 100 раз и считаем число орлов X. Теоретически X ~ Bin(n, 0.5), с ожиданием np = 50 и дисперсией np(1−p) = 25, то есть σ = 5. Согласно ЦПТ, стандартизированная величина Z = (X − 50)/5 приближается к N(0,1). Это значит, что вероятность получить от 40 до 60 орлов примерно равна Φ((60−50)/5) − Φ((40−50)/5) = Φ(2) − Φ(−2) ≈ 0.9545, где Φ — функция распределения стандартного нормального. Даже если вы никогда не считали биномиальные таблицы, вы можете быстро оценить такие вероятности по нормальному приближению. Для более точной оценки при дискретной природе X стоит добавить поправку на непрерывность (continuity correction): использовать границы 39.5 и 60.5 вместо 40 и 60.

2) Сумма погрешностей измерений. В лаборатории вы выполняете множество мелких измерений, каждое из которых имеет случайную погрешность. Пусть погрешности независимы и имеют небольшие, возможно несимметричные распределения. Их сумма (или среднее) при большом числе измерений становится почти нормально распределённой. Это объясняет, почему графики шумов часто напоминают гауссов колокол, даже если отдельная причина шума не нормальна. Практическая подсказка: если в приборе накапливается много мелких независимых источников ошибок, можно аппроксимировать итоговую погрешность нормальным распределением и строить доверительные интервалы.

3) Пример со студентской оценкой. Представьте, что в группе каждый студент получает баллы по разным заданиям, у каждого задания своя случайная составляющая результата. Средний результат по контрольной из 30 заданий будет близок к нормальному, даже если распределение