Оглавлениеfizlesh.ru/lectures/iext-by-an.pdf · 2019-11-02 · Сравнение...

Введение в технику эксперимента

http://fizlesh.ru А.Никольский

ОглавлениеИзмерения.......................................................................................................................2Понятие меры, сравнение с образцом. Способы измерений.....................................2Шкала измерений. ..........................................................................................................3Цена деления шкалы. Линейные и нелинейные шкалы.............................................4Ошибки измерения.........................................................................................................4Точность измерения.......................................................................................................5Статистика.......................................................................................................................8Вероятность.....................................................................................................................9Распределение..............................................................................................................10Совокупность и выборка..............................................................................................12Сравнение выборок......................................................................................................14Аппроксимация..............................................................................................................15Корелляция....................................................................................................................16Нелинейные зависимости............................................................................................18

Измерения

Понятие меры, сравнение с образцом. Способы измерений.Хотим мы этого или нет, мы все время что-то измеряем. Длину, рост, время, расстояние, скорость, глубину, ширину и так далее. Измерять что-то мы учимся в детстве, почти бессознательно, но приходит время, когда нужно разобраться в самом процессе измерения, чтобы делать это не интуитивно, а на какой-то научной основе. Иначе можно намерять чего-то не того, а потом пытаться выдать это за научные результаты. Прежде всего, нужно разобраться, что такое измерение. Еще древние греки понимали измерение как сопоставление измеряемой величины с образцом. Все было просто, пока они измеряли длину и интересовались вопросом: сколько раз один отрезок укладывается в другом ? Но потом появились и другие объекты измерения, для которых такой простой метод, как “приложить и посмотреть” уже не годился. Например, древнегреческие ученые Пифагор и Аристоксен решали задачу измерения звуков музыки. И успешно ее решили, сведя к уже известной. Они придумали измерять длину струны.Таким образом, еще с давних времен человечество пользуется разными способами измерения.Измерения физических величин делятся на прямые и косвенные, абсолютные и относительные. Еще одним видом измерений являются совместные измерения нескольких величин.Наиболее широко используются прямые измерения, состоящие в том, что искомое значение измеряемой величины находят непосредственно с помощью средств измерения. Например, линейный размер можно определить непосредственно по шкале линейки, силу измерить динамометром, температуру - термометром и т.д. Косвенные измерения используют, когда измеряемую величину невозможно или очень сложно измерить непосредственно, или когда прямое измерение дает менее точный

1

http://fizlesh.ru/

результат. Тогда измеряют какую-то другую величину (или несколько величин), связанную с искомой, и вычисляют результат. Например, измерение объема комнаты путем перемножения трех линейных величин (длины, высоты и ширины), определенных с использованием прямого вида измерений.Совместные измерения это одновременные измерения двух или нескольких величин для того, чтобы найти зависимость между ними, например измерения объема газа, производимые одновременно с измерениями температуры, с целью найти зависимость объема от температуры. Другая классификация измерений связана с процессом самого измерения. В соответствии с ней различают абсолютные и относительные измерения. Абсолютные измерения основаны на прямых измерениях величин. В процессе абсолютного измерения получается непосредственно измеряемая величина, выраженная в единицах измерения. Абсолютные измерения сопровождаются оценкой всей измеряемой величины.Относительные измерения основаны на измерении отношения измеряемой величины к другой одноименной величине, принимаемой за исходную. Например, измерение относительной влажности воздуха.По характеру изменения измеряемой величины в процессе измерений бывают статистические, динамические и статические измерения.Статистические измерения связаны с накоплением данных о каком-то процессе и использованием статистических методов для изучения этого процесса. Например, изучение параметров популяции в биологии, статистика населения, итп.Статические измерения имеют место тогда, когда измеряемая величина не меняется в ходе эксперимента.Динамические измерения связаны с такими величинами, которые в процессе измерений претерпевают те или иные изменения.

Шкала измерений. Шкала измерений - это последовательность значений физической величины, которая служит основой для ее измерения. Например, в шкале Цельсия за начало отсчета принята температура таяния льда, а в качестве основного интервала (опорной точки) - температура кипения воды. Одна сотая часть этого интервала является единицей температуры (градус Цельсия). В температурной шкале Фаренгейта за начало отсчета принята температура таяния смеси льда и соли, а в качестве опорной точки взята нормальная температура тела здорового человека. За единицу температуры (градус Фаренгейта) принята одна девяносто шестая часть основного интервала. По этой шкале температура таяния льда равна + 32°F, а температура кипения воды + 212°F. Таким образом, если по шкале Цельсия разность между температурой кипения воды и таяния льда составляет

100°С, то по Фаренгейту она равна 180°F. Существует формула для пересчета градусов Фаренгейта в градусы Цельсия.

Кроме обычной шкалы известны еще несколько разновидностей шкал: шкала наименований, шкала порядка, шкала интервалов, шкала отношений и др.

2

Шкала интервалов не имеет физически обусловленного нулевого значения, а объектом измерения являются интервалы. Примером такой шкалы может служить шкала времени. Какой момент времени считать нулем, мы не знаем, и даже не знаем точно, есть ли такой момент вообще. Поэтому время мы измеряем интервалами, полагая каждый раз какой-то момент времени за 0, например, момент начала эксперимента.Шкала отношений, наоборот, имеет естественное нулевое значение. Например, шкала измерений веса, начинаясь от нуля, может быть градуирована по-разному в зависимости от требуемой точности взвешивания. Что считать нулевым весом, более или менее понятно.Шкала наименований - это качественная, а не количественная шкала, она не содержит нуля и единиц измерений. Примером может служить измерение цвета. Цвета, используемые, например, в строительстве, дизайне имеют названия, такие как «бирюзовый», «пурпурный», и так далее. Процесс измерения заключается в визуальном сравнении цвета какого-то предмета с образцами цветов из атласа. Такое сравнение под силу только опытному эксперту, который специально учился сопоставлять цвета.Шкала порядка характеризует значение измеряемой величины в условных единицах - баллах (шкала землетрясений, силы ветра, твердости физических тел и т.п.). Шкала порядка не обязательно субъективна, но ее единицы не имеют непосредственного физического выражения в виде формул (поэтому она и нужна). Шкала порядка используется тогда, когда измеряемая величина имеет, в отличие от шкалы наименований, набор упорядоченных по величине ступеней, но границы каждой из них могут быть определены только субъективно или посредством сложно формализуемой процедуры. Так, при определении твердости минералов в геологии достаточно простым способом можно определить, что один из образцов тверже или мягче другого. Однако, никакой информации об измеряемой величине это не дает. Поэтому вводят шкалу порядка, принимая за ее ступени твердость различных, достаточно распространенных материалов - талька, мела, стекла, итп. до алмаза. Тогда, сравнивая твердость образца с твердостью одного из эталонов, можно определить, на какой ступеньке шкалы твердости он находится.

Цена деления шкалы. Линейные и нелинейные шкалы.Ценой деления шкалы называется разность значений величин, соответствующих двум соседним отметкам шкалы.Шкала называется линейной, если ее цена деления не зависит от того, в каком месте шкалы находится это деление. В противном случае шкала называется нелинейной. Линейными шкалами удобнее пользоваться, но не всегда удается сделать шкалу прибора линейной. Нелинейные шкалы обычно характеризуются какой-то функциональной зависимостью цены деления от положения его на шкале (например, логарифмической), но бывают шкалы, у которых это не так. Примером могут служить уже рассмотренные шкалы порядка.

Ошибки измеренияВиды ошибок измерения: грубые, случайные, систематические, личные. Грубые ошибки, или промахи – это ситуации, когда измеренная величина не имеет вообще ничего общего с измеряемой. Например, когда экспериментатор записал число 3,5 а прочел его как 8,5. Или когда в приборе что-то сломалось, нет контакта, и так далее. Грубые ошибки необходимо выявлять и исключать из рассмотрения. Случайные ошибки, напротив, являются обычным делом и обусловлены неточностями в проведении измерений. Часто бывает так, что случайная ошибка оказывается намного меньше, чем точность инструмента. Тогда ее можно не учитывать, и пользоваться половиной деления шкалы для оценки точности. Но часто случается так, что случайная

3

ошибка оказывается больше цены деления. Тогда при последовательных измерениях одной и той же величины мы получаем разные результаты. Для оценки точности измерения в таком случае используется статистическая обработка результатов.

Систематические ошибки возникают при неправильно отградуированных приборах или в результате неверных действий экспериментатора. Они заключаются в том, что все измеренные значения оказываются смещенными на некоторую величину относительно истинного. Это, например, может произойти если экспериментатор смотрит на стрелку прибора не сверху, а под углом.

Личные ошибки – это ошибки, связанные с индивидуальными особенностями данного экспериментатора. Например, в некоторых видах астрономических экспериментов результат может зависеть от скорости реакции экспериментатора (пример – наблюдение покрытий звезд Луной и планетами/спутниками/астероидами). Смысл выделения личных ошибок в отдельный класс состоит в том, что не всегда можно сравнивать результаты измерений, проведенных разными людьми.

Точность измерения.Ошибки измерения нужно как-то исследовать, чтобы понять, с какой точностью проведено измерение. Что нужно для того, чтобы можно было оценить какие-то параметры процесса измерения? Метод измерения и применяемая мера, или шкала, должны отвечать некоторым критериям. Во-первых, шкала не должна быть произвольной, как в случае шкалы порядка. Во-вторых, у шкалы должно быть достаточно большое число делений.Точность измерения показывает, насколько хорошо результаты измерения совпадают с истинным значением измеряемой величины.

a=A−a

Чем меньше эта разница, тем больше точность. В связи с этим возникает вопрос: а что такое истинная величина ? Мы хотим оценивать разницу между какой-то величиной и результатом измерения, но при этом истинную величину мы не знаем, ведь ее определение и является целью измерения. Поскольку мы не знаем точное значение измеряемой величины, мы не можем определить точность измерения, но мы можем ее оценить, то есть найти какое-то число, заведомо превосходящее ее по абсолютной величине, но не очень намного.

a∣ a∣

Тогда для точного значения величины будут верны следующие неравенства

4

a−aAaa

Оценка числа a связана с используемой шкалой. Понятно, что измерить длину с точностью до миллиметра линейкой с сантиметровыми делениями невозможно. Если рассматривать только неточности, зависящие от шкалы, то при прямых измерениях разброс отсчетов будет равен одному делению шкалы. Тогда a равно половине деления шкалы. При косвенных измерениях погрешность зависит еще и от выполняемых математических операций. Сложение. За погрешность суммы двух величин принимается сумма абсолютных погрешностей слагаемых. Это достаточно очевидно.Умножение. Пусть

u=aabbтогда, раскладывая сумму, получим

u=aba bbaa b

поскольку мы предполагаем, что ошибка много меньше самого значения, то последнее слагаемое можно отбросить. Итак, абсолютная погрешность произведения a и b равна ab=a bb a

Практический способ определения абсолютной погрешности для любой формулы состоит в том, чтобы вычислить значение формулы, сначала подставив в нее измеренные значения, а потом измеренные значения плюс или минус значения абсолютных ошибок этих значений, так, чтобы в результате получить максимальные возможные отклонения в обе стороны. Например:пусть измеренные значения составили a=2.2±0.1 и b=3.0±0.02, а формула для вычисления значения - a+ln(b-a). Тогда подставив в формулу последовательно пары значений (2.2, 3.0), (2.1,2.98),(2.1,3.02),(2.3,2.98),(2.1,3.02) получим значение искомой величины 1.98 и 4 значения для отклонений: 1.97 2.02 1.91 и 1.97. Из них наибольшее отклонение от искомой величины имеет результат 1.91. Таким образом, результат можно записать как 1.98±0.06Погрешность измерений, которую мы только что рассмотрели, называется абсолютной. Но иногда нас интересует не столько абсолютная величина погрешности, сколько ее величина по отношению к измеренной величине. Это связано с тем, что абсолютная погрешность не позволяет сравнивать результаты разнородных измерений. Например, в одном и том же эксперименте измеряют объем с точностью до миллилитра и вес с точностью до грамма. Как определить, какое из измерений является более точным ? Относительной погрешностью называется отношение абсолютной погрешности к модулю числа a.

a=a

∣a∣

Результаты измерений обычно представляют в виде десятичной дроби. Число значащих цифр в этой дроби должно соответствовать точности измерения. Если обычно нули на конце дробной части числа отбрасывают как незначащие, то в случае записи результатов измерений этого делать нельзя. Например, если измеренная с точностью до миллиметра длина равна 10 см, то записывать ее надо в сантиметрах как 10.0 а в метрах 0.100. Таким образом, точность измерения входит в запись результата. Те цифры, которые входят в запись измеренной величины, называются верными. Кроме того, если известна точность измерения, ее записывают в виде ± ε, например, 10.0±0.4. Нельзя писать 10.234526±0.4. Но как определить количество верных цифр в случае косвенных измерений ?

5

Действуют следующие правила :Для результата арифметических действий над количеством чисел от 1 до 10 (5 слагаемых, 2 сомножителя итп) результат будет иметь на 1 верную цифру меньше, чем наименее точное из чисел. Например, 2.41 + 3.660 + 1.0001 = 7.0Из этого правила следует, что косвенные измерения, включающие несколько значений, нужно производить с примерно одинаковой точностью. Увеличив точность только какого-то одного значения, повысить точность результата невозможно.

Методы повышения точности измерений зависят от того, какую именно ошибку мы пытаемся уменьшить.Для повышения точности шкалы используют устройство под названием нониус. Принцип работы шкалы основан на том факте, что глаз гораздо точнее замечает совпадение делений, чем определяет относительное расположение одного деления между другими.

Для уменьшения количества грубых ошибок используют специальные техники проведения эксперимента. Можно проводить измерения так, чтобы несложными расчетами выявлялось большинство грубых ошибок. Обычно такие методики измерений основаны на простых соотношениях из геометрии или физики, таких как “сумма углов треугольника равна 180 градусам”, “сумма длин двух сторон треугольника не может быть меньше длины третьей стороны” итп. Один из основных приемов устранения грубых ошибок состоит в том, чтобы всегда записывать в точности те результаты, которые были измерены. То есть не производить в уме никаких действий, не корректировать результаты. Например, в процессе измерений оторвалось начало от рулетки. Экспериментаторы решили продолжить измерения, но вместо нуля шкалы использовать деление 10см. Они должны тогда записать в журнал фразу “все последующие измерения ведутся от начала отсчета = 10 см” и записывать далее именно те значения, которые были прочитаны.Для устранения систематических ошибок существует метод, называемый “двойное измерение”. Он предполагает проведение двух измерений таким образом, чтобы систематическая ошибка входила в результат сначала со знаком плюс, а потом со знаком минус.Но измерения могут быть неточными как вследствие свойств прибора, так и из-за особенностей измеряемого объекта. Если измерять длину хвоста у живой ящерицы, то, скорее всего, результаты измерений будут существенно отличаться. А если измерять неподвижно лежащий кусок металла, то точность измерения будет ограничена только делениями на линейке. Случайные ошибки можно оценить статистической обработкой результатов эксперимента.

СтатистикаРассмотрим пример. Допустим, мы измерили одну и ту же длину 3 раза подряд и получили значения 5, 7, 9 см. Первый вывод, который можно сделать, посмотрев на эти числа, это что точность измерения тут явно хуже, чем половина цены деления. Как эту точность оценить?

6

Прежде всего, нужно иметь какую-то среднюю величину для всех этих измерений. Найдем такое значение, для которого сумма квадратов отклонений от всех полученных измерений будет минимальной.

x−52 x−72x−92=min

или3· x2−42 · x155=min

Почему берется именно сумма квадратов ? Понятно, что нас интересует именно величина отклонения от среднего, а не то, в большую она сторону или в меньшую. Но если взять просто абсолютное значение разности, то однозначного минимума не будет (проверьте!). Таким образом, сумма квадратов это самая простая функция, отвечающая двум требованиям: она всегда положительна и она имеет одну точку минимума. Решим уравнение. Заметим, что у параболы имеется одна точка минимума.

D=b2−4a c−p=422−4·3 ·155− p=0p=8

3 · x2−42· x155−8имеет один корень x=7

(Это решение, не использующее производных. Те, кто знает дифференциальное исчисление, могут решить эту задачу самостоятельно в общем виде)Таким образом, значение, имеющее минимальную сумму квадратов отклонений от измеренных это просто их среднее арифметическое. (Доказать строго для любого количества измерений после изучения мат.ан).Оценим разброс измерений. Для этого вычислим среднее отклонений.

2=7−527−727−92

3=8/3=2.66

Эта величина называется дисперсией. Она показывает, насколько близко или далеко лежат измеренные значения. Извлекая корень из дисперсии, получаем 1.63, то есть нечто, интуитивно похожее на то, что мы хотели бы считать отклонением от измеренной величины в данном случае. Эта величина называется среднеквадратичным отклонением.

= 1N ∑

i=1

N

x− xi2

где x - среднее арифметическое.Если случайная ошибка измерения значительно меньше цены деления, то можно ограничиться оценкой абсолютной ошибки змерения. Если же случайная ошибка превосходит цену деления прибора, то следует использовать статистическую обработку – вычислить среднее измерений и среднеквадратичное отклонение.

ВероятностьВероятность определяется как отношение числа интересующих нас случаев к общему числу равновозможных случаев. Например: кидаем монету. Вероятность 1/2.Основной закон вероятности гласит: чем большее число опытов мы проведем, тем ближе суммарный результат этих опытов будет к вероятности данного события. Например,

7

вероятность того, что подброшенная вверх монета упадет гербом вверх, равна 1/2. Если подбросить монету 1 раз, то количество выпавших гербов никак не будет составлять половину числа бросков. Если подбросить монету 2 раза, то возможен вариант, когда 1 раз она упадет вверх гербом, и 1 раз – решеткой. Если этот опыт провести 1000 раз, то число выпавших гербов будет очень близко к 500. Понятие вероятности используют, когда говорят об исходе одного опыта, поскольку вероятность не зависит от числа опытов. Если вероятность события равна P, то в серии из N опытов при достаточно больших N событие произойдет приблизительно в P*N случаях, причем тем точнее, чем больше N. Сумма вероятностей всех возможных исходов эксперимента равна 1. Считать вероятность проще всего именно деля количество нужных нам исходов эксперимента на общее количество возможных его исходов.Условной вероятностью называется вероятность события B при условии что произошло событие A. Вероятность совместного появления двух событий равна произведению вероятности одного из них на условную вероятность другого, вычисленную при условии, что первое событие уже наступило. Например, вероятность того, что при броске двух монет на обеих выпадут орлы равна 1/4. Это верно в случае независимых событий. Но могут быть ситуации, когда вероятность второго события зависит от исхода первого. Например, вероятность вытащить черный шарик из мешка, в котором находится 2 черных и 2 белых шарика, равна 1/2. Вероятность же вытащить второй черный шарик из этого же мешка уже равна 1/3.

P AB=P A⋅PA B

В случае, если события независимые, то есть исход второго не зависит от результата первого, перемножаются просто их отдельно взятые вероятности.Сложение вероятностей. Вероятность того, что произойдет какое-то одно из событий, равна сумме их вероятностей минус вероятность того, что они произойдут одновременно.

P AB=P AP B−P AB

8

Важной особенностью условных вероятностей является их контр-интуитивность. Для понимания этого решите следующую задачу. 1% населения некоторой страны болеет ВИЧ. Имеется тест, дающий правильный результат в 90% случаев. Некий житель этой страны прошел тест на ВИЧ и получил положительный результат. Какова вероятность того, что у него действительно есть ВИЧ ? Оцените эту вероятность, не делая никаких расчетов, а потом посчитайте.

Распределение.Попробуем провести мысленный эксперимент. Будем кидать монету несколько раз и смотреть, какие могут быть варианты выпадения 0, 1, 2, 3 и так далее орлов.Возможные вариантыДля 4 бросков

Результаты бросковИтог1 2 3 4

0 0 0 0 0

0 0 0 1 1

0 0 1 0 1

0 0 1 1 2

0 1 0 0 1

0 1 0 1 2

0 1 1 0 2

0 1 1 1 3

1 0 0 0 1

1 0 0 1 2

1 0 1 0 2

1 0 1 1 3

1 1 0 0 2

1 1 0 1 3

1 1 1 0 3

1 1 1 1 4

Число бросков

Число выпадений

0 1 2 3 41 1 1

2 1 2 1

3 1 3 3 1

4 1 4 6 4 1

Попробуем изобразить эту таблицу несколько иначе

9

Сумма

1 1 1 2

2 1 2 1 4

3 1 3 3 1 8

4 1 4 6 4 1 16

5 1 5 10 10 5 1 32

6 1 6 15 20 15 6 1 64

При одном броске P0=1/2, P1=1/2При двух бросках P0=1/4, P1=2/4, P2=1/4...При шести бросках P0=1/64, P1=6/64, P2=15/64, P3=20/64, P4=15/64, P5=6/64, P6=1/64

На графиках показаны вероятности различных исходов бросания монеты при двух, шести и десяти бросках. Чему равна сумма всех вероятностей?Допустим, нас интересует вопрос, какова вероятность, бросая монету 10 раз, получить 4 или 5 орлов. Вспомним правило сложения вероятностей и посмотрим на гистограммы. Эта вероятность будет равна сумме высот соответствующих столбиков.Если количество бросков увеличивать неограниченно, то распределение вероятностей будет стремиться к некоторой гладкой кривой. Чему равна площадь под этой кривой ? Заметим, что кривая получилась симметричная. Она называется кривой распределения Гаусса, или нормальным распределением.Если взять два каких-либо значения X0 и X1, то площадь под кривой распределения Гаусса от X0 до X1 будет равна вероятности того, что значение находится в диапазоне от X0 до X1.Замечание: какова вероятность, измеряя какую-то величину, получить ее точное значение ? При этом X0 = X1, площадь под кривой равна 0.В результате почти любого процесса, включающего большое количество случайных отклонений распределение вероятностей имеет вид именно кривой Гаусса. Приближение к ней мы и получили, суммируя результаты большого числа случайных процессов. Для непрерывного Гауссовского процесса можно вычислить среднее и дисперсию точно так же, как мы это делали для измерений. Только это будет среднее и дисперсия бесконечного количества значений. Из анализа кривой Гаусса можно вывести следующее важное ее свойство:В диапазоне M±σ находится 68% всех значений.В диапазоне M±2σ находится 95.4% всех значений.В диапазоне M±3σ находится 99.7% всех значений.

10

0

0,1

0,2

0,3

0,4

0,5

0,6

0

0,1

0,2

0,3

0

0,1

0,2

0,3

0,4

Остается невыясненным только один вопрос. Насколько корректно обобщать результаты, полученные с помощью кривой с бесконечным (или очень большим) числом возможных случайных исходов на несколько измерений, подчиняющихся тому же правилу?

Совокупность и выборкаОдним из основных понятий статистики является понятие совокупности. Генеральная совокупность это множество всех однородных объектов, относительно которых учёный намерен делать выводы при изучении конкретной проблемы. Состав генеральной совокупности зависит от целей исследования. Иногда генеральная совокупность это все множество объектов данного класса, существующих в природе, например все мыши-полевки или все население земного шара. Чаще задаётся несколько критериев, определяющих объект исследования. Например, все мыши-полевки данного поля или все березы выше 10 метров. Относительно генеральной совокупности делается какое-либо утверждение, подлежащее экспериментальной проверке. Например, “все березы выше 10 метров имеют средний возраст 20 лет”. Иногда такое утверждение не носит абсолютный характер, например “как минимум 90% берез этого леса высотой больше чем 10 метров имеют возраст более 20 лет”. Проверка такого утверждения заключается в исследовании всей генеральной совокупности. Проблема тут в том, что во-первых, генеральная совокупность может быть очень большой, а во вторых, проведение эксперимента на всей генеральной совокупности может сделать исследуемое утверждение бессмысленным. Например, для того, чтобы проверить утверждение “все березы этого леса высотой больше чем 10 метров имеют возраст более 20 лет” нужно спилить все березы в лесу высотой 10 метров и более, и посчитать их годовые кольца. После завершения эксперимента берез выше 10 метров в лесу не останется и полученный результат будет уже неверен. Для решения этих двух проблем используют так называемую выборку. Изучают не все множество объектов, а некоторую его часть. В этом случае можно говорить только о том, что исследуемое утверждение истинно с некоторой вероятностью. Ведь если в лесу есть 10% берез выше 10 метров но моложе 20 лет, то никак нельзя гарантировать, что мы случайно не спилим березы из тех самых 10%. Попробуем оценить эту вероятность. Исходить мы будем из двух основных предположений.1. Чем больше дисперсия генеральной совокупности, тем больше дисперсия выборки. Соответственно, тем больше потенциальная разница между средними.2. Чем больше объем выборки, тем меньше разница между средними выборки и совокупности.Как связаны выборка и совокупность ? Предположим, что из некоторой совокупности мы будем делать выборки. У каждой выборки будет свое среднее. Оказывается, эти средние тоже образют нормальное распределение. Среднее этого распределения равно среднему

11

выборки, а дисперсия равна σ2/n , где σ – стандартное отклонение совокупности, а n – размер выборки.. Понять это можно следующим образом. Допустим, у нас есть очень большая выборка, практически неотличимая от генеральной совокупности. Тогда ее среднее будет равно среднему совокупности в точности, то есть дисперсия будет близка к 0. Что мы и получаем при больших n. Отсюда стандартное отклонение равно /n . Таким образом, зная среднее и дисперсию выборки, можно будет сделать такое утверждение: с заданной вероятностью среднее совокупности находится в определенном диапазоне (связанном с величиной среднеквадратичного отклонения) относительно среднего совокупности.Среднеквадратичное отклонение выборки считают по несколько иной формуле:

s= 1N−1∑i=1

N

x−x i2

где x - среднее арифметическое.Таким образом:С вероятностью 0.95 средняя совокупности лежит в интервале средняя выборки ±1.96

s/nС вероятностью 0.99 средняя совокупности лежит в интервале средняя выборки ±2.58

s/nС вероятностью 0.997 средняя совокупности лежит в интервале средняя выборки ±3 s/nЭти диапазоны называются доверительными интервалами. Обычно используются доверительные интервалы, соответствующие вероятностям 95, 99, 99.7%Следует заметить, что эти интервалы и эти формулы можно использовать только при достаточно большой выборке. “Достаточно большая выборка” - понятие расплывчатое, но пределом применимости указанных доверительных интервалов можно считать выборку из 30 элементов. Для меньших выборок придется корректировать формулу для σ в сторону увеличения.Во всех предыдущих рассуждениях мы исходили из двух очень важных предположений. Во-первых, что генеральная совокупность подчиняется нормальному распределению. Во вторых, что выборка сделана случайным образом. Как только применяется любой критерий отбора элементов из генеральной совокупности, кроме случайного, все вышеизложенные формулы перестают работать. Более того, легко показать, пользуясь формулами для условной вероятности, что вводя какой-то критерий отбора (а мы не знаем, связан ли он с исследуемым параметром, и не можем это узнать, не имея случайной выборки), можно получить вообще какой угодно результат. Можно даже получить (совершенно случайно) правильный результат, но, не имея критериев оценки, мы никогда не узнаем, насколько он правильный.Выборки из генеральной совокупности бывают двух видов: случайные и недостоверные. Все так называемые “репрезентативные” выборки относятся к недостоверным.

12

Сравнение выборокТот же самый метод исследования вероятностей может помочь дать ответ на важный вопрос: “отличаются ли средние значения двух выборок?” Или, в другой формулировке, “принадлежат ли две данные выборки одной и той же генеральной совокупности?”. Допустим, есть две березовые рощи, и нам интересно сравнить среднюю высоту деревьев в одной и второй. Формулируем гипотезу о том, что между их средними значениями есть только разница, обусловленная случайными отклонениями данной выборки. Это так называемая нулевая гипотеза. Проверим такую гипотезу. Если это так, то среднее значение одной выборки с вероятностью 95% попадет в доверительный интервал совокупности. Таким образом, можно установить, с какой вероятностью данная гипотеза неверна. Если, например, среднее совокупности находится вне 95%-ного доверительного интервала, то можно сказать, что с вероятностью 95% данное среднее не принадлежит данному распределению. С истинностью гипотезы ситуация более сложная. Дело в том, что мы не знаем точное среднее всего распределения, а знаем только его оценку, полученную из анализа другой выборки. Если нулевая гипотеза не отвергается, то это еще не значит, что она верна. К счастью, в реальной жизни чаще всего встречаются задачи именно требующие доказательства различия двух средних. Эта задача решается следующим образом:

1. Формулируем нулевую гипотезу: разница между средними отсутствует.2. Вычисляем стандартную ошибку разности

se= sn

3. Вычисляем число z

z=x−se

4. Сравниваем полученное значение z с приведенной выше таблицей вероятностей. Если |z| > 1.96, то нулевая гипотеза может быть верна только в 5% случаев; если |z| > 2.58, то нулевая

13

Исследования аудитории телевидения проводятся уже много лет. На эти исследования тратят очень большие деньги, однако результаты оставляют желать лучшего. Методы исследований тоже не слишком хорошо известны. Как же это делается ?

В домах специально отобранных добровольцев устанавливают специальные приборы, которые следят, сколько человек смотрят в данный момент телевизор, и какую именно программу. Людей, являющихся объектом теста, тщательно отбирают, и совершенно не случайным образом. Предполагается, что они должны представлять все разнообразие социальных групп телезрителей. На самом деле эта выборка отражает только представления (не обязательно верные) устроителей эксперимента о социальных группах и их составе. Но мало того. Выяснилось, что примерно 90% отобранных для исследования добровольцев не выдерживают постоянного контроля над ними и отказываются от участия в программе.

Понятно, что в результате исследования телевизионной аудитории проходят на выборке, сделанной с влиянием сразу двух неслучайных факторов: изначального отбора участников и отказов участников.

гипотеза может быть верна только в 1% случаев; если |z| > 3, то вероятность случайного совпадения средних составляет всего 0.003.А что, если z лежит внутри доверительного интервала? Значит ли это, что нулевая гипотеза верна, и рассматриваемые выборки принадлежат одной и той же совокупности? Оказывается, что нет. Это могут быть такие выборки из таких совокупностей, что их значения случайно совпадают. Понять это можно на таком примере: допустим, есть два круга диаметра d, и нам известны координаты двух точек, каждая из которых принадлежит соответствующему кругу. Если расстояние между этими точками больше 2d, то можно точно сказать, что круги не имеют общих точек. А если меньше, то ничего определённого сказать нельзя.Обратите внимание: мы хотим доказать, что средние двух совокупностей различаются. Для этого мы формулируем нулевую гипотезу с обратным смыслом, что они равны, но нас интересует только тот случай, когда эта гипотеза неверна.

АппроксимацияПри обработке данных эксперимента часто получают не одно значение, а некоторый набор значений, выражающий зависимость одной величины от другой. Например, объем, занимаемый газом при разном давлении, или зависимость успеваемости от длительности занятий. В начале курса мы выяснили, что такие измерения называются совместными. Существует две основных задачи, решаемых в таких экспериментах. Первая возникает когда наличие связи между двумя величинами несомненно и вид этой связи известен. Из газовых законов и общих соображений ясно, что если газ сжимать, то его давление будет возрастать. Предполагается, что между измеренными величинами есть функциональная зависимость. В этом случае нас интересуют параметры этой зависимости. Другая задача может состоять в том, чтобы выяснить, есть ли вообще какая-то связь между величинами. Так, во втором примере это неочевидно и требует проверки.Начнем с первого случая. Предположим, что известно, что две величины связаны линейной зависимостью:

y=a xb

и мы измерили значения x и y в нескольких точках. Тогда задачу можно переформулировать следующим образом: имеется множество точек, которые должны были бы лежать на одной прямой, но вследствие разнообразных случайных отклонений лежат где-то рядом с этой прямой. Нужно провести прямую некоторым наилучшим образом. Конечно, идеально было бы найти ту самую прямую, на которой должны были бы лежать эти точки, но мы знаем, что это невозможно. В качестве критерия “наилучшести” прямой выберем тот, которым уже пользовались неоднократно. Проведем прямую так, чтобы сумма квадратов расстояний от всех экспериментальных точек до прямой была минимальной. В этом случае

a=∑i=1

n

x i−x ⋅ y i−y

∑i=1

n

x i−x2

b=y−x a

где y и x - средние по y и по x соответственно.

14

Обратите внимание: полученная прямая – вовсе не обязательно та, которой на самом принадлежат точки. Это всего лишь некоторое приближение к искомой прямой.Такое вычисление прямой, наилучшим образом приближающий измеренные

КорелляцияРассмотрим случай, когда точный вид связи между переменными неизвестен, более того, неизвестно, есть ли эта связь вообще. Проблему можно сформулировать следующим образом: действительно ли при увеличении одного параметра второй тоже увеличивается (уменьшается) или все отклонения в их поведении чисто случайны?Графически это можно представить себе следующим образом:Нужно некоторое число, которое бы отражало наличие связи между переменными. Как найти такое число ?

Представим себе, что у нас имеется неограниченное число точек. Разделим горизонтальную ось на равные промежутки – столбцы. Тогда внутри каждого столбца мы получим

15

распределение точек, такое же, как то, которое мы наблюдали, когда исследовали среднее нескольких измерений. Можно считать, что в каждом столбце содержатся результаты измерения y при некотором фиксированном x. Уменьшая ширину столбцов, мы получаем все более точные оценки для локальных средних.

В конце концов, если между переменными имеется линейная зависимость, то при безграничном увеличении числа измерений все средние должны лечь на какую-то прямую.

Разброс точек внутри каждого столбца обусловлен причинами, не зависящими от x. Смещение средней при переходе от одного столбца к другому обусловлено только изменением x. Величина и того и другого разброса можно оценить, используя уже известное нам среднеквадратичное отклонение. Придется только привести данные к одному масштабу. Пропуская дальнейшие, довольно сложные вычисления, приведем сразу формулу:

r=n∑ xi y i−∑ x i∑ y i

n∑ x i2−∑ x i

2n∑ yi2−∑ y i

2

Эта величина называется коэффициент корреляции, и имеет следующие свойства:

1. Значения r находятся в диапазоне от -1 до 1

2. Если связь между переменными отсутствует, то r=0.

3. Если между переменными есть связь, то чем сильнее эта связь, тем ближе r к 1 в случае если y увеличивается с увеличением x, и к -1 в случае если y уменьшается с увеличением x.

Коэффициент корелляции является оценочной величиной. Для любых его значений кроме 0, 1 и -1 о силе связи между переменными в общем случае ничего сказать нельзя. Для большинства применений считается, что корреляция, по абсолютной величине находящаяся в промежутке от 0.1 до 0.3 является “слабой”, от 0.3 до 0.5 “средней”, а от 0.5 до 1 “сильной”. В реальной жизни коэффициент корреляции 1 или -1 появляется только в одном

16

случае – когда измерения коррелируют сами с собой. В любых других ситуациях неизбежная ошибка измерений уменьшает коэффициент корреляции. В биологических применениях “сильную” корреляцию можно считать доказательством какой-либо гипотезы, а “среднюю” - серьезным поводом провести дополнительные исследования.

Что можно сказать, если связь между переменными слабая ? Как правило, ничего, потому что нулевой коэффициент корреляции получается как в случае отсутствия связи, так и в случае когда эта связь нелинейная и значения y расположены симметрично относительно середины исследуемого интервала.

Однако, для часто встречающихся случаев степенной, логарифмической и некоторых других видов зависимости коэффициент корреляции дает неплохие результаты.

Нелинейные зависимостиОстается выяснить, что же делать в тех случаях, когда связь между переменными нелинейная. Существует два основных способа работы с такими данными. Первый – преобразовать координаты так, чтобы зависимость стала линейной. Второй – разбить исследуемый интервал на участки так, чтобы на каждом из этих участков зависимость была приблизительно линейной. Например, преобразованием координат можно превратить гиперболу в прямую. Однако, есть и некоторые тонкости, связанные с нелинейностью зависимости. Одна из них состоит в том, что вблизи некоторых особых точек ошибка измерения может существенно возрастать из-за временной нестабильности системы.Важное замечание: абсолютно линейных систем в природе не существует. (почему?) Линейная зависимость присутствует только на каком-то участке, за пределами которого зависимость ведет себя как-то иначе. Очень часто встречается зависимость вида “ступенька”, когда на участках выше и ниже линейного связь между переменными отсутствует.

Как правило, нас интересует поведение зависимости на линейном участке.При проведении совместных измерений двух величин часто одну из них изменяют не случайным образом, а последовательно, от меньших значений к большим или наоборот. Иногда, в некоторых системах наблюдается так называемый гистерезис – результаты измерений y в зависимости от x на каком-то участке при увеличении и при уменьшении x не совпадают.

17

В связи с тем, что нелинейности могут возникать не только в измеряемом объекте, но и в самом измерительном приборе, точность измерений характеризуется еще двумя важными параметрами: статической точностью, показывающей, насколько хорошо повторяются результаты измерений одной и той же величины, и динамической точностью, показывающей, насколько точно получается измерить изменяющиеся значения. Для оценки точности измерений это не так существенно, поскольку следует брать максимальную погрешность, но это может быть важным при планировании эксперимента.

18

Оглавлениеfizlesh.ru/lectures/iext-by-an.pdf · 2019-11-02 · Сравнение...

Documents