Расчётно-графические работы по курсу математики




страница1/5
Дата04.05.2016
Размер0.64 Mb.
  1   2   3   4   5


Российский Государственный Университет

физической культуры, спорта, молодежи и туризма


Кафедра естественно-научных дисциплин

В.С. Маркарян



РАСЧЁТНО-ГРАФИЧЕСКИЕ РАБОТЫ

ПО КУРСУ МАТЕМАТИКИ

Учебное пособие


Москва


2012

Автор: Маркарян В.С. – кандидат технических наук, доцент кафедры естественно-научных дисциплин Российского государственного университета физической культуры, спорта, молодежи и туризма.

Оглавление


1.Теоретические основы…………………………………………………………4

Математическая статистика. Генеральная совокупность и выборка..…………………………………………………………………............4


Графическое представление вариационного ряда………………………8


Нормальное распределение..……………………………………………..11

Аналитический анализ. Основные статистические характеристики ряда измерений………………..………………………………………………...13

Характеристики положения….…………………………………………..13

Характеристики рассеяния результатов измерений………………........15

Характеристики формы распределения………………………………....18

2. Методика выполнения расчётно-графической работы №1………………...21

Пример 1…………………………………………………………………...23

3. Теоретические основы………………………………………………………..32


Корреляционный анализ………………………………………………….32

Определение формы связи……………………………………………….33

Определение направления взаимосвязи…………………………………34

Определение степени или тесноты взаимосвязи………………………..34

Парный линейный коэффициент корреляции Бравэ-Пирсона (r). Коэффициент детерминации (D)………………………………………….…...36

Оценка достоверности статистических показателей…………………...37

Статистические гипотезы………………………………………………...37

Виды статистических гипотез…………………………………………....38

Достоверность коэффициента корреляции……………………………...40

Регрессионный анализ…………………………………………………....41

Линейная регрессия………………………………………………………41

Расчёт коэффициентов уравнений линейной регрессии……………….42

4. Методика выполнения расчётно-графической работы №2………………...44

Пример……………………………………………………………………..46

Приложение……………………………………………………………………..53

1. Теоретические основы



МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Генеральная совокупность и выборка
Математическая статистика занимается разработкой методов сбора, описания и обработки статистических измерений (данных), т. е. результатов на­блюдений, с целью получения научных и практических выводов.

Статистические измерения представляют собой экспериментальные данные, полученные в результате обследования большого числа объектов или яв­лений, т.е. математическая статистика имеет дело с массовыми явлениями.

Введем основные понятия математической статистики.

Экспериментальные данные в области физической культуры и спорта пред­ставляют собой результаты измерения некоторых признаков (спортивный резуль­тат, результаты физических, психологических, биохимических, физиологических тестов) объектов, выбранных из большой совокупности объектов. Результаты из­мерений в математической статистике обозначаются латинскими буквами ( ).

Статистической совокупностью называется множество однородных объектов, объединенных по некоторому общему отличительному признаку.

Если требуется изучить некоторый признак статистической совокупности, можно провести сплошное обследование, т. е. обследование, проведенное на всей генеральной совокупности.



Генеральной совокупностью называется совокупность всех однородных объектов, подлежащих изучению. Но если число объектов достаточно велико, то осуществить указанное обследование невозможно. В таком случае для изучения интересующего признака применяется выборочный метод. Сущность этого ме­тода заключается в том, что обследованию подвергаются не все объекты совокуп­ности, а только некоторая их часть, случайно выбранная из данной совокупности; выводы, полученные при изучении этой части, распространяются на всю совокуп­ность объектов.

Таким образом, выборочной совокупностью, или выборкой, называется со­вокупность объектов, случайно отобранных из генеральной совокупности.

Число N объектов генеральной совокупности и число n объектов выборочной совокупности называются объёмами генеральной или выборочной совокупностей соответственно, при этом N значительно больше, чем n.

Если выборку отбирают по одному объекту, который обследуют и снова воз­вращают в генеральную совокупность, то выборка называется повторной. Если объекты выборки уже не возвращаются в генеральную совокупность, то выборка называется бесповторной. На практике чаще используется бесповторная выборка. Если объём выборки составляет небольшую долю объёма генеральной совокупно­сти, то разница между повторной и бесповторной выборками незначительна.

Как отмечалось выше, о свойствах генеральной совокупности (случайной ве­личины Х) можно судить по данным наблюдений над отобранными объектами, т. е. по выборке. Для того чтобы по выборке можно было достаточно уверенно судить о случайной величине, выборка должна быть репрезентативной (представитель­ной). Репрезентативность выборки означает, что объекты выборки достаточно хо­рошо представляют генеральную совокупность. Репрезентативность выборки обеспечивается случайностью отбора. Это означает, что любой объект выборки отобран случайно, при этом все объекты имеют одинаковую вероятность попасть в выборку.

При проведении выборочных исследований предполагается, что выборка яв­ляется однородной, т. е. она получена из одной генеральной совокупности, где от­сутствуют объекты, резко выделяющиеся по значениям изучаемого признака. Обычно полученные выборочные данные представляют собой результаты измере­ний для спортсменов одного возраста, квалификации, спортивной специализации и т. п.

Все результаты спортивных измерений или наблюдений классифицируются на три основные группы:

Количественные характеристики - показатели, которые можно измерить с помощью любого прибора или те, которые имеют размерность.

Количественные показатели могут быть дискретные (прерывные) и непре­рывные.

К дискретным показателям можно отнести: количество подтягиваний на пе­рекладине, количество отжиманий из упора лежа, количество человек, участвую­щих в соревнованиях, число попаданий (промахов) при выстреле и т.д. Обычно дискретные показатели выражаются целыми числами.

К непрерывным показателям можно отнести: рост человека, результат в беге на 100м, прыжок в высоту, длину, угол в коленном суставе и т.д. Непрерывные по­казатели могут быть как дробными, так и целыми числами.



Порядковые характеристики - результаты, оцениваемые в баллах или оч­ках. Например, оценки в фигурном катании, спортивной и художественной гимна­стике, занятое место в соревнованиях и т.д. Эти результаты можно расположить в определенном порядке.

Качественные характеристики - результаты, которые не имеют количест­венной оценки. Например, национальность, цвет волос, форма глаз, спортивная специализация, пол спортсмена и т.д. Эти результаты не могут быть упорядочены.

Обычно полученные наблюдаемые данные представляют собой мно-жество расположенных в беспорядке чисел. Просматривая это множество чисел, зачастую бывает трудно выявить какую-либо закономерность их варьирования (изменения). Для изучения закономерностей варьирования значений случайной величины опыт­ные данные подвергаются обработке. При систематизации выборочных данных используются дискретные и интервальные ряды распределений.

Причём, прежде всего полученные экспериментальные данные ранжируются.

Ранжирование - расположение результатов наблюдений над случайной ве­личиной в порядке возрастания или убывания.

После ранжирования опытные данные объединяются в группы, т. е. группи­руются. Каждое значение случайной величины, входящее в отдельную группу сгруппированного ряда, называется вариантом, а изменение этого значения – варьированием. Для каждой группы сгруппированного ряда данных можно под­считать численность вариант, т. е. определить число, показывающее, сколько раз встречается соответствующий вариант в ряде наблюдений, это число называется частотой варианта, обозначается ni. Сумма частот вариант равна объёму вы­борки n. Отношение частоты варианта к объёму выборки называется относитель­ной частотой, или частостью, обозначается рi*:



рi*=.

Отметим, что сумма относительных частот равна единице



р1*+ р2*+…+рi*=.

Дискретным вариационным рядом распределения называется ранжирован­ная совокупность вариантов хi с соответствующими им частотами ni или часто­стями рi*.

Если изучаемая случайная величина является непрерывной, то ранжирование и группировка наблюдаемых значений не позволяют выявить характерные черты варьирования её значений.

Нецелесообразно также построение дискретного ряда для дискретной случайной величины, число возможных значений которой велико. В этом случае следует построить интервальный вариационный ряд распределения. Для его построения весь интервал варьирования наблюдаемых значений случайной величины разбивается на ряд частичных интервалов и подсчитывается частота по­падания значений величины в каждый частичный интервал.

Интервальным вариационным рядом называется упорядоченная совокуп­ность интервалов варьирования случайной величины с соответствующими часто­тами или частостями попаданий в каждый из них значений величины.

Для построения интервального вариационного ряда прежде всего результаты эксперимента заносятся в таблицу, состоящую из трёх строк. Первая строка – ну­мерация показателей, вторая строка – неупорядоченная выборка (экспериментальные данные заносятся в эту строку по мере обследования объектов или яв­лений), третья строка таблицы представляет собой ранжированную или упорядоченную выборку (экспериментальные данные второй строки таблицы ранжируются).

Вся упорядоченная выборка разбивается на интервалы.

Причём число интервалов определяется либо по таблице рекомендуемого числа интервалов для выборок разного объёма, приведённой ниже, либо рассчиты­вается по формуле Стерджеса (Sturges, 1926 г.)



Таблица 1

Рекомендуемое число интервалов для выборок разного объёма



Объём выборки n

10-30

30-60

60-100

100-300

300-400

Число интервалов k

4-5

5-6

7

8

9

Затем определяется шаг или ширина интервала по формуле:



,

где - максимальное значение измеряемого показателя в упорядоченной (ран­жированной) выборке; - минимальное значение показателя.

Полученное значение шага обычно округляют в большую сторону до размерно­сти измеряемого показателя.

Нижняя граница первого интервала выбирается чуть меньшей или равной ми­нимальному значению выборки, то есть от до .

После этого заполняется таблица (см. табл. 2.) по результатам выборки, кото­рые распределены в интервалы, т. е. результаты измерений представляются в виде вариационного ряда по образцу, где количество строк зависит от количества ин­тервалов.

Таблица 2




интервала

Границы

интервала

Срединное значение интервала

Частота

ni

Накопленная

частота

Частость

рi*

Накопленная

частость

1

2

3

4

5

6

7





















В первый столбец таблицы вписывается номер интервала.

Во второй столбец – границы интервала. Причем верхняя граница первого интервала определяется прибавлением шага интервала к его нижней границе. Этот результат является также и нижней границей для следующего интервала. Макси­мальное число верхней границы последнего интервала должно быть больше или равно максимальному значению показателя в выборке.

В третий столбец вписываются срединные значения интервалов.

Середины интервалов являются средними арифметическими значениями границ интервалов. Причём достаточно определить середину первого интервала, прибавив к ней шаг интервала, получить середину второго интервала и т.д.

Четвёртый столбец – частота (ni), т. е. количество значений, попавших в задан­ный интервал. Если граничный результат был учтен в интервале, то в последую­щем интервале учитываются значения выше граничного результата.

Пятый столбец – накопленная частота, которая рассчитывается сум­мированием частот предыдущих интервалов. Причем в последней строке этого столбца обязательно должно быть число, равное объему выборки (n).

Шестой столбец – частость (рi*), т. е. отношение частоты к объёму выборки.

Седьмой столбец – накопленная частость, получаемая суммированием час­тостей предыдущих интервалов. В последней строке столбца 6 получается еди­ница.

Распределение измерений, представленное в столбцах 2(границы интервалов) и 4(частота) или 2(границы интервалов) и 6(частость), назы­вается вариационным рядом.



Графическое представление вариационного ряда

Графическое представление результатов измерений выражается в построе­нии трех графиков: полигона частот (рис. 1), гистограммы (рис. 2) и полигона накопленных частот (кривой сумм или кумуляты) (рис. 4).



Полигон частот и гистограмма показывают распределение измеряемых показателей и их сгруппированность вокруг среднего значения.

Для построения полигона частот в декартовых координатах по оси абсцисс откладываются срединные значения интервалов, а по оси ординат – соответст­вующие им частоты (или частости).



Рис. 1. Полигон частот результатов


Для построения гистограммы по оси абсцисс откладываются границы ин­тервалов и на них восстанавливаются прямоугольники до уровня частот, соответ­ствующих интервалам, отложенных по оси ординат (рис. 2).


Рис. 2. Гистограмма распределения результатов


Если нанести на гистограмму пунктирной линией полигон распределения частот, то мы получим первоначальное представление о дифференциальной функ­ции распределения.

Таким образом, теоретическим аналогом гистограммы является плот­ность распределения вероятностей, или дифференциальная функция распре­деления (рис. 3).



Рис. 3. Плотность распределения вероятностей


Иначе говоря, гистограмма является экспериментальным аналогом плотности распределения вероятностей.

Площадь гистограммы равна сумме всех частот, т. е. объёму выборки, или сумме частостей, т. е. единице.



Полигон накопленных частот показывает прирост показателей от интер­вала к интервалу, поэтому ее ещё называют кривой сумм или кумулятой. Для по­строения полигона накопленных частот по оси абсцисс откладываются верхние границы интервалов, а по оси ординат – соответствующие им накопленные час­тоты (или накопленные частости) (рис. 4).
накопленная

частота



Рис. 4. Полигон накопленных частот результатов



Теоретическим аналогом полигона накопленных частот результатов яв­ляется функция распределения, или интегральная функция распределения (рис. 5).

Рис. 5. Функция распределения


Иначе говоря, полигон накопленных частот результатов является экс­периментальным аналогом функции распределения.

Таким образом, графическое представление результатов измерений выяв­ляет закономерности их распределения и позволяет правильно выбрать последую­щие статистические характеристики для дальнейшего анализа полученных экспе­риментальных данных.

Однако прежде чем перейти к дальнейшим расчётам, напомним о нормаль­ном законе распределения.

Нормальное распределение
Большинство экспериментальных исследований не только в области физиче­ской культуры и спорта, но и в биологии, медицине и др. связано с измерениями, результаты которых могут принимать любые значения в заданном интервале, и описываются моделью непрерывных случайных величин, которые подчинены определённому закону распределения.

Среди всех непрерывных законов распределения вероятностей особое место занимает нормальное распределение, или распределение Гаусса, как наиболее часто встречающийся вид распределения.

Закон нормального распределения выражается следующей формулой:

,

где µ - математическое ожидание;


(основание натурального логарифма);

- называется нормированным отклонением.

Поэтому этот закон называется законом нормального распределения, а гра­фик функции f(x) называют нормальной кривой, или кривой Гаусса (рис.6).



Рис. 6. Кривая нормального распределения



Теорема. Математическое ожидание случайной величины Х приближённо равно среднему арифметическому всех её значений (при достаточно большом числе испытаний).

Как видно из рисунка 6, график нормальной кривой представляет собой колоколообразную фигуру, симметричную относительно вертикальной прямой , и асимптотически приближающуюся к оси абсцисс при .

Главная особенность нормального закона состоит в том, что он является пре­дельным законом, к которому приближаются другие законы распределения. При достаточно многочисленной совокупности нормальное распределение прояв­ляется и в эмпирическом распределении.
Определение. Совокупность всех возможных значений случайной величины и соответствующих им вероятностей образует так называемое теоретическое распределение.

Определение. Совокупность фактических значений случайной величины, полученных в результате наблюдений, с соответствующими частотами (или частостями) образуют эмпирическое распределение.

Рассмотрим некоторые свойства нормального распределения.

1. График нормального распределения определен на всей оси ОХ, т. е. каж­дому значению х соответствует вполне определённое значение функции.

2. При всех значениях х (как положительных, так и отрицательных) функция принимает положительные значения, т. е. нормальная кривая расположена над осью ОХ.

3. Предел функции при неограниченном возрастании х равен нулю

.

Поскольку функция стремится к 0 при , то ось абсцисс является асимптотой графика этой функции.

4. Функция в точке имеет максимум, равный:

.

5. График кривой f(x) симметричен относительно прямой, проходящей через точку х = μ.

Отсюда следует равенство для нормально распределённой величины моды, медианы и математического ожидания.

6. Коэффициенты асимметрии и эксцесса нормального распределения равны 0:



= 0;

= 0.

Отсюда следует важность вычисления этих коэффициентов для эмпирических рядов распределения, т. к. они характеризуют скошенность и кру­тость данного ряда по сравнению с нормальным.

7. Изменение значений параметра (при неизменном ) не влияет на форму нормальной кривой; кривая сдвигается вдоль оси Ox вправо, если возрас­тает, и влево, если убывает.

С изменением же значений параметра форма нормальной кривой изменя­ется. Максимальная ордината графика функции убывает с возрастанием значения (кривая «сжимается» к оси Ox) и возрастает с убыванием значения (кривая «растягивается» в положительном направлении оси Oy).

На рис. 7. изображены три нормальные кривые при одном и том же значении и различных значениях .

Рис. 7. Нормальные кривые при равных и разных



Аналитический анализ.

Основные статистические характеристики ряда измерений

К основным статистическим характеристикам ряда измерений (вариацион­ного ряда) относятся характеристики положения (средние характе­ристики, или центральная тенденция выборки); характеристики рассеяния (ва­риации, или колеблемости) и характеристики формы распределения.

К характеристикам положения относятся среднее арифметическое значе­ние (среднее значение), мода и медиана.

К характеристикам рассеяния (вариации, или колеблемости) относятся: размах вариации, дисперсия, среднее квадратическое (стандартное) отклонение, ошибка средней арифметической (ошибка средней), коэффициент вариации и др.



К характеристикам формы относятся коэффициент асимметрии, мера ско­шенности и эксцесс.

Далее приводятся формулы для расчёта основных статистических характеристик, причём предлагаются расчётные формулы как для несгруппированных данных, так и для данных, сгруппированных в интервалы.



Характеристики положения
1. Среднее арифметическое значение

Среднее арифметическое значение – одна из основных характеристик вы­борки.

Она, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.

Точность вычисления по необработанным данным выше, но процесс вычисления оказывается трудоёмким при большом объёме выборки.

Для несгруппированных данных среднее арифметическое определяется по формуле:



,

где n- объем выборки, х1, х2, ... хn - результаты измерений.

Для сгруппированных данных:

,

где n- объем выборки, k – число интервалов группировки, ni – частоты интервалов, xi – срединные значения интервалов.


2. Мода

Определение 1. Мода - наиболее часто встречающаяся величина в данных вы­борки. Обозначается Мо и определяется по формуле:

,

где - нижняя граница модального интервала, - ширина интервала группи­ровки, - частота модального интервала, - частота интервала, предшествую­щего модальному, - частота интервала, последующего за модаль­ным.



Определение 2. Модой Мо дискретной случайной величины называется наиболее вероятное её значение.

Геометрически моду можно интерпретировать как абсциссу точки максимума кривой распределения. Бывают двухмодальные и многомодальные распределения. Встречаются распределения, которые имеют минимум, но не имеют максимума. Такие распределения называются антимодальными.

Определение. Модальным интервалом называется интервал группировки с наибольшей частотой.

3. Медиана

Определение. Медиана - результат измерения, который находится в сере­дине ранжированного ряда, иначе говоря, медианой называется значение признака Х, когда одна половина значений экспериментальных данных меньше её, а вторая половина – больше, обозначается Ме.

Когда объем выборки n - четное число, т. е. результатов измерений четное количество, то для определения медианы рассчитывается среднее значение двух показателей выборки, находящихся в середине ранжированного ряда.

Для данных, сгруппированных в интервалы, медиану определяют по фор­муле:

,

где - нижняя граница медианного интервала; ширина интервала группи­ровки, 0,5n – половина объёма выборки, - частота медианного интервала, - накопленная частота интервала, предшествующего медианному.



Определение. Медианным интервалом называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n/2) или накопленная частость окажется больше 0,5.

Численные значения среднего, моды и медианы отличаются, когда имеет место несимметричная форма эмпирического распределения.



Характеристики рассеяния результатов измерений
Для математико-статистического анализа результатов выборки знать только характеристики положения недостаточно. Одна и та же величина среднего значе­ния может характеризовать совершенно различные выборки.

Поэтому кроме них в статистике рассматривают также характеристики рассеяния (вариации, или колеблемости) результатов.


1. Размах вариации

Определение. Размахом вариации называется разница между наибольшим и наименьшим результатами выборки, обозначается R и определяется

R=Xmax - Xmin .

Информативность этого показателя невелика, хотя при малых объёмах вы­борки по размаху легко оценить разницу между лучшим и худшим результатами спортсменов.


2. Дисперсия

Определение. Дисперсией называется средний квадрат отклонения значений признака от среднего арифметического.

Для несгруппированных данных дисперсия определяется по формуле

2 =, (1)
где Хi – значение признака, - среднее арифметическое.

Для данных, сгруппированных в интервалы, дисперсия определяется по формуле



,

где хi – среднее значение i интервала группировки, ni – частоты интервалов.

Для упрощения расчётов и во избежание погрешностей вычисления при округ­лении результатов (особенно при увеличении объёма выборки) используются также другие формулы для определения дисперсии. Если среднее арифметическое уже вычислено, то для несгруппированных данных используется следующая фор­мула:

2 =,

для сгруппированных данных:

.
Эти формулы получаются из предыдущих раскрытием квадрата разности под знаком суммы.

В тех случаях, когда среднее арифметическое и дисперсия вычисляются од­новременно, используются формулы:

для несгруппированных данных:

2 =,

для сгруппированных данных:
.
3. Среднее квадратическое (стандартное) отклонение

Определение. Среднее квадратическое (стандартное) отклонение характе­ризует степень отклонения результатов от среднего значения в абсолютных единицах, т. к. в отличие от дисперсии имеет те же единицы измерения, что и результаты измерения. Иначе говоря, стандартное отклонение показывает плотность распределения результатов в группе около среднего значения, или однородность группы.

Для несгруппированных данных стандартное отклонение можно определить по формулам


=,
= или  =.

Для данных, сгруппированных в интервалы, стандартное отклонение определяется по формулам:



,
или .

4. Ошибка средней арифметической (ошибка средней)

Ошибка средней арифметической характеризует колеблемость средней и вычисляется по формуле:

.

Как видно из формулы, с увеличением объёма выборки ошибка средней уменьшается пропорционально корню квадратному из объёма выборки.


5. Коэффициент вариации

Коэффициент вариации определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах:

.

Считается, что если коэффициент вариации не превышает 10 %, то выборку можно считать однородной, то есть полученной из одной генеральной совокупности.



Характеристики формы распределения
Кривая эмпирического распределения (рис. 6) не всегда идеально колоколообразна (нормальна) и симметрична. Отсюда и следует важность вычисления коэффициентов асимметрии и эксцесса для эмпирических рядов распределения, т. к. они характеризуют скошенность и крутость данного ряда по сравнению с нормальным.

Таким образом, для многих распределений характерен сдвиг кривой влево или вправо. В связи с этим различают левостороннюю (положительную) и правостороннюю (отрицательную) асимметрию. Она зависит от знака формулы для определения коэффициента асимметрии (нормированного центрального момента третьего порядка), который служит характеристикой скошенности или асимметрии распределения, определяемой по формулам:



  • для несгруппированных данных:

,
где - центральный момент третьего порядка, - среднее квадратическое отклонение, хi – значение признака, - среднее арифметическое, n – объём выборки;


  • для данных, сгруппированных в интервалы:

,
где ni – частоты интервалов группировки, xi – срединное значение i интервала группировки, k – число интервалов.

При этом, если знак этого выражения отрицательный (-), то асимметрия правосторонняя, или отрицательная (рис. 8), если же знак положительный (+), то асимметрия левосторонняя, или положительная (рис. 9).



Рис. 8. Правосторонняя (отрицательная) асимметрия



Рис. 9. Левосторонняя (положительная) асимметрия

Наиболее простой показатель асимметрии – это мера скошенности:
.
В основу её положено отклонение средней арифметической от моды, а по знаку выражения определяется левосторонняя (положительная) или правосторонняя (отрицательная асимметрия).

Кроме асимметричности кривые распределения имеют характеристики плосковершинности и островершинности. Их характеристикой служит величина эксцесса (нормированного центрального момента четвёртого порядка, см. учебник), которая рассчитывается по формулам:



  • для несгруппированных данных:

,
где хi - значение признака;

  • для сгруппированных данных

,
где ni - частоты интервалов группировки;

х i - срединное значение интервала группировки;

σ - среднеквадратическое отклонение.

Рис. 10. Островершинная и плосковершинная кривые распределения

Если знак эксцесса отрицательный (-), то имеется тенденция к плосковершинности (рис. 10).

Если же знак положительный (+), то имеется тенденция к островершинности (рис. 10).



2. Методика выполнения расчётно-графической работы №1
Расчётно-графическая работа содержит 4 раздела.
В первом разделе:

  1. Формулируется тема;

  2. Формулируется цель работы.

Во втором разделе:



  1. Формулируется условие задачи (в зависимости от специализации);

  2. Заполняется таблица исходных данных выборки по результатам экспериментов, проведённых со спортсменами одной специализации.

В третьем разделе:



  1. Результаты измерений представляются в виде вариационного ряда;

  2. Даётся графическое представление вариационного ряда.

  3. Формулируется вывод.

В четвёртом разделе:



  1. Рассчитываются основные статистические характеристики ряда измере-ний;

  2. По итогам расчётов формулируется вывод.

Оформление работы:



  1. Работа выполняется в отдельной тетради или на форматных листах.

  2. Титульный лист заполняется по образцу.

(Пример оформления титульного листа)


Российский Государственный Университет

физической культуры, спорта, молодёжи и туризма


Кафедра естественнонаучных дисциплин

Графическое представление результатов экспериментов

Расчёт основных статистических характеристик
Расчётно-графическая работа №1

по курсу математики


Выполнил: студент 1 к. 1 пот. 1гр.

Иванов С.М.
Преподаватель : доц. кафедры ЕНД и ИТ

(Ф.И.О.)


Москва - 2012

Пример выполнения расчётно-графической работы №1.
Пример
Тема работы: Графическое представление результатов эксперимента. Расчёт основных статистических характеристик.

Цель работы: Научиться представлять результаты исследований в графическом виде и определять основные статистические характеристики.

Условие задачи: 18 спортсменов выполняли прыжки в длину. Результаты длины прыжка Yi (м) занесены в таблицу.
Таблица исходных данных выборки:
Таблица 3

п/п

1

2

3

4

5

6

7

8

9

Yi, м

6,35

6,83

6,25

6,38

6,42

6,35

6,51

6,06

6,22

ранжированная выборка

6,00

6,06

6,18

6,20

6,22

6,25

6,35

6,35

6,38

п/п

10

11

12

13

14

15

16

17

18

Yi, м

6,20

6,00

6,50

6,65

6,55

6,75

6,60

6,18

6,55

ранжированная выборка

6,42

6,50

6,51

6,55

6,55

6,60

6,65

6,75

6,83

Определим число интервалов по формуле Стерджеса


.
Определим шаг (или ширину) интервала по формуле:

,

где - максимальное значение измеряемого показателя в упорядоченной (ранжированной) выборке; - минимальное значение показателя.

Определим шаг или ширину интервала

.
Границу интервала обычно округляют в большую сторону до размерности измеряемого показателя. Нижнюю границу первого интервала выберем равной минимальному значению выборки, то есть . Заполним таблицу по результатам выборки (см. табл. 6), которые распределены в интервалы, т. е. результаты измерений представим в виде вариационного ряда.

В первый столбец таблицы впишем номера 5 интервалов.

Во второй столбец – границы интервала. Нижней границей первого интервала выбрали 6, прибавим к ней шаг и получим верхнюю границу первого интервала (6,00+0,17=6,17). Этот же результат является нижней границей следующего интервала (6,17+0,17=6,34) и т. д.

Значение верхней границы последнего интервала 6,85 больше максимального значения показателей выборки 6,83.



Третий столбец – срединные значения интервалов. Середину первого интервала определим как среднее арифметическое значение его границ. Середины следующих интервалов получим прибавлением шага интервала к предыдущим значениям.

Четвертый столбец – частота (ni), т. е. количество значений, попавших в заданный интервал. Если граничный результат был учтен в интервале, то в последующем интервале учитываются значения выше граничного результата.

Пятый столбец – накопленная частота рассчитывается суммированием частот предыдущих интервалов. В последней строке столбца 4 получилось число, равное объему выборки (14).

Шестой столбец – частость (рi*) рассчитывается делением частоты на объём выборки.

Седьмой столбец – накопленная частость получается суммированием частостей предыдущих интервалов. В последней строке столбца 7 получилась единица.

Распределение измерений, представленное в столбцах 2(границы интервалов) и 4(частота) или 2(границы интервалов) и 6(частость), назы­вается вариационным рядом. Напомним, что интервальным вариационным рядом называется упорядоченная совокуп­ность интервалов варьирования случайной величины с соответствующими часто­тами или частостями попаданий в каждый из них значений величины.

Представим результаты измерений в виде вариационного ряда (табл. 7).

Таблица 4


Результаты измерений, представленные в виде вариационного ряда





интервала

Границы

интервала

Срединное значение интервала

Частота

ni

Накопленная

частота

Частость

рi*

Накопленная

частость

1

2

3

4

5

6

7

1

6,00 – 6,17

6,085

2

2

2/18

2/18

2

6,17 – 6,34

6,255

4

6(2+4)

4/18

6/18

3

6,34 – 6,51

6,425

6

12(6+6)

6/18

12/18

4

6,51 – 6,68

6,595

4

16(12+4)

4/18

16/18

5

6,68 – 6,85

6,765

2

18(16+2)

2/18

18/18=1



Графическое представление вариационного ряда

Графическое представление результатов измерений выражается в построении трех графиков: полигона частот (см. рис. 1), гистограммы (рис. 2) и полигона накопленных частот (кривой сумм или кумуляты) (рис. 4). Полигон частот и гистограмма показывают распределение измеряемых показателей и их сгруппированность вокруг среднего значения.

Для построения полигона частот в декартовых координатах по оси абсцисс отложим срединные значения интервалов из таблицы 7, а по оси ординат – соответствующие им частоты (или частости). Для приведённого примера полигон распределения изображён на рис. 11.


Рис 11. Полигон частот результатов

Для построения гистограммы по оси абсцисс отложим границы интервалов и на них восстановим прямоугольники до уровня частот, соответствующих интервалам, отложенных по оси ординат (рис. 12).



Рис 12. Гистограмма распределения результатов


Если нанести на гистограмму пунктирной линией полигон распределения частот, то мы получим первоначальное представление о дифференциальной функции распределения.

Как уже говорилось выше, гистограмма является экспериментальным аналогом плотности распределения вероятностей.

Площадь гистограммы равна сумме всех частот, т. е. объёму выборки (18), или сумме частостей, т. е. единице.




Рис 13. Полигон накопленных частот результатов

Для построения полигона накопленных частот (кривой сумм или кумуляты) по оси ординат отложим верхние границы интервалов, а по оси абсцисс – соответствующие им накопленные частоты (рис. 13).

Полигон накопленных частот результатов является экспериментальным аналогом функции распределения.

Далее проведём расчёт основных статистических показателей ряда измерений, он сводится к расчёту характеристик положения, характеристик рассеяния результатов измерений и характеристик формы распределения. Причём приведём методику расчёта с помощью формул для данных сгруппированных в интервалы.

Аналитический анализ.
Характеристики положения:


  • среднее арифметическое значение (среднее значение)


,
где n- объем выборки,

k – число интервалов группировки,

ni – частоты интервалов,

xi – срединные значения интервалов.


  • Мода

где - нижняя граница модального интервала.

В нашем примере модальным является третий интервал (таблица 7), т.к. модальным называется интервал группировки с наибольшей частотой. Тогда нижняя граница модального интервала 6,34.

- ширина интервала группи­ровки,

- частота модального интервала, т.е. частота третьего интервала 6,

- частота интервала, предшествую­щего модальному, т.е. частота второго интервала 4,

- частота интервала, последующего за модаль­ным, т.е. частота четвёртого интервала 4.


  • Медиана

.
где - нижняя граница медианного интервала.

В нашем примере медианным является третий интервал, т.к. медианным называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n/2) или накопленная частость окажется больше 0,5.

Половина объёма выборки 18/2=9, именно в третьем интервале накопленная частота впервые оказалась больше 9, т.е. 12, а накопленная частость 12/18=0,7 (больше 0,5).

– ширина интервала группи­ровки,

0,5n – половина объёма выборки (9),



– частота медианного интервала (6),

– накопленная частота интервала, предшествующего медианному (6).

Характеристики рассеяния результатов измерений:

  • Размах вариации:

R = Xmax - Xmin = 6,83 – 6,00 = 0,83.

  • Дисперсия.

Для данных, сгруппированных в интервалы, дисперсия определяется по формуле:

где хi – среднее значение i интервала группировки,



ni – частоты интервалов.


  • Среднеквадратическое отклонение (стандартное отклонение)

Для данных, сгруппированных в интервалы, стандартное отклонение определяется по формуле:


,


  • Ошибка средней арифметической (ошибка средней)


.



.
Вывод: так как коэффициент вариации не превышает 10 % (V<10 %), то выборка считается однородной.

Характеристики формы распределения:

  • Мера скошенности

.
Равенство нулю меры скошенности свидетельствует о том, что имеет место симметричное распределение. Действительно, как видно из предыдущих расчётов Мо = Ме = . Это характерно для нормального распределения.


  • Эксцесс для сгруппированных данных:

,
где ni - частоты интервалов группировки;

х i - срединное значение интервала группировки;

σ - среднеквадратическое отклонение.

Знак эксцесса отрицательный, следовательно, у рассматриваемого эмпирического распределения наблюдается тенденция к плосковершинности.



  1   2   3   4   5


База данных защищена авторским правом ©ekonoom.ru 2016
обратиться к администрации

    Главная страница