stat formuli

Post on 10-Oct-2014

354 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Уважаеми колеги,

Курсът по базисната дисциплина “Статистика” съдържа сравнително голям

брой формули. Нашата цел е те да не бъдат заучавани механически. Основното,

което ще остане във Вашето съзнание трябва да бъдат познавателните

възможности и изискванията при практическото приложение на серия от

статистически измерители и методи за анализ.

Когато във Вашата бъдеща практика възникне конкретен казус, свързан с

набирането и възможностите за анализ на емпирична числова информация,

следва да се досетите, че науката Статистика Ви дава множество възможности в

тази област. Предлаганият учебник съдържа обстойно представяне на основните

от тях. Нещо повече, след всяка глава е представена и допълнителна

специализирана литература по съответната тема. За Вас оставяме само коректно

да приложите необходимите измерители и методи за статистически анализ, за да

достигнете да разкриване на статистически значими връзки и зависимости, за ги

моделиране и измерите количествено. Получените от анализа резултати можете

да използвате и за прогностични цели.

Тези от Вас, които желаят, могат да си разпечатат предлагания свитък от

основни формули, които са съпроводени и със съответни кратки описания и без

каквито и да било допълнения от тяхна страна, да го използват по време на

семестриалния изпит по дисциплината “Статистика”. Това би Ви спестило

неудобството да правите “пищови” и би ви улеснило да акцентирате вниманието

си върху съдържателната страна на изпитния тест, а не върху механичното

запаметяване на конкретни формули.

ОСНОВНИ ФОРМУЛИ, ИЗПОЛЗВАНИ В СТАТИСТИКАТА

1. СТАТИСТИЧЕСКИ ГРУПИРОВКИ

1.1.Аритметична формула за определяне ширината на интервала при интервални

групировки с еднаква ширина на интервалите:

k

XXh minmax

h – ширина на интервала; Xmax – максимално значение на признака; Xmin –

минимално значение на признака; k – предварително определен брой на групите.

1.2. Относителни честоти, характеризиращи едномерни емпирични честотни

разпределения.

1.2.1. По отношение на цялата съвкупност:

N

fp i

i

fi – абсолютни честоти на i-то значение на статистическия признак Xi ; N – общ

брой на единиците в съвкупността

1.2.2. По отношение на броя на действително разпределените единици в

съвкупността:

i

ii

f

fp*

Σfi – сума от абслоютните честоти за всички значения на статистическия признак

Xi .

1.3. Кумулативни честоти, характеризиращи едномерни емпирични честотни

разпределения.

1.3.1. Кумулативна честота

i

1jji fC за i=1, …, k.

fj – абсолютни честоти на j-то значение на статистическия признак; k – брой на

значенията на признака Xi .

1.3.2. Относителна кумулативна честота:

i

j

ji

i pn

CC

1

(%)(%) %100. за i=1, …, k.

Ci – кумулативна честота на i-то значение на статистическия признак Xi ; pj –

относителна честота на j-то значение на признака Xi ; k – брой на значенията на

признака Xi .

2. СТАТИСТИЧЕСКИ СРЕДНИ ВЕЛИЧИНИ

2.1. Алгебрични средни величини

2.1.1. Средна аритметична величина

2.1.1.1. Непретеглена средна аритметична величина

N

x

N

xxxx

N

i

i

N

121 ...

където: хi са индивидуалните значения на признака ; N- брой на наблюдаваните

единици.

2.1.1.2. Претеглена средна аритметична величина

ii

ii

ii

k

i

i

k

i

ii

pxN

fx

N

fx

f

fx

x

1

1

където: хi са индивидуалните значения на признака ; fi - абсолютни честоти

(тегла); pi - относителни честоти (тегла); k – брой на значенията на xi ; N- брой на

наблюдаваните единици.

Основни свойства на средната аритметична величина:

0)( XXi

min)( 2 XXi

AX

f

fАX

k

i

i

k

i

ii

1

1

)(

AX

f

fАX

k

i

i

k

i

ii

1

1

)(

A

X

f

fA

X

k

i

i

k

i

i

i

1

1

)(

X

Af

АfX

k

i

i

k

i

ii

1

1

)(

)(

X

A

f

XA

f

k

i

i

k

i

i

i

1

1

)(

където А е произволна константа, А≠ 0.

2.1.2. Средна хармонична величина.

2.1.2.1. Непретеглена средна хармонична величина:

x

N

xxx

Nx

N

харм 11...

11

21

където: хi са индивидуалните значения на признака ; N- брой на наблюдаваните

единици.

2.1.2.2. Претеглена средна хармонична величина:

Fx

F

Fx

Fx

Fx

FFFx

k

N

k

харм

11...

11

...

2

2

1

1

21

където: Fi = xi fi ; хi са индивидуалните значения на признака ; k – брой на

значенията xi ; N- брой на наблюдаваните единици.

2.2. Неалгебрични (позиционни) средни величини.

2.2.1. Медиана (средна на положение) при интервални статистически редове:

Me

MeMeMef

hCNLMe .1

където: MeL е долната граница на медианния интервал; NMe е номерът на единицата, носеща медианното значение:

2

1

NNMe

- N- общ брой на единиците в съвкупността.

1MeC е кумулативната честота на предмедианния интервал;

Mef е честотата на медианния интервал; h е ширината на медианния интервал.

2.2.2. Мода (най-често срещаното значение на признака) при интервални

статистически редове:

)()(

)(

11

1

MoMoMoMo

MoMoMo

ffff

hffLMo

където: LMo - долна граница на модалния интервал;

fMo - честота в модалния интервал;

fMo-1 - честота в предмодалния интервал;

fMo+1 - честота в следмодалния интервал;

h - ширина на модалния интервал.

2.3. Съотношение между средната аритметична, медианата и модата в едно

емпирично честотно разпределение:

)(3 MexMox

3. СТАТИСТИЧЕСКО РАЗСЕЙВАНЕ

3.1. Размах на разсейването.

3.1.1. Абсолютен размер:

R = xmax - xmin

3.1.2. Относителен размер (коефициент на вариация по размаха):

100.minmax(%)

x

xxVR

където: xmax - максимално значение на признака ; xmin - минимално значение на признака; x е средната аритметична.

3.2. Средно аритметично (линейно) отклонение.

3.2.1. Абсолютен размер.

3.2.1.1. Непретеглена формула:

N

xxi

където: хi са индивидуалните значения на признака ; x е средната аритметична; N – брой на

наблюдаваните единици.

3.2.1.2. Претеглена формула:

i

ii

f

fxx

където: хi са индивидуалните значения на признака ; fi - абсолютни честоти

(тегла); x е средната аритметична.

3.2.2. Относителен размер (коефициент на вариация по средно аритметично

отклонение):

100.(%)x

V

3.3. Средно квадратично(стандартно) отклонение.

3.3.1. Абсолютен размер.

3.3.1.1. Непретеглена формула:

N

xxi

2

където: хi са индивидуалните значения на признака ; x е средната аритметична; N – брой на

наблюдаваните единици.

3.3.1.2. Претеглена формула:

i

ii

f

fxx2

където: хi са индивидуалните значения на признака ; fi - абсолютни честоти

(тегла); x е средната аритметична.

3.3.2. Относителен размер (коефициент на вариация по средно квадратично

отклонение):

100.(%)x

V

3.4. Дисперсия.

3.4.1. Непретеглена формула:

N

xxi

2

2

3.4.2. Претеглена формула:

22

2

2 1xfx

Nf

fxxii

i

ii

3.5. Средно квадратично (стандартно ) отклонение при алтернативен

(дихотомен) признак:

pq

където р е относителен дял на единиците по едно от значенията на признака, а q

– по другото, т.е. q = 1- p.

3.6. Средна разлика на К.Джини.

3.6.1. Непретеглена формула:

2

1 1

N

xx

G

n

i

n

j

ji

където: хi и xj са индивидуални значения на признака; N – брой на наблюдаваните единици.

3.6.2. Претеглена формула:

)1(

21

NN

CCfx

G

k

i

iiii

където: хi са индивидуални значения на признака; fi - абсолютни честоти (тегла);

iC е прогресивно-кумулативна честота, получена чрез сумиране на честотите от

първата до i–та група; iC е регресивно-кумулативна честота, получена чрез

кумулация на честотите от последната до i–та група; N – брой на наблюдаваните единици.

4. АСИМЕТРИЯ И ЕКСЦЕС

4.1. Коефициент на асиметрия на Пирсън.

MoxKP

a

където: x е средната аритметична; σ е стандартното отклонение; Мо е модата на разпределението.

4.2. Коефициент на асиметрия на Юл

Mex3KY

a

където: x е средната аритметична; σ е стандартното отклонение; Ме е медианата на разпределението.

4.3. Коефициент на асиметрия на Боули.

13

13Ba

QQ

Me.2QQK

където: Q1 и Q3 са съответно 1-ви и 3-ти квартил на разпределението; Ме е медианата на разпределението.

4.4. Моментен коефициент на асиметрия.

3

3

aK

където 3 е 3-тия централен момент, който се изчислява по формулата:

i

ii

f

fxx3

3

Интерпретация на коефициентите на асиметрия

Когато Ка = 0 разпределението е симетрично;

Когато Ка < 0 разпределението е ляво асиметрично;

Когато Ка > 0 разпределението е дясно асиметрично.

4.5. Моментен коефициент на ексцес.

4.5.1. Обикновен коефициент на ексцес:

4

4

Е

където 4 е 4-тия централен момент, който се изчислява по формулата:

i

ii

f

fxx4

4

4.5.2. Стандартизиран коефициент на ексцес:

Еs = E – 3

Интерпретация на коефициентите на ексцес

Когато Е = 3 или Еs = 0 разпределението е с нормален ексцес;

Когато Е < 3 или Еs < 0 разпределението е приплеснато;

Когато Е > 3 или Еs > 0 разпределението е с връхна източеност.

5. ЕДНОМЕРНИ ТЕОРЕТИЧНИ РАЗПРЕДЕЛЕНИЯ

5.1. Функция на разпределението (интегрален закон на разпределението):

F(x) = P(X≤x)

където: х е произволна стойност от областта от значения на случайната величина Х; Р е вероятност.

5.1.1. При прекъснати (дискретни) случайни величини:

F(x) = Σf(x)

5.1.2. При непрекъснати (индискретни) случайни величини:

а

dxxfаF )()(

където f(x) е функция на плътността.

5.2. Функция на плътността (честотна функция):

x

xFxf

)()(

където F(x) е интегралната функция.

5.2.1. При прекъснати (дискретни) случайни величини:

f(a) = P(х=a)

5.2.2. При непрекъснати (индискретни) случайни величини:

b

a

dxxfbxaP )()(

5.3. Нормално разпределение.

5.3.1. Функция на разпределението:

dxexF

xx

2

2

2

2

1)(

5.3.2. Функция на плътността:

2

2

2

2

1)(

xx

exf

където средната аритметична ( х ) и стандартното отклонение (σ) са параметри

на разпределението.

5.4. Стандартизирано нормално разпределение.

5.4.1. Функция на разпределението:

dzeZF

Z z

2

2

2

1)(

5.4.2. Функция на плътността:

2

2

2

1)(

Z

eZf

където

xxz

са стандартизираните стойности на случайната величина х .

5.5. Логаритмично нормално (логнормално) разпределение.

5.5.1. Функция на разпределението:

)(ln.2

1)(ln

2

2

2

ln

ydeyF

y

5.5.2. Функция на плътността:

2

2

2

ln1

.2

1)(ln

y

ey

yf

където ln y = x и = E(ln y).

5.6. t – разпределение на Стюдънт.

5.6.1. Функция на плътността:

2

1

2

1

2

2

1

.1

)(

ttf

за -∞ < t < ∞,

където

nxxt

:

; x e средна на случайната величина Х, наблюдавана от

извадка; х е средна на Х за генаралната съвкупност; n

е стандартното

отклонение на получените средни за извадките; Г е гама функция с общ вид:

2

2

1

ν е параметър на гама функцията, наричан степени на свобода, който може да

заема само положителни значения.

5.7. F – разпределение на Фишер.

5.7.1. Функция на плътността:

2

2

1

2

2

2

2

1

21

21

21

11

1

..

22

2)(

vv

vv

v

fv

f

v

v

vv

vv

Ff

където 2

2

y

xF

; x и y са дисперсиите на две независими случайни величини Х и

У, наблюдавани чрез извадки (-∞< Х <∞) и (-∞< У <∞); Г е гама функция с

параметри ν1 и ν2, наричани степени на свобода, които могат да заемат само

положителни значения.

5.8. 2 – разпределение на Пирсън.

5.8.1. Функция на плътността:

21

2

2

2 ..

2.2

1)(

xv

vex

vf

( 0 ≤ 2 < ∞ )

където

v

i

iv xxxxxxxx

1

222

2

2

12 ........

; xi са стойности на

случайната величина Х, наблюдавани при случайна извадка; x и σ са съответно

средната и стандартното отклонение на случайната величина Х; Г е гама функция

с параметър ν (степени на свобода).

6. СТАТИСТИЧЕСКО ОЦЕНЯВАНЕ НА ПАРАМЕТРИ

НА ГЕНЕРАЛНА СЪВКУПНОСТ

6.1. Средно стохастично (стандартно) отклонение по данни от представителна (репрезентативна) извадка – формула на

Бесел:

1

2

n

xxS

i

x

където: хi са индивидуалните значения на признака; x е средната аритметична; n – обем на

извадката.

6.2. Средна стохастична (стандартна) грешка на оценката на средна

аритметична величина.

6.2.1. При възвратен подбор:

n

Sxx

където xS е оценка на стандартното отклонение.

6.2.2. При безвъзвратен подбор:

N

n

n

Sxx 1.

където N – обем на генералната съвкупност.

6.3. Средна стохастична (стандартна) грешка на оценката на относителен дял

при алтернативен признак:

6.3.1. При възвратен подбор:

n

pqp

където р е относителният дял, получен от данни на извадката; q = 1 – p; n е

обемът на извадката.

6.3.2. При безвъзвратен подбор:

N

n

n

pqp 1.

където N – обем на генералната съвкупност.

6.4. Максимално допустима грешка на оценката на средна аритметична

величина.

xx Z .

където Z е гаранционен множител, който зависи от равнището на гаранционната

вероятност и се определя от таблицата на стандартизираното нормално

разпределение.

6.5. Максимално допустима грешка на оценката на относителен дял:

pp Z .

6.5. Доверителен интервал на средна аритметична величина:

xx xx

където е средна аритметична на генералната съвкупност.

6.6. Доверителен интервал на относителен дял:

pp pPp

където Р е относителен дял в генералната съвкупност.

6.7. Обем на извадката при оценка на средна аритметична и относителен дял.

6.7.1. При възвратен подбор

2

22 .

SZn

където Z е гаранционният множител; S2 е оценка на дисперсията на величината,

чиято средна аритметична или относителен дял ще бъдат оценявани; Δ е

максимално допустимата грешка на оценката, която ще се оценява .

6.7.2. При безвъзвратен подбор

222

22

..

..

SZN

NSZn

където N е обема на генералната съвкупност.

7. СТАТИСТИЧЕСКА ПРОВЕРКА НА ХИПОТЕЗИ

7.1. Етапи на статистическата проверка на хипотези.

7.1.1. Дефиниране на нулевата (Но) и алтернативната (Н1) хипотези.

7.1.2. Фиксиране на риска за грешки от първи род ().

7.1.3. Избор на метод за проверка и съответния статистически критерий,

чрез който се проверяват дефинираните хипотези.

7.1.4. Набавяне на необходимата за проверката информация.

7.1.5. Изчисляване на емпиричната характеристика на статистическия

критерий въз основа на данни от представителната извадка.

7.1.6. Определяне на характера на критичната област, ако това е

необходимо, според използвания статистически критерий и начина на

дефиниране на Н1 .

7.1.7. Определяне на теоретичната характеристика на статистическия

критерий въз основа на необходимите параметри.

7.1.8. Вземане на решение относно това, да приемем или да отхвърлим

нулевата хипотеза.

7.2. Емпирична характеристика за статистическа проверка на хипотези въз

основа на данни от една извадка.

7.2.1. Относно средна аритметична на генерална съвкупност.

7.2.1.1. При големи извадки (n ≥ 30):

n

xz

/

където x е оценка на средната аритметична на извадката; е средната

аритметична в генералната съвкупност; σ е стандартното отклонение в

генералната съвкупност; n е обем на извадката. Когато стойността на σ е

неизвестна, тя се замества с нейната оценка xS, получена от данните за

извадката, т.е.:

nS

xz

x /

7.2.1.2. При малки извадки (n < 30).

n

xt

или nS

xt

x

7.2.2. Относно относителен дял за генерална съвкупност.

7.2.2.1. При големи извадки (n ≥ 30):

npq

Ppz

където р е относителният дял, получен от данни на извадката; q = 1 – p; Р е

относителният дял за генералната съвкупност; n е обемът на извадката.

7.2.2.2. При малки извадки (n < 30).

npq

Ppt

7.3. Емпирична характеристика за статистическа проверка на хипотези въз

основа на данни от две независими извадки.

7.3.1. Относно разлика между две средни аритметични величини.

7.3.1.1. При големи извадки (n1 ≥ 30 и n2 ≥ 30):

2

22

1

21

21

n

S

n

S

XXZ

където: 1X е средната на първата извадка; 2X е средната на втората извадка; 21S и

22S са оценки на дисперсиите в двете извадки; n1 и n2 са съответните

обеми на двете извадки. 7.3.1.2. При малки извадки (n1 < 30 и/или n2 < 30):

2

11...

2

1

2

2

21

2

1

2121

nnnSnS

nnХХt

7.3.2. Относно разлика между два относителни дяла.

7.3.2.1. При големи извадки (n1 ≥ 30 и n2 ≥ 30):

2

22

1

11

21

n

qp

n

qp

ррZ

където р1 е относителният дял, получен от данни на първата извадка; р2 е

относителният дял, получен от данни на втората извадка; q1 = 1 – p1; q2 = 1 – p2 ;

n1 и n2 са съответните обеми на двете извадки.

7.3.2.2. При малки извадки (n1 < 30 и/или n2 < 30):

21

222111

2121

11.

2.

nnnqpnqp

nnppt

8. ЕДНОФАКТОРЕН ДИСПЕРСИОНЕН АНАЛИЗ

Еднофакторния дисперсионен анализ е статистически метод за анализ на

корелационен тип зависимости между едно явление-фактор, представено на

слаба(номинална или ординална) скала, и явление-следствие, представено на

силна(пропорционална или интервална) скала. Процедурата на дисперсионния

анализ представлява проверка на хипотеза за наличие на статистически значима

зависимост между разглежданите явления, основана на F-критерия на Фишер.

Изчисляването на емпиричния F- критерий преминава през следните етапи:

8.1. Измерване на разсейването на резултативната променлива Xij .

8.1.1. Обща девиация на Xij :

2

0 )( XXSS ijijo

където Xij са индивидуалните стойности на резултативната променлива; i са

номера на значенията на факторната променлива; j е номер на единиците от i-та

група; 0X e общата средна.

8.1.2. Междугрупова девиация на Xij :

jjjm nXXSS 2

0)(

където iX е средната аритметична за i-та извадка; ni брой на единиците в i-та

извадка.

8.1.3. Вътрегрупова девиация на Xij :

2)( jijijb XXSS

8.2. Независими оценки на общата дисперсията на Xij .

8.2.1. Междугрупова дисперсия:

1

)(

1

1

2

0

k

nXX

k

SS

k

j

jj

където k е броят на значенията (групите) на факторната променлива.

8.2.2. Вътрегрупова дисперсия:

kn

XX

kn

SS

k

j

n

i

jij

b

в

j

1 1

2)(

където n е обем на извадката.

8.3. Емпирична характеристика на статистическия критерий:

2

2

в

мF

9. РЕГРЕСИОНЕН И КОРЕЛАЦИОНЕН АНАЛИЗ

Регресионният анализ е статистически метод за анализ на зависимости от

корелационен тип когато всички явления, включени в анализа са измерени на

силни скали – пропорционална или интервална. Основната задача на

регресионния анализ е да изведе формата на зависимостта в аналитичен вид и

да я измери количествено с помощта на регресионните коефициенти.

Корелационният анализ е статистически метод за измерване теснотата (силата)

на зависимости от корелационен тип.

Зависимост от корелационен тип е такава зависимост, при която на едно

значение на факторната променлива (Х) съответстват повече от едно значения

на резултативната променлива (У).

9.1. Регресионен модел.

9.1.1. Еднофакторни регресионни модели.

9.1.1.1. Линеен еднофакторен регресионен модел:

Yi = 0 + 1X1 + εi i=1,...,N

където Yi са фактическите (емпиричните) стойности на ендогенната

(резултативна/зависима) променлива; Xi са фактическите (емпиричните)

стойности на екзогенната (факторна/независима) променлива; 0 е параметър на

модела; 1 е регресионен коефициент; εi са случайни отклонения.

9.1.1.2. Нелинейни еднофакторни регресионни модели.

Полиномиален модел:

i

k

iкiii ХXXY ...2

210 i=1,...,N;

Мултипликативен модел:

10 .10

ji XY i i=1,...,N;

Експоненциален модел:

iiX

i eY

10

i=1,...,N;

Логистичен модел:

i

i

iX

Y

10

i=1,...,N.

9.1.2. Многофакторни регресионни модели.

9.1.2.1. Линеен многофакторен регресионен модел:

Yi = 0 + 1X1i + 2X2i + ………+ kXki + εi i=1,...,N;

9.1.2.2. Нелинейни многофакторни регресионни модели:

Мултипликативен модел:

210

21 .10

iii XXY i

i=1,...,N;

Експоненциален модел:

ikikii XXX

i eY

...22110

i=1,...,N.

9.2. Метод на най-малките квадрати.

9.2.1. Функция измерваща разликата между фактическите и получените от

модела значения на зависимата променлива, която се минимизира:

N

i

ii

N

i

i YY1

2

1

2 min)(

9.2.2. Система от нормални уравнения при еднофакторен линеен регресионен

модел:

ΣYi = Nb0 + b1 ΣXi ΣXi Yi = b0 ΣXi + b1 ΣXi

2

където b0 и b1 са оценки на параметрите 0 и 1 ; N брой на единиците в

извадката.

9.2.3. Параметри на еднофакторен линеен регресионен модел:

221)( ii

iiii

XXN

YXYXNb

N

Xa

N

Ya

ii 10

9.3. Измерване на разсейването на резултативната променлива Yi .

9.3.1. Обща девиация на Yi :

2)( YYSS io

където Yi са индивидуалните стойности на резултативната променлива; Y e

средната аритметична.

9.3.2. Обяснена девиация на Yi :

2

1 )( YYSS i

където iY

са теоретичните стойности на Yi , получени от регресионния модел.

9.3.3. Необяснена (остатъчна) девиация на Уj :

2

2 )( ii YYSS

9.4. Независими оценки на общата дисперсията на Уi .

9.4.1. Обяснена дисперсия:

1

)(

1

1

2

12

p

YY

p

SS

N

i

i

Y

където p е броят на факторните променливи в регресионния модел.

9.4.2. Необяснена дисперсия:

pN

YY

pN

SSS

N

i

ii

Y

1

2

22

)(

където N е обем на извадката.

9.5. Стандартна грешка на регресионния модел:

pN

YY

S

N

i

ii

Y

1

2)(

9.6. Стохастични грешки на параметрите на еднофакторен линеен регресионен

модел:

22

2

0

XXN

XS

i

iY

22 1

1

XXS

i

Y

9.7. Коефициент на детерминация, който показва каква част от изменението на

резултативната променлива се обяснява с факторите в модела:

2

2

2

22

2

2

2 1Y

Y

Y

YY

Y

YYX

SSr

9.8. Коефициент на индетерминация:

I = (1-

2

YXr )

9.9. Единични коефициенти на корелация.

9.9.1. Коефициент на корелация на Пирсън (0сновава се на изведения

регресионен модел на зависимостта):

2

2

1Y

YYX

Sr

, 0 ≤ rYX ≤ 1

9.9.2. Коефициент на линейна корелация на Браве. Този коефициент измерва

достоверно силата на зависимост между две явления, когато тя е линейна:

22YYXX

YYXX

N

YYXXr

ii

ii

YX

iiYX

-1 ≤ rYX ≤ 1

9.9.2. Скала на интерпретация на корелационните коефициенти:

При 0 ≤ rYX < 0,3 корелационната зависимост се смята за слаба;

При 0,3 ≤ rYX < 0,5 корелационната зависимост е умерена;

При 0,5 ≤ rYX < 0,7 корелационната зависимост е значителна;

При 0,7 ≤ rYX < 0,9 корелационната зависимост е силна;

При 0,9 ≤ rYX < 1,0 корелационната зависимост е много силна.

9.9.3. Стохастична точност на единичните корелационни коефициенти.

2

1 2

N

rYX

rYX

9.10. Множествени коефициенти на корелация.

9.10.1. Коефициент на множествена корелация:

2

2

...,

...,21

211

Y

XXXy

XXXYk

k

SR

където 2

...,, 21 kXXXYS е необяснената дисперсия на У при приложението на

съответния регресионен модел.

9.10.2. Чисти (частни) коефициенти на корелация:

)1)(1( 22.

323

3232

32

XXYX

XXYXYX

XYX

rr

rrrr

В индекса на коефициента, вляво от точката, се отбелязват явленията,

между които се измерва теснотата на зависимостта (в случая У и Х2 ), а вдясно от

нея – тези, чието влияние е елиминирано (в случая Х3 ). Броят на явленията,

чието влияние е елиминирано, определят порядъка на чистите коефициенти на

корелация.

9.11. Коефициенти на автокорелация.

N

pt

N

pt

tt

pN

t

pN

t

tt

N

pt

t

pN

t

t

N

pt

ptt

YY

YpN

YYpN

Y

YYpN

YY

rptt

1 1

22

1 1

2

)

2

111

)(1

.)(1

1

където Yt е стойността на У в t-ия период; Yt-p е стойността на У в (t-р)-ия период;

p порядък на автокорелационния коефициент.

9.12. Критерии за наличие на автокорелация в остатъчните елементи около

регресионната линия.

9.12.1. Критерий на Нойман:

NNK

N

i

i

N

i

ii

1

2

2

2

1

:1

където εi са случайни остатъци в i-ия период; където εi-1 са случайни остатъци в (i-

1)-ия период.

9.12.2. Критерий на Дърбин – Уотсън:

N

i

i

N

i

ii

d

1

2

2

2

1

10. СТАТИСТИЧЕСКО ИЗУЧАВАНЕ НА РАЗВИТИЕ

10.1. Елементарни статистически показатели за развитие.

10.1.1. Общ абсолютен обем:

N

N

t

t YYYY

.....21

1

където Yt е абсолютния обем на явлението в t–ия период (момент); N е броя на

наблюдаваните периоди (моменти).

10.1.2. Среден абсолютен обем.

10.1.2.1. При периодни динамични редове.

непретеглен метод – когато периодите на наблюдение са с еднаква

дължина:

N

Y

Y

N

t

t 1

претеглен метод – когато периодите на наблюдение са с различна

дължина:

N

i

i

N

i

ii

t

tY

Y

1

1

10.1.2.1. При моментни динамични редове.

непретеглен метод – когато моментите на наблюдение отстоят на

еднакво разстояние във времето:

1

2........

212

1

N

YYY

Y

Y

N

N

претеглен метод – когато моментите на наблюдение отстоят на

различно разстояние във времето:

1

1

2

1

1

1

2N

i

i

N

i

ii

N

i

ii

t

tYtY

Y

10.1.3. Абсолютен прираст.

10.1.3.1. При постоянна основа:

ΔYt/1 = Yt – Y1

където първият наблюдаван период е приет за основа.

10.1.3.2. При верижна основа:

ΔYt/t-1 = Yt – Yt-1

10.1.4. Среден абсолютен прираст:

11

......... 11/2/31/2

N

YY

N

YYYY NNN

10.1.5. Темпове на растеж (индекси на динамика).

10.1.5.1. При постоянна основа:

1

21/2

Y

; 1

3

1/3Y

; ………… 1

1/Y

YТ N

N

където първият наблюдаван период е приет за основа.

10.1.5.2. При верижна основа:

1

21/2

Y

; 2

3

2/3Y

; ..................... 1

1/

N

NNN

Y

10.1.5.3. Връзка между темповете при постоянна и верижна основа:

112

1

3

4

2

3

1

2 *..........**Y

Y

Y

Y

Y

Y

Y

Y

Y

Y

Y

Y N

N

N

N

N

11

1

1

:

t

ttt

Y

Y

Y

Y

Y

Y

10.1.6. Темпове на прираст:

11

1/ Y

Yd t

t

или

11

1/

t

ttt

Y

Yd

10.1.7. Средногеомтричен темп на разтеж:

1

1

11/

11/3/42/31/2 ........ N

NNN

NNN

Y

YTTTTTT

10.2. Верижни (плъзгащи се) средни.

10.2.1. При нечетен брой елементи на усредняваната величина.

3-членни верижни средни:

3

321

2

YYYY

;

3

432

3

YYYY

; .........................

3

12

1

NNNN

YYYY

5-членни верижни средни:

5

54321

3

YYYYYY

,

5

65432

4

YYYYYY

………………………….

5

1234

2

NNNNNN

YYYYYY

10.2.2. При нечетен брой елементи на усредняваната величина (центрирани

верижни средни).

4-членни верижни средни:

4

22

5

4321

3

YYYY

Y

Y

,

4

22

6

5432

4

YYYY

Y

Y

,

…………………………

4

22123

4

2

N

NNN

N

N

YYYY

Y

Y

10.3. Аналитичен метод за изследване на тренда (основната тенденция) на

развитие.

Трендът изразява основната закономерност в развитието на изследваното

явление. Графичното му изображение преставлява плавна линия (права,

парабола, хипербола и др.), минаваща възможно най-близко до всички емпирични

стойности на У. Аналитично трендът се описва чрез подходяща функция на

времето (t), т.е. Ŷt = f(t). Задачата на анализа се свежда до това, да се установи

вида на функцията f, чрез която ще се осъществи най-добро описание на

съдържащата се в даден временен ред тендеция на развитие и да се оценят

нейните параметри.

10.3.1. Линеен трендови модел:

Ŷi = ao + a1ti ,

където Ŷi са теоретичните (изгладени) стойности на явлението в i-ия период; ti е

поредния номер на i-ия период; ao и a1 са параметри модела.

Случайни отклонения в модела:

εi = Yi – Ŷi

където Yi е абсолютния обем на явлението в i-ия период.

Система от нормални уравнения:

ii taNaY 10

2

10 iiii tataYt

10.3.2. Експоненциален трендови модел.

Общ вид на модела:

ita

i AY 010

Трансформиран вид на модела:

lg Ŷi = a0 + a1 ti ,

където a1 = lgA.

10.3.3. Двойнологаритмичен модел.

Общ вид на модела:

1010a

i

a

i tY

Трансформиран вид на модела:

lg Ŷi = a0 + a1 lgti

10.3.4. Полином от 2-ра степен:

Общ вид:

Ŷi = a0 + a1ti + a2ti2 .

Система от нормални уравнения:

ΣYi = Na0 + a1Σti + a2Σti2

Σti Yi = a0Σti + a1Σti2 + a2Σti

3

Σti2 Yi = a0Σti

2 + a1Σti3 + a2Σti

4

10.5. Стандартна грешка на трендовия модел:

NN

YYS

iii

Y

22

10.6. Екстраполационна прогноза въз основа на трендови модел.

Прогноза за развитието на явлението;

Y*N+l = a0 + a1 tN+l

където Y*N+l е очаквана стойност за Y в (N+l)-тия период; l – хоризонт на

прогнозата, т.е. отдалеченост на периода, за който се разработва прогнозата по

отношение на последната година от базисния период.

Стохастична грешка на прогнозата:

N

i

i

lN

Yпр

tt

tt

NS

1

2

2

)(

)(11

10.7. Статистическо изучаване на сезонни колебания.

Сезонни колебания са периодично повтарящите се вътрешногодишни

колебания с еднаква амплитуда по едноименни подпериоди, които са

предизвикани от стопанските и климатичните особености на годишните времена

или на различните месеци в годината.

10.7.1. Метод на простите средни.

10.7.1.1. Абсолютни сезонни колобения:

YYD jj за j=1,..., k

където jY е средния абсолютен обем на явлението за j-ия подпериод; Y е

средния абсолютен обем на явлението за целия изследван период; k е броя на

подпериодите в целия изследван период.

10.7.1.2. Индекси за сезонни колобения:

Y

YI

j

j за j=1,..., k

10.7.2. Метод на отношенията на фактическите към изгладениете стойности.

10.7.2.1. Отношения на фактическите към изгладениете стойности на явлението Y

.

11

11'

11Y

YS

, 12

12'

12Y

YS

, ………, nk

nknk

Y

YS '

където Ŷij са изгладените стойности на Yij за j-тия подпериод на i-тата година по

метода на 12-членните центрирани верижни средни; i = 1,...,n и j = 1,...,k; при

работа с месечни данни к = 12, а при тримесечни данни - к = 4.

10.7.2.2. Осреднени отношения на фактическите към изгладениете стойности:

n

i

iSn

S1

'

1

'

1

1

,

n

i

iSn

S1

'

2

'

2

1

,……………,

n

i

ikk Sn

S1

'' 1

10.7.2.3. Индекси за сезонни колебания

k

j

j

j

j

Sk

SI

1

'

'

1

за j = 1,...,k.

11. ИНДЕКСИ НА ДИНАМИКА И ИНДЕКСЕН ФАКТОРЕН АНАЛИЗ

11.1. Единични индекси на динамика.

11.1.1. Индекс на равнище.

при единични явления:

0

1

x

xix

където x0 е равнище на явлението в базисния период; x1 е равнище на явлението

в индексирания период.

при еднородни съвкупности:

0

00

1

11

0

1 :y

yx

y

yx

x

xix

където y0 е обем на явлението в базисния период; y1 е обем на явлението в

индексирания период.

11.1.2. Индекс на обем.

при единични явления:

0

1

y

yiy

при еднородни съвкупности:

0

1

y

yiy

11.2. Множествени индекси на динамика.

11.2.1. Индекс на маса.

00

11

0

1

xy

xy

S

SI s

където S0 е обем на изследваното сложно съставно явление през базисния

период; S1 е обем на изследваното сложно съставно явление през индексирания

период.

11.2.2. Индекс на обем.

00

01

)( 0 xy

xyI xv

11.2.3. Индекс на равнище.

Индекс на Пааше:

10

11)( 1 yx

yxI vx

Индекс на Ласпер:

00

01

)( 0 yx

yxI yx

11.2.4. Връзка между индекса на маса, индекса на обем и индекса на равнище:

)()( 10 yxxyS III

11.3. Индексен факторен анализ при зависимост от типа S = xy.

11.3.1. Мултипликативно разлагане:

xyS IIxy

xy

S

SI

00

11

0

1

,

където Iy е индекса на екстензивния фактор; Ix е индекса на интензивния фактор.

11.3.2. Адитивно разлагане:

xy

S

yx

S

xy

SS )()( 00

където )( 0xy

S е прираст, дължащ се само на изменението в обема на изучаваната

съвкупност (екстензивен фактор), при неизменно равнище на съответния

качествен признак (интензивния фактор); )( 0yx

S е прираст, дължащ се само на

изменеие в равнището на изучавания качествен признак, но при неизменен обем

на изследваната съвкупност; xy

S е прираст, дължащ се на съвместното действие

на двата фактора.

11.4. Индексен факторен анализ при зависимост от типа yxS

11.4.1. Мултипликативно разлагане:

str

S

yx

SyS IIII)( 0

където yI е относителното изменение в явлението S, настъпило само в резултат

на промени в обема на изучаваната съвкупност; )( 0yx

SI е факторен субиндекс,

който измерва относителното изменеие в явлението S, дължащо се само на

изменения в индивидуалните равнища на х по подсъвкупности; str

SI е факторен

субиндекс, който да измерва относителното изменение в явлението S, дължащо

се на настъпили структурни промени в у през индексирания период в сравнение с

базисния, във връзка с различните равнища на х през индексирания период.

11.4.2. Адитивно разлагане:

yx

S

str

S

yx

S

xy

SS )()( 00

където )( 0xy

S е прираст, дължащ се на промени само в обема на изучаваната

съвкупност, при неизменно средно равнище на съответния качествен признак;

)( 0уx

S е прираст, дължащ се само на настъпили промени в средното равнище на

изучавания качествен признак; ΔSstr е абсолютният прираст на S, формиран под

въздействието на структурни изменения; yx

S е частта от абсолютния прираст на

явлението S, дължаща се на съвместното влияние на двата фактора.

11.5. Индексен факторен анализ при зависимост от типа S = Σ xy

11.5.1. Мултипликативно разлагане:

stryxxyS IIII ..00

където 0xyI е индекс на обем, изразяващ настъпилото относително изменение в

явлението S, дължащо се само на промени в обема на изучаваната съвкупност;

0yxI е индекс на равнище, изчислен по формулата на Ласпер, изразяващ

настъпилото относително изменение в явлението S, дължащо се само на

промени в значенията на изучавания качествен признак; strI е индекс на

структура, който се изчислява като отношение между индекса на равнище,

установен по формулата на Пааше, и този, установен по формулата на Ласпер.

11.5.2. Адитивно разлагане:

xy

S

str

S

yx

S

xy

SS )()( 00

където )( 0xy

S е прираст на сложното съставно явление S, предопределен от

промени в обема на изучаваната съвкупност; )( 0ух

S е прираст в сложното съставно явление S, дължащ се само на изменение в индивидуалните равнища на

изучавания качествен признак; str

S е прираст, дължащ се само на структурни

промени в обема на изучаваната съвкупност; ху

S е прираст, дължащ се само на съвместното влияние на двата фактора.

top related