spis treści - mif.pg.gda.pl · przemawiającym na korzyść surowców rolnych są rosnące...

44
Spis treści 1 Wstęp (Edyta Koziara, Iwona Lorenz) 4 1.1 Przedstawienie aktywów ................................. 5 2 Analiza danych (Iwona Lorenz) 9 2.1 Charakterystyki liczbowe ................................ 11 2.2 Testy normalności .................................... 13 3 Miary ryzyka 15 3.1 Koherentne miary ryzyka (Edyta Koziara) ....................... 15 3.2 Value-at-Risk (Edyta Koziara) ............................. 16 3.3 Expected Shortfall (Iwona Lorenz) ........................... 17 4 Modelowanie rozkladów dwuwymiarowych 21 4.1 Test Mardia (Edyta Koziara) .............................. 21 4.2 Estymacja gęstości (Edyta Koziara) .......................... 22 4.3 Kopuly (Iwona Lorenz) ................................. 24 4.3.1 Podstawowy podzial kopul ........................... 24 4.4 Inwestycja lączna (Edyta Koziara) ........................... 28 4.5 Porównanie inwestycji (Iwona Lorenz) ......................... 29 5 Podsumowanie (Edyta Koziara, Iwona Lorenz) 31 Zalączniki 32 Dodatek A ........................................... 32 Dodatek B ........................................... 36 Dodatek C ........................................... 45 Wykaz literatury 46 3

Upload: doandien

Post on 27-Feb-2019

219 views

Category:

Documents


0 download

TRANSCRIPT

Spis treści

1 Wstęp (Edyta Koziara, Iwona Lorenz) 4

1.1 Przedstawienie aktywów . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Analiza danych (Iwona Lorenz) 9

2.1 Charakterystyki liczbowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2 Testy normalności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3 Miary ryzyka 15

3.1 Koherentne miary ryzyka (Edyta Koziara) . . . . . . . . . . . . . . . . . . . . . . . 15

3.2 Value-at-Risk (Edyta Koziara) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.3 Expected Shortfall (Iwona Lorenz) . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

4 Modelowanie rozkładów dwuwymiarowych 21

4.1 Test Mardia (Edyta Koziara) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

4.2 Estymacja gęstości (Edyta Koziara) . . . . . . . . . . . . . . . . . . . . . . . . . . 22

4.3 Kopuły (Iwona Lorenz) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4.3.1 Podstawowy podział kopuł . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

4.4 Inwestycja łączna (Edyta Koziara) . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

4.5 Porównanie inwestycji (Iwona Lorenz) . . . . . . . . . . . . . . . . . . . . . . . . . 29

5 Podsumowanie (Edyta Koziara, Iwona Lorenz) 31

Załączniki 32

Dodatek A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

Dodatek B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

Dodatek C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

Wykaz literatury 46

3

1 Wstęp

Praca przedstawia ocenę ryzyka straty inwestycji w akcje dwóch wybranych aktywów. Prze-

analizowane zostały różne portfele inwestycyjne (jednoskładnikowe oraz złożone) w łącznej kwocie

1 mln dolarów na okres jednego miesiąca. Do oszacowania potrzebnych zabezpieczeń finansowych

posłużono się wybranymi miarami ryzyka, Value at Risk oraz Expected Shortfall. Praca złożona

jest z 5 rozdziałów.

Pierwszy rozdział zawiera wstęp oraz podstawowe wiadomości dotyczące aktywów: pszenicy

oraz soi. Ponadto w tym rozdziale przedstawione zostały historyczne notowania na otwarcie i

zamknięcie miesiąca z ostatnich 5 lat, razem 61 obserwacji.

W rozdziale drugim napisanym przez Iwonę Lorenz znajdują się dane, wartości stóp strat

wyliczone na podstawie wszystkich obserwacji. Przedstawiona została także statystyczna analiza

danych oraz test na normalność rozkładu stóp strat.

W trzecim rozdziale, wprowadzona została teoria miar ryzyka. W podrozdziale 3.1 oraz

3.2 napisanym przez Edytę Koziarę wyróżniono koherentność miary oraz opis i interpretację war-

tości zagrożonej ryzykiem. Kolejny podrozdział zawierający omówienie i interpretację uśrednionej

wartości zagrożonej napisała Iwona Lorenz.

Rozdział czwarty zawiera badanie dwuwymiarowego rozkładu, niezbędnego przy analizie

dwuskładnikowego portfela inwestycyjnego. Pierwsze dwa podrozdziały napisane przez Edytę Ko-

ziarę przedstawiają test Mardia oraz estymację gęstości. W kolejnym podrozdziale napisanym przez

Iwonę Lorenz umieszczona została koncepcja funkcji kopuły oraz równania i wykresy wybranych

kopuł archimedejskich i eliptycznych. Na podstawie wyestymowanych danych otrzymano parametry

kopuł, decydujące o najlepiej dopasowanej funkcji do danych. Podrozdział omawiający dywersyfi-

kacje portfela łącznego napisała Edyta Koziara. Podsumowanie rozdziału zawierające porównanie

inwestycji jednoskładnikowej z dwuskładnikową, napisała Iwona Lorenz. Do oszacowania ryzyka

inwestycji złożonej posłużono się wybraną wcześniej kopułą. Jest to najważniejsza część pracy, w

której podsumowano i porównano różne portfele, dla których przeanalizowano wysokości rezerw

koniecznych do zabezpieczenia inwestycji.

Na końcu pracy umieszczono Załączniki. W Dodatku A przedstawione są dodatkowe de-

finicje, wzory oraz przeprowadzone dowody. W Dodatku B zawarty jest kod do programu SAS

9.3, dzięki któremu wygenerowano wykresy oraz wartości użyte w pracy. W ostatnim Dodatku C

załączono tablicę kwantyli rozkładu normalnego.

Abstract

This thesis evaluated the risk of loss of investment in the shares of the two selected assets.

Different investment portfolios (one-and complex) were analyzed for a period of one month. I took

the total amount 1 million U.S. dollars. To estimate the necessary financial security was used

to selected risk measures, Value at Risk and Expected Shortfall. The BA thesis consists of five

chapters.

The first chapter contains an introduction and basic information concerning the assets

of wheat and soybeans. In addition, this chapter presents the historical stock quotes for for the

opening and closing of the month in the last five years. It included 61 observations.

The second section contains data, the feet losses calculated on the based on all observations.

Also presents the a statistical analysis of the data and test for normality of distribution losses feet.

Iwona Lorenz did it.

4

In the third chapter, was introduced the theory of risk measures. In subsection 3.1 and

3.2 written by Edyta Koziara, distinguished coherence in the measurement and description and

interpretation of value at risk. The next section contains a discussion and interpretation of averaged

value at risk. That wrote Iwona Lorenz.

The fourth chapter presents the study of two-dimensional distribution, which is necessary in

the analysis of two-component of the investment portfolio. The first two sections written by Edyta

Koziara present Mardia test and density estimation. In the next section written by Iwona Lorenz

was placed in the dome of the concept of functions and equations and graphs of selected archimedes’

and elliptical domes.Based on assessment data, the parameters of the domes, determining the best-

fit function to the data. Subsection discusses the joint portfolio diversification wrote Edyta Koziara.

Summary of Chapter containing a comparison of investment mono-component. Iwona Lo-

renz wrote it. To estimate the risk of the investment complex was used previously selected dome.

This is the most important part of the thesis, which summarizes and compares the different port-

folios, which were analyzed for the amount of reserves necessary to protect your investment.

On the end placed Attachments. Appendix A shows the additional definitions, formulas,

and carried out the evidence. In Appendix B is contained code to the SAS 9.3 by which the

generated charts and the values used in the work. In the last Appendix C attached array quantile

of the normal distribution.

1.1 Przedstawienie aktywów

Każda inwestycja powiązana jest ściśle z ryzykiem, bez względu na to czy dotyczy ona dzia-

łalności gospodarczej, zakupu towaru, czy inwestycji na rynku finansowym. Samo pojęcie ryzyka

oznacza zagrożenie osiągnięcia określonych planów, spotykane przy podejmowaniu codziennych de-

cyzji. Szacujemy wówczas prawdopodobieństwo zdarzeń za pomocą rozsądku, doświadczenia czy

też rachunku prawdopodobieństwa. W naszej pracy przedstawimy ryzyko inwestycji, będące mie-

rzalną niepewnością. Wyliczone rezerwy określone na podstawie miar ryzyka wykorzystamy do

oszacowanie potrzebnych zabezpieczeń przed stratną inwestycją.

Analizując wspomniane ryzyko skupimy się na dwóch zbożach pszenicy oraz soi. Są to

najpowszechniejsze rośliny odpowiednio wśród zbóż i roślin oleistych. Zboża te są istotnymi skład-

nikami paszy i stanowią wartościową część pożywienia dla człowieka.

Soja to roślina jednoroczna należąca do rodziny bobowatych. Pochodzi z południowo-

wschodniej Azji. Jest jedną z najbardziej popularnych roślin oleistych w handlu. Stanowi cenny

pokarm dla człowieka i jest ważnym surowcem do produkcji pasz (jej nasiona zawierają 25% tłusz-

czu i 50% białka). Na bazie jej nasion wytwarza się m.in. olej, mączkę, kaszę oraz mleko sojowe.

Preparaty z soi podnoszą wartości odżywcze pokarmów, dodawane są do przetworów, m.in. kon-

serw mięsnych, wędlin. Wyhodowanie dużej liczby odmian soi umożliwiło jej uprawę we wszystkich

klimatach. Obecnie największe uprawy znajdują się na obszarach o klimacie umiarkowanym cie-

płym. Prawie 1/3 światowej produkcji soi podlega eksportowi. Do największych eksporterów należą:

Brazylia, Stany Zjednoczone, kraje Ameryki Południowej, Paragwaj, Kanada i Ukraina, a do naj-

większych importerów: Chiny, kraje Europy, Japonia oraz Australia. Na wartości notowań soi na

giełdzie znaczący wpływ mają etapy rozwoju rośliny.

5

Pszenica jest jednym z najstarszych zbóż. Uprawia się ją od co najmniej 6 tysięcy lat.

Pochodzi z południowo-zachodniej i środkowej Azji. Uprawiana jest przede wszystkim w strefach

klimatu umiarkowanego i podzwrotnikowego (wymaga okresu wegetacyjnego powyżej 100 dni). Na

świecie zajmuje pierwsze miejsce w strukturze zasiewów z powierzchnią 220 mln hektarów. Tak

jak i soja, stanowi cenny pokarm dla człowieka. Z pszenicy produkuje się najlepsze gatunki mąk,

które służą do wyrobu chleba, makaronów oraz produktów cukierniczych. Spożycie globalne wynosi

około 70 kg na osobę rocznie. Na świecie zbiera się około 690 mln ton ziaren pszenicy rocznie, co

daje jej trzecie miejsce po ryżu i kukurydzy. Średnio 20% światowej produkcji jest przedmiotem

międzynarodowego handlu. Do czołowych producentów tego zboża zaliczamy: Chiny, Indie, Rosję,

Francję, Australię i Kanadę, do czołowych eksporterów: Stany Zjednoczone, Kanadę, Francję, Au-

stralię i Argentynę, natomiast do czołowych importerów: Rosję, Chiny, Japonię, Egipt, Brazylię i

Włochy.

Dlaczego akurat surowce rolne?

Bardzo dobrą odpowiedź na to pytanie udzielił Biznes.pl1:„Obrót surowcami rolnymi skupia uwagę

inwestorów na całym świecie. Jedną z przyczyn tego zainteresowania jest stosunkowo niska korelacja

rynku z rynkiem obrotu akcjami. Dodatkowo rynek surowców rolnych charakteryzuje bardzo duża

zmienność – ceny poszczególnych towarów rządzą się własnymi prawami, podlegając jednocześnie

wypadkowym specyficznym dla tego sektora. Nie są tu rzadkością na przykład kilkuprocentowe

wzrosty cen w skali dnia, które poprzedzone znacznymi spadkami w okresie miesiąca, generują kil-

kunastoprocentowe zyski w ujęciu kwartalnym czy półrocznym. Niekwestionowanym argumentem

przemawiającym na korzyść surowców rolnych są rosnące potrzeby konsumpcyjne przy jednocześnie

trudnej do zwiększenia w wielu przypadkach podaży, która mimo rosnącej efektywności produkcji,

ograniczana jest wieloma czynnikami o charakterze lokalnym i globalnym. Na wskaźniki popytu

wyraźnie oddziaływują obecnie państwa wschodzące, które przeobrażając się generują znaczne za-

potrzebowanie w zakresie artykułów żywnościowych czy pasz. Z drugiej strony podaż ograniczana

jest w wyniku kurczenia się areału upraw, rekalibrowania produkcji czy wreszcie np. na skutek

decyzji politycznych, jak wstrzymanie eksportu. Ogromny wpływ posiada tu także niemożliwa do

przewidzenia zmienna, czyli pogoda. Powodzie, susze, stopniowa zmiana klimatu czy gwałtowne

zjawiska pogodowe w oczywisty sposób wpływają na lokalne i światowe poziomy cen surowców

rolnych.”

1Czy rynek surowców rolnych to efektywna alternatywa?, artykuł internetowy [1]

6

Poniżej zaprezentujemy wykresy notowań opisanych surowców z ostatnich 5 lat.

Rysunek 1: Wykres notowań soi z lat 2009-2014

Rysunek 2: Wykres notowań pszenicy z lat 2009-2014

Na pierwszy rzut oka widać, że ceny obydwu surowców rosną i maleją w tych samych okresach.

Wynika to ze wspomnianej wcześniej zmienności pogody i decyzji politycznych. Dokładniej

będzie można to zauważyć na wykresie łącznym. Kolorem niebieskim oznaczone są notowania dla

soi a kolorem różowym dla pszenicy.

Rysunek 3: Łączny wykres notowań soi (niebieski) i pszenicy (różowy) z lat 2009-2014

7

Rysunek 3 pokazuje, iż notowania soi jak i pszenicy w tych samych momentach spadają a za

chwilę gwałtownie rosną. Mimo to trudno jest przewidzieć ceny tych surowców w najbliższym

czasie. Niełatwo zatem na podstawie takich danych stwierdzić, która inwestycja (w soję czy

pszenicę) jest mniej ryzykowna. W tym celu wylicza się historyczne stopy strat, które mówią o

wielkości poniesionych strat na przestrzeni kolejnych miesięcy.

8

2 Analiza danych

Dane jakie analizujemy to ceny poszczególnych zbóż (cent/buszel) z okresu 01.01.2009-

31.01.2014 roku pozyskane z oficjalnej strony internetowej stooq.com. Bierzemy pod uwagę wartości

notowań na otwarciu i na zamknięciu w poszczególnych miesiącach. Stopy strat wyliczamy na

podstawie wzoru:

L =Wo −Wz

Wo(2.1)

gdzie:

Wo-wartość notowania początkowego,

Wz-wartość notowania końcowego.

Wszystkie dane zostały zaprezentowane w Tablicy 1 i 2.

Tablica 1: Notowania na giełdzie

Data Pszenica Soja

Rok Miesiąc Otwarcie Zamknięcie Stopy strat Otwarcie Zamknięcie Stopy strat

2014 styczeń 602.88 555 0.07942 1288.88 1283.88 0.00388

2013

grudzień 669.12 605.12 0.09565 1337.62 1289.38 0.03606listopad 667.62 668.25 -0.00094 1266.12 1337 -0.05598październik 678.12 667.38 0.01583 1277.88 1265.62 0.00959wrzesień 662.62 679.12 -0.02490 1396.62 1281.38 0.08251sierpień 663.25 654.88 0.01262 1247.75 1356.38 -0.08706lipiec 655.5 663.62 -0.01239 1427.12 1247.25 0.12604czerwiec 707.88 656.88 0.07205 1509.62 1429.38 0.05315maj 731.38 706.62 0.03385 1396.62 1510.12 -0.08127kwiecień 682.88 730.25 -0.06937 1402.5 1396.5 0.00428marzec 716.38 688.25 0.03927 1452.88 1404.38 0.03338luty 780.25 716.12 0.08219 1470 1451.62 0.01250styczeń 786.62 780.5 0.00778 1433 1471.12 -0.02660

2012

grudzień 869.38 778.5 0.10453 1444 1409.88 0.02363listopad 867.38 863.5 0.00447 1552.38 1440.62 0.07199październik 901 867.25 0.03746 1596.75 1552.25 0.02787wrzesień 892.12 899.38 -0.00814 1773.62 1598.38 0.09881sierpień 889.75 888.63 0.00126 1657.88 1754.37 -0.05820lipiec 764.75 890.88 -0.16493 1495.62 1653.5 -0.10556czerwiec 646.25 758.88 -0.17428 1344.25 1480.88 -0.10164maj 654.38 644.13 0.01566 1503.38 1340.75 0.10818kwiecień 662.12 655.13 0.01056 1406.62 1505 -0.06994marzec 665.75 658.88 0.01032 1319.13 1401.88 -0.06273luty 666.75 667.88 -0.00169 1202.38 1319.12 -0.09709styczeń 666.38 666.62 -0.00036 1236.5 1200.38 0.02921

9

Tablica 2: Notowania na giełdzie

Data Pszenica Soja

Rok Miesiąc Otwarcie Zamknięcie Stopy strat Otwarcie Zamknięcie Stopy strat

2011

grudzień 614.88 653.12 -0.06219 1134.25 1211.88 -0.06844listopad 629.62 615.75 0.02203 1215.62 1134.12 0.06704październik 608.62 630.12 -0.03533 1176.38 1219.62 -0.03676wrzesień 788.38 606.88 0.23022 1455.12 1176.62 0.19139sierpień 671.12 789.88 -0.17696 1350.12 1456.12 -0.07851lipiec 615.75 672.5 -0.09216 1309 1346.38 -0.02856czerwiec 767.75 614.25 0.19994 1371.5 1300.5 0.05177maj 809.25 780.25 0.03584 1392 1377.25 0.01060kwiecień 761.75 804 -0.05546 1405 1394.75 0.00730marzec 818 762.5 0.06785 1372.5 1406 -0.02441luty 840 816.25 0.02827 1423.5 1365.75 0.04057styczeń 816 840 -0.02941 1407.25 1411.75 -0.00320

2010

grudzień 717.5 791.25 -0.10279 1265.25 1402.75 -0.10867listopad 721.5 689.25 0.04470 1234.75 1245.75 -0.00891październik 669 715.5 -0.06951 1098.75 1232 -0.12127wrzesień 698.75 674.75 0.03435 1013 1102.25 -0.08810sierpień 688.5 684.25 0.00617 1021 1006.75 0.01396lipiec 481.25 660.25 -0.37195 904 1005 -0.11173czerwiec 454.5 482 -0.06051 936.4 902 0.03674maj 505.75 457.75 0.09491 997 937.75 0.05943kwiecień 452.5 504.5 -0.11492 944 999.5 -0.05879marzec 517 450.5 0.12863 955.25 939.75 0.01623luty 474.5 519.25 -0.09431 915 961.75 -0.05109styczeń 554.5 472.75 0.14743 1065.75 914.75 0.14168

2009

grudzień 590 540.25 0.08432 1068.4 1048.25 0.01886listopad 497 585.4 -0.17787 984 1060.4 -0.07764październik 450 493.4 -0.09644 925 976.4 -0.05557wrzesień 491.4 456.4 0.07122 983 927 0.05697sierpień 542 499 0.07934 1032 979.4 0.05097lipiec 540 528 0.02222 1000 982 0.01800czerwiec 656 545 0.16921 1202 981 0.18386maj 541 636.4 -0.17634 1055 1184 -0.12227kwiecień 528 537 -0.01704 956 1055 -0.10356marzec 510.4 532 -0.04232 851 952 -0.11868luty 559 520 0.06977 970 872 0.10103styczeń 602 567 0.05814 970 980 -0.01031

W związku, ze wzorem (2.1) ujemne stopy strat są zyskami, zaś dodatnie - stratami. W

przypadku obu surowców kolorem czerwonym zostały oznaczone 3 największe straty a kolorem

niebieskim największe zyski.

10

2.1 Charakterystyki liczbowe

Oceniając ryzyko inwestycji warto przeprowadzić analizę zebranych danych. Zaczniemy od

wyznaczenia charakterystyk liczbowych wyznaczonych na podstawie danych statystycznych oraz

od przeanalizowania rozkładu. Poniżej przedstawiamy podstawowe definicje opracowane na pod-

stawie pozycji [6] umieszczonej w Wykazie literatury.

”Punktem wyjścia badania statystycznego cechy X jest wylosowanie z całej populacji pewnej

skończonej liczby n elementów. Uzyskane w ten sposób wartości x1, x2, ..., xn są zaobserwowanymi

wartościami n-elementowej próby o rozkładzie X.

Do najważniejszych form wnioskowania statystycznego należą:

• estymacja (ocena) nieznanych parametrów bądź ich funkcji. Parametry te charakteryzują roz-

kład badanej cechy populacji,

• weryfikacja (badanie prawdziwości) postawionych hipotez statystycznych.

Wnioskowanie statystyczne dostarcza jedynie wniosków wiarygodnych - a nie absolutnie prawdzi-

wych. Dowolne dwie n-elementowe próbki z tej samej populacji są na ogół różne. Wygodnie jest

traktować ciąg x1, x2, ..., xn jako realizację ciągu X1, X2, ..., Xn, gdzie Xi, i=1,2,...,n jest ciągiem

niezależnych zmiennych losowych. Ciąg tych zmiennych losowych X1, X2, ..., Xn będziemy nazywali

n-elementową próbą losową. Ciąg liczb x1, x2, ..., xn będziemy nazywali zaobserwowaną próbą lo-

sową, bądź po prostu próbką.” [6]

Definicja 2.1.1. Estymator wartości oczekiwanej [6]

Estymatorem wartości oczekiwanej µ = E(X), inaczej średnią z próby x1, ...xn nazywamy liczbę x

określoną wzorem:

µ = x = 1n

n∑i=1

xi.

Definicja 2.1.2. Estymator mediany

Miedianą nazywamy kwantyl rzędu 12 , co oznaczamy q0.5(F ).

Zachodzi równość:

q0.5(F ) = me,

gdzie me jest medianą próbki.

Uzupełnienie znajduje się w Dodatku A.1. i A.2.

Definicja 2.1.3. Estymator odchylenia standardowego i wariancji

Estymatory miar rozproszenia wyrażają się wzorami:

a) wariancja:

σ2 = 1n−1

n∑i=1

(xi − x)2,

b) odchylenie standardowe:

σ =√σ2 =

√1

n−1

n∑i=1

(xi − x)2.

Odchylenie standardowe mówi, jak rozlegle rozrzucone są wartości wokół średniej.

11

Definicja 2.1.4. Estymator skośności

Estymator skośności wyraża się wzorem:

A = M3σ3 =

1n

n∑i=1

(xi−x)3

σ3 ,

gdzie:

M3-trzeci moment centralny [Dodatek A.6],

σ-odchylenie standardowe.

Ujemna wartość skośności wskazuje na lewostronną asymetrię (wydłużone lewe ramię rozkładu),

dodatnia na prawostronną (wydłużone prawe ramię rozkładu), natomiast skośność równa zeru

oznacza rozkład symetryczny.

Definicja 2.1.5. Estymator kurtozy

Estymator kurtozy wyraża się wzorem:

K = M4σ4 − 3 =

1n

n∑i=1

(xi−x)4

σ4 − 3,

gdzie:

M4-czwarty moment centralny,

σ-odchylenie standardowe.

Im większa kurtoza, tym bardziej dane skupiają się wokół średniej. Jeśli jej wartość jest ujemna

to dane są bardziej skoncentrowane niż przy rozkładzie normalnym, a jeśli dodatnia to odwrotnie.

Gdy kurtoza wynosi zero, spłaszczenie rozkładu jest podobne do spłaszczenia rozkładu

normalnego.

Po zdefiniowaniu charakterystyk liczbowych przejdźmy do omówienia poszczególnych war-

tości dla stóp strat pszenicy i soi uzyskanych w wyniku działania programu SAS 9.3.

Tablica 3: Wyestymowane charakterystyki liczbowe dla pszenicy

Momenty

N 61 Suma wag 61Średnia -0.0002295 Mediana 0.01Odchylenie std. 0.10124844 Wariancja 0.01025125Skośność -0.7755391 Kurtoza 2.25383341

Tablica 3 prezentuje wyestymowane wartości dla pszenicy. Średnia arytmetyczna jest ujemna, co

wskazuje, że średnio z inwestycji w to zboże osiągamy nieznaczne zyski. Odchylenie standardowe

jest bliskie zeru, zatem dane nie odstają daleko od średniej. Mediana ma również wartość nie-

znacznie różną od zera, co oznacza, że zysków i strat jest mniej więcej po równo. Ujemna skośność

świadczy o lewostronnej asymetrii (czyli dłuższym lewym ogonie). Dodatnia kurtoza mówi o więk-

szej smukłości rozkładu danych próbki pszenicy niż w przypadku rozkładu normalnego.

12

Tablica 4: Wyestymowane charakterystyki liczbowe dla soi

Momenty

N 61 Suma wag 61Średnia -0.0038689 Mediana 0.004Odchylenie std. 0.07690589 Wariancja 0.00591452Skośność 0.40859525 Kurtoza -0.2697633

Tablica 4 prezentuje oszacowane wartości dla soi. Średnia arytmetyczna również jest ujemna,

co wskazuje, że średnio z inwestycji osiągamy zyski. Odchylenie standardowe jest bliskie zeru, zatem

dane nie odstają daleko od średniej. Mediana ma wartość nieznacznie różną od zera, co oznacza,

że zysków i strat jest mniej więcej po równo, tak jak i w przypadku pszenicy. Dodatnia skośność

świadczy o dłuższym prawym ogonie. Bliska zeru kurtoza sugeruje zbliżenie danych do rozkładu

normalnego.

Histogramy (najbardziej popularne wykresy statystyczne) potwierdzają liczbowe wartości

statystyk.

Rysunek 4: Histogramy dla zmiennej L1 (pszenica) i zmiennej L2 (soja)

Jak łatwo zauważyć na Rysynku 4 histogramy dla obu aktywów wyglądają inaczej. W przy-

padku zmiennej L1 wartość skośności była ujemna, zatem widoczna jest asymetria lewostronna,

natomiast w przypadku zmiennej L2 skośność była dodatnia i zauważamy wydłużenie prawego

ogona rozkładu. Ewidentna różnica jest również w smukłości rozkładów. Tak jak wskazywały war-

tości kurtozy dla próbki soi (zmienna L2) dane są rozłożone a wykres przypomina rozkład normalny.

Dane dotyczące pszenicy (zmienna L1) są bardziej skoncentrowane, dzięki czemu wykres jest bar-

dziej spiczasty.

Należy jednak pamiętać, iż histogramy jedynie potwierdzają zmienność i kształt analizowanych

danych. Zawsze należy wykonać testy statystyczne, a nie tylko sugerować się wyglądem wykresu.

2.2 Testy normalności

Mając już pewne wyobrażenie na temat naszych danych po przeanalizowaniu charaktery-

styk liczbowych przystąpimy do analizy rozkładu. W tym celu skorzystamy z testów normalności.

Testy te sprawdzają, czy rozkład danych różni się od założonego rozkładu teoretycznego, gdy znana

jest tylko pewna skończona liczba obserwacji. Naszym założonym rozkładem teoretycznym będzie

13

rozkład normalny. Badając normalność stawiamy hipotezę zerową o dopasowaniu danych do roz-

kładu normalnego, wobec hipotezy alternatywnej, że dane takiego rozkładu nie mają.

Formalny zapis hipotez:

H0- dane pochodzą z rozkładu normalnego,

HA- dane nie pochodzą z rozkładu normalnego.

Przyjmujemy poziom istotność α = 0, 05. Jest to maksymalne ryzyko błędu, jakie możemy dopu-

ścić. Wykonując test porównujemy poziom istotności α z wyliczoną wartością p zgodnie z regułami

decyzyjnymi. Jeśli wartość p jest większa od poziomu istotności α to nie mamy podstaw do odrzu-

cenia H0, w przeciwnym przypadku odrzucamy H0 na korzyść HA.

Formalna definicja rozkładu normalnego umieszczona jest w Dodatku A.7.

Korzystając z programu SAS 9.3 przeprowadzimy dwa testy: test Shapiro-Wilka oraz

Kołmogorowa-Smirnowa. Bezsporną zaletą użytych testów jest możliwość korzystania z nich w

przypadku analizy rozkładów niedużych prób. Ponadto test Shapiro-Wilka jest jednym z najbar-

dziej preferowanych testów na normalność rozkładu ze względu na moc w porównaniu z innymi

dostępnymi testami.

Tablica 5: Testy normalności dla pszenicy

Test Statystyka Wartość p

Shapiro-Wilka W 0.952981 Pr.<W 0.0200Kołmogorowa-Smirnowa D 0.115975 Pr.>D 0.0407

Jak wskazuje Tablica 5 wartość p dla dwóch testów jest mniejsza niż zadany poziom istotności α.

Jak wcześniej było powiedziane, w takim przypadku odrzucamy hipotezę o normalności rozkładu

danych pszenicy i przyjmujemy hipotezę alternatywną.

Tablica 6: Testy normalności dla soi

Test Statystyka Wartość p

Shapiro-Wilka W 0.964099 Pr.<W 0.0706Kołmogorowa-Smirnowa D 0.095331 Pr.>D >0.1500

W przypadku próbki soi wartość p jest większa niż poziom istotniści α, co potwierdza Tablica

6. Biorąc pod uwagę otrzymane wyniki nie mamy podstaw do odrzucenia hipotezy zerowej. W

związku z tym przyjmujemy, że dane mają rozkład normalny.

Kod z programu SAS 9.3, użyty do wyznaczenia statystyk i wykonania testów, znajduje się w

Dodatku B.1.

14

3 Miary ryzyka

Oceniając ryzyko inwestycji należy oszacować rezerwy, jakie trzeba zgromadzić by inwe-

stycja nie przyniosła straty (w najgorszym przypadku). Funkcje obliczające wysokości tych rezerw

nazywane są miarami ryzyka, w szczególności koherentnymi miarami ryzyka. Rozdział ten został

opracowany głownie na podstawie pozycji [2].

3.1 Koherentne miary ryzyka

Aby określić czym jest koherentna miara ryzyka zaczniemy od zdefiniowania miary ryzyka.

Ustalmy pewną przestrzeń probabilistyczną (Ω,F,P) a ∆ oznaczmy przedział czasowy inwestycji.

Poprzez L0(Ω,F,P) oznaczmy zbiór wszystkich zmiennych losowych określonych na (Ω,F ). Ele-

menty zbioru zmiennych losowych stożka wypukłego M [Dodatek A.8.] należącego do L0(Ω,F,P)

będziemy rozumieli jako stopy strat inwestycji w przedziale czasowym ∆. Wówczas miarę ryzyka

definiujemy nastepująco:

Definicja 3.1.1. Miara ryzyka [5]

Miarą ryzyka nazywamy pewną funkcję rzeczywistą działającą ze zbioru zmiennych losowych okre-

ślonych na stożku wypukłym na zbiór liczb rzeczywistych

ρ : M → R.

Mając formalną Definicję 3.1.1. przejdźmy do interpretacji.

Miarę ryzyka ρ(L) rozumiemy jako wielkość rezerw dołożonych do inwestycji. W przypadku ujem-

nej bądź zerowej wartości (ρ(L)¬0) możemy stwierdzić, że nie trzeba tworzyć dodatkowych rezerw,

gdyż ujemna stopa strat to zysk. W sytuacji odwrotnej (ρ(L)>0) należy przygotować odpowiednią

ilość rezerw finansowych.

Po wyjaśnieniu czym jest miara ryzyka przejdziemy do omówienia koherentności miar.

Definicja 3.1.2. Koherentne miary ryzyka [2]

Funkcję ρ : M → R nazywamy koherentną miarą ryzyka, jeśli:

1. jest niezmiennicza na translacje, czyli dla dowolnego l ∈ R oraz L ∈M

ρ(l + L) = l + ρ(L) (3.1)

Jeżeli mamy inwestycję na kwotę L i l jest kwotą, którą jesteśmy dłużni to rezerwy ρ(L)

naszej inwestycji musimy powiększyć o kwotę l.

2. jest subaddytywna

ρ(L1 + L2) ¬ ρ(L1) + ρ(L2) (3.2)

Subaddytywność oznacza, że jeśli mamy dwie inwestycje A i B (o stratach odpowiednio L1 i

L2) to ryzyko poniesienia straty dla portfela złożonego z tych inwestycji (A+B) jest mniejsze

lub równe niż suma ich indywidualnych ryzyk.

3. jest dodatnio jednorodna, czyli jeśli λ > 0

ρ(λL) = λρ(L) (3.3)

15

Jeżeli ryzyko wzrasta λ-krotnie to rezerwy też muszą być λ-krotnie większe.

4. jest monotoniczna, jeśli L1 ¬ L2 prawie wszędzie to

ρ(L1) ¬ ρ(L2). (3.4)

Jeżeli strata L1 dla inwestycji A jest mniejsza niż strata L2 dla inwestycji B, wówczas ryzyko

poniesienia straty z inwestycji A jest mniejsze niż z inwestycji B.

Lemat 1. Równoważność warunków miary ryzyka

Jeśli miara ryzyka ρ spełnia warunki o subaddytywności i dodatniej jednorodności to warunek mo-

notoniczności jest równoważny z:

∀L∈M L ¬ 0⇒ ρ(L) ¬ 0.

Dowód powyższego lematu znajduję się w Dodatku A.11.

3.2 Value-at-Risk

Jedną z najpopularniejszych miar ryzyka jest miara nazywana wartością zagrożona, w skró-

cie V aRα (ang. Value-at-Risk). Estymuje ona maksymalną kwotę, jaką można stracić inwestując

w przedziale czasowym ∆ przy ustalonym poziomie ufności α.

Definicja 3.2.1. Value-at-Risk [2]

Niech X zmienna losowa. Wówczas wartością zagrożoną (kwantylem) X nazywamy:

V aRα(X) = qα(X) = infx : FX(x) ­ α (3.5)

gdzie FX oznacza dystrybuantę.

Mniej formalnie mówiąc jest to pierwszy moment przecięcia poziomu α na wykresie dystrybuanty.

W ujęciu probabilistycznym, V aRα interpretuje się jako kwantyl rzędu α. Poziom ufności α

ustala się dowolnie, jednak najczęściej przyjmuje się α=0.95. Co oznacza, że isnieje 95% szansy, iż

strata będzie mniejsza niż oszacowana wartość tej miary. Przedział czasowy ∆ również ustalamy

dowolnie.

Wartość zagrożona nie jest koherentną miarą ryzyka, nie spełnia warunku subaddytywności.

Dowód znajduje się w Dodatku A.12. Z uwagi na to, że indeksy pszenicy nie formują rozkładu

normalnego skorzystamy z programu SAS 9.3, aby wyznaczyć kwantyl nieznanego nam rozkładu

[Dodatek B.1.]. Przyjrzyjmy się wartościom otrzymanym dla naszych danych.

Tablica 7: Wyestymowana wartość zagrożona

Value-at-Risk

pszenica soja

0.147 0.126

Na podstawie Tablicy 7 możemy stwierdzić, że możliwa strata inwestycji w soję jest mniejsza niż

strata przy inwestycji w pszenicę, gdyż mniejsza wartość Value-at-Risk świadczy o mniejszym

ryzyku. Oszacujmy więc potrzebne rezerwy przy inwestycji 1 mln dolarów w każde aktywo, przy

pomocy wzoru (3.3):

16

Dla pszenicy

V aR0.95(1000000 · L1) = 1000000 · V aR0.95(L1) = 1000000 · 0.147 = 147000[USD]

Dla soi

V aR0.95(1000000 · L2) = 1000000 · V aR0.95(L2) = 1000000 · 0.126 = 126000[USD]

Zastanówmy się czy można zredukować to ryzyko, estymując dane znanym rozkładem

normalnym. Przyjmijmy za parametry rozkładu wcześniej oszacowane wartości średniej oraz

odchylenia standardowego, umieszczone w Tablicy 3 i 4.

Zatem załóżmy, że:

• stopy strat dla pszenicy mają rozkład normalny: N(-0.0002295;0.10124844),

• stopy strat dla soi mają rozkład normalny: N(-0.0038689;0.07690589).

Na podstawie wzoru umieszczonego w Dodatku A.10. wyznaczymy wartości kwantyli poszczegól-

nych aktywów przyjmując wartość kwantyla standardowego rozkładu normalnego rzędu 0.95 równą

1.6449 [Dodatek C.1.] :

Dla pszenicy:

V aRα = 0.10124844 · 1.6449 + (−0.0002295) = 0.1663141

Dla soi:

V aRα = 0.07690589 · 1.6449 + (−0.0038689) = 0.1226336

Wyliczmy rezerwy pamiętając, że inwestujemy 1 mln dolarów :

Dla pszenicy

V aR0.95(1000000 · L1) = 1000000 · V aR0.95(L1) = 1000000 · 0.1663141 = 166314.1[USD]

Dla soi

V aR0.95(1000000 · L2) = 1000000 · V aR0.95(L2) = 1000000 · 0.1226336 = 122633.6[USD]

Porównując powyższe wyniki z wcześniej wyznaczonymi [Tablica 7] stwierdzamy, że program SAS

9.3 generuje mniejsze wartości Value-at-Risk nieznanego nam rozkładu dla stóp strat pszenicy,

natomiast dla soi większe. Warto też zauważyć, że w przypadku soi liczby te, wyliczone dwoma

sposobami, niewiele się różnią. Stąd też potwierdzenie zbliżenia rozkładu stóp strat soi do rozkładu

normalnego.

3.3 Expected Shortfall

Kolejną miarą ryzyka jaką omówimy jest tzw. zagrożona wartość oczekiwana lub uśred-

niona wartość zagrożona, w skrocie ESα (ang. Expected Shortfall). Jej wartość jest większa niż

wartość V aRα, gdyż określa ile średnio stracimy jeśli strata przekroczy poziom α. Miara ta oddaje

własności ogonów rozkładu. Estymuje średnią stratę dla przypadków znajdujących się w (1-α) ogo-

nie procentowym rozkładu.

17

Definicja 3.3.1. Expected Shortfall [2]

Niech X zmienna losowa, taka że E|X| < ∞. Wówczas uśrednioną wartością zagrożoną (ang.

Expected shortfall) nazywamy:

ESα(X) =1

1− α

1∫α

V aRu(X)du, (3.6)

gdzie FX oznacza dystrybuantę.

Jak wynika wprost z Definicji 3.3.1. Expected Shortfall jest miarą powiązaną z wartością

zagrożoną, zachodzi nierówność:

ESα(X) ­ V aRα(X)

Zagrożona wartość oczekiwana jest koherentną miarą ryzyka. Dowód umieszczony jest w Dodatku

A.13.

Po teoretycznym wprowadzeniu przejdźmy do wyliczenia wartości Expected Shortfall dla naszych

danych, w tym celu posłużymy się następującym lematem:

Lemat 2. [5]

Niech L1, L2, ... będzie ciągiem niezależnych zmiennych losowych o tym samym rozkładzie FL. Wów-

czas

limn→∞

bn(1−α)c∑i=1

Li,n

bn(1− α)c= ESα(L) p.w., (3.7)

gdzie L1,n ­ L2,n ­ ... ­ Ln,n są statystykami pozycyjnymi L1, L2, ..., Ln.

Jak wynika z Lematu 2. będziemy sumować bn(1−α)c największych strat. Obliczmy: bn(1−α)c =

b61 · (1− 0.95)c = 3. Wspomniane 3 największe straty zostały oznaczone w Tablicy 1 i 2 kolorem

czerwonym.

Wartości Expected Shortfall dla naszych danych zostały wyliczone za pomocą programu SAS 9.3.

Kod został umieszczony w Dodatku B.2.

Tablica 8: Wyestymowana uśredniona wartość zagrożona

Expected Shortfall

pszenica soja

0.1996667 0.1723333

Z Tablicy 8 wynika, że tak jak i w przypadku wartości zagrożonej, wartość dla pszenicy jest więk-

sza. Sprawdźmy zatem wysokości rezerw jakie musimy zgromadzić by inwestycja nie przyniosła

nam straty. Jak już wcześniej było powiedziane będziemy inwestować kwotę w wysokości 1 mln

dolarów w każde aktywo. Wykorzystując dodatnią jednorodność uśrednionej wartości zagrożonej:

ESα(1000000 · L) = 1000000 · ESα(L) dla danych zapiszmy:

18

Dla pszenicy

ES0.95(1000000 · L1) = 1000000 · ES0.95(L1) = 1000000 · 0.1996667 = 199666.7[USD]

Dla soi

ES0.95(1000000 · L2) = 1000000 · ES0.95(L2) = 1000000 · 0.1723333 = 172333.3[USD]

Istnieje jeszcze jeden sposób obliczenia uśrednionej wartości zagrożonej. W tym celu skorzystamy

z twierdzenia.

Twierdzenie 1. Expected Shortfall dla rozkładu normalnego [5]

W przypadku, gdy α ∈(0,1) oraz dystrybuanta straty FL ma rozkład normalny o średniej µ oraz o

wariancji σ2, czyli FL ∼ N(µ,σ2), możemy zapisać

ESα = µ+ σφ(Φ−1(α))

1− α(3.8)

gdzie φ jest gęstością standardowego rozkładu normalnego, a Φ−1 dystrybuantą odwrotną.

Jak wynika z Twierdzenia 1. analizowana zmienna musi mieć rozkład normalny. Załóżmy zatem,

że obie nasze zmienne (pszenica i soja) mają taki rozkład. Zbadamy na podstawie powyższego

twierdzenia, czy dzięki estymacji rozkładem normalnym możemy zmniejszyć ryzyko, a co za tym

idzie wysokości potrzebnych rezerw. Jak łatwo zauważyć wzór zależy tylko od parametrów µ i σ,

które zostały wyestymowane z rozkładu poszczególnych stóp strat (Tablica 2 i 3), gdyż wartość

φ(Φ−1(α)) jest stała (gęstość kwantyla rzędu α standardowego rozkładu normalnego).

Posługując się programem SAS 9.3 bez większej trudności wyznaczymy potrzebne wielkości.

Tablica 9: Wyestymowana uśredniona wartość zagrożona

Expected Shortfall

pszenica soja

0.2086010 0.1547537

W tym przypadku również wartość ES dla pszenicy jest znacznie większa. Mając dane z

Tablicy 9 wyliczmy wysokości rezerw.

Dla pszenicy

ES0.95(1000000 · L1) = 1000000 · ES0.95(L1) = 1000000 · 0.2086010 = 208601[USD]

Dla soi

ES0.95(1000000 · L2) = 1000000 · ES0.95(L2) = 1000000 · 0.1547537 = 154753.7[USD]

Wartości Expected Shortfall wyliczone dwoma sposobami różnią się od siebie. Korzystając z Le-

matu 2. braliśmy pod uwagę tylko konkretne trzy wartości, natomiast korzystając z Twierdzenia

1. parametry rozkładu całej próby, zatem te wyniki są bardziej dokładne. Wyliczając z defini-

cji miarę ryzyka dla próbki pszenicy założyliśmy jej pochodzenie z rozkładu normalnego. Wynik

jednak okazał się większy niż przy wykorzystaniu Lematu 2. Możemy zatem stwierdzić, że nasza

próba dopasowania próbki pszenicy do rozkładu normalnego nie przyniosła zamierzonego efektu,

ponieważ nie zmniejszyliśmy ryzyka. Wartości ES wyliczone dla soi są mniejsze niezależnie od wy-

boru metody. Najmniejszą wartość otrzymaliśmy analizując parametry rozkładu całej próby, czyli

korzystając z Twierdzenia 1.

19

Podsumujmy wszystkie zebrane wyniki.

Tablica 10: Porównanie rezerw

Pszenica [USD] Soja [USD]

Varoszacowany kwantyl rzędu 0.95 147000 126000z założenia o normalności rozkładu 166314.1 122633.6

ESz Lematu 2. 199666.7 172333.3z Twierdzenia 1. 208601 154753.7

Jak wynika z Tablicy 10, wszystkie wyliczone wartości dla próbki soi są mniejsze niż dla próbki

pszenicy. Zatem dla portfeli jednoskładnikowych stwierdzamy, że inwestując tę samą kwotę w

wybrane dwa aktywa, korzystniejsza jest inwestycja w soję, ponieważ potrzebne są mniejsze

rezerwy finansowe.

20

4 Modelowanie rozkładów dwuwymiarowych

Przeanalizowaliśmy już ryzyko inwestycji portfeli jednoskładnikowych. W tym rozdziale

rozpoczniemy badanie portfeli dwuskładnikowych, czyli zajmiemy się znalezieniem rozkładu łącz-

nego portfela. Poznaliśmy już rozkłady obu inwestycji, które w przypadku portfela dwuskład-

nikowego stają się rozkładami brzegowymi. Rozkład stóp strat dla soi miał rozkład normalny

natomiast rozkład dla pszenicy niestety nie (uzasadnienie znajduje się w rozdziale poprzednim).

W takim przypadku zweryfikujemy normalność dwuwymiarowego rozkładu. Na początku jednak

przedstawimy podstawową definicję wielowymiarowego rozkładu normalnego opracowaną na pod-

stawie pozycji [2].

Definicja 4.1.1. Wielowymiarowy rozkład normalny [2]

Wektor X = (X1, X2, ..., Xp)′ ma niezdegenerowany rozkład normalny (gaussowski) X ∈ N(µ,Σ)

jeśli

EX = µ ∈ Rp, Σ = E(X− µ)(X− µ)T

dla macierzy kowariancji detΣ 6= 0 zaś gęstość x ∈ Rp

f(x) = 1

(2π)p2 |Σ|

12exp(− 1

2 (x− µ)TΣ−1(x− µ)).

Definicja 4.1.1. przedstawia p-wymiarowy rozkład gaussowski wektora losowego X jednoznacznie

określony przez p-wymiarowy wektor wartości oczekiwanej µ oraz kwadratową symetryczną i nie-

ujemną macierz kowariancji Σ o wymiarach p x p (oznaczenie X ∼ Np(µ,Σ) - zmienna X ma

p-wymiarowy rozkład normalny).

Jak już wspomnieliśmy we wstępie tego rozdziału będziemy analizować portfel dwuskładnikowy,

zatem interesuje nas dwuwymiarowy rozkład normalny (biorąc pod uwagę ww. definicję

przyjmujemy p=2).

Dla dwuwymiarowego rozkładu normalnego prawdziwe jest twierdzenie.

Twierdzenie 2.

Niech X = (X1, X2, ..., Xp)′ ma rozkład eliptyczny. Wówczas dla L1,L2 ∈M zachodzi:

V aRα(L1 + L2) ¬ V aRα(L1) + V aRα(L2).

Jak wynika z Twierdzenia 2. w przypadku dwuwymiarowości rozkładu normalnego Value-at-Risk

jest koherentną miarą ryzyka.

4.1 Test Mardia

Istnieje wiele metod badania dwuwymiarowej normalności. Jedną z nich jest Test Mardia

[2].

Maridia-test jest oparty na mierze skośności

β1,p = E((X− µ)TΣ−1(Y− µ))3

gdzie X,Y są niezależne oraz kurtozie

21

β2,p = E((X− µ)TΣ−1(Y− µ))2.

Dla wektorów losowych X,Y wielowymiarowego rozkładu normalnego, jeśli X, Y są niezależne

wówczas β1,p = 0 zaś β2,p = p(p+ 2).

Przejdźmy do wykonania tego testu dla naszych danych. Ustalamy standardowo poziom

istotności α = 0.05 oraz zakładamy hipotezę zerową:

H0 - dane pochodzą z dwuwymiarowego rozkładu normalnego

wobec hipotezy alternatywnej:

HA - dane nie pochodzą z rozkładu normalnego.

Bierzemy pod uwagę:

• kurtozę wielowymiarową znormalizowaną - jeśli jej wartość mieści się w przedziale

(-1.96,1.96), to nie mamy podstaw do odrzucenia H0, w przeciwnym wypadku hipotezę tę

odrzucamy;

• kappę według Mardii, średnią skalowaną kurtozę wielowymiarową oraz skorygowaną średnią

skalowaną kurtozę wielowymiarową - wszystkie wartości powinny być większe od wartości

krytycznej K = − 2p+2 = − 1

2 (p liczba wymiarów), wówczas nie mamy podstaw do

odrzucenia H0, w przeciwnym wypadku hipotezę odrzucamy.

Wyniki przedstawia Tablica 11 na podstawie Dodatku B.3.

Tablica 11: Test na dwuwymiarową normalność

Kurtoza warość hipoteza zerowa

Kurtoza wielowymiarowa znormalizowana 1.4103 nie odrzucamyKappa według Mardii 0.1806 nie odrzucamyŚrednia skalowana kurtoza wielowymiarowa 0.3305 nie odrzucamySkorygowana średnia skalowana kurtoza wielowymiarowa 0.3305 nie odrzucamy

W wykonanym teście wszystkie kryteria wskazują, że nie mamy podstaw by odrzucić H0. Mogli-

byśmy zatem przyjąć, że nasze dane mają dwuwymiarowy rozkład normalny, jednak nie jest to

jednoznacznie stwierdzone (brak podstaw do odrzucenia hipotezy nie jest równoważny z jej przy-

jęciem). Dlatego w kolejnym rozdziale sprawdzimy czy dopasowania znanymi nam kopułami nie

przybliżą precyzyjniej naszego rozkładu danych.

Warto w tym miejscu wspomnieć, że jeżeli mamy dane dwuwymiarowe o rozkładzie normalnym to

rozkłady brzegowe (dla rozkładu łącznego) również mają taki rozkład. Niestety w naszym przy-

padku nie jest to jasne, gdyż jak wykazały testy na normalność jeden z rozkładów brzegowych nie

był normalny oraz w przypadku dwuwymiarowych danych także nie mamy co do tego pewności.

4.2 Estymacja gęstości

Estymacja nieznanej funkcji gęstości polega na aproksymacji (zastąpieniu matematycznych

wielkości innymi, o przybliżonych własnościach, łatwiejszymi do badania i zastosowania) przy wy-

korzystaniu znanej funkcji (np. gęstości rozkładu normalnego). Inaczej mówiąc funkcja ta uśrednia

dane obserwowane w próbie i tworzy estymator - wygładzoną aproksymację. Dokonujemy tego przy

użyciu procedury KDE (kernel density estimation) w programie SAS 9.3. [Dodatek B.4.]

22

Poniżej znajduje się graficzne przedstawienie estymacji dla naszych danych.

Rysunek 5: Rozkład i gęstość danych (wykres dwuwymiarowy)

Rysunek 6: Gęstość danych (wykres trójwymiarowy)

23

4.3 Kopuły

Jednym ze sposobów wyznaczania rozkładu łącznego jest zastosowanie kopuł. Kopuła jest

funkcją wyznaczającą dystrybuantę łączną przy użyciu jednostajnych dystrybuant brzegowych, o

czym mówi Twierdzenie Sklara. Zanim jednak przejdziemy do wyznaczania rozkładu przedstawimy

niezbędną definicję i twierdzenie.

Definicja 4.3.1. Kopuła dwuwymiarowa [9]

Kopuła dwuwymiarowa C : [0, 1]2 → [0, 1] jest to funkcja spełniająca następujące warunki:

a) C(0, t) = C(t, 0) = 0 , dla t ∈ I

b) C(1, t) = C(t, 1) = t , dla t ∈ I

c) C(u2, v2) − C(u1, v2) − C(u2, v1) + C(u1, v1) ­ 0 dla wszystkich u1, u2, v1, v2 ∈ I, takich że

u1 ¬ u2 i v1 ¬ v2.

Dla wyżej opisanej kopuły dwuwymiarowej możemy sformułować twierdzenie:

Twierdzenie 2. (Sklar’a) [5]

Niech F będzie dystrybuantą łączną o rozkładach brzegowych F1, F2. Wówczas istnieje kopuła C :

[0, 1]2 → [0, 1] taka, że

∀(x1,x2)∈R2=[−∞,∞] F (x1, x2) = C(F1(x1), F2(x2)). (5.1)

Ponadto, jeżeli rozkłady brzegowe są ciągłe, wówczas C jest określona jednoznacznie.

4.3.1 Podstawowy podział kopuł

Kopuły dzielimy na dwie rodziny: archimedejskie i eliptyczne. Do kopuł archimedejskich

należą: kopuła Claytona, Franka oraz Gumbela, natomiast rodzina kopuł eliptycznych składa się z

kopuły Normalnej i T (T-studenta). Poniżej prezentujemy wzory wymienionych kopuł dla jedno-

stajnych rozkładów brzegowych x1, x2 (kopuły dwuwymiarowe).

Kopuły archimedejskie

Clayton

Cθ(x1, x2) = (x−θ1 + x−θ2 − 1)−1θ , gdzie 0 < θ <∞ (5.2)

Frank

Cθ(x1, x2) = −1θln[1 +

(exp(−θx1)− 1)(exp(−θx2)− 1)exp(−θ)− 1

] , gdzie θ ∈ R\0 (5.3)

Gumbel

Cθ(x1, x2) = exp−((−lnx1)θ + (−lnx2)θ)1θ , gdzie 1 < θ <∞ (5.4)

Kopuły eliptyczne

T-student

Cν,ρ(x1, x2) =

t−1ν (x1)∫−∞

t−1ν (x2)∫−∞

1

2π(1− ρ2)12

[1 +u2 − 2ρuv + v2

ν(1− ρ2)]−

ν+22 du dv, (5.5)

24

gdzie ν, ρ - parametry kopuły, t−1ν - funkcja odwrotna do dystrybuanty rozkładu T-Studenta z ν

stopniami swobody.

Normalna

Cρ(x1, x2) =

Φ−1(x1)∫−∞

Φ−1(x2)∫−∞

1

2π(1− ρ2)12exp−u

2 − 2ρuv + v2

2(1− ρ2) du dv, (5.6)

gdzie ρ - parametr kopuły, Φ−1 - funkcja odwrotna do dystrybuanty rozkładu normalnego.

Jak wynika ze wzorów dla odpowiednich kopuł z rodziny archimedejskich są ode zależne od para-

metrów θ. Parametr ten mówi o zależności pomiędzy rozkładami brzegowymi. Jeżeli θ zbiega do

dolnego ograniczenia parametru (w zależności od rodzaju kopuły) to mamy niezależne rozkłady

brzegowe. Najlepsze dopasowanie tych parametrów dobiera nam program SAS 9.3 przy użyciu

procedury proc copula. W przypadku kopuł z rodziny eliptycznych otrzymujemy macierze korela-

cji. Ponadto program generuje podstawowe kryteria najlepszego dopasowania kopuły do naszych

danych. I kolejno otrzymujemy:

• parametr Log Likelihood (w skrócie LOG) - im większa wartość tym lepsze dopasowanie;

• parametr Akaike (w skrócie AIC) - im mniejsza wartość tym lepsze dopasowanie.

W przypadku niejasności wyboru, tzn. gdy wartości LOG i AIC nie wskazują jednoznacznie na któ-

rąś z kopuł bierzemy pod uwagę trzeci parametr. Jest to tzw. kryterium Schwarza (baysowskie),

w skrócie SBC - i tak jak w przypadku AIC im mniejsza jego wartość tym lepsze dopasowanie.

Poniżej przedstawiamy kopuły wraz z kryteriami dopasowania oraz miarami ryzyka odpowiednimi

dla każdej z nich. Kod generujący znajduje się w Dodatku B.5.

Kopuła Claytona

Tablica 12: Kopuła Claytona - wykrestrójwymiarowy

Tablica 13: Kopuła Claytona

θ 1.170232

kryteria

Log Likelihood 13.6296AIC -25.2592SBC -23.14833

25

Kopuła Franka

Tablica 14: Kopuła Franka - wykrestrójwymiarowy

Tablica 15: Kopuła Franka

θ 4.740441

kryteria

Log Likelihood 14.43497AIC -26.86993SBC -24.75906

Kopuła Gumbela

Tablica 16: Kopuła Gumbela - wykrestrójwymiarowy

Tablica 17: Kopuła Gumbela

θ 1.798871

kryteria

Log Likelihood 15.90243AIC -29.80487SBC -27.69399

Kopuła Normalna

Tablica 18: Kopuła Normalna - wykrestrójwymiarowy

Tablica 19: Kopuła Normalna

macierz korelacji[

1 0.6549046050.654904605 1

]

26

Kopuła T

Tablica 20: Kopuła T - wykres trójwy-miarowy

Tablica 21: Kopuła T

macierz korelacji[

1 0.6845337270.684533727 1

]v 100

kryteria

Log Likelihood 17.16300AIC -30.32599SBC -26.10425

Po zaprezentowaniu wszystkich kopuł wróćmy jeszcze do kopuł eliptycznych. Otrzymali-

śmy dwie macierze korelacji. Jedną dla kopuły Normalnej:[1 0.654904605

0.654904605 1

]drugą dla kopuły T: [

1 0.684533727

0.684533727 1

]

Zanim zinterpretujemy otrzymane wielkości zdefiniujmy potrzebny w tym celu współczynnik ko-

relacji.

Definicja 4.3.2 Współczynnik korelacji [7]

Współczynnik korelacji między zmiennymi X i Y określonymi na tej samej przestrzeni probabili-

stycznej, dla których 0 < V ar(X) <∞ i 0 < V ar(Y) <∞, jest liczbą zdefiniowaną następująco:

Corr(X,Y) = ρXY =Cov(X,Y)√

V ar(X) · V ar(Y)(5.7)

Jeżeli X, Y są niezależnymi zmiennymi losowymi, to Cov(X,Y) = 0 oraz ρXY = 0.

Jak wynika z Definicji 4.3.2. współczynnik korelacji mówi o zależności między zmiennymi. Im

wartość bliższa 1 tym większa zależność (jak wiadomo ρXY ∈ [−1, 1]). Współczynniki korelacji dla

naszych kopuł wynoszą odpowiednio 0.654904605 dla kopuły Normalnej i 0.684533727 dla kopuły

T. Obie wielkości są porównywalne. Ponadto dla dużej liczby stopni swobody (w naszym przy-

padku ν=100) rozkład T-Studenta praktycznie pokrywa się z rozkładem normalnym. Dzięki temu

i dzięki podobnym wartościom współczynnika korelacji możemy założyć, że kopuły T i Normalna

nie różnią się znacznie. Zatem w dalszej części nie będziemy brać pod uwagę kopuły Normalnej.

27

Tablica 22: Porównanie kopuł

kopuła θ Log Likelihood AIC SBC VaR ES

Clayton 1.170232 13.6296 -25.2592 -23.14833 0.120580 0.142799Gumbel 1.798871 15.90243 -29.80487 -27.69399 0.144757 0.178801Frank 4.740441 14.43497 -26.86993 -24.75906 0.120395 0.149366T - 17.163 -30.32599 -26.10425 0.142617 0.174153

Na podstawie Tablicy 22 możemy wybrać najlepiej dopasowaną kopułę do naszych danych. Wyniki

są jednoznaczne. Według pierwszego (Log Likelihood) jak i drugiego kryterium (Akaike) najlepiej

dopasowaną kopułą okazała się kopuła T. Dodatkowo w tablicy zostały umieszczone wartości miar

ryzyka dla portfela dwuskładnikowego złożonego z 12 kapitału przeznaczonego na aktywo pierw-

sze i 12 kapitału przeznaczonego w aktywo drugie, dzięki którym wyliczymy rezerwy potrzebne do

inwestycji łącznej (uzyskane za pomocą kodu znajdującego się w Dodatku B.6).

4.4 Inwestycja łączna

Kwota inwestycji łącznej jest taka sama jak w przypadku inwestycji pojedynczych, czyli

1 mln dolarów. Dywersyfikując portfel przeznaczymy połowę kapitału na inwestycję w pszenicę a

połowę na inwestycję w soję, tzn. po 500000 dolarów w każde aktywo. Miary ryzyka dla inwestycji

łącznej zostały policzone przy pomocy danych wygenerowanych z najlepiej dopasowanej kopuły T,

dzięki którym możemy wyliczyć potrzebne rezerwy.

V aR0.95(1000000 · L3) = 1000000 · V aR0.95(L3) = 1000000 · 0.142617 = 142617[USD]

ES0.95(1000000 · L3) = 1000000 · ES0.95(L3) = 1000000 · 0.174153 = 174153[USD]

Jak łatwo zauważyć wyliczone rezerwy finansowe wg pierwszej miary są mniejsze niż wg

miary drugiej, czyli ES. Różnica wynika z faktu, że ES bada 5% najgorszych przypadków inwesty-

cyjnych, a VaR jest miarą dokładniejszą i szacuje rezerwy na podstawie całej próby.

Zastanówmy się jeszcze jak zmienią się wysokości potrzebnych rezerw przy innym podziale

kapitału. W tym celu posłużymy się dodatnią jednorodnością zarówno wartości zagrożonej jak i

zagrożonej wartości oczekiwanej, co możemy zapisać następująco:

V aR0.95(A · L1 +B · L2) = (A+B) · V aR0.95 · (A

A+B· L1 +

B

A+B· L2) (5.8)

oraz

ES0.95(A · L1 +B · L2) = (A+B) · ES0.95 · (A

A+B· L1 +

B

A+B· L2), (5.9)

gdzie:

A+B - całkowity kapitał (1 mln dolarów),

A - kwota inwestycji w pszenicę,

B - kwota inwestycji w soję.

28

Korzystając z programu SAS 9.3, do którego kod znajduję się w Dodatku B.7. oraz za-

leżności (5.8) i (5.9), przyjrzyjmy się wybranym dywersyfikacjom naszego portfela. Posługując się

Tablicami 23 i 24 wybierzemy najbardziej optymalną inwestycję, którą porównamy z wcześniej

omówioną, czyli dzielącą kapitał pomiędzy dwoma aktywami po równo.

Tablica 23: Wybrane dywersyfikacje portfela

14 · L1 + 3

4 · L234 · L1 + 1

4 · L215 · L1 + 4

5 · L245 · L1 + 1

5 · L2

VaR 140414.6 154660.1 143100.5 158258.2

ES 171185.9 190552.9 172291.5 194749.3

Tablica 24: Wybrane dywersyfikacje portfela

25 · L1 + 3

5 · L235 · L1 + 2

5 · L218 · L1 + 7

8 · L278 · L1 + 1

8 · L2

VaR 142493 146093 143270.1 162698.6

ES 171626.4 179472.4 174692 201211.8

Analizując powyższe tablice łatwo zauważyć, że najmniej ryzykowną inwestycją jest pierwsza

spośród analizowanych, czyli składająca się z 14 kapitału przeznaczonego w akcje pszenicy i 3

4

kapitału w akcje soi. Rezerwy te wynoszą kolejno 140414.6 USD wg VaR i 171185.9 USD wg ES.

Wybierzmy zatem najkorzystniejszą inwestycję łączną. Weźmiemy pod uwagę dwie z nich:

12 · L1 + 1

2 · L214 · L1 + 3

4 · L2

rezerwy wg VaR: 142617[USD] rezerwy wg VaR: 140414.6[USD]

rezerwy wg ES: 174153[USD] rezerwy wg ES: 171185.9[USD]

Jak nie trudno zauważyć mniejsze wartości w przypadku obydwu miar otrzymaliśmy dla inwestycji

drugiej, czyli 14 kapitału przeznaczonego na pszenicę i 3

4 na soję. I tę oto inwestycję uznajemy za

najmniej ryzykowną spośród inwestycji łącznych, gdyż wielkości rezerw bez wątpienia wskazują

właśnie na nią.

4.5 Porównanie inwestycji

Podsumujmy wszystkie przeanalizowane w pracy inwestycje. Jak już wcześniej ustalili-

śmy bardziej ryzykowną inwestycją pojedynczą okazały się akcje pszenicy, i co do tego nie mamy

żadnych wątpliwości, gdyż obie miary ryzyka oszacowały większe niezbędne zabezpieczenia finan-

sowe. Na tej podstawie za mniej ryzykowną inwestycję uznajemy akcje soi i to właśnie tę inwestycję

będziemy porównywać z inwestycją złożoną. Następnie analizowaliśmy różne inwestycje łączne spo-

śród których najkorzystniejszą okazała się inwestycja składająca się z 14 kapitału przeznaczonego

na akcje pszenicy i 34 kapitału przeznaczonego na akcje soi. W Tablicy 25 umieściliśmy wyliczone

rezerwy dla tych portfeli.

29

Tablica 25: Rezerwy jakie należy przeznaczyć na poszczególne inwestycje

Soja[USD] Łączna[USD]

VaR 122633.6 140414.6ES 154753.7 171185.9

Porównując te dwie wybrane inwestycje łatwo zauważyć, że większe wartości otrzymaliśmy

w przypadku inwestycji łącznej. Stąd też najmniej ryzykowną inwestycją okazała się inwestycja w

kwocie 1 mln dolarów na okres jednego miesiąca w akcje soi. Rezerwy te wynoszą odpowiednio

wg Value-at-Risk 123 tysiące dolarów, czyli około 12% wartości zainwestowanego kapitału, zaś

wg Expected Shortfall około 155 tysięcy dolarów, co stanowi niecałe 15,5% wartości całkowitego

kapitału.

30

5 Podsumowanie

W pracy przeanalizowano inwestycje jedno i dwuskładnikowe (dzielące kapitał w wysoko-

ści 1 mln dolarów w różnych proporcjach) w akcje pszenicy oraz soi szacując niezbędne rezerwy,

by inwestycje te nie przyniosły strat. W tym celu posłużono się dwiema miarami ryzyka, Value

at Risk oraz Expected Shortfall. Na ich podstawie stwierdzono, że w przypadku inwestycji jedno-

składnikowych mniej ryzykowną inwestycją okazała się inwestycja w soję, gdyż wymagała znacznie

mniejszych zabezpieczeń finansowych niż pszenica. Ponadto wykonano testy Shapiro-Wilka, Koł-

mogorowa Smirnowa oraz Mardia test sprawdzające normalność rozkładów stóp strat dla wspo-

mnianych aktywów.

Poprzedzając analizę inwestycji łącznej wprowadzono teorię dotyczącą dwuwymiarowego

rozkładu normalnego oraz sprawdzono dopasowanie danych do rozkładów innych znanych funk-

cji, funkcji kopuł z rodziny archimedejskich i eliptycznych. Korzystając z dwóch parametrów, Log

Likelihood i Akaike wybrano najlepiej dopasowaną kopułę, którą okazała się kopuła zbliżona do

normalnej, czyli kopuła T. Mając wybraną kopułę wyliczono wartości omówionych wcześniej miar

ryzyka i na ich podstawie oszacowano wysokości rezerw dla inwestycji łącznych dywersyfikując

portfel w różnych proporcjach. Najmniej ryzykowną inwestycją dwuskładnikową okazała się inwe-

stycja składająca się z 14 kapitału przeznaczonego na akcje pszenicy i 3

4 kapitału przeznaczonego

na akcje soi.

Biorąc pod uwagę wszystkie omówione w pracy portfele stwierdzono, że najmniej ryzy-

kowną inwestycją okazała się inwestycja w soję. Oszacowane wielkości zabezpieczeń wynosiły ko-

lejno wg VaR 123 tysiące dolarów, a wg ES około 155 tysięcy.

31

Załączniki

Dodatek A

A.1. Definicja Kwantyl [5]

Niech F będzie dystrybuantą funkcji zmiennej losowej X, uogólnioną funkcją odwrotną F← nazy-

wamy kwantylem funkcji F. Dla α ∈ (0, 1), α - kwantyl funkcji F jest postaci:

qα(F ) := F←(α) = infx ∈ R : F (x) ­ α

A.2. Definicja Mediana próbki [6]

Medianą próbki x1, ...xn nazywamy środkową liczbę w uporządkowanej niemalejąco próbce: x(1) ¬x(1) ¬ ... ¬ x(n), gdy n jest liczbą nieparzystą, albo średnią arytmetyczną dwóch środkowych liczb,

gdy n jest liczbą parzystą, tzn.

me =

x(n+12 ) gdy n nieparzyste12 (x(n2 ) + x(n2+1)) gdy n parzyste.

A.3. Definicja Odchylenie standardowe i wariancja [6]

a) Wariancją zmiennej losowej X nazywamy liczbę σ2(X) = V ar(X) daną wzorem:

V ar(X) = EX2 − (EX)2.

b) Odchyleniem standardowym zmiennej losowej X nazywamy liczbę σ(X) =√V ar(X).

A.4. Definicja Skośność [6]

Skośność jest to współczynnik asymetrii wyrażony wzorem:

A = M3σ3 ,

gdzie:

M3-trzeci moment centralny,

σ-odchylenie standardowe.

A.5. Definicja Kurtoza [6]

Kurtoza jest to współczynnik koncentracji (skupienia) wyrażony wzorem:

K = M4σ4 − 3,

gdzie:

M4-czwarty moment centralny ,

σ-odchylenie standardowe.

32

A.6. Definicja Moment Centralny [6]

Moment centralny rzędu r wyraża się wzorem:

Mr = E(X− µ)r = 1n

n∑i=1

(xi − x)r,

gdzie µ jest pierwszym momentem zwykłym, czyli estymatorem wartości oczekiwanej.

A.7. Definicja Rozkład normalny N(µ, σ2) [7]

Gęstość rozkładu normalnego N(µ, σ2) jest postaci

f(x) = 1σ√

2πexp[− (x−µ)2

2σ2 ],

gdzie µ ∈ R, σ > 0.

Fakt

Jeżeli zmienna losowa X ma rozkład N(µ, σ2), to E(X) = µ, V ar(X) = σ2,

ϕ(t) = exp(iµt− σ2t2

2 ).

Rozkład normalny N(0, 1) nazywa się standardowym rozkładem normalnym. Jego dystrybuanta

wyraża się wzorem:

Φ(x) = 1√2π

x∫−∞

e−t22 dt

Z postaci funkcji charakterystycznej łatwo wywnioskować, że jeżeli zmienne losowe X, Y są nie-

zależne i mają rozkłady odpowiednio N(µ1, σ21), N(µ2, σ

22), to suma X+Y ma rozkład normalny

N(µ1 + µ2, σ21 + σ2

2).

A.8. Definicja Stożek [2]

Zbiór zmiennych losowych jest stożkiem M jeśli:

a) stałe należą do M,

b) L1,L2 ∈ M to L1 + L2 ∈ M,

c) λ >0 i L ∈M to λL ∈ M.

A.9. Definicja Uogólniona funkcja odwrotna [5]

Niech funkcja niemalejąca F, będzie określona następująco F : R→ R, uogólniona funkcja odwrotna

do funkcji F jest zdefiniowana następująco:

F←(y) := infx ∈ R : F (x) ­ y,

używamy konwencji, że kres dolny zbioru pustego jest równy nieskończoności (inf∅ =∞).

33

A.10. Wzór Wartość zagrożona dla rozkładu normalnego[3]

Jeśli założymy, że rozkład stóp strat ma rozkład normalny (ozn. L ∼ N(µ, σ2), wówczas:

V aRα = (σ · qα + µ) ·W

gdzie:

µ - wyestymowana średnia z próbki,

σ - wyestymowane odchylenie standardowe dla próbki,

qα- kwantyl standarowgo rozkładu normalnego rzędu α,

W -wartość portfela finansowego.

A.11. Dowód. Lemat 1.

Dowód.

”⇒ ”

Niech L1 ¬ L2 ⇒ ρ(L1) ¬ ρ(L2)

Przyjmijmy L2 = 0, wówczas:

L1 ¬ 0⇒ ρ(L1) ¬ ρ(0) = 0, z jednorodności miary.

”⇐ ”

Niech L ¬ 0⇒ ρ(L) ¬ 0 oraz L1, L2 ∈M .

Przymijmy, że L1 ¬ L2 ⇒ L1 − L2 ¬ 0. Z założenia otrzymujemy, że ρ(L1 − L2) ¬ 0.

L1 = L1 − L2 + L2

Wykorzystując subaddytywność miary mamy:

ρ(L1) = ρ(L1 − L2 + L2) ¬ ρ(L1 − L2) + ρ(L2) ¬ ρ(L2).

A.12. Dowód Badanie koherentności VaR

Ad.1 Niezmienniczość na translacje, czyli dla dowolnego l ∈ R oraz L ∈M

V aRα(l + L) = l + V aRα(L)

Dowód. [8]

V aRα(l + L) = inft ∈ R : P (l + L > t) ¬ 1− α = inft ∈ R : Fl+L(t) ­ α =

= inft ∈ R : P (l + L ¬ t) ­ α = inft ∈ R : P (L ¬ t− l) ­ α =

= inft ∈ R : FL(t− l) ­ α = inft− l + l ∈ R : FL(t− l) ­ α =

= l + inft− l ∈ R : FL(t− l) ­ α = l + V aRα(L).

Ad.3 Dodatnia jednorodność, czyli jeśli λ > 0

V aRα(λL) = λV aRα(L)

Dowód. [8]

V aRα(λL) = qα(λL) = infx ∈ R : FλL(x) ­ α = infx ∈ R : P (λL ¬ x) ­ α =

= infx ∈ R : P (L ¬ xλ ) ­ α = infλ · xλ ∈ R : P (L ¬ x

λ ) ­ α =

= λ · infxλ ∈ R : P (L ¬ xλ ) ­ α = λ · infxλ ∈ R : FL(xλ ) ­ α =

= λ · qα(L) = λ · V aRα(L).

34

Ad.4 Monotoniczność, jeśli L1 ¬ L2 prawie wszędzie to

V aRα(L1) ¬ V aRα(L2)

Dowód. [8]

Korzystając ze wzoru 3.5 mamy:

V aRα(L1) = qα(L1) = infx ∈ R : FL1(x) ­ αV aRα(L2) = qα(L2) = infx ∈ R : FL2(x) ­ α

Niech L1, L2 ∈M oraz x ∈ R takie, że L1 ¬ L2 ¬ x.

Zauważmy, że jeśli L2 ¬ x⇒ L1 ¬ x to zachodzi również L2 ¬ x ⊆ L1 ¬ x.Stąd:

α ¬ P (L2 ¬ x) ¬ P (L1 ¬ x)

P (L2 ¬ x) ­ α⇒ P (L1 ¬ x) ­ αx : FL2 ­ α ⊆ x : FL1 ­ α wiedząc, że infinium podzbioru zbioru jest większe otrzymujemy:

infx : FL2 ­ α ­ infx : FL1 ­ α.Zatem:

V aRα(L1) ¬ V aRα(L2).

Ad.2 Brak subaddytywności

V aRα(L1 + L2) ¬ V aRα(L1) + V aRα(L2)

Dowód. [4]

Rozważmy 100 akcji, których stopy zwrotu są niezależne. Strata przyjmuje następujące wartości:

-5 z prawdopodobieństwem 0.98 oraz 100 z prawdopodobieństwem 0.02. Porównamy ryzyko dwóch

portfeli mierzone wartością zagrożoną:

A. 100 odrębnych akcji różnych spółek

B. 100 jednakowych akcji (jednej spółki)

Na tej podstawie otrzymujemy funkcje straty określone w następujący sposób:

Li = 100 · Yi − 5 · (1− Yi) = 105 · Yi − 5,

gdzie i oznacza i-tą akcję (i ∈ 1, 2, ..., 100), Yi jest zmienną binarną, taką że:

Yi = 0⇔ Li = −5

Yi = 1⇔ Li = 100

Mając podstawowe informacje na temat inwestycji obliczmy VaR dla poziomu ufności α = 0.95 dla

obydwu portfeli:

A.

V aRα(A) = V aRα(100∑i=1

Li) = V aRα(105 ·100∑i=1

Yi−500) = 105 ·V aRα(100∑i=1

Yi)−500 = 525−500 = 25,

gdyż (100∑i=1

Yi) ma rozkład Bernoulliego B(100,0.02) stąd qα(100∑i=1

Yi) = 5.

B.

V aRα(B) = V aRα(100 · L1) = 100 · V aRα(L1) =100∑i=1

(V aRα(Li)) = 100 · (−5) = −500.

Zatem otrzymujemy:

V aRα(A) = 25 6¬ −500 = V aRα(B).

35

Powyższa nierówność wskazuje, że portfel A jest o wiele bardziej ryzykowny od portfela B, co

jest sprzeczne z warunkiem subaddytywności, który mówi o odwrotnej sytuacji. To portfel jedno-

składnikowy B powinien być bardziej ryzykowny.

Stąd potwierdzenie, że VaR nie jest koherentną miarą ryzyka.

A.13. Dowód Koherentność ES [8]

Ad.1 Niezmienniczość na translacje, czyli dla dowolnego l ∈ R oraz L ∈M

ESα(l + L) = l + ESα(L)

Dowód. Korzystając z niezmienniczości na translacje dla VaR zapiszmy:

ESα(l+L) = 11−α

1∫α

V aRu(l+L)du = 11−α

1∫α

(l+V aRu(L))du = 11−α

1∫α

ldu+ 11−α

1∫α

V aRu(L)du =

= l + ESα(L).

Ad.3 Dodatnia jednorodność, czyli jeśli λ > 0

ESα(λL) = λESα(L)

Dowód. Korzystając z dodatniej jednorodności VaR mamy:

ESα(λL) = 11−α

1∫α

V aRu(λ · L)du = 11−α

1∫α

λ · V aRu(L)du = λ1−α

1∫α

V aRu(L)du = λESα(L).

Ad.4 Monotoniczność, jeśli L1 ¬ L2 prawie wszędzie to

ESα(L1) ¬ ESα(L2)

Dowód. Korzystając z monotoniczności VaR otrzymujemy:

ESα(L1) = 11−α

1∫α

V aRu(L1)du ¬ 11−α

1∫α

V aRu(L2)du = ESα(L2).

Ad.2 Subaddytywność

ESα(L1 + L2) ¬ ESα(L1) + ESα(L2)

Dowód.

Weźmy ciąg uporządkowanych, niezależnych zmiennych losowych L1,n ­ L2,n ­ . . . ­ Ln,n.

Ustalmy dowolnie wybrane m takie, że 1 ¬ m ¬ n. Wówczas otrzymujemy zależność:m∑i=1

Li,n = supLi1 , Li2 , . . . , Lim : 1 ¬ i1 ¬ i2 ¬ . . . ¬ im ¬ m

Rozpatrzmy dwie zmienne losowe L oraz L o określonej dystrybuancie łącznej F .

Biorąc ciąg niezależnych wektorów losowych (L1, L1), (L2, L2), ..., (Ln, Ln) o jednakowym rozkła-

dzie F, określmy: (L+ L)i := Li + Li oraz (L+ L)i,n dla uporządkowanych wektorów

(L1 + L)1, . . . , (Ln + L)n.

Zachodzi wówczas:m∑i=1

(L+ L)i;n = sup(L1 + L1)i1 , . . . , (Ln + Ln)im : 1 ¬ i1 ¬ . . . ¬ im ¬ m ¬

¬ supLi1 , Li2 , . . . , Lim : 1 ¬ i1 ¬ i2 ¬ . . . ¬ im ¬ m++supLi1 , Li2 , . . . , Lim : 1 ¬ i1 ¬ i2 ¬ . . . ¬ im ¬ m =

=m∑i=1

Li,n +m∑i=1

Li,n

Podstawiając za m = bn(1 − α)c i korzystając z Lematu 2. przy założeniu n → ∞ otrzy-

mujemy warunek subaddytywności dla ES przy poziomie ufności α:

ESα(L+ L) ¬ ESα(L) + ESα(L).

36

Dodatek B

Kod z programu SAS 9.3 do wyliczenia stóp strat dla pszenicy oraz soi.

data DANE2.stopyPSZ;

set DANE2.PSZENICA;

Lp=ROUND(((Wo-Wz)/Wo),0.001);

run;

data DANE2.stopySO;

set DANE2.SOJA;

Ls=ROUND(((Wo-Wz)/Wo),0.001);

run;

Dodatek B.1.

Kod generujący opisowe statystyki, histogramy, wyniki testów normalności oraz wartości kwantyli

rzędu 0.95 dla stóp strat pszenicy i soi.

TITLE1 ”Statystyki dla PSZENICY”;

TITLE2 ”Rezultaty 1”;

PROC UNIVARIATE data =DANE2.stopyPSZ normal;

var Lp;

histogram Lp;

RUN;

TITLE1 ”Statystyki dla SOI”;

TITLE2 ”Rezultaty 1”;

PROC UNIVARIATE data =DANE2.stopySO normal;

var Ls;

histogram Ls;

RUN;

Dodatek B.2.

Kod generujący wielkości uśrednionych wartości zagrożonych dla stóp strat pszenicy oraz soi.

PROC SORT DATA =DANE2.stopyPSZ OUT =DANE2.esPSZ;

BY DESCENDING Lp;

PROC MEANS DATA = DANE2.esPSZ( OBS =3) MEAN;

var Lp;

TITLE ”Expected Shortfall dla PSZENICY”;

RUN;

PROC SORT DATA =DANE2.stopySO OUT =DANE2.esSO;

BY DESCENDING Ls;

PROC MEANS DATA = DANE2.esSO( OBS =3) MEAN ;

var Ls;

TITLE ”Expected Shortfall dla SOI”;

RUN ;

37

Dodatek B.3.

Program użyty do uzyskania wyniku testu na normalność dwuwymiarowego rozkładu.

proc calis data =dane2.razem kurtosis;

title1 ”Output 1.1”;

title2 ”Computation of Mardia’s Kurtosis”;

lineqs

L1 = e1,

L2 = e2;

std

e1=L1, e2=L2;

run ;

Dodatek B.4.

Program użyty do uzyskania wykresów rozkładu i gęstości jądra dla L1 i L2

ods graphics on;

proc kde data =dane2.razem;

title ′Wykresy kde′; bivar L1 L2 / plots = all plots = SURFACE (ROTATE = 150);

run;

Dodatek B.5.

Programy generujące kopuły wraz z parametrami.

/*Clayton*/

proc copula data = dane2.razem;

title ”Clayton”;

var L4 L5;

fit clayton / marginals = EMPIRICAL

plots = (data = BOTH SCATTER)

outcopula = dane2.CLwyniki;

simulate / ndraws = 1000

seed = 1234

out = dane2.CLgenerowane

plots = (data = BOTH MATRIX distribution = CDF);

run ;

/*Frank*/

proc copula data = dane2.razem;

title ”Frank”;

var L1 L2;

fit frank / marginals = EMPIRICAL

plots = (data = BOTH SCATTER)

outcopula = dane2.FRwyniki;

simulate / ndraws = 1000

seed = 1234

38

out = dane2.FRgenerowane

plots = (data = BOTH MATRIX distribution = CDF);

run ;

/*Gumbel*/

proc copula data = dane2.razem;

title ”Gumbel”;

var L1 L2;

fit gumbel / marginals = EMPIRICAL

plots = (data = BOTH SCATTER)

outcopula = dane2.GUwyniki;

simulate / ndraws = 1000

seed = 1234

out = dane2.GUgenerowane

plots = (data = BOTH MATRIX distribution = CDF);

run ;

/*T*/

proc copula data = dane2.razem;

title ”T”;

var L1 L2;

fit t / marginals = EMPIRICAL

plots = (data = BOTH SCATTER)

outcopula = dane2.Twyniki;

simulate / ndraws = 1000

seed = 1234

out = dane2.Tgenerowane

plots = (data = BOTH MATRIX distribution = CDF);

run ;

/*Normalna*/

proc copula data = dane2.razem; title ”Normal”;

var L1 L2;

fit normal / marginals = EMPIRICAL

plots = (data = BOTH SCATTER)

outcopula = dane2.Nwyniki;

simulate / ndraws = 1000

seed = 1234

out = dane2.Ngenerowane

plots = (data = BOTH MATRIX distribution = CDF);

run ;

39

Dodatek B.6.

Kod generujący miary ryzyka dla poszczególnych kopuł.

/*Clayton - miary ryzyka*/

data dane2.CLvar;

set dane2.CLgenerowane;

L3 = 0.5 * L1 + 0.5 * L2;

run;

TITLE ”VaR - Clayton”;

proc means data= dane2.CLvar P95;

var L3;

run;

PROC SORT DATA =dane2.CLvar OUT =dane2.CLes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.CLes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - Clayton”;

RUN ;

/* Frank - miary ryzyka*/

data dane2.FRvar;

set dane2.FRgenerowane;

L3 = 0.5 * L1 + 0.5 * L2;

run;

TITLE ”VaR - Frank”;

proc means data= dane2.FRvar P95;

var L3;

run;

PROC SORT DATA =dane2.FRvar OUT =dane2.FRes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.FRes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - Frank”;

RUN;

/* Gumbel - miary ryzyka*/

data dane2.GUvar;

set dane2.GUgenerowane;

L3 = 0.5 * L1 + 0.5 * L2;

run;

TITLE ”VaR - Gumbel”;

proc means data= dane2.GUvar P95;

var L3;

run;

PROC SORT DATA =dane2.GUvar OUT =dane2.GUes;

BY DESCENDING L3;

40

PROC MEANS DATA =dane2.GUes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - Gumbel”;

RUN;

/* T - miary ryzyka*/

data dane2.Tvar;

set dane2.Tgenerowane;

L3 = 0.5 * L1 + 0.5 * L2;

run;

TITLE ”VaR - T”;

proc means data= dane2.Tvar P95;

var L3;

run;

PROC SORT DATA =dane2.Tvar OUT =dane2.Tes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Tes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - T”;

RUN;

/* Normalna- miary ryzyka*/

data dane2.Nvar;

set dane2.Ngenerowane;

L3 = 0.5 * L1 + 0.5 * L2;

run;

TITLE ”VaR - Normalna”;

proc means data= dane2.nvar P95;

var L3;

run;

PROC SORT DATA =dane2.Nvar OUT =dane2.Nes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Nes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - Normalna”;

RUN ;

Dodatek B.7

Kod generujący wartości miar ryzyka dla kopuły T z wybranymi dywersyfikacjami portfela.

data dane2.Tvar;

set dane2.Tgenerowane;

L3 = 1/4 * L1 + 3/4 * L2;

run;

TITLE ”VaR - T”;

proc means data= dane2.Tvar P95;

41

var L3;

run;

PROC SORT DATA =dane2.Tvar OUT =dane2.Tes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Tes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - T”;

RUN ;

data dane2.Tvar;

set dane2.Tgenerowane;

L3 = 3/4 * L1 + 1/4 * L2;

run;

TITLE ”VaR - T”;

proc means data= dane2.Tvar P95;

var L3;

run;

PROC SORT DATA =dane2.Tvar OUT =dane2.Tes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Tes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - T”;

RUN ;

data dane2.Tvar;

set dane2.Tgenerowane;

L3 = 1/5 * L1 + 4/5 * L2;

run;

TITLE ”VaR - T”;

proc means data= dane2.Tvar P95;

var L3;

run;

PROC SORT DATA =dane2.Tvar OUT =dane2.Tes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Tes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - T”;

RUN ;

data dane2.Tvar;

set dane2.Tgenerowane;

L3 = 4/5 * L1 + 1/5 * L2;

run;

TITLE ”VaR - T”;

proc means data= dane2.Tvar P95;

var L3;

42

run;

PROC SORT DATA =dane2.Tvar OUT =dane2.Tes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Tes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - T”;

RUN ;

data dane2.Tvar;

set dane2.Tgenerowane;

L3 = 2/5 * L1 + 3/5 * L2;

run;

TITLE ”VaR - T”;

proc means data= dane2.Tvar P95;

var L3;

run;

PROC SORT DATA =dane2.Tvar OUT =dane2.Tes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Tes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - T”;

RUN ;

data dane2.Tvar;

set dane2.Tgenerowane;

L3 = 3/5 * L1 + 2/5 * L2;

run;

TITLE ”VaR - T”;

proc means data= dane2.Tvar P95;

var L3;

run;

PROC SORT DATA =dane2.Tvar OUT =dane2.Tes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Tes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - T”;

RUN ;

data dane2.Tvar;

set dane2.Tgenerowane;

L3 = 1/8 * L1 + 7/8 * L2;

run;

TITLE ”VaR - T”;

proc means data= dane2.Tvar P95;

var L3;

run;

43

PROC SORT DATA =dane2.Tvar OUT =dane2.Tes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Tes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - T”;

RUN ;

data dane2.Tvar;

set dane2.Tgenerowane;

L3 = 7/8 * L1 + 1/8 * L2;

run;

TITLE ”VaR - T”;

proc means data= dane2.Tvar P95;

var L3;

run;

PROC SORT DATA =dane2.Tvar OUT =dane2.Tes;

BY DESCENDING L3;

PROC MEANS DATA =dane2.Tes (OBS =50) MEAN;

var L3;

TITLE ”Expected Shortfall - T”;

RUN ;

44

Dodatek C

Dodatek C.1. [10]

45

Wykaz literatury

1. Biznes, http://biznes.pl/rynki/gielda/analizy/czy-rynek-surowcow-rolnych-to-efektywna-

alternatyw,5576594,news-detal.html, 12.09.2013, (data dostępu 02.06.2014 r.).

2. Dziedziul K.: Teoria ryzyka z SAS, http://www.mif.pg.gda.pl/homepages/kdz/

teoriaryzyka/ryzyko.pdf , 2013.

3. Gierszewski J.: Alokacja kapitału, WFTiMS PG, 2014.

4. Jajuga K.: Zarządzanie ryzykiem. Wydawnictwo naukowe PWN, Warszawa 2007.

5. Kantowska A.: Analiza ryzyka portfela: inwestycje w srebro i złoto. Projekt dyplomowy

inżynierski. WFTiMS PG, 2011.

6. Krysicki W., Bartos J., Dyczka w., Królikowska K., Wasilewski M.: Rachunek

prawdopodobieństwa i statystyka matematyczna w zadaniach. Wydawnictwo naukowe

PWN, Warszawa 1998.

7. Krzyśko M.: Statystyka Matematyczna. Wydawnictwo naukowe UAM, Poznań 1994.

8. McNeil A., Frey R., Embrechts P.: Quantitative Risk Management: Concepts, Techniques,

and Tools, Princeton University Press, 2005.

9. Wikipedia, http://pl.wikipedia.org/wiki/Kopuła (matematyka),

(data dostępu 02.06.2014 r.)

10. Zieliński W.: Wybrane tablice statystyczne, http://wojtek.zielinski.statystyka.info/Innosci/

T01 normalny.pdf, (data dostępu 02.06.2014 r.)

11. stooq.com/

46