Тема 7, 8: Работа с данни. Представяне на...
TRANSCRIPT
![Page 1: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/1.jpg)
Тема 7, 8: Работа с данни.
Представяне на резултатите
Петър Станков
Изследователски методи
![Page 2: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/2.jpg)
План на дискусията
1. Видове данни
2. Какви данни са подходящи за моята тема?
3. Организация на данните
4. Типични грешки при работа с данни
5. Проверка на хипотезата
6. Представяне на резултатите в таблици
7. Оформяне на изводите от анализа
8. Формулиране на мерки в икономическата политика
9. Написване на заключение и резюме
10. Разпространение на резултатите
![Page 3: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/3.jpg)
1. Видове данни
Сечение: множество индивиди, фирми, държави, за които имаме данни само към определен момент от времето:
Yi = Ai + αX1i + βX2i +… +γXni + ɛi
Дълги редове: един отделен индивид/фирма /държава, данни за много периоди:
Yt = At + αX1t + βX2t +… +γXnt + ɛt
Панелни данни: множество индивиди, фирми, държави, за които имаме данни за множество периоди:
Yit = Ait + αX1it + βX2it +… +γXnit + ɛit
![Page 4: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/4.jpg)
1. Видове данни:
примери
Сечение (+)
-лесно извеждане на корелации
- интуитивно извеждане на зависимости
Сечение (-)
- Сравнително малко наблюдения
- Резултатите нямат каузална интерпретация
Източник: Walliman (2011)
![Page 5: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/5.jpg)
1. Видове данни:
примери
Времеви ред (+)
-лесно извеждане на корелации
- интуитивно извеждане на зависимости
Времеви ред (-)
-Резултатите често нямат каузална интерпретация
-Сравнително малко променливи
- често не може да се прилага МНМК, без да се преобразуват данните
![Page 6: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/6.jpg)
1. Видове данни:
примериПанелни данни (+)
- Възможност за каузална интерпретация
- Възможност да се включат в модела ненаблюдаеми характеристики
Панелни данни (-)
-Методите за анализ са по-сложни
-Данните се събират по-трудно и по-рядко се намират неизследвани бази данни, ако са публично достъпни
![Page 7: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/7.jpg)
2. Какви данни да използвам?• Използвайте сечение, ако:
– Изследвате връзки към даден момент от времето
– Правите международни сравнения с множество държави на един и същ обект (повече от 30, препоръчително над 100)
– Изследвате различни административни единици (области, общини, щати) в една и съща държава, но към даден момент от времето
• Използвайте времеви ред, ако:
– Ви е интересна само една държава или организация
– Въпросът ви засяга определено историческо развитие на две или повече променливи за тази държава
• Използвайте панел, ако:
– Целите резултатите ви да имат каузална интерпретация
– Целите моделите ви да имат висока обяснителна способност
– Се интересувате от историческо развитие на много места едновременно – потвърждаване и отхвърляне на теории?
![Page 8: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/8.jpg)
3. Организиране на данните и
актуализация
• Голяма папка с данни (към папките с л-ра, резултатите и програмата (.do))
• По-малки папки с данни от различни източници и години
• Мастър файлове и работни файлове
• Добавяне на данни– Важност
– Как се прави (append или merge, в зависимост от това дали е панел или сечение)
• Чистене на данни
• Графично представяне на данни
![Page 9: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/9.jpg)
4. Грешки при работа с данни
• При сечения:– Интерпретирам каузалност, вместо корелация
– Правя изводи за историята на даден процес
– Извеждам политически мерки въз основа на това как е работело нещо някъде другаде
• При времеви ред:– Интерпретирам каузалност без необходимата аргументация
– Не съм трансформирал данните си в подходящ за оценка вид: трябва да са “произволни променливи”; трябва да съм направил тестове за единичен корен
• При панелни данни:– Не включвам възможностите на панелните данни – фиксираните
ефекти, клъстеризиране на стандартните отклонения
• Обща грешка:– Не аргументирам защо моето X не е корелирано с грешките и защо
няма обратна каузалност между Y и X – тази аргументация е в основата на извеждането на каузалност (вместо на корелация)
– Опитвам се да максимизирам R2
![Page 10: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/10.jpg)
5. Проверка на хипотезата
• 5.1. Да се върнем на модела. Как проверяваме дадена хипотеза?– Yit = Ait + αX1it + βX2it +… +γXnit + ɛit
– Ако α > 0 и е статистически значимо, то X1 се отразява положително на Y
– Какво става, ако α > 0, но не е статистически значимо?
– Извеждане на резултата от анализа: Икономическа интерпретация на α?
• 5.2. Повтаряме процедурата за всяко X, което ни интересува как влияе на Y
![Page 11: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/11.jpg)
6. Оформяне на
резултатите в
таблици
-По редове: X
- По колони: Y
- Ако имате няколко
версии на модела – те се
дават в различни колони.
Напр., колона (1) дава
влияние на X1-Xk; колона
(2) дава влияние на X1-Xk ,
както и на допълнителни
променливи Xk+1-Xn
-- Таблицата в дясно
имаме едни и същи X, но
различни Y.
![Page 12: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/12.jpg)
6.1. Задължителни атрибути на
таблиците с резултати
• Заглавие: какво изследваме
• X и Y – разбираеми
• Коефициенти, статистически значимости,
стандартни отклонения
• Брой наблюдения (държави / фирми /
потребители)
• R2 (или Adj. R2) – особено при МНМК
• Бележки: допълнителна информация
![Page 13: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/13.jpg)
6.2. Написване на бележките към таблиците
-Максимално кратко и ясно: пояснения: какви променливи се използват
-Добре е да се даде дори уравнението, което се оценява
- Задълженително се дават статистическите значимости накрая
![Page 14: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/14.jpg)
7. Формулиране на изводите от
анализа
• След частта с резултатите:
• Извеждат се повтарящи се зависимости
• Потвърждава ли се хипотезата?
• Вписват ли се резултатите от проверката на хипотезата в определено течение в литературата?– Намерихме ли допълнителни сведения за валидността
на определена теория?
– Опровергахме ли други теории?
• Какво ново научихме от тези резултати?
• Защо се получават тези резултати? (особено ако не са интуитивни)
![Page 15: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/15.jpg)
8. Формулиране на мерки в
икономическата политика
• Имат ли значение моите резултати за определена политика?
• Ако не – за моето изследване политиката няма значение; изследването ми няма отношение към политиката
• Ако да – как може да се промени политиката (или мисленето за политиката) в следствие на моя анализ?
– Пример: изследване за плоския данък
• Необходимост от конкретика
![Page 16: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/16.jpg)
9. Заключение и резюме (abstract)
• Какво направих?
• Как го направих?
• Защо го направих? (На кого служат изводите ми?)
• Потвърждава ли се основната ми хипотеза?
• Имам ли принос към литературата?
• Мога ли да изведа мерки в икономическата политика въз основа на проверката на хипотезата ми?
![Page 17: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/17.jpg)
10. Разпространение на резултатите
1. Конференции
2. Работни доклади на определени организации (напр. финансиращи, или там, където сте провели изследването)
3. Публикации
1. Сборници от конференции
2. Монографии и книги
3. Списания без импакт фактор
4. Списания с импакт фактор
![Page 18: Тема 7, 8: Работа с данни. Представяне на резултатитеhome.cerge-ei.cz/pstankov/teaching/UNWE/resmf16/07_08_Danni_Re… · Тема 7, 8: Работа](https://reader033.vdocuments.pub/reader033/viewer/2022051908/5ffc840470c391428656f1d1/html5/thumbnails/18.jpg)
Още информация
Петър Станков
Каб. 4022, К-ра Икономикс, УНСС
Уебсайт: http://home.cerge-
ei.cz/pstankov/teaching/resmf16.htm
Консултации: Сряда, 09:30-10:30; 15:00-18:00, след
предварителна уговорка по мейл.
СЕДМО Домашно: Произведете първата си таблица с
резултати. Напишете няколко страници коментари по нея,
като имате предвид през цялото време вашата основна
хипотеза. Направете извод накрая: Имате ли достатъчно
основание да потвърдите хипотезата си?