Аналитика в общественной деятельности

Post on 18-Jul-2015

153 Views

Category:

Data & Analytics

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

АНАЛИТИКА ВОБЩЕСТВЕННОЙДЕЯТЕЛЬНОСТИ

(на примере избирательных кампаний)

Василенко Евгенийdatastory.org.ua82geka@gmail.com

Проблема «неиспользования данных»

отсутствиеколичественныхкритериев дляклассификации

событий и явлений

неполное доведениерезультатов работы

до конечного потребителя,низкая степень восприятия

представленнойинформации

отстутствие единогомассива данных непозволяет повторно

повторно использоватьинформацию;

отсутствие аналитики,как таковой - «рваный»

ритм в обработке данных

низкая репрезентативностьполученных выводов,

отсутствие информациио погрешностях

и доверительныхинтервалах

пропуск знаний и опытав результате неполнойпроработки имеющихся

массивов данных

невозможностьпривлечения знаний

из смежных областейисследований,невозможность

передачи знаний иопыта!

2

! Записывайте номер страницы, если возник вопрос

Возможности и решения

●анализ данных на больших массивах можно проводить «до бесконечности»

●объединение данных из разных источников даёт синергетический эффект

●инструменты анализа открыты и доступны: программное обеспечение с открытым исходным кодом

●визуализация обязательна!

●многие отрасли используют схожие методики: маркетинговые исследования, социологические исследования, экологический мониторинг, электоральные исследования

3

Инструменты анализа данных

●R — язык программирования (аналитика, графика)●QGIS — геоинформационная система (картография)●OpenStreetMap — картографический сервис (готовые шаблоны)●LibreOffice — пакет офисного ПО (текущая работа с данными)●Debian GNU/Linux — операционная система

4

Сбор данных

Подготовка

ВИЗУАЛИЗАЦИЯ

Описательнаястатистика

Data Mining

Анализ

«Постаналитика»

Последовательность работы с данными 5

средние значения;минимум;максимум;

изменчивость...ответ на вопрос

«что происходит?»

ассоциация;классификация;

последовательность;кластеризация;

прогнозированиеответ на вопрос

«почему происходит?»

Начало избирательной кампании:сбор информации

6

Начало избирательной кампании:компоновка данных

7

Начало избирательной кампании:состав избирательных комиссий

8

Начало избирательной кампании:состав избирательных комиссий

9

Начало избирательной кампании:состав избирательных комиссий

10

Начало избирательной кампании:состав избирательных комиссий

11

Выборы-2012 Выборы-2014

! От низкой явки выигрывали: Компартія; Україна — Вперед!; Солідарність жінок; Сильна Україна; Опозиційний блок

Результаты голосования:регрессионные зависимости

16

! Несмотря на изначально высокую поддержку, с ростом явки в Харьковской области утрата позиций Оппозиционного блока происходила стремительней

Результаты голосования:закон Бенфорда

18

Результаты голосования:типизация избирательных участков

19

Результаты голосования:типизация территориальных сообществ

20

Результаты голосования:разные результаты «тюрьма-воля»

21

Результаты голосования:электоральная география

22

Подключаем сторонние данные:перепись населения, Государственная служба статистики

23

множественные сравнения!

Несколько уровней абстракции;пересчёты в разных срезах

!Стремитесь к наивысшей детализации исходных данных

24

Выводы

●данных много, полезных знаний в них — тоже много

●агрегация данных из разных источников даёт лавинообразный рост полезных знаний

●нужно стремиться к максимальной детализации данных: усреднённые показатели можно всегда рассчитать самим

●эра «исследовательских институтов» прошла

●навыки, умения и примеры легко найти в интернете

●визуализация и снижение размерности обязательны

25

top related