Каким образом и насколько могут big data и Искусственный...
TRANSCRIPT
Каким образом и насколько могут Big Data и Искусственный
Интеллект улучшить on-line обучение?
Профессор Александр Павлович Рыжов МГУ им. М.В. Ломоносова
Российская Академия Народного Хозяйства и Государственной Службы при Президенте РФ
Экосистема обучения люди технологии процессы контент
Москва, 22 ноября 2016
Содержание• Зачем нужны компьютерные обучающие системы?
Существующие образовательные технологии как тормоз развития современной экономики.
• Почему сейчас? Яркие успехи применения Big Data и Искусственного интеллекта в близких областях (например, биржевая торговля, рекомендательные системы).
• Как могут Big Data и Искусственный интеллект улучшить on-line обучение? Необходимые условия интеллектуального управления обучением; персонификация обучения на основе Big Data.
• Каков потенциал персонификации on-line обучения? Нет технических препятствий сделать компьютерные обучающие системы настолько же эффективными, как и лучшие репетиторы или персональные тренеры.
• А можно еще лучше? Не понятно, надо пробовать. Вычислительная педагогика и квантовое управление процессом обучения как близкое будущее.
Зачем нужны компьютерные обучающие системы?
• Зачем нужны компьютерные обучающие системы? Существующие образовательные технологии как тормоз развития современной экономики.
• Почему сейчас? Яркие успехи применения Big Data и Искусственного интеллекта в близких областях (например, биржевая торговля, рекомендательные системы).
• Как могут Big Data и Искусственный интеллект улучшить on-line обучение? Необходимые условия интеллектуального управления обучением; персонификация обучения на основе Big Data.
• Каков потенциал персонификации on-line обучения? Нет технических препятствий сделать компьютерные обучающие системы настолько же эффективными, как и лучшие репетиторы или персональные тренеры.
• А можно еще лучше? Не понятно, надо пробовать. Вычислительная педагогика и квантовое управление процессом обучения как близкое будущее.
Прорывные технологии: преимущества, которые изменят жизнь, бизнес и мировую экономику
http://www.mckinsey.com/business-functions/business-technology/our-insights/disruptive-technologies
Общая характеристика исследования
• Объем: более 100 технологий • Горизонт: среднесрочный (10-20 лет) • Источники:
• Научные журналы • Технологическая и деловая пресса • Сделки венчурных фондов • Тысячи интервью с ведущими экспертами и лидерами бизнеса
• Критерии: • высокий темп технологических изменений (high rate of technology change) • широкая потенциальная сфера влияния (broad potential scope of impact), • затронуты большие отрасли экономики (large economic value that could be affected), • существенный потенциал прорывных экономических последствий (substantial potential for
disruptive economic impact) • Общий результат:
• 12 технологий • общая прямая выгода от внедрения к 2025 году оценивается в пределах от $14 трлн. до
$33 трлн., причем большую часть этого прироста получат экономически развитые страны
Почему сейчас (потребности)?
• Умирание старых/ появление новых специальностей время сжимается
• Технологии обучения мало изменились • «Пифагор» • «Монастырь» • «Школа»
• Вывод: образовательные технологии - тормоз развития современной экономики!
«Пифагор»: Учитель в центре
Greece Sumerians
Rome India China
«Монастырь»: Книга в центре. Книги уникальные и ОЧЕНЬ
дорогие.
«Школа»: Учебник в центре. Учебник стандартный и дешевый.
Ничего не изменилось: • учебник —> iPad • деревянная доска —> пластиковая доска • мел —> фломатер
И это все !
Почему сейчас?• Зачем нужны компьютерные обучающие системы?
Существующие образовательные технологии как тормоз развития современной экономики.
• Почему сейчас? Яркие успехи применения Big Data и Искусственного интеллекта в близких областях (например, биржевая торговля, рекомендательные системы).
• Как могут Big Data и Искусственный интеллект улучшить on-line обучение? Необходимые условия интеллектуального управления обучением; персонификация обучения на основе Big Data.
• Каков потенциал персонификации on-line обучения? Нет технических препятствий сделать компьютерные обучающие системы настолько же эффективными, как и лучшие репетиторы или персональные тренеры.
• А можно еще лучше? Не понятно, надо пробовать. Вычислительная педагогика и квантовое управление процессом обучения как близкое будущее.
Почему сейчас (возможности)?
• Развитие ИКТ/интернета, возможность накапливания и обработки больших объемов данных (big data)
• Успехи data sciences/ machine learning в финансах, производстве и др. областях
• Проблема: адаптивность/ персонификация/ индивидуализация обучения
Всем известно
The global data storage, Exabyte
The global
The global computing power, 1018 ops/secRef: «The world’s technological capacity to store, communicate, and compute information» by Hilbert & Lopez, Science, 2011
• Каждый день в мире производится 2,5 квинтильона (1018) байтов данных. 90%данных созданы за последние два года.
• Каждый час Wal-Mart совершает 1 миллион сделок, пополняя базу данных на 2,5 петабайта (1015) - в 170 раз больше объема данных Библиотеки Конгресса США.
• Объем отправлений, доставляемых американской Почтовой службой за один год, равен 5 петабайтам, а Google обрабатывает такой же объем данных всего за один час.
• Суммарный объем всей существующей на земле информации составляет несколько больше одного зеттабайта (1021).
Ref: Брюхов Д.О., Вовченко А.Е., Калиниченко Л.А., Ковалев Д.Ю., Скворцов Н.А. Извлечение и интеграция информации из больших данных. ИПИ ФИЦ ИУ РАН - http://synthesis.ipi.ac.ru/synthesis/student/BigData/DataIntegration2016/L1%20Introduction.pdf
Немного историиNature 455, 1 (4 September 2008). doi:10.1038/455001a; Published online 3 September 2008
Clifford Lynch, editor
May 2011
http://www.mckinsey.com/business-functions/business-technology/our-insights/big-data-the-next-frontier-for-innovation
Alexander Ryjov. Towards an optimal task-driven information granulation. In: Information Granularity, Big Data, and Computational Intelligence. Witold Pedrycz and Shyi-Ming Chen (Eds.). Springer International Publishing Switzerland 2015, pp. 191-208 h"p://link.springer.com/chapter/10.1007%2F978-3-319-08254-7_9
Большие данные - большие перспективы
Ref.: http://www.mckinsey.com/mgi/publications/big_data/index.asp
Некоторые факты The use of big data will
underpin new waves of productivity growth and consumer surplus
Использование больших данных ляжет в основу новой волны роста производительности труда и потребительского изобилия
Где есть данные? В чем потенциал?
Big Data - не просто…• Как собрать? Как и где хранить? Как искать? - «технические проблемы».
• Аналитика больших данных - ценность для бизнеса:
• Биржи 1): • 70% торгов на Уолл-стрит осуществляются через роботов • В России на долю роботов приходится почти половина заявок на ММВБ и до 90% на
срочном рынке РТС • На EUREX алгоритмическая торговля уже составляет 90%, и эта цифра стремится к
100 процентам
• Торговля 2): • Amazon.com утверждает, что 40% продаж генерируются через механизмы
рекомендаций. • Социальные сети 3):
• 50% выбора работы на LinkedIn - прямой результат рекомендаций • … Примеры - https://www.youtube.com/watch?v=1bo27Jkn5OI
Ref 1: Восстание машин. Роботы захватили и разоряют мировые биржи? - Версия. №44 от 14.11.2016 - https://versia.ru/roboty-zaxvatili-i-razoryayut-mirovye-birzhi Ref 2: http://kpis.ru/2008/04/29/Item_to_Item_Amazon.html#.WDBK3aKLRE4 Ref 3: https://www.quora.com/How-does-LinkedIns-recommendation-system-work?cm_mc_uid=39580370786314790366644&cm_mc_sid_50200000=1479560781
EdTech market landscape
Как могут Big Data и Искусственный интеллект улучшить on-line обучение?• Зачем нужны компьютерные обучающие системы?
Существующие образовательные технологии как тормоз развития современной экономики.
• Почему сейчас? Яркие успехи применения Big Data и Искусственного интеллекта в близких областях (например, биржевая торговля, рекомендательные системы).
• Как могут Big Data и Искусственный интеллект улучшить on-line обучение? Необходимые условия интеллектуального управления обучением; персонификация обучения на основе Big Data.
• Каков потенциал персонификации on-line обучения? Нет технических препятствий сделать компьютерные обучающие системы настолько же эффективными, как и лучшие репетиторы или персональные тренеры.
• А можно еще лучше? Не понятно, надо пробовать. Вычислительная педагогика и квантовое управление процессом обучения как близкое будущее.
Mindset для smart learning
• Система управления
• Объект управления
• Среда
• Критерий
27
Mindset для smart learning• Система управления
• Объект управления
• Среда
• Критерий
28
Телеметрия
Управление
Критерий
Mindset для smart learning• Система управления
• Объект управления
• Среда
• Критерий
29
Трэкинг
Управление
контерном Критерий
Трэкинг/ измерения
30
Трэкинг
Управление
контентом Критерий
Нет smart learning без измерений
• Что мы может измерять? • Время • Количество правильных/ не правильных ответов
• Стиль (играется мышкой?)
• Аудио/ видео обстановку • Показания health trackers • …
Управление контентом
31
Трэкинг
Управление
контентом Критерий
Нет smart learning без вариативного контента
• Что мы можем менять? • оформление контента (цвет,
картинки) • Последовательность подачи/
навигация • Уровень сложности • Перерыв • Турбо-режим • …
Цели/ критерий управления
32
Трэкинг
Управление
контентом Критерий
Нет smart learning без четкого критерия
• Возможны различные критерии
• Максимальный объем за заданное время
• Заданное качество за минимальное время
• Критерий задается извне
Персонификация • Уровни персонификации (примеры):
• Если ученик слабый (сильный) - не давать сложное (простое) задание
• Если ученик устал - отложить сложное задние
• …
• Надо уметь (как минимум):
• Определять сложность задания (простое - сложное)
• Классифицировать учеников (слабый - сильный)
Сложность заданияIRT (Item Response Theory (syn: latent trait theory, strong true score theory, modern mental test theory))
Сложность задания
Кластеризация заданий
легкие/сложные/очень сложные
Кластеризация заданий: легкие/сложные/очень сложные..?
Классификация учеников
Оптимизация:• дисбаланс классов• степень нечеткости
Количество кластеров Степень нечеткости Дисбаланс3 0,268 0,8134 0.28 0,9275 0.28 0,8876 0.29 0,8587 0.28 0,9068 0.3 0,942
c-means (FCM, с-средних)
Классификация учеников (решение задания)
История (70:30)Обучение (на 70%)• k-Nearest Neighbors algorithm (алгоритм k Ближайших Соседей)• Random forest (комитет решающих деревьев)• AdaBoost (Adaptive Boosting — усиление классификаторов, путём объединения их в комитет)
• Gbm (Gradient boosting)Тестирование (на 30%)Ошибки 1 и 2 рода
Классификация учеников (прогнозирование решения задания)
Ассоциативные зависимости
Профили
Минимальная верхнеуровневая архитектура
Обучение (первичные измерения)
ТестированиеСистема оценки и мониторинга принадлежности
к классам
• Внимательность• Скорость• Выносливость• Обработка
Система оценки и мониторинга
процесса обучения
• Очень легко• Штатно• Очень тяжело
Система генерации сценарияобучения
• Тип контента• Последовательность• …
Система оценкии мониторинга
качестваобучения
• Отлично• Хорошо• Удовлетворительно• Плохо
Расширенная верхнеуровневая архитектура
Обучение (первичные измерения)
ТестированиеСистема оценки и мониторинга принадлежности
к классам
Система оценки и мониторинга
процесса обучения
Система генерации сценарияобучения
Система оценкии мониторинга
качестваобучения
Система оценки и мониторинга
психофизическогосостояния
Система оценки и мониторинга окружающей
среды
Приборы Мини-тесты Гаджеты Датчики PC/ планшета
• Внимательность• Скорость• Выносливость• Обработка
• Очень легко• Штатно• Очень тяжело
• Тип контента• Последовательность• …
• Отлично• Хорошо• Удовлетворительно• Плохо
Детализация минимальной архитектуры
Первичные измерения (цифры)
Система оценки и мониторинга принадлежности
к классам
Система оценки и мониторинга
процесса обучения
Система генерации сценарияобучения
Система оценкии мониторинга
качестваобучения
Лингвистическое представление (принадлежность к понятиям)A
X=x*; Y=y*
Xx*
маленький большой
Если A=маленькая и B=большая то Z1Если С=маленький то Z2… Логическое представление (нечеткие правила)
• Внимательность• Скорость• Выносливость• Обработка
• Очень легко• Штатно• Очень тяжело
• Тип контента• Последовательность• …
• Отлично• Хорошо• Удовлетворительно• Плохо
Каков потенциал персонификации on-line обучения?
• Зачем нужны компьютерные обучающие системы? Существующие образовательные технологии как тормоз развития современной экономики.
• Почему сейчас? Яркие успехи применения Big Data и Искусственного интеллекта в близких областях (например, биржевая торговля, рекомендательные системы).
• Как могут Big Data и Искусственный интеллект улучшить on-line обучение? Необходимые условия интеллектуального управления обучением; персонификация обучения на основе Big Data.
• Каков потенциал персонификации on-line обучения? Нет технических препятствий сделать компьютерные обучающие системы настолько же эффективными, как и лучшие репетиторы или персональные тренеры.
• А можно еще лучше? Не понятно, надо пробовать. Вычислительная педагогика и квантовое управление процессом обучения как близкое будущее.
Куда придем
FAT гарантирует существование решения
А можно еще лучше? • Зачем нужны компьютерные обучающие системы?
Существующие образовательные технологии как тормоз развития современной экономики.
• Почему сейчас? Яркие успехи применения Big Data и Искусственного интеллекта в близких областях (например, биржевая торговля, рекомендательные системы).
• Как могут Big Data и Искусственный интеллект улучшить on-line обучение? Необходимые условия интеллектуального управления обучением; персонификация обучения на основе Big Data.
• Каков потенциал персонификации on-line обучения? Нет технических препятствий сделать компьютерные обучающие системы настолько же эффективными, как и лучшие репетиторы или персональные тренеры.
• А можно еще лучше? Не понятно, надо пробовать. Вычислительная педагогика и квантовое управление процессом обучения как близкое будущее.
Cloud
Education XIX vs. Education XXI
Ref: Alexander Ryjov. Disruptive technologies: transforming health care, education, and government. The 2nd APEC e-Government Forum and IAC 10th Anniversary Event. September 28-29, 2015, Waseda University, Tokyo, Japan.
Возможности• Ассоциативные правила - неочевидные эффективные зависимости. Лучше специалиста (второй закон И. Ньютона).
• Квантовое управление - генерация «хорошего решения» из нескольких «плохих». Лучше консилиума специалистов (закон С.В. Ульянова).
• Новая «вычислительная педагогика» разрешит противоречие экономики XXI века.
Более широкий контекст
���������
�������������� ����������
���������������������������
������������������ ���������� ��������������������������
����������� ������������������������������������������������ ������ ���� �������� ���������� ���� ������ ���������������������������� �������������������������������������������� ��� � �������������� ��� ������ ��������������� ������������ �� �� �������� ����� ����������� ������������� ������������������������������������������������������ �������� ������� ��� ���������� ��������� �������� ����������� ������� ��������� ������� ������� ����������������������� ��������������������� ������� ���� ��������� ������ ��� � ������� ��� ���� ���� ���� ��� ����������� �������� ��� �� ������� ��� ��� �� �������!���"��������������������������������������� ��#��� �� ������ ���� ���� ����� �������� � �� � ���� ���� ������������ ���# � ������� �� � � ������������� ��� ����������� ������������������#��������������������������������������� � $��� �� ����������� ������������ "���#!���� %� ������������ ��� ����� ����� ������ ��� ���!���������� ������� ������������� �������!��� �� ����������!��� ����� ����� ����� � �� � �������� � ������ �� ���������� ������ ����������� ����� #$����� ���������� ������� �� ��!��������������������������������������� ��������
������������ ���������������%&��� ������������������������������� ����������������� ��!������'������ ����������������������������� ������()�������%�*��������������+�����,������������-&./�(0����'��������-1��&���������"#�� �������� �������������������������!���������������������$#���� ���������� ������������!���
���������������
Рыжов Александр Павлович[email protected]: alexander.ryjovLinkedIn: ru.linkedin.com/pub/alexander-ryjov/1/957/859http://www.intsys.msu.ru//staff/ryzhov/