М.А. Шафир Москва АнАлиз соответствий...

16
Cоциология: 4М. 2009. № 28. 29 М.А. Шафир (Москва) АнАлиз соответствий: предстАвление МетодА 1 статья посвящена известному и активно применяющемуся в исследова- тельской практике методу обработки нечисловой информации – анализу соответствий. Метод рассматривается в контексте французской традиции анализа данных и сравнивается с другими разведочными методами. Ключевые слова: анализ соответствий, таблица сопряженности, разве- дочный анализ данных, карта восприятия. в последние годы в социологических и особенно в маркетин- говых исследованиях все чаще используется анализ соответствий. Это многомерный статистический метод, который позволяет исследовать структуру данных, содержащихся в таблицах сопря- женности путем графического представления строк и столбцов таблицы в виде точек пространства более низкой размерности. Как правило, данные, собираемые в ходе социологических и маркетинговых исследований, являются категориальными, т.е. измеренными по порядковой или номинальной шкале. наиболее простая и часто встречаемая форма представления таких данных Марк Александрович Шафир – преподаватель кафедры методов сбора и анализа социологической информации ГУ-вШЭ; генеральный директор не- зависимой исследовательской компании «рАдАр» (www.radar-research.ru). E-mail: [email protected]. 1 Методу анализа соответствий уделялось внимание на страницах нашего журнала (см. № 2 за 1991 г.) в статьях с.Ю. Адамова и Ю.н. Клишиной. в первой из них речь идет о пакете программ, содержащем соответствующий алгоритм.

Upload: others

Post on 16-Aug-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

Cоциология: 4М. 2009. № 28. 29

М.А. Шафир(Москва)

АнАлиз соответствий: предстАвление МетодА 1

статья посвящена известному и активно применяющемуся в исследова-тельской практике методу обработки нечисловой информации – анализу соответствий. Метод рассматривается в контексте французской традиции анализа данных и сравнивается с другими разведочными методами.

Ключевые слова: анализ соответствий, таблица сопряженности, разве-дочный анализ данных, карта восприятия.

в последние годы в социологических и особенно в маркетин-говых исследованиях все чаще используется анализ соответствий. Это многомерный статистический метод, который позволяет исследовать структуру данных, содержащихся в таблицах сопря-женности путем графического представления строк и столбцов таблицы в виде точек пространства более низкой размерности. Как правило, данные, собираемые в ходе социологических и маркетинговых исследований, являются категориальными, т.е. измеренными по порядковой или номинальной шкале. наиболее простая и часто встречаемая форма представления таких данных

Марк Александрович Шафир – преподаватель кафедры методов сбора и анализа социологической информации ГУ-вШЭ; генеральный директор не-зависимой исследовательской компании «рАдАр» (www.radar-research.ru). E-mail: [email protected].

1 Методу анализа соответствий уделялось внимание на страницах нашего журнала (см. № 2 за 1991 г.) в статьях с.Ю. Адамова и Ю.н. Клишиной. в первой из них речь идет о пакете программ, содержащем соответствующий алгоритм.

Page 2: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

30

М.А. Шафир

– это таблица сопряженности (так, по некоторым экспертным оценкам, до 80% маркетингового анализа осуществляется с по-мощью таких таблиц) [1]. поэтому использование анализа соот-ветствий, представляющегося ценным инструментом понимания и объяснения информации, содержащейся в этих таблицах, является весьма актуальным.

за последние два десятилетия резко возросло количество публикаций, посвященных анализу соответствий, носящих как теоретическую, так и прикладную направленность. Широкому распространению анализа соответствий способствовал и тот факт, что в конце 80-х – начале 90-х гг. XX в. метод был реализован в ряде популярных статистических пакетов, таких как SAS, SPSS, STATISTICA. однако в современной отечественной литературе анализ соответствий не имеет адекватного отражения, хотя доволь-но часто применяется в практике маркетинговых исследований. существует ряд работ, ориентированных главным образом на описание техники метода, но большинство из них доступно для понимания весьма ограниченного круга специалистов – тех, кто хорошо знаком с математической статистикой. для значительной же части пользователей-социологов и исследователей рынка такие сугубо теоретические описания имеют невысокую практическую ценность.

Более того, анализ соответствий не может быть сведен просто к техническому описанию алгоритма сингулярного разложения матрицы [2], лежащего в его основе. Анализ соответствий – это нечто большее, чем просто линейное преобразование матриц. Это – особая философия, свойственная, прежде всего, фран-цузской исследовательской традиции. в анализе соответствий процесс тестирования гипотез, использующийся в классических методах математической статистики, замещается интерпретацией графического представления данных – так называемых «карт соответствия» (correspondence map). иллюстрацией этого под-хода служит знаменитый афоризм Ж.-п. Бензекри, одного из

Page 3: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

31

Анализ соответствий: представление метода

основателей метода: «Модель должна вытекать из данных, а не наоборот» [3]. Ж.-п. Бензекри подчеркивает важность видения данных такими, какие они есть, в противовес подгонке данных под заранее заданные модели. в целом эта позиция достаточно точно выражает саму суть разведочного анализа данных.

в статье особое внимание будет уделено теоретико-методоло-гическим истокам анализа соответствий, зародившегося во Фран-ции во второй трети XX в., и распространившегося по всему миру в начале XXI в. Мы затронем лишь историко-философский аспект метода, в то время как технические детали любопытный читатель может найти, например, в работе [4].

Краткое описание метода

основная цель анализа соответствий состоит в том, чтобы перейти от исходной матрицы данных, которой может быть любая таблица сопряженности, к новой, более простой матрице, потеряв при этом как можно меньше информации. Кроме того, анализ соот-ветствий позволяет представить полученные результаты графически, что существенно облегчает интерпретацию. тем самым анализ со-ответствий напоминает метод главных компонент. в том, и в другом случае находится некое n-мерное пространство, которое наилучшим образом описывает исходные данные, а затем полученные оси вра-щаются для того, чтобы перераспределить общую дисперсию между всеми найденными факторами таким образом, чтобы первый фактор объяснял наибольшую долю различий, второй – меньшую, третий – еще меньшую и т.д. так, А. Кутлалиев и А. попов определяют анализ соответствий как особый случай анализа главных компонент строк и столбцов матрицы, который используется в основном для анализа категориальных переменных, в то время как метод главных компо-нент – для анализа непрерывных величин [5, с. 301–302].

ряд авторов подчеркивают родство анализа соответствий с ана-лизом канонических корреляций (см., например, [6, p. 1; 7, p. 208]).

Page 4: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

32

М.А. Шафир

если последний обычно применяется для выявления связи между двумя наборами непрерывных числовых переменных, то первый изначально был разработан для анализа двух дискретных пере-менных. наконец, Ж. Блазиус в работе [8] даже предлагает рас-сматривать анализ соответствий как особый вид многомерного шкалирования, где для вычисления близостей между объектами используется хи-квадрат расстояния, и каждый объект взвешива-ется пропорционально его массе (в качестве массы используется маргинальная частота той или иной строки или столбца исходной таблицы сопряженности).

Анализ соответствий, имея ряд сходств с различными мето-дами многомерного анализа, может использоваться в роли метода и анализа взаимосвязи между категориальными переменными, снижения размерности, поиска латентных факторов, измерения близости между объектами и построения пространства вос-приятия.

в анализе соответствий категории двух или более иссле-дуемых дискретных переменных представляются в виде точек в пространстве низкой размерности. при этом категории, имеющие сходные распределения, будут представлены точками, лежащими близко друг к другу; и, напротив, категории с сильно различаю-щимися распределениями породят далеко лежащие друг от друга точки. поясним это на примере.

в табл. 1 приведены данные об использовании различных источников информации при принятии решения о покупке раз-личных товаров и услуг в 2005 г. они были получены в рамках регулярного синдикативного исследования ��I-россия, проводи-��I-россия, проводи--россия, проводи-мого компанией «КоМКон»1. применяя к этой таблице анализ соответствий, мы получаем геометрическое решение – карту со-ответствий, изображенную на рис. 1, где источники информации

1 подробное описание исследования ��I-россия можно найти на сайте группы компаний «КоМКон» [9].

Page 5: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

33

Анализ соответствий: представление метода

«Как

ими

исто

чник

ами

инфо

рмац

ии в

ы

чащ

е вс

его

поль

зует

есь…

»

советы родных, друзей и знакомых

радио

Газеты

Журналы

телевидение

листовки и брошюры в почтовом ящике

тематические издания, справочники, каталоги

Уличная и транспортная реклама

выставки, презентации

интернет

информация на местах продаж (оформление витрин и прилавков)

Консультации продавцов

при

пок

упке

про

дукт

ов п

итан

ия,

беза

лког

ольн

ых

напи

тков

8272

493

515

510

1526

303

441

353

727

349

2401

3637

при

вы

боре

алк

огол

ьны

х на

питк

ов76

9130

126

731

770

817

832

924

359

119

416

6130

52п

ри в

ыбо

ре т

абач

ных

изде

лий

2833

169

169

166

313

110

139

208

176

107

626

719

при

вы

боре

оде

жды

, обу

ви81

9742

948

574

582

736

356

234

165

034

224

0037

48п

ри в

ыбо

ре у

слуг

и т

овар

ов п

о ух

оду

за д

етьм

и56

5929

034

755

458

821

550

622

435

423

312

9923

50п

ри в

ыбо

ре б

ыто

вой

техн

ики

9045

535

684

914

1345

520

1262

372

784

584

2268

4718

при

пла

ниро

вани

и по

купк

и ко

мпью

тера

, ак

сесс

уаро

в ил

и пр

огра

ммно

го о

бесп

ечен

ия45

8221

932

063

045

824

510

8114

241

774

512

3028

93

при

вы

боре

авт

омоб

иля

или

мото

цикл

а38

9120

129

953

237

212

972

614

137

631

672

915

13п

ри о

бращ

ении

за б

анко

вски

ми и

ли с

трах

овы

ми

услу

гами

6357

419

626

386

638

224

633

177

233

361

948

1527

при

пла

ниро

вани

и от

пуск

а, п

утеш

еств

ия76

5940

855

562

971

528

881

219

130

548

367

111

59п

ри п

лани

рова

нии

вече

ра80

5110

1410

6980

213

3638

649

470

242

044

881

990

8п

ри у

хаж

иван

ии за

дом

ашни

ми ж

ивот

ными

6517

584

852

1142

1278

321

1622

228

511

401

1133

2942

при

пла

ниро

вани

и ул

учш

ения

дом

ашне

го

инте

рьер

а, р

емон

та, п

окуп

ки с

трой

мате

риал

ов72

3643

874

413

8514

6440

715

3630

247

735

116

1231

75

Табл

ица

1ЧА

сто

тА и

сп

ол

ьзо

вАн

ия

ис

тоЧн

иКо

в и

нФ

орМ

Ац

ии

при

при

ня

тии

реШ

ени

я о

по

КУп

КА

х

Ист

очни

к да

нны

х: и

ссле

дова

ние

TGI-

Росс

ия, I

пол

угод

ие 2

005

г., го

рода

с н

асел

ение

м 10

0 т

ыс.

чел

. и б

олее

[9].

Page 6: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

34

М.А. Шафир

и категории товаров/услуг представлены точками в двумерном пространстве.

результат интерпретируется в терминах взаимного расположе-ния точек на карте. общее число измерений в решении на единицу меньше, чем число категорий у переменной наименьшей размер-ности (в нашем примере переменная «источник информации» имеет 12 категорий, а переменная «товар/услуга» – 13 категорий; и, следовательно, итоговая размерность пространства составит 12 – 1 = 11 измерений). Как правило, при практическом исполь-зовании анализа соответствий выбирается двумерное решение, являющееся наиболее наглядным и не слишком сложным для интерпретации. визуализация и интерпретация уже трех осей представляются затруднительными (некоторые способы визуали-зации решений в случае более двух размерностей описываются в работе Ж. рована [10]).

двумерная карта, представленная на рис. 1, показывает взаимосвязь источников информации с категориями товаров и услуг. Горизонтальная ось отделяет услуги (на правом полюсе оси находятся досуг, отпуск, банковские и страховые услуги) от товаров (на левом полюсе – компьютер, бытовая техника, одежда). вертикальная ось отделяет индивидуальное принятие решения (алкогольные напитки и табачные изделия, расположенные на нижнем полюсе, выбираются сугубо индивидуально) от коллек-тивного, семейного (на верхнем полюсе – уход за домашними животными, улучшение интерьера, ремонт, покупка компьютера). расположение точек в пространстве, образованном этими двумя осями, указывает на то, что при выборе индивидуальных услуг и способов проведения досуга характерно использовать информа-цию, получаемую с помощью радио и уличной и транспортной рекламы; в то время как при выборе услуг для всей семьи (уход за домашними животными, улучшение домашнего интерьера, ремонт) чаще используют тематические издания, справочники, каталоги, журналы и интернет. оформление витрин и прилавков

Page 7: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

35

Анализ соответствий: представление метода

Рис. 1

. Кар

та

соот

вет

стви

й

Конс

ульт

ации

про

давц

ов

Инф

орм

ация

на

мес

тах

прод

аж (о

фор

мле

ние

витр

ин и

при

лавк

ов)

Инт

ерне

т

Вы

став

ки, п

резе

нтац

ии

Улич

ная

и тр

ансп

ортн

ая

рекл

ама

Тем

атич

ески

е из

дани

я,

спра

вочн

ики,

кат

алог

и

Лис

товк

и и

брош

юры

в

почт

овом

ящ

ике

Теле

виде

ние

Жур

налы

Газе

ты Рад

ио

Сов

еты

род

ных,

дру

зей

и зн

аком

ых

При

пла

ниро

вани

и ул

учш

ения

ин

терь

ера,

рем

онта

, пок

упки

ст

ройм

атер

иало

вП

ри у

хаж

иван

ии з

а до

маш

ним

и ж

ивот

ным

и

При

пла

ниро

вани

и ве

чера

При

пла

ниро

вани

и от

пуск

а,

путе

шес

твия

При

обр

ащен

ии з

а ба

нков

ским

и ил

и ст

рахо

вым

и ус

луга

ми

При

вы

боре

авт

омоб

иля

или

мот

оцик

ла

При

пла

ниро

вани

и по

купк

и ко

мпь

юте

ра, а

ксес

суар

ов и

ли

прог

рам

мно

го о

бесп

ечен

ия

При

вы

боре

бы

тово

й те

хник

и

При

вы

боре

усл

уг и

тов

аров

по

ухо

ду з

а де

тьм

и

При

вы

боре

оде

жды

, обу

ви

При

вы

боре

таб

ачны

х из

дели

йП

ри в

ыбо

ре а

лког

ольн

ых

напи

тков

При

пок

упке

про

дукт

ов

пита

ния,

нап

итко

в

-0,3

-0,2

-0,10

0,1

0,2

0,3

0,4

0,5

0,6

-0,4

-0,3

-0,2

-0,1

00

,10

,20

,30

,40

,5

ÓÑ

ËÓÃÈ

ÒÎ

ÂÀÐÛ

ÑÅÌ

ÅÉ

ÍÎ

Å

ÏÎ

ÒÐÅÁ

ËÅÍ

ÈÅ

ÈÍ

ÄÈ

ÂÈ

ÄÓÀËÜ

ÍÎ

Å

ÏÎ

ÒÐÅÁ

ËÅÍ

ÈÅ

Page 8: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

36

М.А. Шафир

(информация на местах продаж) чаще всего служит основным источником информации при покупке товаров индивидуального потребления с низкой вовлеченностью («импульсные» товары, одежда, обувь). при выборе товаров с высокой вовлеченностью, когда решение принимается не столько индивидуально, сколько коллективно всей семьей (бытовая техника, компьютер), характер-но получать консультации у продавцов, использовать информацию из тематических изданий, справочников, каталогов.

Рис. 2. Стадии анализа соответствий (цит. по: [4])

в общих чертах полученные выводы являются достаточно тривиальными; однако приведенный пример дает возможность

Page 9: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

37

Анализ соответствий: представление метода

понять основное свойство анализа соответствий – визуализацию связей между категориями в таблицах сопряженности – на ин-туитивном уровне.

схематически процесс анализа происходит следующим обра-зом (см. рис. 2). он проводится в две стадии: сначала для набора категорий одной переменной, потом – второй переменной; после чего результаты обеих стадий совмещаются. в свою очередь каж-дую из этих стадий можно разбить на три этапа. вначале рассчи-тываются профили категорий, получающиеся делением значения в ячейке таблицы на маргинальные суммы по строке или столбцу, и их массы в результате деления маргинальных сумм по строке или столбцу на сумму маргиналов. затем вычисляются расстоя-ния между точками. на третьем этапе находятся оси n-мерного пространства, наилучшим образом описывающие облако точек. полученная конфигурация затем вращается для того, чтобы оси лежали как можно ближе к точкам.

История метода анализа соответствий название анализа соответствий происходит от французско-

го «analyse des correspondences». современный анализ соот-». современный анализ соот-ветствий был разработан во Франции в конце 1960-х – начале 1970-х гг. [3; 11]. при этом схожие методы независимо друг от друга развивались во многих странах и были известны под на-званиями: оптимальное шкалирование, взаимное усреднение, оптимальная оцифровка, квантификационный метод, анализ однородности.

история метода анализа соответствий сопряжена с развитием французской социологической школы и французской традиции в анализе данных (French Data Analysis, FDA), которая фактически опи-рается на анализ соответствий [12]. так, Г. рунэ [13] выделят три перио-да развития анализа соответствий: появление анализа соответствий как самостоятельного направления во Франции в 1963–1973игг., рост

Page 10: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

38

М.А. Шафир

и развитие метода внутри Франции в 1973–1981 гг. и последующее постепенное распространение за пределами Франции с 1981 г.

Первый период. согласно Г. рунэ, теория и практика ана-лиза соответствий начинается с ранних работ Ж.-п. Бензекри в 1963–1964 гг. и защиты докторской диссертации Б. Кодрье в 1965 г. [14], после появления которых метод начал применяться в раз-личных областях исследований. некоторые из ранних примеров практического приложения анализа соответствий были позже описаны Ж.-п. Бензекри и его коллегами. с разработкой новых приемов, таких как дополнительные точки на картах восприятия, множественный анализ соответствий и других, возникла целая методология комплексного анализа многомерных данных, по-лучаемых в ходе эмпирических исследований, которая довольно быстро получила широкое распространение среди французских социологов, в том числе п. Бурдье (цит. по: [13]). Фактически к середине 70-х гг. вокруг Ж.-п. Бензекри и его коллег возникла новая школа анализа данных. в 1971 г. вышла первая книга, по-священная анализу соответствий [15], вслед за которой в 1973 г. появился фундаментальный трактат Ж.-п. Бензекри [3]. следует подчеркнуть, что в течение всего этого периода основной реакцией на «французский анализ» данных со стороны англоговорящих социологов и специалистов по математической статистике было вежливое игнорирование.

Как отмечают К. ван Метер и его соавторы [12], основным препятствием, мешавшим распространению анализа соответствий за пределами Франции, был языковой барьер. лишь незначитель-ная часть англоговорящих социологов и исследователей знала французский язык, в то время как сами французы не предпри-нимали никаких попыток перевести хотя бы базовые работы на английский.

Второй период. в течение второго периода, выделяемого Г. рунэ с 1973-го по 1981 гг., анализ соответствий приобретает огромную популярность во Франции. появляются многочисленные книги,

Page 11: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

39

Анализ соответствий: представление метода

публикации и диссертации, а также множество статей в самых различных областях социологических, маркетинговых, экономе-трических и медицинских исследований. Анализ соответствий становится основным методом анализа данных; в ведущих уни-верситетах, готовящих социологов и специалистов по статистике, анализ соответствий включается в основную программу; появля-ется ряд спецкурсов [12].

Между тем, в англоязычной литературе анализ соответствий все еще не был отражен и языковой барьер остался основной про-блемой. так, анализ соответствий не был упомянут в популярных руководствах по многомерному анализу данных с. хабермана [16] и У. Бишопа [17]. однако, как это часто бывает при противо-стоянии двух научных парадигм, с широким распространением анализа соответствий игнорирование сменилось постепенным взаимопроникновением [12].

Третий период. третий период, выделенный Г. рунэ с 1981 г. и до настоящего времени, ознаменовался приходом на французский рынок популярных американских статистических пакетов, таких как SPSS, SAS, BDMP и др. параллельно интерес к французскому анализу данных возникает, наконец, за пределами Франции. ра-боты [4; 11; 18; 19] и др. содержат подробное описание анализа соответствий, однако все они подходят к методу скорее с матема-тической стороны. Более практически ориентированные работы появились несколько позже, и одновременно ведущие журналы опубликовали в упрощенном изложении отдельные главы и статьи из вышедших ранее работ, в том числе [1; 4; 19]. Это стало своеобраз-ным прорывом в истории анализа соответствий, который стал широко распространяться среди американских ученых и студентов. в 1984 г. известный психолог и социолог Ф. янг включил в свою фундамен-тальную статью по методам шкалирования [20] отдельный раздел, посвященный анализу соответствий. в 1987 г. л.А. Гуд ман [21] по-казал взаимосвязь логлинейного анализа, латентно-структурного анализа и анализа соответствий, предложив использовать их ком-

Page 12: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

40

М.А. Шафир

бинацию для получения возможной количественной информации, содержащейся в категориальных данных.

огромную роль в преодолении разрыва между французской и англоговорящей школами анализа данных сыграли представители первой и в особенности М. Гринакр, бывший студент Ж.-п. Бен-зекри. его колоссальные усилия способствовали выходу метода анализа соответствий на международную арену.

Анализ соответствий во французской социологической школе

поскольку первоначально анализ соответствий развивался в русле французской школы анализа данных, нам представляется крайне важным коснуться, хотя бы поверхностно, той методоло-гической парадигмы, которая лежит в ее основе. Это необходимо для понимания как сути метода, так и причин противостояния французской и «англосаксонской» (термин из источника [12]) традиций анализа данных, сложившегося в 70-е гг. XX в. и не по-XX в. и не по- в. и не по-терявшего своей актуальности до настоящего времени.

при анализе многомерных и к тому же зачастую «некаче-ственных» (в смысле полевых работ, несовершенства исследова-тельского инструментария, большого числа пропущенных ответов и т.д.) социологических данных, с которыми исследователю, как правило, приходится работать, классические инструменты мате-матической статистики редко когда оказываются эффективными. такие инструменты были разработаны в рамках дедуктивного, причинно-следственного естественнонаучного подхода или «про-изводственной статистики», где основным вопросом является контроль качества продукции (решается, считать ли произведен-ную деталь бракованной или нет). они в первую очередь предна-значены для тестирования статистических гипотез и практически не уделяют внимания таким задачам, как описание и комплексное изучение структуры данных, в то время как перечисленные за-

Page 13: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

41

Анализ соответствий: представление метода

дачи часто являются весьма актуальными в социологических исследованиях. Более того, классические методы математической статистики накладывают ряд ограничений на исходные данные: нормальность распределения, независимость наблюдений и т.д. Между тем специфика социологических данных такова, что при-менительно к ним эти ограничения практически никогда не вы-полняются полностью.

в этой связи преимущества анализа соответствий, не налагаю-щего никаких ограничений на данные, очевидны. Фактически этот анализ стал популярным во Франции в противовес классическим методам математической статистики, распространенным в англо-язычном научном сообществе. в качестве основных свойств анали-за соответствий, делающих его крайне актуальным, французские исследователи чаще всего называют то, что он может работать с очень большими массивами данных и позволяет получить доста-точно четкое представление об их структуре.

Французская методологическая парадигма ярче всего пред-ставлена в работах Ж.-п. Бензекри. в одной из своих статей [3] он утверждает, что социологическая наука подвергается серьез-ной опасности из-за присущего большому числу исследователей идеализма, который заставляет их подгонять реальные факты под некоторые априорные представления. в противовес этой тенден-ции Ж.-п. Бензекри предлагает новый метод анализа данных, в котором априорные соображения и заранее заданные гипотезы за-меняются статистически определяемыми показателями, получен-ными на богатом эмпирическом материале. Этими «статистически определяемыми показателями» являются факторы (оси), благодаря которым, по мнению Ж.-п. Бензекри, исследователи получают воз-можность раскрыть сущность вещей, созданную Богом. Ж.-п. Бен-зекри использует понятие «correspondence analysis factors». здесь не случаен термин «факторы». Фактически оси, получаемые в результате применения анализа соответствий, есть не что иное, как латентные факторы, которые, как и в методе главных компо-

Page 14: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

42

М.А. Шафир

нент, вычисляются с помощью сингулярного разложения. на эту тему Ж.-п. Бензекри даже опубликовал статью во французском католическом журнале «La Pensee Catholique» в 1969 г. [22].

несомненно, еще одной причиной повышения интереса к ана-лизу соответствий как во Франции, так и за ее пределами, служит популярность работ п. Бурдье, который использовал этот метод в целом ряде своих работ (см., прежде всего, [23]). так, например, с помощью анализа соответствий п. Бурдье исследовал феномен, который впоследствии был им назван «социальным простран-ством» (social space). различные социально-профессиональные группы и определенный набор ценностей были представлены в пространстве трех главных осей. первые две оси он определил как «объем капитала» и «структура капитала», а третья представляла собой ось времени. при этом термин «капитал» использовался п. Бурдье для обозначения всей совокупности ресурсов и воз-можностей, которыми обладает индивид, включая экономический, социальный и культурный капитал [23].

используя анализ соответствий, п. Бурдье показал связь между определенными типами «вкусов» (tastes), или «стилей жизни» (life-styles), и социальным статусом индивида. Благо-даря тому, что теоретические выводы п. Бурдье иллюстрировал реальными эмпирическими данными, его аргументы приобрели достаточно убедительную силу, что способствовало дальнейше-му распространению анализа соответствий в исследовательской практике, в особенности при изучении проблем социальной стратификации, социальной мобильности, экономической со-циологии и др.

идея построения некого пространства признаков, в котором располагаются определенные объекты, является крайне при-влекательной для маркетинговых исследований. сегодня анализ соответствий является ключевым инструментом построения карт восприятия бренда, анализа имиджа бренда, определения рыноч-ных ниш продукта, оценки конкурентных преимуществ марки.

Page 15: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

43

Анализ соответствий: представление метода

на основании вышеизложенного можно сделать вывод, что анализ соответствий относится к методам предварительного, или разведочного (exploratory) анализа данных. Этот класс методов предназначен в первую очередь для исследования структуры данных, а не для проверки статистических гипотез или установ-ления причинно-следственных связей. разведочные методы не опираются на вероятностные пред положения о природе данных и в отличие от классиче ских методов математической статистики дают результаты, от носящиеся к выборке, а не к генеральной совокупно-сти. их можно эффективно использовать как на предварительном этапе изучения данных (для выявления аномальных наблю дений и группировки объектов), так и для интерпретации ре зультатов моделирования [24]. таким образом, разведочные методы призва-ны порождать гипотезы о распределении и взаимосвязях данных, после чего – на следующем этапе – полученные гипотезы могут тестироваться подтверждающими методами.

литерАтУрА

1. Hoffman D., Franke G. Correspondence Analysis: �raphical Representation of Categorical Data in Market Research // Journal of Marketing Research. 1986. No. 23.

2. Eckart C., Young G. �he Approximation of One Matrix by Another of Lower Rank // Psychometrica. 1936. No. 1. P. 211–218.

3. Benzecri J.-P. Analyse des Donnes. �ome 2. L’analyse de Correspondences. Paris: Dunod, 1973.

4. Greenacre M.J. Practical Correspondence Analysis // Interpreting Multivariate Data / Ed. by V. Barnett. NY: Wiley, 1981. P. 119–146.

5. Кутлалиев А., Попов А. Эффективность рекламы. М.: ЭКсМо, 2005.6. Clausen S.-E. Applied Correspondence Analysis: An Introduction // Series:

Quantitative Applications in the Social Sciences. 1998. Vol. 121. (Sage University Papers).

7. Heiser W., Meulman J. Homogenity Analysis: Exploring the Distribution of Variables and �heir Nonlinear Relationships // Correspondence Analysis in the Social Sciences. San Diego, CA: Academic Press, 1994. P. 179–209.

8. Blasius J. Correspondence Analysis in Social Sciences Research // Corre-spondence Analysis in the Social Sciences. San Diego, CA: Academic Press, 1994. P. 23–52.

Page 16: М.А. Шафир Москва АнАлиз соответствий ...ecsocman.hse.ru/data/2012/02/27/1269103161/Shafir.pdf2012/02/27  · презентации Уличная и

44

М.А. Шафир

9. Группа компаний КоМКон: описание исследования ��I-Russia // http://www.comcon-2.com/default.asp?trID=427.

10. Rovan J. Visualizing Solutions in More than �wo Dimensions // Corre-spondence Analysis in the Social Sciences. San Diego, CA: Academic Press, 1994. P. 210–230.

11. Lebart L., Morineau A., Warwick К. Multivariate Descriptive Statistical Analysis. NY, 1984.

12. Meter K. van, Schiltz M.-A., Cibois P., Mounier L. �he BMS :A History and French Sociological Perspective // Correspondence Analysis in the Social Sciences. San Diego, CA: Academic Press, 1994. P. 128–138.

13. Rouanet H., Everitt B. Comparative Study of Statistical Methods Applied to Social Sciences Data. Paris: ESRC-CNRS, 1988.

14. Codrier-Escofier B. L’analyse des Correspondances: Doctoral �hesis. Ren-nes: Université de Rennes, 1965.

15. Lebart L., Fénelon J.-P. Statistique et Informatique Appliquées. Paris: Dunod, 1971.

16. Haberman S.J. Analysis of Qualitative dada. Chicago: Academic Press, 1978. Vol. 1.

17. Bishop Y., Feinberg S., Holland P.W. Discrete Multivariate Analysis: �heory and Practice. Cambridge USA: MI� Press, 1975.

18. Nishisato S. Analysis of Categorical Data: Dual Scaling and Its Applications. �oronto: University of �oronto Press, 1980.

19. Greenacre M.J. �heory and Applications of Correspondence Analysis. NY: Academic Press, 1984.

20. Young F.W. Scaling // Annual Review of Psychology. 1984. Vol. 35. P. 55–81. 21. Goodman L.A. New Methods for Analyzing the Intrinsic Character of Quali-

tative Variables Using Cross-classified Data // American Journal of Sociology. 1987. Vol. 93(3). P. 529–583.

22. Benzecri J.-P. Philosophie �homiste et Connaissance Mathématique de la Nature // La Pensee Catholique. 1969. No. 118. P. 11–24.

23. Bourdieu P. Distinction: A Social Critique of the Judgment of �aste. Cam-bridge, M.A.: Harvard University Press, 1984.

24. Адамов С. система анализа нечисловой информации «сАни» // социо-логия: методология, методы, математические модели. 1991. № 2. с. 86–104.