segmentaÇÃo de mercado de um programa de...

71
i FACULDADE DE ECONOMIA E FINANÇAS IBMEC PROGRAMA DE PÓS-GRADUAÇÃO E PESQUISA EM ADMINISTRAÇÃO E ECONOMIA DISSERTAÇÃO DE MESTRADO PROFISSIONALIZANTE EM ADMINISTRAÇÃO SEGMENTAÇÃO DE MERCADO DE UM PROGRAMA DE RECOMPENSA: UMA APLICAÇÃO DO MÉTODO DRSADOMINANCE-BASED ROUGH SET APPROACH CHARLENE SANTINO DA SILVA ORIENTADOR: PROF. DR. LUIZ FLÁVIO AUTRAN MONTEIRO GOMES Rio de Janeiro, 26 de fevereiro de 2014.

Upload: nguyendieu

Post on 08-Dec-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

i

FACULDADE DE ECONOMIA E FINANÇAS IBMEC PROGRAMA DE PÓS-GRADUAÇÃO E PESQUISA EM

ADMINISTRAÇÃO E ECONOMIA

DDIISSSSEERRTTAAÇÇÃÃOO DDEE MMEESSTTRRAADDOO

PPRROOFFIISSSSIIOONNAALLIIZZAANNTTEE EEMM AADDMMIINNIISSTTRRAAÇÇÃÃOO

SEGMENTAÇÃO DE MERCADO DE UM PROGRAMA DE RECOMPENSA: UMA

APLICAÇÃO DO MÉTODO DRSA– DOMINANCE-BASED ROUGH SET

APPROACH

CCHHAARRLLEENNEE SSAANNTTIINNOO DDAA SSIILLVVAA

ORIENTADOR: PROF. DR. LUIZ FLÁVIO AUTRAN MONTEIRO GOMES

Rio de Janeiro, 26 de fevereiro de 2014.

ii

“SEGMENTAÇÃO DE MERCADO DE UM PROGRAMA DE RECOMPENSA: UMA

APLICAÇÃO DO MÉTODO DRSA– DOMINANCE-BASED ROUGH SET

APPROACH”

CHARLENE SANTINO DA SILVA

Dissertação apresentada ao curso de

Mestrado Profissionalizante em

Administração como requisito parcial para

obtenção do Grau de Mestre em

Administração.

Área de Concentração: Gestão das

Organizações

ORIENTADOR: LUIZ FLÁVIO AUTRAN MONTEIRO GOMES

Rio de Janeiro, 26 de fevereiro de 2014.

iii

iv

S586

Silva, Charlene Santino da.

Segmentação de mercado de um programa de recompensa:

uma aplicação do método DRSA – Dominance-Based Rough

Set Approach / Charlene Santino da Silva. - Rio de Janeiro:

[s.n.], 2014.

60 f. : il.

Dissertação de Mestrado profissional em Administração

do IBMEC.

Orientador(a): prof.º Luiz Flávio Autran Monteiro Gomes.

1. Gestão das Organizações. 2. Apoio Multicritério à

Decisão. 3. DRSA. 4. Programa de Fidelidade. I. Título.

CDD 658.4034

v

AGRADECIMENTOS

Aos meus pais, pois sem eles nada disso seria possível. Agradeço por todos os esforços que

fizeram e por tudo que tiveram de abrir mão para me proporcionar uma educação de qualidade

e uma formação acadêmica capaz de enfrentar os desafios da minha carreira profissional. Sou

muito grata a vocês por tudo o que fizeram, fazem e ainda farão por mim.

Ao meu noivo, por todo o apoio, paciência, compreensão e incentivo que teve durante a

realização do meu mestrado.

Ao meu orientador, Professor Luiz Flavio Autran Monteiro Gomes, pelo aprendizado

proporcionado, bem como pela sua paciência e atenção em todo o processo de criação dessa

dissertação.

Ao Ayrton Couto por ter me auxiliado durante o meu processo de aplicação do método usado

nesse trabalho e por ter dispensado algumas horas do seu dia me ajudando a formatar o banco

de dados.

vi

“Todo o ato de criação é, em primeiro

lugar, um ato de destruição”.

Pablo Picasso

vii

RESUMO

Esse estudo teve foco na segmentação de clientes através do uso de uma ferramenta pouco

usada no Brasil, embora amplamente divulgada na literatura especializada de Apoio

Multicritério à Decisão – o DRSA, ou Dominance-Based Rough Set Approach. O DRSA

consiste em um método que possibilita determinar regras de classificação, na presença de

múltiplos critérios. Assim, este método opera através da relação de preferência no domínio

dos critérios escolhidos, levando em consideração a opinião dos tomadores de decisão,

diferentemente das técnicas estatísticas mais tradicionalmente usadas. O estudo aqui

apresentado segmentou uma amostra de 10 mil clientes do Estado do Rio de Janeiro, que

participam de um programa de relacionamento de uma empresa de telecomunicações. O uso

do DRSA gerou mais de 200 regras, que permitiram classificar os clientes de acordo com seus

perfis, através dos critérios escolhidos. Além disso, o DRSA determinou o grupo de clientes

de maior valor para a empresa, ou seja, aqueles que devem ser alvos diretos de suas

campanhas de incentivo a resgate de prêmios. Pela relativa simplicidade do DRSA, concluiu-

se que o mesmo enfoque deve definitivamente ser empregado em outros estudos de

segmentação de mercado semelhantes ao aqui abordado.

Palavras Chave: Apoio Multicritério à Decisão, DRSA, Segmentação de Mercado, Programa

de Fidelidade.

viii

ABSTRACT

This study focused on a market segmentation through the use of an analytical tool that has

been barely used in Brazil, although well known in the Multicriteria Decision Aid litterature –

DRSA, or Dominance-Based Rough Set Approach. DRSA is a method that allows

determining classification rules in the presence of multiple criteria. DRSA functions through

the preference relation in the domain of the chosen criteria, taking into account the opinions

of decision makers, differently from traditional statistical approaches. The study that is

presented here considered a sample with 10,000 clients in the State of Rio de Janeiro. Those

are clients that participate in a relationship program of a telecommunications company. Using

DRSA led to more than 200 rules, that allowed classifying clients according to their profiles,

by means of chosen criteria. Besides, DRSA determined the group of clients with the highest

value for the company and those should be the direct target of specific actions. Due to the

relative simplicity of DRSA, it was concluded that the same approach must definitely be used

in similar studies of market segmentation.

Key Words: Multicriteria Decision Aid, DRSA, Market segmentation, Loyalty program.

ix

LISTA DE FIGURAS

Figura 1- Imagem Gerada no Software JMAF com os valores da qualidade da

aproximação e da quantidade de clientes dentro de cada aproximação superior e

inferior das classes e a região de fronteira para o modelo 1. ...................................... 36

Figura 2 - Imagem Gerada no Software JMAF com os valores da qualidade da

aproximação e da quantidade de clientes dentro de cada aproximação superior e

inferior das classes e a região de fronteira para o modelo 2. ...................................... 37 Figura 3 - Imagem Gerada no Software JMAF com os redutos e núcleo do modelo 1. .. 38

Figura 4 - Imagem Gerada no Software JMAF com os redutos e núcleo do modelo 2. ... 38

Figura 5 - Imagem Gerada no Software JMAF com as 6 regras de decisão para o modelo

1. ....................................................................................................................................... 50

Figura 6 - Imagem Gerada no Software JMAF com as regras de decisão de 1 a 29 para

o modelo 2. ....................................................................................................................... 51

Figura 7 - Imagem Gerada no Software JMAF com as regras de decisão de 30 a 58

para o modelo 2. .............................................................................................................. 52

Figura 8 - Imagem Gerada no Software JMAF com as regras de decisão de 59 a 87 para

o modelo 2. ....................................................................................................................... 53

Figura 9 - Imagem Gerada no Software JMAF com as regras de decisão de 88 a 116

para o modelo 2. .............................................................................................................. 54

Figura 10 - Imagem Gerada no Software JMAF com as regras de decisão de 117 a 145

para o modelo 2. .............................................................................................................. 55

Figura 11 - Imagem Gerada no Software JMAF com as regras de decisão de 146 a 174

para o modelo 2. .............................................................................................................. 56

Figura 12 - Imagem Gerada no Software JMAF com as regras de decisão de 175 a 200

para o modelo 2. .............................................................................................................. 57

Figura 13 - Imagem Gerada no Software JMAF com as regras de decisão de 201 a 229

para o modelo 2. .............................................................................................................. 58

Figura 14 - Imagem Gerada no Software JMAF com a reclassificação dos objetos

segundo as regras geradas pelo modelo 1. .................................................................... 58

Figura 15 - Imagem Gerada no Software JMAF com os volumes gerados na

reclassificação dos objetos segundo as regras geradas pelo modelo 1. ...................... 59

Figura 16 - Imagem Gerada no Software JMAF com a reclassificação dos objetos

segundo as regras geradas pelo modelo 2. .................................................................... 59

Figura 17 - Imagem Gerada no Software JMAF com os volumes gerados na

reclassificação dos objetos segundo as regras geradas pelo modelo 2. ...................... 59 Figura 18 - Algoritmo de DOMLEM .................................................................................... 60

x

LISTA DE TABELAS

Tabela 1 – Comparativo entre os métodos da Escola Francesa e da Escola Norte-Americana 10 Tabela 2 – Tipos de Problemática e seus Objetivos. ................................................................ 11 Tabela 3 – Descrição dos Critérios Usados no Estudo ............................................................. 31 Tabela 4 – Matriz de Dados (30 primeiros clientes da amostra de 10 mil clientes). ............... 34

Tabela 5 – Comparativo entre o volume de regras geradas por Modelo. ................................. 38

xi

SUMÁRIO

1 INTRODUÇÃO ..................................................................................................... 1

2 PROBLEMA ......................................................................................................... 3

2.1 Contextualização do Problema ................................................................................................................... 3

2.2 Formulação do Problema ............................................................................................................................ 3

2.3 Objetivos ....................................................................................................................................................... 3

2.4 Relevância do Estudo ................................................................................................................................... 4

2.5 Delimitação do estudo .................................................................................................................................. 4

3 REVISÃO DA LITERATURA ............................................................................... 5

3.1 Segmentação de Mercado ............................................................................................................................ 5

3.2 Métodos de Apoio à decisão de Multicritério ............................................................................................ 8

3.3 Método RSA – Rough Set Approach ou TCA – Teoria dos Conjuntos aproximativos ....................... 12

4 METODOLOGIA ................................................................................................ 19

4.1 Método DRSA – Dominance –Based Rough Set Approach ..................................................................... 19 4.1.1 Entendendo o DRSA .......................................................................................................................... 20 4.1.2 Extraindo as regras de decisão ........................................................................................................... 25

5 ESTUDO DE CASO: SEGMENTAÇÃO DE CLIENTES DE UM PROGRAMA DE RELACIONAMENTO ................................................................................................ 27

6 CONCLUSÃO .................................................................................................... 42

7 RECOMENDAÇÃO DE ESTUDOS FUTUROS ................................................. 43

REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................... 45

APÊNDICE A ............................................................................................................ 49

APÊNDICE B ............................................................................................................ 50

ANEXO A – ALGORITMO DOMLEM ....................................................................... 60

1

1 INTRODUÇÃO

As empresas buscam a inovação continuamente, mas no universo de telecomunicações, assim

como em outros mercados, isso nem sempre acontece na velocidade desejada e os clientes

acabam preferindo os concorrentes. Pensando nisso, as empresas de telecomunicações

começaram a investir em programas de relacionamento.

Para Kotler (2007) uma empresa precisa encontrar seu próprio caminho e algumas medidas

podem ser tomadas, tais como: “Segmentar mais criativamente do que seus concorrentes e

encontrar novos segmentos em que possa se posicionar melhor; Cercar seus produtos com

uma reputação de qualidade melhor ou que sejam mais difíceis de ser imitados; Trabalhar em

cima de planos melhores para criar clientes leais (tais como programas de fidelidade)”.

Os programas de fidelidade do consumidor, ou programas de relacionamento baseados em

recompensa, podem ser aplicados em praticamente qualquer segmento. Os mais complexos se

baseiam em três pilares que funcionam de forma integrada: o relacionamento, o

reconhecimento e a recompensa. O primeiro estabelece uma relação com o cliente através de

um canal de comunicação direto, o segundo proporciona ao cliente um sentimento de fazer

parte de um grupo seleto com benefícios diferenciados e exclusivos, que o diferencia dos

demais e, o terceiro premia o cliente de acordo com o seu consumo, de forma proporcional

visando um aumento do consumo tradicional.

Como os clientes não são iguais e estão em constante assédio da concorrência, é fundamental

que se tenha bem definido quais são os clientes mais valiosos para o negócio, pois são para

estes clientes que os Programas de Fidelidade, em geral, são direcionados.

2

Um dos principais desafios dos programas de relacionamento é promover recompensas que

sejam atraentes aos seus clientes e que os mantenham fiéis ao negócio da empresa. Em grande

parte dos programas de relacionamento buscam-se recompensas que onerem pouco a empresa

e que gerem satisfação aos clientes. Mas nem sempre o que os clientes desejam é barato.

Então é muito importante saber o que oferecer e a quem oferecer. Dessa forma, outro desafio

desse negócio é selecionar o público-alvo do programa de relacionamento, pois embora o

programa seja para “todos os clientes”, dependendo do tipo de recompensa disponível, o custo

da mesma é alto e inviável para a empresa. Sendo assim, quais os clientes devem ser

priorizados no universo de recompensas? Como selecionar o verdadeiro público-alvo do

programa?

Tentando responder essas e outras perguntas, esse estudo pretende estabelecer um modelo de

segmentação de clientes de um programa de relacionamento de uma grande empresa de

telecomunicações brasileira e, ainda, estabelecer um critério de priorização destes clientes

frente ao programa de relacionamento de modo a torná-lo uma ferramenta eficiente e

importante na manutenção da fatia do mercado (market share) da empresa.

A fim de atingir esse objetivo, esse estudo utilizou-se do método de apoio a decisão

multicritério DRSA (Dominance-based Rough Set Approach) proposto por Greco, Matarazzo

& Slowinski (1998 a, 1999 a,b), que utiliza o princípio de dominância estabelecendo as

relações de dominância e aproximação das classes de decisão para gerar a segmentação dos

clientes através da inferência de regras de decisão do tipo “se..., então...”. Isto é, se o cliente

tem determinado perfil, então ele é classificado nessa classe de decisão e, assim, é

estabelecida a segmentação desses clientes.

3

2 PROBLEMA

2.1 CONTEXTUALIZAÇÃO DO PROBLEMA

Os programas de relacionamento têm sido uma das formas utilizadas por diversas empresas

para conquistar os clientes e fidelizados a sua marca. A grande dificuldade é ter um programa

atrativo que seja eficiente e que realmente consiga realizar seu principal papel: manter o

cliente vinculado à empresa. A proposta desse trabalho é ajudar uma empresa de

telecomunicações a identificar o grupo de clientes que deve ser priorizado nas suas ações de

incentivo ao resgate de recompensa de modo a manter a saúde financeira do programa.

2.2 FORMULAÇÃO DO PROBLEMA

O problema que será respondido nesse estudo é: Como tornar um programa de

relacionamento, utilizando técnicas de segmentação de mercado, uma ferramenta eficiente

para uma empresa, visando a manutenção da base de seus principais clientes?

2.3 OBJETIVOS

2.3.1 OBJETIVO PRINCIPAL

O objetivo principal do trabalho é identificar os grupos de clientes principais, segundo sua

propensão de resgate, de modo a orientar os tomadores de decisão no planejamento do

programa para o próximo ano.

2.3.2 OBJETIVO INTERMEDIÁRIO

Tem-se por objetivo intermediário desse trabalho, a criação de uma segmentação de clientes

segundo a propensão a resgate utilizando o método de apoio a decisão multicritério DRSA.

4

2.4 RELEVÂNCIA DO ESTUDO

Esse estudo será importante para as empresas do mercado de telecomunicações brasileiro ou

para qualquer outra empresa ou pessoa interessada em segmentar seus clientes e que desejam

investir ou criar programas de relacionamentos eficientes.

Além disto, proporciona conhecimento científico com a aplicação do método de apoio à

decisão multicritério na criação de uma segmentação para potencializar e direcionar um

programa de relacionamento de uma empresa de telecomunicações.

Há vários métodos na literatura que possibilitam a realização de uma segmentação, mas o

método DRSA permite gerar regras de classificação das mais variadas, a partir da relação de

preferência no domínio dos critérios escolhidos pelos tomadores de decisão, que possibilitarão

classificar os clientes de forma clara, levando em consideração a opinião dos tomadores de

decisão.

2.5 DELIMITAÇÃO DO ESTUDO

Apesar da existência de diversos métodos de apoio da decisão classificatórios utilizados

atualmente, esse estudo se limitará a utilizar o método de apoio à decisão multicritério DRSA

para ajudar no direcionamento dos tomadores de decisão de uma empresa de

telecomunicações.

O estudo se baseia na percepção do tomador de decisão com base nos critérios a priori

estabelecidos e observados pela companhia e pelas tendências apontadas pelos clientes dessa

empresa. Esse estudo não promoverá a segmentação completa da base de clientes dessa

5

empresa, ele mostrará como se deve proceder na aplicação do método de apoio a decisão

multicritério DRSA para uma amostra desses clientes, segundo as características do problema.

3 REVISÃO DA LITERATURA

3.1 SEGMENTAÇÃO DE MERCADO

Segundo Kotler (1998), “As empresas seriam espertas se conhecessem melhor seus clientes.

Toda companhia deve ter um grupo de clientes para ajudar a ler a mente em mudança do

consumidor.”

A segmentação de mercado é uma prática realizada por diversas empresas para conseguir

avaliar o mercado potencial de seus produtos, desenvolver posições competitivas para os

produtos frente os concorrentes e para direcionar suas ações de forma customizada e assertiva

para o público ou nichos escolhidos investirem em produtos ou serviços.

Segmentação de mercado é o processo de dividir um mercado em grupos de

compradores que tenham semelhantes necessidades e desejos, percepções de

valores ou comportamentos de compra. Os indivíduos ou organizações de cada

grupo – ou segmento – do mercado podem responder de maneira semelhante a

uma determinada estratégia de marketing. As empresas usam as informações

para decidir a quais segmentos de mercado podem atender de forma mais

lucrativa, enquanto as organizações sem fins lucrativos usam-nas para serem

mais eficientes no alcance de suas metas. O segmento específico de mercado

que uma organização seleciona para servir é chamado de mercado-alvo.

(CHURCHILL; PETER, 2000, p. 204-205)

6

Realizar uma segmentação não é algo simples e algumas etapas são necessárias, tais como:

levantamento de informações (através de entrevistas, grupos de foco, questionários ou bancos

de dados disponibilizados pelas empresas), análise (aplicações de técnicas estatísticas, tais

como a análise fatorial que ajudam a identificar as variáveis altamente correlacionadas e

análise de conglomerados ou de cluster e técnicas de regressão multivariada que determinam

os grupos segundo as características semelhantes) e desenvolvimento do perfil (detalhamento

de cada segmento segundo suas atitudes, comportamentos, fatores demográficos,

psicográficos e hábitos de mídia).

Conforme Churchill & Peter (2000); Kotler & Armstrong (1998); Kotler (1998); Simpson

(2001) a segmentação de mercado é realizada das seguintes formas:

Segmentação Geográfica (requer uma divisão do mercado em diferentes unidades

geográficas, como países, estados, regiões, cidades ou bairros.).

Segmentação Demográfica (divisão do mercado com base em variáveis demográficas,

tais como: sexo e idade, etc.).

Segmentação Psicográfica ou Socioeconômica (segmenta através dos perfis do estilo

de vida dos diferentes consumidores, classe social, na personalidade, nas atitudes e na

percepção).

Segmentação Comportamental (utiliza-se de características comportamentais, tais

como: conhecimento, atitude, uso ou resposta para um determinado produto para

segmentar os clientes.).

Segmentação por Multiatributos (esse tipo de segmentação de mercado parte do

princípio de conglomerados geográficos, que proporcionam informações mais ricas

sobre os consumidores.).

7

Segmentação baseada em Comportamento de Compra (o comportamento de compra

pode ser: prudente, impulsivo, pessimista, tradicional e confiante combinado com a

frequência de uso, situação de lealdade e situação de usuário ou ainda, a sensibilidade

a preços ou preferências de qualidade).

Segmentação de Mercados Industriais (utiliza-se das formas de segmentação de

consumidores, tais como: variáveis demográficas, operacionais, de abordagens de

compra, de fatores situacionais e de características pessoais.).

Segmentação dos Mercados Internacionais (utiliza-se de uma única variável ou de uma

combinação delas, tais como: regiões, nível de renda, estabilidade do governo,

receptividade e determinada característica cultural.).

Segmentação Intermercado (consumidores com hábitos semelhantes, mas em regiões

diferentes).

Depois de identificado os segmentos de mercado potenciais, esses deveriam ser analisados,

pois nem todas as formas de segmentação são efetivas. Os segmentos precisam ser:

Mensuráveis (que conseguem ser medidos), Substanciais (importantes), Acessíveis (que pode

ser compreendido com facilidade) e Acionáveis (que pode ser acionado), para serem úteis.

Na literatura há diversos trabalhos realizados no âmbito da segmentação de mercado, entre

eles, temos: Granat (2004), que fez uso da análise de cluster para segmentar os clientes de

uma empresa do ramo das telecomunicações e posteriormente determinar algoritmos que

descrevessem tais clusters; Coughlan & Soberman (2005), que segmentaram clientes de dois

fabricantes a partir de modelos probabilísticos baseados na preferência espacial, sensibilidade

de preço e serviço; Martins (2011), que segmentou clientes portugueses de marcas próprias

utilizando a análise fatorial e a análise de cluster.

8

3.2 MÉTODOS DE APOIO À DECISÃO DE MULTICRITÉRIO

O processo de tomada de decisão envolve múltiplos critérios, também denominados de

objetivos ou fatores, e variáveis qualitativas. Para Malczewski (1999), decisões são

necessárias quando uma oportunidade ou problema existe, ou quando algo não é o que deveria

ser ou, ainda, quando existe uma oportunidade de melhoria ou otimização. Segundo Gomes &

Gomes (2012), decidir é escolher uma alternativa em um conjunto de alternativas possíveis

sob a influência de pelo menos dois parâmetros conflitantes.

Para Gomes & Gomes (2012), a tomada de decisão complexa pode estar relacionada a

problemas que possuem pelo menos uma dessas características:

Os critérios de resolução do problema são pelo menos dois e que conflitam entre si;

Tanto os critérios ou alternativas de solução não são claramente definidos e as

consequências da escolha de dada alternativa com relação a pelo menos um critério

não são claramente compreendidas;

Os critérios e alternativas podem estar interligados;

A solução do problema depende de um conjunto de pessoas;

As restrições do problema não são bem definidas;

Alguns critérios são quantificáveis enquanto outros só o são por meio de julgamentos

em cima de escalas;

A escala para dado critério pode ser cardinal, verbal ou ordinal;

Várias outras complicações podem surgir de um problema real de tomada de decisão.

Na década de 70, surgiram os primeiros métodos voltados para problemas discretos de

decisão, no ambiente multicritério e multiobjetivo que utilizam uma abordagem diferenciada

para essa classe de problemas. Atualmente, existem vários métodos analíticos de Apoio

9

Multicritério à Decisão, que são oriundos de duas escolas de pensamento, segundo Clímaco &

Craveirinha (2005):

A Escola Americana, onde uma função de utilidade multiatributo (linear ou não) é

construída para apoiar a avaliação de um conjunto discreto de alternativas;

A Escola Francesa, também chamada de Escola Europeia, que introduz ordens parciais

ou relações de superação nos seus modelos.

Para Gomes (2007), o método MAUT - Multiple-Attribute Utility Theory (Keeney & Raiffa,

1976) e o AHP - Analytic Hierarchy Process (Saaty, 1980) são os mais representativos da

escola norte-americana, que procura agregar todas as informações por meio de uma grande

síntese. Enquanto que, os métodos Electre (Ehrgott , Figueira & Greco, 2010) e Prométhée

(Brans et al., 1984) pertencem a escola francesa, que agregam as informações a partir do

conceito de superação sem utilizar operações de síntese. Outros métodos também são

utilizados como MACBETH (Bana & Costa; Vansnick, 1995, 1997), TODIM (Gomes &

Rangel, 2009), etc.

A seguir, temos a tabela 1 que compara as principais características dos métodos da escola

norte-americana e francesa.

Métodos da Escola Francesa ou Escola

Europeia

Métodos da Escola Americana ou Teoria

de Utilidade Multiatributo

Permitem ordenar (pelo menos parcialmente)

as alternativas em termos relativos, mesmo

quando a informação de que dispõe sobre as

preferências critério a critério é pobre; no

entanto, não é possível a indicação do mérito

global de cada alternativa.

Possibilita definir uma medida de mérito

(global) para cada alternativa, indicadora da

sua posição relativa numa ordenação final;

no entanto, é necessário dispor de

informação completa (cardinal), sobre as

preferências intracritérios dos decisores, o

que em alguns casos práticos pode ser difícil.

10

Permitem quatro diferentes formas de

comparação entre alternativas: preferência

sem hesitação; preferência com hesitação;

indiferença e incomparabilidade.

Permite duas formas de comparação:

preferência e indiferença, não pressupõe a

existência de hesitação.

A hesitação é uma área fértil para aplicação

de teorias que trabalham com não

determinismo: Teoria dos Conjuntos

Nebulosos e Teoria dos Conjuntos

Aproximativos (TCA).

Existem trabalhos que aplicam as Teorias dos

Conjuntos Nebulosos e TCA para verificar a

sensibilidade dos resultados.

Não necessitam de uma função de utilidade,

utilizando-se de comparações paritárias e

gráficos de Kernel para representar a

dominância das alternativas.

Pressupõe a criação de uma função de

utilidade.

Não pressupõe transitividade. Pressupõe transitividade.

Pressupõem superação e análise paritária. Facilita o estabelecimento de hierarquias.

Tabela 1 – Comparativo entre os métodos da Escola Francesa e da Escola Norte-Americana

Fonte: Adaptada de Gomes & Gomes (2012)

Dias et al. (1996) identificam duas fases nos processos de apoio a decisão: a fase de

estruturação e a de avaliação. Ainda podemos identificar uma terceira fase: a recomendação

dos cursos da ação a serem seguidos.

A fase de estruturação, segundo Bana & Costa et al. (2000), representa 80% do total do

problema, pois trata da formulação do problema e da identificação dos objetivos. Essa fase

busca identificar, caracterizar e organizar os fatores considerados relevantes no processo de

apoio à decisão. Assim como, definir os objetivos do decisor, identificar as alternativas

viáveis, estabelecer os critérios que vão intervir no processo de decisão, entre outras etapas

que dependem do problema abordado.

11

A fase de avaliação pode ser dividida em fase de avaliação parcial das alternativas, segundo

cada critério, e a fase de avaliação global, considerando as diversas avaliações parciais. Para

realizar a avaliação é necessário escolher um dos métodos disponíveis, tradicionalmente

classificados em métodos para problemas multiatributos e multiobjetivos. Os problemas

multiatributos lidam com alternativas discretas enquanto que os problemas multiobjetivos

consideram um espaço contínuo de alternativas.

Segundo Gomes & Gomes (2012), podemos identificar quatro tipos de problemática de

referência no contexto de apoio à decisão em função do resultado pretendido em determinado

problema. A tabela 2 apresenta os tipos de problemática e seu resultado pretendido.

Tabela 2 – Tipos de Problemática e seus Objetivos.

Fonte: Adaptado de Gomes & Gomes (2012)

Na literatura, existem diferentes métodos multicritério de apoio à decisão para tratar essas

problemáticas. Caberá ao especialista ou tomador de decisão escolher o método que mais se

adéqua ao seu problema e a decisão que se pretende tomar.

Dado o objetivo desse estudo de classificar clientes de um programa de relacionamento,

optou-se por dois métodos que serão mais detalhados adiante, o RSA – Rough Set Approach

Tipos de Problemática Resultado Pretendido

Problemática P Realizar uma escolha ou um procedimento de seleção

Problemática P Realizar uma triagem ou um procedimento de classificação

Problemática P Realizar um arranjo ou um procedimento de ordenação

Problemática P Realizar uma descrição ou um procedimento cognitivo

12

(Pawlak, 1982) e o DRSA - Dominance-Based Rough Set Approach (Greco, Matarazzo &

Slowinski, 1998, 1999).

3.3 MÉTODO RSA – ROUGH SET APPROACH OU TCA – TEORIA DOS

CONJUNTOS APROXIMATIVOS

Proposta pelo matemático polonês Zdizslaw Pawlak, em 1982, a Teoria dos Conjuntos

Aproximativos (TCA) busca extrair de um banco de dados os atributos fundamentais para que

se possa chegar a uma regra de decisão. Na TCA, o tratamento da imprecisão dos dados é por

meio de aproximações inferior e superior de um conjunto de dados (Pawlak, 1991).

O conceito fundamental dessa teoria é o conceito de granularidade, que segundo Pawlak

(1991) está caracterizado na identificação das unidades observadas no exame dos vetores de

avaliações do conjunto de variáveis e na precisão na medição de cada variável. Para Pawlak &

Slowinski (1994), a granularidade na representação da informação pode ser a origem de

inconsistências nas decisões, dada a ambiguidade na explicação ou na prescrição da mesma

com base numa informação inconsistente.

Outra vantagem dessa teoria, segundo Pawlak e Skowron (2007), é que não são necessárias

informações preliminares ou adicionais aos dados, conforme acontece em outros métodos.

A TCA se aplica a muitos casos reais e em diversas áreas de estudo da administração, de

sistemas da informação, pesquisa operacional, etc. Algumas aplicações podem ser vistas em:

Ferreira & Gomes (1995), Pawlak et al. (1995), Gomes & Gomes (2001), Yiyu Yao & Yan

Zhao (2007) e Couto & Gomes (2010).

13

Para utilizar a TCA, o problema deve ter um sistema de informações com objetos, atributos

condicionantes e atributos de decisão ou classificação.

No início da aplicação do TCA, os objetos são agrupados em classes, onde aqueles agrupados

em uma mesma classe são considerados indiscerníveis, pois possuem as mesmas

características para os mesmos atributos analisados, sendo assim, considerados iguais diante

do banco de dados analisado.

A redução do número de atributos é desejável em um problema de classificação usando

múltiplos atributos, desde que se mantenha a mesma qualidade da classificação. Segundo

Ziarko (1993), a TCA é uma das ideias mais úteis para reduzir-se o número de critérios (ou

atributos). Uma etapa importante da TCA é a identificação dos redutos (reduct), que é o

conjunto mínimo de atributos de condição suficientes para identificar os conjuntos de

observações indiscerníveis pelo(s) atributo(s) de decisão, que mantém a classificação original.

Em outras palavras, o reduto é o conjunto mínimo de atributos de condição que permite tomar

as mesmas decisões caso fossem emregados todos os atributos de condição (Pawlak, 1991;

Pawlak & Slowinski, 1994; Pawlak, 2000). O número de redutos pode ser grande ou pequeno,

assim como o número de atributos em cada reduto, isso depende da granularidade na medição

de cada atributo.

Os atributos que aparecem em todos os redutos, isto é, as interseções desses conjuntos de

redutos, representam o núcleo (core) que corresponde à parte insubstituível da informação, ao

passo que os outros atributos mínimos podem ser intercambiáveis. O núcleo pode ser

interpretado como a parte mais importante de um sistema de informação (Pawlak, 1991;

Pawlak & Slowinski, 1994; Pawlak, 2000).

14

Durante essa etapa de identificação dos redutos, temos atributos que podem ser classificados

como dispensáveis e por isso acabam saindo do sistema de informação, pois a retirada deles

não afeta a classificação dos objetos que se mantêm as mesmas de antes (Pawlak, 1982).

A Teoria dos Conjuntos Aproximativos não distingue as inconsistências do seu sistema de

informações pela possibilidade de uma classificação em um valor imediatamente superior ou

inferior pelo atributo de decisão. Toda inconsistência tem o mesmo peso para o cálculo da

qualidade da aproximação (Patrício et al., 2005).

Para entender como funciona o TCA, é necessário entender algumas terminologias. Segundo

Pawlak & Slowinski (1994) o sistema de informação do TCA (S) é composto por uma

quádrupla S=<U,Q,V,>, onde:

U é um conjunto finito de objetos

Q é um conjunto finito de atributos

V= q ϵ Q Vq , Vq é o domínio do atributo q

: U x Q →V é uma função total tal que (x,q) ϵ Vq q ϵ Q, x ϵ U, denominada

função de informação. Todo par (q,v), q ϵ Q, v ϵ Vq é chamado descritor em S.

Dessa forma, o sistema de informação pode ser relacionado a uma matriz finita, onde cada

coluna é associada a um atributo, cada linha corresponde a um objeto e a célula localizada no

cruzamento da coluna q com a linha x tem o valor (x,q). Logo, cada linha da matriz

representa a informação de um objeto em S.

Se dois objetos quaisquer possuem os seus valores (x,q) pertencentes a um mesmo

subintervalo, diz-se que são indiscerníveis em relação a um atributo. De acordo com Pawlak

15

& Slowinski (1994), seja S=<U,Q,V,> um sistema de informação e P Q e x, y ϵ U. Os

objetos x e y são indiscerníveis pelo conjunto de atributos P em S se e somente se (x,q) =

(y,q) q ϵ P.

Portanto, todo P Q gera uma relação binária em U, denominada relação de

indiscernibilidade ou relação de equivalência segundo P, designada por IND (P). As classes

de equivalência de IND (P), são chamadas conjuntos P-elementares em S e a família de todas

as classes de equivalência da relação IND (P) em U é designada por U | IND (P) ou, em

termos abreviados, U | P.

A cada par (objeto, atributo) associa-se um descritor, sendo que cada linha da matriz contém

descritores representativos da informação sobre um particular objeto. DESP (x) designa uma

descrição do conjunto P-elementar x e U | P em termos dos valores dos atributos de P, ou seja,

DESP (x) = <(q, v) : (x, q) = v, x ϵ X, q ϵ P>.

Seja o sistema de informação estruturado como uma tabela de decisão, na qual Q = C D e C

D = , onde C é o conjunto de atributos de condição e D o conjunto de atributos de

decisão.

Uma tabela de decisão S = < U, C D, V, > é determinística se e somente se C D, caso

contrário essa tabela será não determinística. Se determinadas condições preestabelecidas para

a tomada de decisão são satisfeitas, a tabela é determinística e descreve univocamente as

decisões a serem tomadas. Se estas condições não forem estabelecidas, as decisões serão não

univocamente relacionadas e a tabela de decisão será não determinística. Neste caso será

definido um subconjunto de decisões que serão tomadas caso ocorram tais circunstâncias.

16

Sejam P Q e Y U. Define-se a aproximação P-inferior a Y, designada por P Y, e a

aproximação P-superior a Y, designada por P Y, pelas seguintes expressões (1):

P Y = {X ϵ U | P: X Y } e PY = {X ϵ U | P: X Y } (1)

Sendo assim, Y é um conjunto aproximativo em relação a P, se e somente se, P Y PY

(Pawlak, 1991).

Define-se ainda a P-fronteira do conjunto Y pela equação (2):

FP (Y) = P Y - P Y (2)

Onde, o conjunto P Y é o conjunto de todos os elementos de U que podem ser com certeza

classificados como elementos de Y, a partir do conjunto de atributos P eP Y é o conjunto dos

elementos que não podem, com certeza, ser classificados como elementos de Y utilizando-se

o conjunto de atributos P.

A cada subconjunto Y U associa-se uma precisão da aproximação ao conjunto Y pelo

conjunto de atributos P na quádrupla S (Pawlak & Slowinski, 1994). A precisão de Y é

indicada pela fórmula (3):

(3)

, onde card designa cardinalidade.

17

A precisão mede o quanto o conhecimento sobre o conjunto Y está completo. A falta de

exatidão de um conjunto é devido à existência da região de fronteira. Quanto maior a região

de fronteira, menor é a precisão (Pawlak, 1991).

Seja a partição y = {Y1, Y2,..., Yn} do conjunto de objetos U. Essa partição pode advir da

designação de cada objeto a uma categoria pré-definida por um especialista, caso em que a

origem da partição independe dos atributos em P. Sendo assim, os subconjuntos Yi, i = 1,..., n,

são classes (ou categorias) da partição Y. As aproximações P-inferior e P-superior de S são os

conjuntos PY = { PY1 , PY2 , ... , PYn} e PY = {PY1 , PY2 , ... , PYn}, respectivamente.

Entende-se por qualidade da aproximação da partição Y pelo conjunto de atributos P, também

denominada qualidade da classificação, o quociente dado pela fórmula (4):

(4)

O conjunto de atributos R Q depende do conjunto de atributos P Q em S, representado

por P R, se e somente se IND (P) IND (R). Seja um subconjunto mínimo R P Q , tal

que P (Y) = R (Y), denomina-se Y-redução de P, representada por REDY (P). Um sistema

pode possuir mais de uma Y-redução, a interseção de todas as Y-reduções é denominada Y-

núcleo de P, isto é, NUCY (P) = REDY (P).

Dada uma tabela de decisão, pode-se deduzir um conjunto de regras de decisão. Seja U | IND

(C) uma família de todos os conjuntos C-elementares denominados classes de condições e

designados por Xi ( i = 1, ... , m). Seja, também, a família U | IND (D) de todos os conjuntos

D-elementares designados por Yj (j = 1, ... , n) e denominados classes de decisões.

18

Define-se (C, D), a regra de decisão, como sendo a relação causal DESC (Xi) DESD (Yj).

Dada esta definição, as regras são declarações lógicas do tipo “se... então ... ” que relacionam

descrições de classes de condições de decisões.

Define-se ainda {rij} como o conjunto de regras de decisão para classes de decisões Yj (j =

1,..., n), isto é, {rij} = { DESC (Xi) DESD (Yj): Xi Yj, i = 1, ... , m}. Caso Xi Yj,

diz-se que a regra de decisão é determinística e, caso contrário, a regra é não determinística.

O problema de classificação multicritério consiste em descobrir regras de decisão, levando-se

em conta as avaliações (preferências) do especialista ou agente de decisão. Neste caso, tem-se

que card (C) > 1 e card (D) = 1.

Pode-se aplicar a TCA, através da construção de uma tabela de decisão, nos seguintes

problemas:

i. Descrição multicritério, onde card (C) > 1 e card (D) = 0;

ii. Avaliação multi-especialista, onde card (C) = 1 e card (D) > 1; e

iii. Classificação (ou avaliação) multicritério e multi-especialista, onde card (C) > 1 e card

(D) > 1.

Segundo Ziarko (1993; 1993a), a TCA apresenta algumas restrições, entre elas: a TCA é

sensível a pequenos erros de classificação, causados por problemas de dependência de

atributos e que as conclusões derivadas desse conjunto são aplicáveis somente a esse

conjunto, o que na prática, limita a generalização das conclusões para um conjunto maior de

informações. Como alternativa Ziarko (1993; 1993a) propõe o uso do modelo VP (Variable

Precision) que permite reconhecer a presença de dependência dos dados.

19

Além disso, Greco, Matarazzo & Slowinski (2005) observam que o princípio de

indiscernibilidade não é suficiente para cobrir toda a semântica de um conjunto de

informações e propõem a substituição do princípio de indiscernibilidade pelo princípio de

dominância.

De acordo como princípio de dominância proposto por Roy & Bouyssou (1993), se x domina

y, x é ao menos tão bom quanto y com relação a todos os critérios considerados, então x

deveria pertencer a uma classe não pior do que a classe y; se não, há uma inconsistência entre

x e y.

4 METODOLOGIA

4.1 MÉTODO DRSA – DOMINANCE –BASED ROUGH SET APPROACH

O método Dominance-Based Rough Set Approach (DRSA) proposto por Greco, Matarazzo &

Slowinski (1998, 1999, 2012) lida com problemas de classificação multicritério. Ele

generaliza o método Rough Set Approach (RSA) (Pawlak, 1982, 1991), substituindo a relação

indiscernibilidade, utilizada na RSA, por uma relação de dominância, permitindo a descoberta

de inconsistências no que diz respeito ao princípio de dominância. Além disso, o DRSA

prepara uma base conceitual para a aplicação de regras que tem sintaxe concordante com o

princípio da dominância.

No DRSA assim como no RSA, as informações dos objetos são representados por uma matriz

de dados, onde as linhas correspondem aos objetos, às colunas são os atributos e os valores da

matriz representam os valores dos objetos para cada atributo correspondente.

20

Na classificação multicritério, atributos de condição são critérios cuja noção envolve uma

ordem de preferência no seu domínio, enquanto os domínios de atributos, geralmente

considerados, não são ordenados pela preferência.

4.1.1 Entendendo o DRSA

Seja U um conjunto finito de objetos, Q um conjunto finito de atributos, Vq um domínio do

atributo q, e f (x, q) uma função onde para cada par objeto - atributo (x, q) temos um valor de

Vq. O conjunto Q em geral é dividido em conjunto C de atributos de condição e D do atributo

de decisão.

O atributo de decisão D divide U em um número finito de classes Cl = {Clt, t ∈ T}, T = {1, ...,

n}. Cada x ∈ U pertence a uma e somente uma classe Clt ∈ Cl . As classes Cl são ordenadas

de acordo com a ordem de preferência crescente dos índices da classe, ou seja, para todos r, s

∈ T, tal que r > s, os objetos de Clr são os preferidos aos objetos de Cls.

Dessa forma, devido à ordem de preferência no conjunto de classes Cl, os objetos são

aproximados por uniões para cima (upward) e uniões para baixo (downward) das classes,

respectivamente, pelas equações em (5):

e , t =1,…,n (5)

Onde, é o conjunto de objetos pertencentes à classe Clt ou a classe mais preferida,

enquanto é o conjunto de objetos pertencentes à classe Clt ou a classe menos preferida.

21

Note que para t = 2,..., n temos , ou seja, todos os objetos que não pertencem

a classe Clt , ou melhor, pertencem à classe de Clt-1 ou pior. Dessa forma, cada objeto, a partir

da união para cima , é preferido a cada objeto da união para baixo . É dessa forma

que o princípio de dominância é aplicado no DRSA.

Seja q uma relação de preferência fraca em U (Roy, 1985) que representa uma preferência

no conjunto de objetos com relação ao critério q; x q y significa "x é pelo menos tão bom

quanto y em relação ao critério de q". Dizemos que x domina y em relação a P ⊆ C (ou, x

P-domina y), denotado por xDpy , se x q y q ∈ P. Assumindo que, sem perda de

generalidade, todos os domínios de critérios são ordenados de modo que a preferência

aumenta com o valor, xDpy é equivalente a: f (x,q) ≥ f (y,q) q ∈ P. Observe que para cada x

∈ U, xDpx, ou seja, a relação de dominância é reflexiva .

Dado P ⊆ C e x ∈ U, os "grânulos de conhecimento" usados em DRSA para a aproximação

das uniões e são:

• um conjunto de objetos que dominam x, chamado conjunto P-dominante,

.

• um conjunto de objetos dominados por x, chamado conjunto P-dominado,

.

Dado um conjunto de critérios de P ⊆ C, a inclusão de um objeto x ∈ U para a união para

cima das classes , t = 2,..., n, cria uma inconsistência no sentido do princípio de

dominância se uma das seguintes condições ocorre:

22

• x pertence à classe Clt ou melhor, mas é P-dominado por um objeto y pertencente a uma

classe pior do que Clt, ou seja x ∈ , mas ,

• x pertence a uma classe pior do que Clt, mas P-domina um objeto y pertencente a classe Clt

ou melhor, isto é, x ∉ , mas .

Logo, se dado um conjunto de critérios P ⊆ C, a inclusão de x ∈ U para , t = 2, ... , n, cria

uma inconsistência no sentido do princípio de dominância, dizemos que x pertence a com

alguma ambiguidade. Assim, x pertence sem qualquer ambiguidade em relação ao P ⊆ C,

se x ∈ e não há nenhuma inconsistência no sentido do princípio de dominância. Isto

significa que todo objeto P-dominante x pertence a , isto é, ⊆ .

Além disso, x poderia pertencer a no que diz respeito a P ⊆ C, se uma das seguintes

condições ocorre:

1) de acordo com o atributo de decisão D, x pertence ,

2) de acordo com o atributo de decisão D, x não pertence a mas é inconsistente no sentido

do princípio de dominância com um objeto y pertencente a .

Em termos de ambiguidade, x poderia pertencer a no que diz respeito a P ⊆ C, se x

pertence com ou sem qualquer ambiguidade. Devido à reflexividade da relação de

dominância DP, as condições 1) e 2) podem ser sintetizados como segue: x poderia pertencer a

classe Clt ou melhor , no que diz respeito a P ⊆ C, se entre os objetos P- dominado por x há

um objeto y pertencente a classe Clt ou melhor, isto é , .

23

Para P ⊆ C, o conjunto de todos os objetos pertencentes a sem qualquer ambiguidade

constitui o P-menor aproximação de , indicado por P ( ), e o conjunto de todos os

objetos que poderiam pertencer à constitui a P-aproximação superior da , indicado por

P ( ) em (6):

P ( ) = { x ∈ U: ⊆ },P ( ) = { x ∈ U: } , para t = 1,..., n . (6)

De forma análoga, pode-se definir P- menor aproximação e P-aproximação superior da

como se segue em (7):

P ( ) = {x ∈ U: ⊆ }, P ( ) = { x ∈ U: } , para t =1,...,n. (7)

Todos os objetos pertencentes a e com alguma ambiguidade constituem a P- fronteira

de e , denotado pelo BnP ( ) e o BnP ( ), respectivamente. Eles podem ser

representados, em termos de aproximações superiores e inferiores como em (8):

BnP ( ) = P ( ) – P ( ) , BnP ( ) = P ( ) – P ( ) , para t=1,...,n. (8)

Aproximações P-inferiores e P-superiores da união de classes e têm uma propriedade

importante de complementaridade. Diz-se que se o objeto x pertence, sem qualquer

ambiguidade, a classe Clt ou melhor, é impossível que ele possa pertencer a classe Clt-1 ou

pior , ou seja, P ( ) = U -P( ). Devido à propriedade de complementaridade, tem-se

que a BnP ( ) = BnP ( ) , para t = 2,..., n , o que significa que, se x pertence à classe de

ambiguidade Clt ou melhor, ele também pertence à classe com a ambiguidade Clt-1 ou pior.

24

As aproximações P-inferiores da união de classes representam conhecimento certo fornecido

pelos critérios de P ⊆ C, enquanto as aproximações P-superiores representam o possível

conhecimento e as P-fronteiras contêm o conhecimento duvidoso. Essas definições de

aproximações são baseadas em uma aplicação estrita do princípio da dominância.

Para cada P ⊆ C, os objetos sendo consistentes no sentido do princípio de dominância com as

uniões de classes para cima e para baixo são P- classificadas corretamente. Para cada P ⊆ C, a

qualidade da aproximação da classificação multicritério Cl por um conjunto de critérios P é

definido como a razão entre o número de objetos P- classificados corretamente e o número de

todos os objetos no conjunto de amostra de dados. Uma vez que os objetos P- classificados

corretamente são aqueles que não pertencem a qualquer P-fronteira das uniões e ,

t= 1, ... , n, a qualidade da aproximação da classificação multicritério Cl pelo conjunto de

atributos P, pode ser escrita como em (9):

(9)

Onde, γp(Cl) pode ser visto como uma medida da qualidade do conhecimento que pode ser

extraída da matriz de dados, onde p é o conjunto de critérios e Cl é a classificação

considerada.

Cada subconjunto mínimo P⊆C, tal que γp(Cl) = γc(Cl), é chamado um reduto de Cl e, é

denotado por REDCl. Assim como em RSA, um conjunto de amostras de dados pode ter mais

de um reduto e a interseção de todos os redutos é chamada de núcleo e é denotada por

CORECl. Os critérios do CORECl não podem ser removidos do conjunto da amostra de dados

25

sem deteriorar o conhecimento da informação. Dessa forma, no conjunto C temos três

categorias de critérios:

1) Os critérios indispensáveis incluídos no núcleo,

2) os critérios permutáveis incluídos em alguns redutos mas não no núcleo,

3) os critérios redundantes que nem são indispensáveis nem passíveis de troca, portanto, não

incluídos em qualquer reduto.

4.1.2 Extraindo as regras de decisão

As aproximações das uniões de classes para cima e para baixo do DRSA podem servir para

induzir regras de decisão do tipo "se ... , então ..." para os objetos da matriz de dados.

Para uma dada união de classes para cima e para baixo, e , as regras de decisão

induzidas sob uma hipótese de que os objetos pertencentes a P( ) ou P( ) são positivos e

todos os outros negativos, e sugerem uma atribuição a "classe Clt ou melhor" ou a "classe Cls

ou pior" , respectivamente. Por outro lado, as regras de decisão induzidas sob a hipótese de

que os objetos pertencentes à intersecção P ( ) ∩ P ( ) são positivos e todos os outros

negativos, estão sugerindo uma atribuição para algumas classes entre Cls e Clt (s < t). Na

classificação multicritério é significativo considerar os seguintes cinco tipos de regras de

decisão:

1) Regras de decisão certas ( ): se f (x, q1 ) ≥ rq1 e f (x, q2) ≥ rq2 e ... f (x, qp) ≥ rqp, então

x ∈ ,

2) Regras de decisão possível ( ): se f (x, q1 ) ≥ rq1 e f (x, q2) ≥ rq2 e ... f (x, qp) ≥ rqp , então

x poderia pertencer a ,

26

3) Regras de decisão certas ( ): se f (x, q1 ) ≤ rq1 e f (x, q2) ≤ rq2 e ... f (x, qp) ≤ rqp, então

x ∈ ,

4) Regras de decisão possível ( ): se f (x, q1) ≤ rq1 e f (x, q2) ≤ rq2 e ... f (x, qp) ≤ rqp, então

x poderia pertencer a ,

5) Regras de decisão aproximativas ( ): se f (x, q1) ≥ rq1 e f (x, q2) rq2 ≥ e ... f (x, qk ) ≥ rqk

e f (x, qk +1) ≤ rqk+1 e ... f (x, qp ) ≤ rqp, então x ∈ Cls ∪ Cls+1 ∪ ... ∪ Clt ,

No lado esquerdo de uma regra de decisão podemos ter "f ( x , q) ≥ rq" e "f ( x , q) ≤ r'q" ,

onde rq ≤ r'q , para o mesmo q ∈ C. Além disso, se rq = r'q , as duas condições se resumem a

"f (x, q) = rq" .

As regras do tipo 1) e 3) representam um certo conhecimento extraído da matriz de dados,

uma vez que são aplicadas para objetos sem ambiguidade, enquanto as regras de tipo 2) e 4)

representam conhecimento possível e são aplicadas a objetos com ou sem qualquer

ambiguidade , e as regras de tipo 5) representam o conhecimento duvidoso, para objetos em

que não conseguimos discernir a sua classe e que pertence a união de todas as classes.

Um conjunto de regras de decisão está completo se for capaz de abranger todos os objetos a

partir da matriz de dados de tal forma que objetos consistentes são reclassificados para suas

classes originais e objetos inconsistentes são classificados para o grupo de classes que se

referem a esta inconsistência. Chamamos de mínimo (minimal) a cada conjunto de regras de

decisão que seja completo e não redundante, ou seja, a exclusão de qualquer regra deste

conjunto torna-o não completo.

27

Para induzir as regras, Greco et al. (2000b) usa o algoritmo chamado DOMLEM, construído

sobre a ideia de LEM2 (Grzymala-Busse , 1992), gera a descrição mínima (minimal).

Maiores detalhes desse algoritmo estão no anexo A.

Assim como o RSA, o DRSA pode ser aplicado em diversas áreas do conhecimento, alguns

exemplos de aplicação podem ser vistos em diversos artigos de Greco, Matarazzo &

Slowinski (2006, 2012).

5 ESTUDO DE CASO: SEGMENTAÇÃO DE CLIENTES DE UM PROGRAMA DE

RELACIONAMENTO

Uma empresa de telecomunicações brasileira deseja classificar os clientes que participam do

seu programa de relacionamento a fim de identificar o grupo de clientes mais atrativo para

suas campanhas de incentivo e publicidade.

Dado que um programa de relacionamento trabalha com uma verba limitada e, precisa gastar

o mínimo possível para não onerar o programa, é muito importante saber quais clientes

deverão ser foco de suas ações de modo a gerar um benefício para a empresa, tais como:

redução do churn (% de cancelamentos de linhas), manutenção do market share (fatia do

mercado) e valorização da marca. E, ainda, proporcionar a satisfação dos clientes.

Antes de mostrar como foi aplicado o método DRSA para realizar a segmentação dos clientes,

vamos entender como funciona o programa de relacionamento dessa empresa.

Quando o programa de relacionamento foi construído definiu-se que somente os clientes da

empresa que possuíam uma linha de telefonia móvel pós-paga ou um cartão de crédito dessa

28

empresa seriam elegíveis a participar do programa de relacionamento, porque eram produtos

novos que ainda estavam se fortalecendo no mercado.

Além disso, foi definido que todo o gasto em Reais desse cliente com serviços de

telecomunicações da empresa seria convertido em pontos, que poderiam ser usados no futuro

para o resgate de recompensas. Logo, apesar de somente ter uma parcela de clientes elegíveis

ao programa, a empresa possibilitou que todo o gasto em Reais com outros serviços da

empresa, tais como: Fixo e TV, por exemplo, fosse convertido em pontos, o que geraria um

acúmulo maior de pontos e, ainda, incentivaria os clientes a adquirirem outros produtos da

empresa a fim de acumular um volume maior de pontos para resgatar os prêmios disponíveis.

Hoje, o programa de relacionamento conta com diversos prêmios, tais como: aparelhos

celulares, tablets, bônus de SMS ou descontos em pacotes de dados 3G, ingressos para

espetáculos de teatro e shows, passagens aéreas, entre outros. Para adquirir esses prêmios o

cliente precisa acessar a página web da empresa e solicitar o resgate de pontos.

Esses prêmios, quando resgatados, geram uma despesa para a empresa que varia de acordo

com o prêmio. Além disso, há prêmios que possibilitam a fidelização dos clientes com a

empresa, isto é, os clientes ficam fidelizados a empresa por um ano, onde em caso do cliente

solicitar o cancelamento do serviço móvel, por exemplo, o cliente só o poderá fazer após

pagar uma multa proporcional ao valor do prêmio resgatado.

Dado que o universo de clientes dessa empresa de telecomunicações varia na grandeza de

milhões de clientes e que se deseja manter os clientes fiéis à empresa, seja por meio da

fidelização ou mesmo pela satisfação do cliente com o programa de recompensa, a empresa

precisa realizar uma comunicação direcionada sobre o programa para seus clientes, sem

29

causar um resgate em massa, pois é necessário manter o programa de relacionamento

funcionando de forma financeiramente saudável para a empresa.

Pensando nisso, a empresa alvo desse estudo precisa segmentar os clientes que participam de

seu programa de relacionamento, de modo a identificar os clientes que serão alvos da sua ação

de comunicação de incentivo ao resgate do próximo ano.

Diversas metodologias podem ser aplicadas para segmentar os clientes, tais como: a análise

de cluster, a regressão linear multivariada, etc. Contundo nesse trabalho, optou-se por utilizar

uma metodologia multicritério de apoio à decisão, conhecida como DRSA, utilizada em

diversas áreas do conhecimento, como pode ser visto em Greco, Matarazzo & Slowinski

(2006, 2012).

Esse método foi escolhido porque ele permite classificar objetos, nesse caso clientes, com

base em diferentes critérios, que podem ser quantitativos ou qualitativos, e que no fim

permitem gerar regras de classificação com base nesses critérios escolhidos. Além disso, leva

em consideração a opinião do tomador de decisão, o que não acontece na aplicação dos

métodos tradicionais.

O DRSA pode ser aplicado em grandes bancos de dados, mas a fim de simplificar o estudo,

optou-se em trabalhar com uma amostra de dez mil clientes do estado do Rio de Janeiro que

participam do programa de relacionamento dessa empresa de telecomunicações. Lembrando

que esse método pode ser aplicado em toda a base de clientes.

Essa amostra de clientes foi gerada de forma aleatória com base no CPF do cliente cadastrado

no programa de relacionamento e cujo endereço de correspondência estava com o CEP

30

associado ao estado do Rio de Janeiro. A partir do CPF do cliente, capturaram-se as demais

informações que compõem o BD (banco de dados) desse estudo. Mais adiante será

apresentada uma exemplificação do BD usado nesse estudo.

As principais questões a serem respondidas no estudo são as seguintes:

Quais os principais grupos de clientes, de acordo com a propensão de resgate que

deverão ser incentivados nas ações dessa empresa de telecomunicações?

Quais são os conjuntos mínimos de regras de decisão que permitem uma segmentação

de clientes de forma eficiente?

Quais são os redutos de critérios que garantem a mesma qualidade de aproximação da

classificação multicritério como todo o conjunto de critérios?

As informações contidas no banco de dados usado são consistentes?

Na aplicação do DRSA é necessário que seja identificado o(s) critério(s) sob os quais serão

gerados a classificação dos clientes. Nesse estudo, a escolha dos critérios foi realizada com

base na experiência de especialistas que fazem a gestão do programa de relacionamento e com

base nas informações fornecidas pelos seus gerentes. Os critérios estão descritos na tabela 3,

onde os cinco primeiros são variáveis contínuas e os demais são variáveis ordinais.

Variável

do BD Critério Descrição do Critério

A1 Saldo de Pontos do

Cliente

Volume de pontos acumulados pelo cliente e que

pode ser utilizado no processo de resgate da

recompensa.

A2 Média de Crédito de Média de pontos creditados no saldo do cliente nos

31

pontos dos últimos três

meses

últimos três meses.

A3 Gasto Médio dos últimos

três meses com serviços

de Telecom

Gasto Médio em Reais do cliente com a empresa nos

últimos três meses, que é a base para a conversão dos

pontos.

A4 Total de Pontos

Expirados do Programa

Total de pontos expirados do cliente desde o início do

programa.

A5 Total de Pontos

Expirados/ Total de

Pontos Creditados

Razão entre o total de pontos expirados do cliente em

relação ao total de pontos acumulados desde o início

do programa.

A6 Participação do Cliente

no Programa

Classificação usada pela empresa para identificar os

clientes que acessaram a página do programa de

relacionamento no site da empresa e, aceitaram o

regulamento do programa de relacionamento. Logo,

se A6=0 significa que o cliente ainda não aceitou o

regulamento do programa, se A6=1 significa que

cliente aceitou o regulamento do programa.

A7 Origem do cliente no

Programa

Produto pelo o qual o cliente iniciou sua participação

no programa. Se a origem no programa foi através da

aquisição de um cartão de crédito, A7=0. Se cliente

entrou no programa a partir da aquisição de um

móvel, A7=1.

A8 Idade do Cliente no

Programa

Tempo de participação do cliente no programa, isto é,

se cliente tem: até 6 meses no programa (A8=1), de 7

a 12 meses (A8=2), de 1 a 2 anos (A8=3) e acima de

2 anos (A8=4).

A9 Indicador de Resgate no

Programa

Identifica se cliente já realizou algum resgate no

programa (A9=1), em caso negativo, A9=0.

A10 Indicador de Cliente

Fidelizado

Identifica se cliente está com alguma fidelização com

a empresa (A10=1), em caso negativo, A10=0.

Tabela 3 – Descrição dos Critérios Usados no Estudo

32

A seguir, os dez critérios foram classificados com base na sua preferência de valor, onde (↑)

significa preferência crescente com o valor e (↓) significa preferência diminuindo com valor.

Essa classificação servirá para identificar a preferência de cada um dos critérios que será

colocada na aplicação do software usado para gerar o método.

• Saldo de Pontos do Cliente (A1): (↑), pois quanto maior o volume de pontos, maior a chance

de o cliente poder realizar um resgate.

• Média de Crédito de pontos dos últimos três meses (A2): (↑), pois quanto maior o volume de

crédito, maior a probabilidade de o cliente poder realizar um resgate.

• Gasto Médio dos últimos três meses com serviços de Telecom (A3): (↑), pois quanto maior

o gasto, maior o acúmulo de pontos e a chance de poder realizar um resgate.

• Total de Pontos Expirados do Programa (A4): (↓), pois quanto maior o volume de pontos

expirados, menor a chance de resgate do cliente, uma vez que o mesmo não percebe valor no

programa.

• Total de Pontos Expirados/ Total de Pontos Creditados (A5): (↓), pois quanto maior a razão,

menor a chance de resgate do cliente, uma vez que o mesmo não percebe valor no programa.

• Participação do Cliente no Programa (A6): (↑), pois se A6=0, cliente ainda não aceitou o

regulamento do programa. Se A6=1 significa que cliente aceitou o regulamento do programa.

• Origem de Entrada do cliente no Programa (A7): (↑), pois se A7=0 significa que cliente deu

entrada no programa por meio da aquisição de um cartão de crédito. Se A7=1 significa que o

cliente deu entrada no programa a partir da aquisição de um móvel.

• Idade do Cliente no Programa (A8): (↑), pois quanto maior o tempo de participação do

cliente no programa, maior a chance de acúmulo de pontos e realização de resgate. Logo, se

cliente tem até 6 meses no programa considera-se como muito novo (A8=1), de 7 a 12 meses

considera-se novo (A8=2), de 1 a 2 anos, antigo (A8=3) e acima de 2 anos, muito antigo

(A8=4).

33

• Indicação de Resgate no Programa (A9): (↓), pois embora a chance de resgate novamente

desse cliente seja maior, o foco da empresa nesse cliente é menor.

• Indicador de Cliente Fidelizado (A10): (↓), pois se cliente fidelizado (A10=1), o foco da

empresa nesse cliente é menor.

Além da determinação dos critérios, o método DRSA também sugere a determinação de uma

variável de decisão, que também pode ser simulada pelo modelo a partir das regras de decisão

que são geradas. Durante a aplicação do método, os especialistas sentiram necessidade de

determinar duas variáveis de decisão (V1 e V2).

A variável de decisão (V1) teve como premissa a metodologia utilizada por esses especialistas

na determinação de quais clientes serão alvos de suas comunicações. Onde, de acordo com o

saldo de pontos, os clientes são separados segundo a pontuação mínima exigida no resgate de

prêmio incentivado, de forma a obter quatro classes:

• V1 = ALTA (A) que corresponde ao cliente principal da ação de incentivo, que por ter saldo

de pontos mais elevado, é classificado com chance "Alta" de propensão a resgate.

• V1 = MEDIA (M) que corresponde ao segundo grupo da ação de incentivo, que por ter saldo

de pontos mediano, é classificado com “Média” chance de propensão a resgate.

• V1 = BAIXA (B) que corresponde ao grupo da ação de incentivo menos incentivado por ter

o menor saldo de pontos e consequentemente uma “Baixa" propensão a resgate.

• V1 = INEXISTENTE (I) que corresponde ao grupo de clientes com saldo insuficiente para

realizar qualquer tipo de resgate, logo é classificado como tendo propensão a resgate “Nula”

ou “Inexistente”.

34

Dessa forma, os subconjuntos de V1 foram denotados por um conjunto de classes Cl = {ClA ,

ClM, ClB, ClI} , onde: a classe ClA é melhor do que a ClM que é melhor que ClB que é melhor

que ClI.

Na tabela 4, foi apresentado o layout do banco de dados e de suas informações, descritas na

tabela 3, para os primeiros trinta clientes usados na aplicação do método.

Tabela 4 – Matriz de Dados (30 primeiros clientes da amostra de 10 mil clientes).

Além da variável de decisão V1, os especialistas optaram por criar uma variável de decisão

V2, seguindo a mesma nomenclatura usada em V1 (V2=ALTA (A); V2=MEDIA (M);

V2=BAIXA (B); V2=INEXISTENTE (I)), a partir da quantidade de eventos positivos ao

CLIENTE A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 V1 C00001 5251 152 456 738 12 0 1 4 0 0 ALTA C00002 1340,5 67 202 1104 24 1 1 4 1 1 ALTA C00003 161 31 93 0 0 0 0 1 0 0 INEXISTENTE C00004 2894,5 85 254 3146 51 1 1 4 0 0 BAIXA C00005 7326 199 596 3276 32 0 1 4 0 0 ALTA C00006 1875 54 161 943 34 0 1 4 0 0 BAIXA C00007 2243,5 133 397 0 0 1 1 3 1 1 MEDIA C00008 4612,5 191 571 0 0 1 1 4 1 0 ALTA C00009 2092,5 203 625 0 0 0 1 1 0 0 MEDIA C00010 669 128 384 0 0 0 1 1 0 0 ALTA C00011 11518 295 784 4696 28 1 1 4 0 0 ALTA C00012 1683,5 163 497 0 0 0 1 1 0 0 ALTA C00013 1123 105 315 0 0 0 1 1 0 0 ALTA C00014 627 153 459 0 0 0 1 4 0 0 ALTA C00015 6979,5 111 331 266 3 1 1 4 1 1 ALTA C00016 5140 189 564 1336 7 0 1 4 1 0 ALTA C00017 15794 427 1180 4210 19 1 1 4 1 0 ALTA C00018 1070 63 209 0 0 0 1 1 0 0 BAIXA C00019 421 46 205 0 0 0 1 1 0 0 INEXISTENTE C00020 5479 132 394 2832 33 1 1 4 0 0 ALTA C00021 1539 51 154 0 0 1 1 3 0 0 BAIXA C00022 4492 141 423 0 0 1 1 3 0 0 MEDIA C00023 1579 113 356 0 0 0 1 1 0 0 ALTA C00024 383 48 144 0 0 0 1 1 0 0 INEXISTENTE C00025 3817 96 287 3381 47 0 1 4 0 0 MEDIA C00026 0 0 0 0 0 0 1 3 0 0 INEXISTENTE C00027 8415 322 965 0 0 1 1 4 1 0 ALTA C00028 1663 145 434 0 0 0 1 1 0 0 ALTA C00029 564,5 40 119 0 0 0 1 1 0 0 INEXISTENTE C00030 5438 145 437 2186 30 1 1 4 0 0 ALTA

35

resgate. Para determinar os eventos positivos, levou-se em consideração uma série de fatores:

se cliente tem saldo de pontos diferente de zero, se cliente tem possibilidade de acúmulo de

pontos com maior velocidade, se cliente está fidelizado, se cliente não teve pontos expirados e

se cliente realizou algum resgate. Dessa forma, os clientes com o maior número de eventos

positivos ao resgate foram classificados como V2=ALTA, clientes com nenhum evento

positivo foram classificados como V2=INEXISTENTE, clientes com poucos eventos foram

classificados como V2=BAIXA e os demais como V2=MEDIA.

O método DRSA foi aplicado na amostra de dez mil clientes do Rio de Janeiro para classificá-

los segundo os critérios propostos e, determinar os clientes que serão o foco da empresa nas

ações do próximo ano.

A aplicação do DRSA foi realizada por duas perspectivas diferentes com relação ao atributo

de decisão e para aplicá-lo foi usado o programa jMAF (Blaszczynski et al.,2011). Os

resultados serão demonstrados na sequência.

A fim de facilitar o entendimento, vamos adotar:

Modelo 1 é aquele gerado com base na variável de decisão V1 e,

Modelo 2 é aquele gerado com base na variável de decisão V2.

O primeiro resultado do DRSA para o modelo 1 indicou que a qualidade para todas as

aproximações superiores e inferiores da união das classes foi igual a 1, o que indica

consistência nos dados, o que pode ser observado na figura 1. Já no modelo 2, observou-se

que a matriz de dados dessa amostra de dez mil clientes não é consistente para todos os

conjuntos aproximativos do critério de decisão V2, pois nem todas as aproximações inferiores

36

e superiores das classes , , , , , apresentaram a qualidade da

aproximação igual a 1, conforme mostra a figura 2.

Figura 1- Imagem Gerada no Software JMAF com os valores da qualidade da aproximação e da

quantidade de clientes dentro de cada aproximação superior e inferior das classes e a região de fronteira

para o modelo 1.

37

Figura 2 - Imagem Gerada no Software JMAF com os valores da qualidade da aproximação e da

quantidade de clientes dentro de cada aproximação superior e inferior das classes e a região de fronteira

para o modelo 2.

O segundo resultado do modelo 1 gerou um reduto com um único critério, saldo do cliente,

que foi alocado no núcleo. Logo, somente o saldo do cliente foi o atributo considerado como

indispensável, o mais importante. Em contrapartida, no modelo 2 não tivemos redutos

gerados, isto é, todas as variáveis foram consideradas indispensáveis ao modelo e foram

alocadas no núcleo. As figuras 3 e 4 mostram as saídas do programa para os modelos 1 e 2,

respectivamente.

38

Figura 3 - Imagem Gerada no Software JMAF com os redutos e núcleo do modelo 1.

Figura 4 - Imagem Gerada no Software JMAF com os redutos e núcleo do modelo 2.

O terceiro resultado do modelo, indicou volume de regras de decisão muito distintos entre o

modelo 1 e o modelo 2 descrevendo , , , , e . A tabela 5 apresenta

um comparativo entre o volume de regras geradas em cada modelo.

Tabela 5 – Comparativo entre o volume de regras geradas por Modelo.

Modelo 1 Modelo 2

1 8

1 46

1 21

1 76

1 59

1 19

Total 6 229

39

O modelo 1 só teve uma regra de decisão para determinar o segmento de clientes principal

(V1=ALTA) para o qual a empresa de telecomunicações deveria dar foco em suas

comunicações, dada pela regra:

1) se f(x, A1)>= 5000.5, então x ϵ .

Já para o modelo 2 foram geradas 19 regras de decisão para esse mesmo segmento

(V2=ALTA), mas pode-se observar que três critérios não entraram nas regras geradas para

esse segmento, os critérios A7, A9 e A10. Abaixo, estão as regras geradas para esse

segmento:

1) se f(x, A2)>=381, então x ϵ .

2) se f(x, A2)>=300,17 e f(x, A3)>=599,21, então x ϵ .

3) se f(x, A1)>=8474 e f(x, A2)>=27 e f(x, A8)>=4, então x ϵ .

4) se f(x, A2)>=298,17 e f(x, A3)>=1033,86, então x ϵ .

5) se f(x, A1)>=5469,5 e f(x, A3)>=146,97 e f(x, A4)<=1801, então x ϵ .

6) se f(x, A1)>=5469,5 e f(x, A5)<=31,63 e f(x, A8)>=4 , então x ϵ .

7) se f(x, A1)>=7821,5 e f(x, A3)>=116,85 e f(x, A8)>=4 , então x ϵ .

8) se f(x, A1)>=5306,5 e f(x, A3)>=405,63 e f(x, A5)<=5,26 , então x ϵ .

9) se f(x, A2)>=241,17 e f(x, A3)>=1068,81 e f(x, A6)>=1 , então x ϵ .

10) se f(x, A1)>=5000,5 e f(x, A2)>=209, então x ϵ .

11) se f(x, A1)>=5003,5 e f(x, A2)>=159,83 e f(x, A6)>=1, então x ϵ .

12) se f(x, A1)>=5003,5 e f(x, A3)>=195,58 e f(x, A8)>=4, então x ϵ .

13) se f(x, A1)>=5023,5 e f(x, A3)>=233,63 e f(x, A5)<=4,86, então x ϵ .

14) se f(x, A1)>=5204 e f(x, A5)<=23,02 e f(x, A6)>=1, então x ϵ .

40

15) se f(x, A1)>=4989 e f(x, A3)>=412,12 e f(x, A8)>=4, então x ϵ .

16) se f(x, A1)>=4969 e f(x, A4)<=1335,5 e f(x, A8)>=4, então x ϵ .

17) se f(x, A1)>=4456 e f(x, A2)>=26,67 e f(x, A4)<=283,5 e f(x, A8)>=4, então x ϵ .

18) se f(x, A3)>=181,36 e f(x, A5)<=24,37 e f(x, A8)>=4, então x ϵ .

19) se f(x, A3)>=197,75 e f(x, A5)<=24,94 e f(x, A8)>=4, então x ϵ .

No apêndice B, encontram-se todas as regras geradas para o modelo 1 e 2 nas figuras 5 a 13.

O quarto resultado retirado do DRSA foi a reclassificação dos objetos utilizando as regras

geradas pelos modelos. No modelo 2, tivemos 8,47% de classificações incorretas e 2,41% não

classificados. Quando se observa a classe (ClA) que seria o segmento foco da ação da

empresa, observamos que 83% desse grupo foi classificado de forma correta. Já no modelo 1,

vimos que 100% das classificações foram corretas, muito embora os resultados possam

indicar dependência entre o atributo de decisão V1 e o critério saldo do cliente que é usado na

regra de classificação. Nas figuras 14 a 17 do apêndice B, observamos essas informações.

Se a empresa considerasse a precisão de classificação de 89% dos clientes adequada, uma vez

que a maioria dos modelos estatísticos trabalham com precisões em torno de 50%,

poderíamos adotar o modelo 2 como sendo o mais adequado para se trabalhar, podendo ser

replicado para toda a base de clientes do Rio de Janeiro a partir das regras de decisão geradas

no modelo, que permitiriam classificar toda a base de dados.

Como os clientes do Rio de Janeiro podem ter perfis diferentes em relação aos clientes dos

demais estados, não podemos aplicar as regras do Rio de Janeiro para os demais estados.

Logo, para os demais estados brasileiros temos que rodar novamente o modelo usando como

base de dados uma amostra aleatória destes estados.

41

Caso a empresa desejasse obter uma classificação para todos os clientes, pode-se adotar uma

variação do método DRSA, o VCDRSA (Variable Consistency Dominance-based Rough Set

Approach) usado por Blazczynski et al. (2007) e Greco et al. (2000b), que propõe um

relaxamento na consistência da aproximação inferior dos objetos utilizando a adoção de

aproximações inferiores dos objetos suficientemente consistentes, e, não apenas consistentes

como ocorre no DRSA. A partir de diferentes medidas de consistência que permitem uma

maior flexibilização na classificação dos dados.

42

6 CONCLUSÃO

Classificação multicritério pelo método DRSA difere das abordagens tradicionais de

classificação, uma vez que envolve ordens de preferência em domínios dos atributos e do

conjunto de classes. Isto faz com que deficiências no banco de dados sejam reparadas pelo

método, aplicando o princípio de dominância.

Nesse estudo o método multicritério de apoio a decisão DRSA foi aplicado com o objetivo de

segmentar uma amostra de dez mil clientes do Rio de Janeiro de um programa de

relacionamento de uma empresa de telecomunicações. E, ainda, identificar o principal grupo

de clientes que deveria ser incentivado nas ações de comunicação de incentivo a resgate dessa

empresa.

Na aplicação do DRSA, observou-se que o mesmo é sensível quanto à opinião de diferentes

decisores em relação a melhor forma de realizar a segmentação dos clientes do programa de

relacionamento, ou melhor, na determinação do atributo de decisão e critérios usados.

No modelo 1, o qual considera o atributo de decisão V1 construído a partir da variável saldo

de pontos do clientes, viu-se que o modelo apresentou ótima qualidade de aproximações das

classes, o que pode estar diretamente relacionado à dependência entre o atributo de decisão e

o atributo saldo do cliente, que foi a única variável presente no reduto e a única que aparece

nas regras de decisão geradas. Quanto à determinação do grupo principal da ação de

comunicação da empresa, uma única regra de classificação foi gerada, que considera somente

os clientes com saldo de pontos acima de 5.000,5 pontos como alvo da empresa, que

corresponde a 2.511 clientes da amostra de dez mil clientes.

43

No segundo modelo tem-se uma qualidade de aproximação em torno de 70%, cuja estatística

é razoável ao lidar com grandes bases de dados. E, apesar do grande volume de regras de

classificação (229) geradas, esse resultado demonstra maior estratificação dos objetos frente

aos atributos analisados. Em relação à determinação do grupo principal, que deverá ser o foco

das ações de comunicação de incentivo ao resgate do programa de relacionamento da

empresa, o modelo 2 gerou 19 regras de classificação que contemplou basicamente todos os

critérios escolhidos com uma precisão de 83% na classificação dos clientes desse grupo,

levando a classificação de 4.930 clientes nesse grupo.

Pensando na melhor estratificação dos dados, o modelo 2 conseguiu atingir esse objetivo e

determinar: o conjunto de regras de classificação dos clientes do Rio de Janeiro do programa

de relacionamento dessa empresa estudada e o grupo de clientes de interesse da empresa, que

serão alvo das ações de comunicação do próximo ano. A partir dessas regras, a empresa

poderá classificar todos os clientes do Rio de Janeiro.

7 RECOMENDAÇÃO DE ESTUDOS FUTUROS

Para estudos futuros pode-se aplicar o método DRSA para segmentar os clientes dos demais

estados do programa de relacionamento dessa empresa e comparar os resultados obtidos.

Além disso, pode-se aplicar ao conjunto de dados analisado outro método de classificação

multicritério e avaliar se os resultados encontrados são muito diferentes. Entre os métodos já

usados na atualidade, o método VCDRSA seria uma boa opção, pois ele permite a obtenção

de uma classificação para a totalidade dos dados analisados, pois ele flexibiliza a aproximação

44

inferior dos objetos dentro das classes gerando uma classificação dos clientes com

aproximações suficientemente consistentes.

Pode-se também aplicar as técnicas estatísticas conhecidas para realizar segmentação de

clientes, tais como: regressão multivariada, análise de cluster, entre outras; e comparar com os

resultados obtidos nesse estudo.

Outro estudo interessante seria adotar a Regressão Ordinal Robusta, descrita no livro de

Ehrgott, Figueira & Greco (2010), em conjunto com o DRSA, aplicada em alguns estudos a

fim de reduzir os atributos, uma vez que trabalha com funções de utilidade e preferências

fracas. Esse estudo possibilitaria o uso de relações de preferência que consideraria as

informações dos tomadores de decisão que não podem ser capturadas em uma análise de

regressão que só leva em consideração a informação dos clientes presentes no banco de dados.

A metodologia do DRSA aplicada nesse estudo também pode ser utilizada pela empresa de

telecomunicações em outros setores da empresa, podendo ser aplicada na segmentação dos

clientes dos demais produtos da empresa, tais como: fixo, banda larga e etc.

Outro estudo que se pode realizar seria a aplicação de um método de apoio à decisão

multicritério para priorizar o portfólio de prêmios do programa de relacionamento frente a

cada segmento definido no modelo DRSA minimizando o custo do programa.

45

REFERÊNCIAS BIBLIOGRÁFICAS

ALVES, M., CARMO,E.R. "Segmentação de mercado com base no consumidor

segmentação demográfica”. Disponível em: < http://www.unioeste.br/campi/cascavel/ccsa/

IISeminario/trabalhos/Segmenta%C3%A7%C3%A3o%20de%20mercado%20com%20base%

20no%20consumidor.pdf>. Acesso em 5 mai. 2012

ALBUQUERQUE, T. Marketing de Relacionamento Dirigido.

Disponível em: <http://www.mktdireto.com.br/mrd.html>. Acesso em 8 mai. 2012.

BANA E COSTA, C.A., FERREIRA, J.A.A., CORREA, E.C. Metodologia multicritério de

apoio a avaliação de propostas em concursos públicos. In: ANTUNES,C.H.; TAVARES,

L.V. (Eds) Casos de Aplicação da Investigação Operacional, Amadora:bMcGraw Hill, 2000.

BANA E COSTA, C.A.; VANSNICK, J.C. Uma Nova Abordagem ao Problema da

Construção de uma Função de Valor Cardinal: MACBETH. Investigação Operacional,

Vol.15, p.15-35, 1995.

_______. Thoughts on a Theoretical Framework for Measuring Attractiveness by

Categorical Based Evaluation Technique (MACBETH). In: CLÍMACO, J.C.N. (Org).

Multicriteria Analysis. Berlim: springer-Verlag, 1997.

BLASZCZYNSKI, J.; GRECO, S.; MATARAZZO, B.; SLOWINSKI, R.; SZELAG, M.

JMAF – Dominance-based Rough Set Data Analysis Framework. Disponível em:

<http://www.cs.put.poznan.pl/jblaszczynski/Site/jRS.html>, Nov 10, 2011.

BLASZCZYNSKI, J.; GRECO, S.; SLOWINSKI, R. Multicriteria Classification – a New

Scheme for Application of Dominance-based Decision Rules. European Journal of

Operational Research, Vol.3, p.1030-1044, 2007.

BRANS,J.P.; MARESCHAL,B.; VINCKE,P.H. PROMETHEE: A New Family of

Outracking Methods in MCDM. IFORS, No.84, p.477-490, 1984.

CHURCHILL,G.A., PETER,J.J.P. Marketing: Criando Valor Para os Clientes. 2. ed.

São Paulo: Saraiva, 2000.

CLÍMACO, J.; CRAVEIRINHA,J. Multicriteria Analysis in Telecommunication Network

Planning and Design – Problems and Issues. In: FIGUEIRA,J.; GRECO,S.; EHRGOTT,M.

Multiple Criteria Decision Analysis: State of the Art Surveys. Boston: Springer Science,

2005.

COUGHLAN, A.T.; SOBERMAN, D.A. Strategic Segmentation Using Outlet Malls.

International Jounal of Research in Marketing, v.22, p.61-86, 2005.

COUTO, A.B.G. ; GOMES, L.F.A.M. A Tomada de Decisão em Recursos Humanos com

Dados Replicados e Inconsistentes: Uma Aplicação da Teoria dos Conjuntos

Aproximativos. Pesquisa Operacional, v.30, n.3, p.657-686, 2010.

46

DIAS,L.M.C., ALMEIDA,L.M.A.T., CLÍMACO,J.C.N. Apoio Multicritério à Decisão.

Coimbra: Universidade de Economia – Universidade de Coimbra, 1996.

EHRGOTT, M., FIGUEIRA,J.R., GRECO,S. Trends in Multiple Criteria Decision.

Vol.142, New York: Springer, 2010.

FERREIRA, F.H.G. “Segmentação de Mercado” . Biblioteca Temática do

Empreendedor – Sebrae. Disponível em: <http://www.bte.com.br >. Acesso em 5 mai.

2012.

FERREIRA,A.C.S.; GOMES, L.F.A.M. The Multicriteria ABC Analysis – An

Application of Rough Set Theory, Foundations of Computing and Decision Sciences,

Vol.20, N.3, 1995.

GOMES, L.F.A.M.; GOMES, C.F.S. Uma Técnica de Data Mining: Princípios Básicos dos

Conjuntos Aproximativos e suas Aplicações. Revista ANGRAD, Vol.2, p.13-22, 2001.

______. Tomada de Decisão Gerencial: Enfoque Multicritério. São Paulo: Atlas, 2012.

GOMES, L.F.A.M.; RANGEL, L.A.D. An Application of the TODIM Method to the

Multicriteria Rental Evaluation of Residential Properties. European Journal of

Operational Research, Poznan, Vol.193, n.2, p.204-211, 2009.

GRANAT, J. Mutlicriteria Analysis for Behavioral Segmentation. Journal of

Telecommunications and Information Technology, Vol.3, p.1-5, 2004.

GRECO, S.; MATARAZZO, B.; SLOWINSKI, R. A New Rough Set Approach to

Evaluation of Bankruptcy risk. In: ZOPOUNDINIS C. (Ed.), Operational Tools in the

Management of Financial Risk. Kluwer, Dordrecht, pp. 121-136, 1998a.

_______. Rough Approximation of a Preference Relation by Dominance Relations.

European J. Operational Research, Vol.117: p.63-83, 1999a.

_______. The Use of Rough Sets and Fuzzy Sets in MCDM. In: Gal T, Stewart t, Hanne T.

(EDS.) Advances in Multiple Criteria Decision Making. Kluwer, Dordrecht, pp.14.1 – 14.59,

1999b.

_______. Decision Rule Approach. In: Multiple criteria decision analysis state of the art

surveys [edited by J. Figueira, S. Greco and M. Ehrgott]. Springer Science, New York -

Business media, cap. 13, p. 507-561, 2005.

47

_______. Dominance-Based Rough Set Approach to Decision Involving Multiple

Decision Makers. In: Greco S., Hata Y., Hirano s., Inuiguchi M., Miyamoto S., Nguyen H.S.

& Slowinski R. (Eds.), Rough Sets and Current Trends In Computing (RSCTC 2006).

Springer LNCs 4259, Berlin, p. 306-317, 2006.

GRECO, S.; MATARAZZO, B.; SLOWINSKI, R.; STEFANOWSKI, J. An algorithm for

Induction of Decision Rules Consistent with the Dominance Principle. Proc. RSTC’2000

Conference, Banff (to appear), 2000b.

GRZYMALA-BUSSE, J.W. LERS – A System for Learning from Examples Based on

Rough Sets, In Slowinski, R., (ed.), Intelligent Decision Support. Handbook of Applications

and Advances of the Rough Sets Theory, Kluwer, Dordrecht, p.3-18, 1992.

KEENEY, R. & H. RAIFFA. Decision with Multiple Objectives: Preferences and Value

Tradeoffs. New York: Wiley, 1976. Reprinted in 1993 by Cambridge University Press.

KOTLER, P.; ARMSTRONG, G. Princípios de Marketing. Rio de Janeiro: Prentice-Hall do

Brasil, 1998.

KOTLER, P. Administração de Marketing: Análise, planejamento, Implementação e

Controle. 5ª ed. São Paulo: Atlas, 1998.

MALCZEWSKI, J. GIS and multicriteria decision analysis. New York: John Wiley, 1999.

MARTINS, A.E.C. Segmentação do Consumidor de Marcas Próprias – Caso Português ,

Instituto Politécnico de Lisboa, Lisboa, 2011. Disponível em: < http://repositorio

.ipl.pt/bitstream/10400.21/1051/1/Tese_mestrado.pdf >. Acesso em 4 fev. 2013.

MELO, B. “Philip Kotler fala sobre inovação, fidelidade, segmentação, sustentabilidade e

customização.” Mundo do Marketing, São Paulo, Jul.2007. Disponível em:

<http://mundodomarketing.com.br/entrevistas/1780/philip-kotler-fala-sobre-inovacao-

fidelidade-segmentacao-sustentabilidade-e-customizacao.html >. Acesso em 5 mai. 2012.

OLIVEIRA,V.F.; CAVENAGHI,V.; MÁSCULO,F.S.; SANT’ANNA,A.; COLOMBO,C.R.;

LACERDA,D.P.; NETO,J.A.; SOUZA, S.D.C.; CARVALHO,M.M. Tópicos Emergentes e

Desafios Metodológicos em Engenharia de Produção: Casos, Experiências e Proposições, Vol.5. Rio de Janeiro: ABEPRO, 2012.

PATRICIO, C.M.; PINTO, J.O.P.; SOUZA, C.C. Rough Sets – Técnica de Redução de

Atributos e Geração de Regras para Classificação de Dados. Anais do XXVIII CNMAC,

p.9-15. São Paulo, 2005.

PAWLAK, Z. Rough sets. International Journal of Information and Computer Sciences, Vol.

11, No. 5, p.341-356, 1982.

48

______. Rough sets. Theoretical Aspects of Reasoning About Data. Dordrecht, Kluwer,

1991.

______. Rough sets and decision analysis. Information Systems & Operational Research,

Vol. 38, No. 3, p.132-144, 2000.

PAWLAK, Z.; GRZYMALA-BUSSE, J.; SLOWINSKI,R.; ZIARKO,W. Rough Sets,

Communications of the ACM, Vol.38, N.11,1995.

PAWLAK, Z.; SKOWRON, A. Rudiments of Rough Sets, Information Sciencies, Vol.77, p.

3-27, 2007.

PAWLAK, Z.; SLOWINSKI, R. Rough Set Approach to Multi-Attribute Decision

Analysis. European Journal of Operational Research, Invited Review, Vol.72, p.443-459,

1994.

ROY, B.; BOUYSSOU, D. Aide Multicritère à la Décision: Méthodes et Cas. Economica,

Paris, 1993.

SAATY, T.L. The Analytic Hierarchy Process. Nova York: McGraw-Hill, 1980.

SIMPSON P.M., Marketing as melhores práticas. Porto Alegre: Bookman, 2001.

SLOWINSKI, R.; GRECO, S.; MATARAZZO, B. Rough Set and Rule-Based

Multicriteria Decision Aiding. SOBRAPO, Pesquisa Operacional, Vol. 32, No. 2, p.213-

269, 2012.

YAO,Y.; ZHAO,Y. Conflict Analysis Based on Discernibility and Indiscernibility.

Proceedings of IEEE Symposium on Foundations of Computational Intelligence, p.302-307,

2007.

ZIARKO, W. Analysis of uncertain information in the framework of variable precision

rough sets. Foundations of Computing and Decision Sciences, Vol.18 (3-4), p.381-396, 1993.

______. Variable precision rough set model. Journal of Computer and System Sciences,

46(1), p.39-59, 1993a.

49

APÊNDICE A

Na aplicação do DRSA foi utilizado o software JMAF – Dominance-based Rough Set Data

Analysis Framework (Blaszczynski et al., 2011). A seguir são apresentadas as etapas de

formatação do banco de dados usado para iniciar o estudo.

Para aplicar o JMAF o banco de dados deve estar no formato aceitável no programa. Utilizei

um editor de texto para descrever os critérios, as regras de preferência e carregar os dados.

Conforme abaixo:

**ATTRIBUTES

+A1:(continuous)

+A2:(continuous)

+A3:(continuous)

+A4:(continuous)

+A5:(continuous)

+A6:(integer)

+A7:(integer)

+A8:(integer)

+A9:(integer)

+A10:(integer)

+D:[INEXISTENTE,BAIXA,MEDIA,ALTA]

DECISION:D

**PREFERENCES

A1:GAIN

A2:GAIN

A3:GAIN

A4:COST

A5:COST

A6:GAIN

A7:GAIN

A8:GAIN

A9:COST

A10:COST

D:GAIN

**EXAMPLES

5251 152 456 738 12 0 1 4 0 0 BAIXA

1340.5 67 202 1104 24 1 1 4 1 1 MEDIA

161 31 93 0 0 0 0 1 0 0 BAIXA

2894.5 85 254 3146 51 1 1 4 0 0 MEDIA

7326 199 596 3276 32 0 1 4 0 0 BAIXA

1875 54 161 943 34 0 1 4 0 0 BAIXA

50

2243.5 133 397 0 0 1 1 3 1 1 ALTA

4612.5 191 571 0 0 1 1 4 1 0 ALTA

2092.5 203 625 0 0 0 1 1 0 0 ALTA

669 128 384 0 0 0 1 1 0 0 MEDIA

...

Após realizar as devidas configurações salvei o arquivo como amostra_2.isf para poder ser

aberto no JMAF.

APÊNDICE B

Abaixo estão as regras geradas na aplicação do DRSA para o modelo 1, figura x. Na

sequencia estão todas as regras geradas no modelo 2, figuras 5 a 13.

Figura 5 - Imagem Gerada no Software JMAF com as 6 regras de decisão para o modelo 1.

51

Figura 6 - Imagem Gerada no Software JMAF com as regras de decisão de 1 a 29 para o modelo 2.

52

Figura 7 - Imagem Gerada no Software JMAF com as regras de decisão de 30 a 58 para o modelo 2.

53

Figura 8 - Imagem Gerada no Software JMAF com as regras de decisão de 59 a 87 para o modelo 2.

54

Figura 9 - Imagem Gerada no Software JMAF com as regras de decisão de 88 a 116 para o modelo 2.

55

Figura 10 - Imagem Gerada no Software JMAF com as regras de decisão de 117 a 145 para o modelo 2.

56

Figura 11 - Imagem Gerada no Software JMAF com as regras de decisão de 146 a 174 para o modelo 2.

57

Figura 12 - Imagem Gerada no Software JMAF com as regras de decisão de 175 a 200 para o modelo 2.

58

Figura 13 - Imagem Gerada no Software JMAF com as regras de decisão de 201 a 229 para o modelo 2.

A seguir encontram-se as figuras 14 a 17 com o detalhe das reclassificações geradas para o

modelo 1 e 2.

Figura 14 - Imagem Gerada no Software JMAF com a reclassificação dos objetos segundo as regras

geradas pelo modelo 1.

59

Figura 15 - Imagem Gerada no Software JMAF com os volumes gerados na reclassificação dos objetos

segundo as regras geradas pelo modelo 1.

Figura 16 - Imagem Gerada no Software JMAF com a reclassificação dos objetos segundo as regras

geradas pelo modelo 2.

Figura 17 - Imagem Gerada no Software JMAF com os volumes gerados na reclassificação dos objetos

segundo as regras geradas pelo modelo 2.

60

ANEXO A – ALGORITMO DOMLEM

Procedure DOMLEM

(input: Lupp – a family of lower approximations of upward unions of decision classes:

{ P(Clt ≥ ), P(Cl

≥ t− 1),…, P(Cl2

≥)};output: R≥ set of D≥-decision rules);

begin

R≥:= ;

for each B∈ Lupp do

begin

E:=find_rules(B);

for each rule E ∈ E do

if E is a minimal rule then R≥ := R≥∪E;

end

end.

Function find_rules

(input: a set B; output: a set of rules E covering set B);

begin

G := B; {a set of objects from the given approximation}

E := ;

while G ≠ do

begin

E := ; {starting complex}

S := G; {set of objects currently covered by E}

while (E = ) or not ([E] ⊆ B) do

begin

best := ; {best candidate for elementary condition}

for each criterion qi ∈ P do begin

Cond:={(f(x,qi)≥rqi) : ∃ x∈ S (f(x,qi)=rqi)};

{for each positive object from S create an elementary

condition}

for each elem ∈ Cond do

if evaluate({elem}∪E) is_better_than evaluate({best}∪E) then

best:=elem;

end;{for}

E := E ∪ {best}; {add the best condition to the complex}

S := S ∩ [best];

end; {while not ([E] ⊆ B)}

for each elementary condition e ∈ E do

if [E − {e}] ⊆ B then E := E − {e};

create a rule on the basis of E;

E := E ∪ {E}; {add the induced rule}

G := B – ∪E∈E[E]; {remove examples covered by the rule}

end; {while G ≠ }

end {function}

Figura 18 - Algoritmo de DOMLEM

Fonte: Greco, Matarazzo, Slowinski & Stefanowski (2000b)