segmentaÇÃo de mercado de um programa de...
TRANSCRIPT
i
FACULDADE DE ECONOMIA E FINANÇAS IBMEC PROGRAMA DE PÓS-GRADUAÇÃO E PESQUISA EM
ADMINISTRAÇÃO E ECONOMIA
DDIISSSSEERRTTAAÇÇÃÃOO DDEE MMEESSTTRRAADDOO
PPRROOFFIISSSSIIOONNAALLIIZZAANNTTEE EEMM AADDMMIINNIISSTTRRAAÇÇÃÃOO
SEGMENTAÇÃO DE MERCADO DE UM PROGRAMA DE RECOMPENSA: UMA
APLICAÇÃO DO MÉTODO DRSA– DOMINANCE-BASED ROUGH SET
APPROACH
CCHHAARRLLEENNEE SSAANNTTIINNOO DDAA SSIILLVVAA
ORIENTADOR: PROF. DR. LUIZ FLÁVIO AUTRAN MONTEIRO GOMES
Rio de Janeiro, 26 de fevereiro de 2014.
ii
“SEGMENTAÇÃO DE MERCADO DE UM PROGRAMA DE RECOMPENSA: UMA
APLICAÇÃO DO MÉTODO DRSA– DOMINANCE-BASED ROUGH SET
APPROACH”
CHARLENE SANTINO DA SILVA
Dissertação apresentada ao curso de
Mestrado Profissionalizante em
Administração como requisito parcial para
obtenção do Grau de Mestre em
Administração.
Área de Concentração: Gestão das
Organizações
ORIENTADOR: LUIZ FLÁVIO AUTRAN MONTEIRO GOMES
Rio de Janeiro, 26 de fevereiro de 2014.
iv
S586
Silva, Charlene Santino da.
Segmentação de mercado de um programa de recompensa:
uma aplicação do método DRSA – Dominance-Based Rough
Set Approach / Charlene Santino da Silva. - Rio de Janeiro:
[s.n.], 2014.
60 f. : il.
Dissertação de Mestrado profissional em Administração
do IBMEC.
Orientador(a): prof.º Luiz Flávio Autran Monteiro Gomes.
1. Gestão das Organizações. 2. Apoio Multicritério à
Decisão. 3. DRSA. 4. Programa de Fidelidade. I. Título.
CDD 658.4034
v
AGRADECIMENTOS
Aos meus pais, pois sem eles nada disso seria possível. Agradeço por todos os esforços que
fizeram e por tudo que tiveram de abrir mão para me proporcionar uma educação de qualidade
e uma formação acadêmica capaz de enfrentar os desafios da minha carreira profissional. Sou
muito grata a vocês por tudo o que fizeram, fazem e ainda farão por mim.
Ao meu noivo, por todo o apoio, paciência, compreensão e incentivo que teve durante a
realização do meu mestrado.
Ao meu orientador, Professor Luiz Flavio Autran Monteiro Gomes, pelo aprendizado
proporcionado, bem como pela sua paciência e atenção em todo o processo de criação dessa
dissertação.
Ao Ayrton Couto por ter me auxiliado durante o meu processo de aplicação do método usado
nesse trabalho e por ter dispensado algumas horas do seu dia me ajudando a formatar o banco
de dados.
vii
RESUMO
Esse estudo teve foco na segmentação de clientes através do uso de uma ferramenta pouco
usada no Brasil, embora amplamente divulgada na literatura especializada de Apoio
Multicritério à Decisão – o DRSA, ou Dominance-Based Rough Set Approach. O DRSA
consiste em um método que possibilita determinar regras de classificação, na presença de
múltiplos critérios. Assim, este método opera através da relação de preferência no domínio
dos critérios escolhidos, levando em consideração a opinião dos tomadores de decisão,
diferentemente das técnicas estatísticas mais tradicionalmente usadas. O estudo aqui
apresentado segmentou uma amostra de 10 mil clientes do Estado do Rio de Janeiro, que
participam de um programa de relacionamento de uma empresa de telecomunicações. O uso
do DRSA gerou mais de 200 regras, que permitiram classificar os clientes de acordo com seus
perfis, através dos critérios escolhidos. Além disso, o DRSA determinou o grupo de clientes
de maior valor para a empresa, ou seja, aqueles que devem ser alvos diretos de suas
campanhas de incentivo a resgate de prêmios. Pela relativa simplicidade do DRSA, concluiu-
se que o mesmo enfoque deve definitivamente ser empregado em outros estudos de
segmentação de mercado semelhantes ao aqui abordado.
Palavras Chave: Apoio Multicritério à Decisão, DRSA, Segmentação de Mercado, Programa
de Fidelidade.
viii
ABSTRACT
This study focused on a market segmentation through the use of an analytical tool that has
been barely used in Brazil, although well known in the Multicriteria Decision Aid litterature –
DRSA, or Dominance-Based Rough Set Approach. DRSA is a method that allows
determining classification rules in the presence of multiple criteria. DRSA functions through
the preference relation in the domain of the chosen criteria, taking into account the opinions
of decision makers, differently from traditional statistical approaches. The study that is
presented here considered a sample with 10,000 clients in the State of Rio de Janeiro. Those
are clients that participate in a relationship program of a telecommunications company. Using
DRSA led to more than 200 rules, that allowed classifying clients according to their profiles,
by means of chosen criteria. Besides, DRSA determined the group of clients with the highest
value for the company and those should be the direct target of specific actions. Due to the
relative simplicity of DRSA, it was concluded that the same approach must definitely be used
in similar studies of market segmentation.
Key Words: Multicriteria Decision Aid, DRSA, Market segmentation, Loyalty program.
ix
LISTA DE FIGURAS
Figura 1- Imagem Gerada no Software JMAF com os valores da qualidade da
aproximação e da quantidade de clientes dentro de cada aproximação superior e
inferior das classes e a região de fronteira para o modelo 1. ...................................... 36
Figura 2 - Imagem Gerada no Software JMAF com os valores da qualidade da
aproximação e da quantidade de clientes dentro de cada aproximação superior e
inferior das classes e a região de fronteira para o modelo 2. ...................................... 37 Figura 3 - Imagem Gerada no Software JMAF com os redutos e núcleo do modelo 1. .. 38
Figura 4 - Imagem Gerada no Software JMAF com os redutos e núcleo do modelo 2. ... 38
Figura 5 - Imagem Gerada no Software JMAF com as 6 regras de decisão para o modelo
1. ....................................................................................................................................... 50
Figura 6 - Imagem Gerada no Software JMAF com as regras de decisão de 1 a 29 para
o modelo 2. ....................................................................................................................... 51
Figura 7 - Imagem Gerada no Software JMAF com as regras de decisão de 30 a 58
para o modelo 2. .............................................................................................................. 52
Figura 8 - Imagem Gerada no Software JMAF com as regras de decisão de 59 a 87 para
o modelo 2. ....................................................................................................................... 53
Figura 9 - Imagem Gerada no Software JMAF com as regras de decisão de 88 a 116
para o modelo 2. .............................................................................................................. 54
Figura 10 - Imagem Gerada no Software JMAF com as regras de decisão de 117 a 145
para o modelo 2. .............................................................................................................. 55
Figura 11 - Imagem Gerada no Software JMAF com as regras de decisão de 146 a 174
para o modelo 2. .............................................................................................................. 56
Figura 12 - Imagem Gerada no Software JMAF com as regras de decisão de 175 a 200
para o modelo 2. .............................................................................................................. 57
Figura 13 - Imagem Gerada no Software JMAF com as regras de decisão de 201 a 229
para o modelo 2. .............................................................................................................. 58
Figura 14 - Imagem Gerada no Software JMAF com a reclassificação dos objetos
segundo as regras geradas pelo modelo 1. .................................................................... 58
Figura 15 - Imagem Gerada no Software JMAF com os volumes gerados na
reclassificação dos objetos segundo as regras geradas pelo modelo 1. ...................... 59
Figura 16 - Imagem Gerada no Software JMAF com a reclassificação dos objetos
segundo as regras geradas pelo modelo 2. .................................................................... 59
Figura 17 - Imagem Gerada no Software JMAF com os volumes gerados na
reclassificação dos objetos segundo as regras geradas pelo modelo 2. ...................... 59 Figura 18 - Algoritmo de DOMLEM .................................................................................... 60
x
LISTA DE TABELAS
Tabela 1 – Comparativo entre os métodos da Escola Francesa e da Escola Norte-Americana 10 Tabela 2 – Tipos de Problemática e seus Objetivos. ................................................................ 11 Tabela 3 – Descrição dos Critérios Usados no Estudo ............................................................. 31 Tabela 4 – Matriz de Dados (30 primeiros clientes da amostra de 10 mil clientes). ............... 34
Tabela 5 – Comparativo entre o volume de regras geradas por Modelo. ................................. 38
xi
SUMÁRIO
1 INTRODUÇÃO ..................................................................................................... 1
2 PROBLEMA ......................................................................................................... 3
2.1 Contextualização do Problema ................................................................................................................... 3
2.2 Formulação do Problema ............................................................................................................................ 3
2.3 Objetivos ....................................................................................................................................................... 3
2.4 Relevância do Estudo ................................................................................................................................... 4
2.5 Delimitação do estudo .................................................................................................................................. 4
3 REVISÃO DA LITERATURA ............................................................................... 5
3.1 Segmentação de Mercado ............................................................................................................................ 5
3.2 Métodos de Apoio à decisão de Multicritério ............................................................................................ 8
3.3 Método RSA – Rough Set Approach ou TCA – Teoria dos Conjuntos aproximativos ....................... 12
4 METODOLOGIA ................................................................................................ 19
4.1 Método DRSA – Dominance –Based Rough Set Approach ..................................................................... 19 4.1.1 Entendendo o DRSA .......................................................................................................................... 20 4.1.2 Extraindo as regras de decisão ........................................................................................................... 25
5 ESTUDO DE CASO: SEGMENTAÇÃO DE CLIENTES DE UM PROGRAMA DE RELACIONAMENTO ................................................................................................ 27
6 CONCLUSÃO .................................................................................................... 42
7 RECOMENDAÇÃO DE ESTUDOS FUTUROS ................................................. 43
REFERÊNCIAS BIBLIOGRÁFICAS ......................................................................... 45
APÊNDICE A ............................................................................................................ 49
APÊNDICE B ............................................................................................................ 50
ANEXO A – ALGORITMO DOMLEM ....................................................................... 60
1
1 INTRODUÇÃO
As empresas buscam a inovação continuamente, mas no universo de telecomunicações, assim
como em outros mercados, isso nem sempre acontece na velocidade desejada e os clientes
acabam preferindo os concorrentes. Pensando nisso, as empresas de telecomunicações
começaram a investir em programas de relacionamento.
Para Kotler (2007) uma empresa precisa encontrar seu próprio caminho e algumas medidas
podem ser tomadas, tais como: “Segmentar mais criativamente do que seus concorrentes e
encontrar novos segmentos em que possa se posicionar melhor; Cercar seus produtos com
uma reputação de qualidade melhor ou que sejam mais difíceis de ser imitados; Trabalhar em
cima de planos melhores para criar clientes leais (tais como programas de fidelidade)”.
Os programas de fidelidade do consumidor, ou programas de relacionamento baseados em
recompensa, podem ser aplicados em praticamente qualquer segmento. Os mais complexos se
baseiam em três pilares que funcionam de forma integrada: o relacionamento, o
reconhecimento e a recompensa. O primeiro estabelece uma relação com o cliente através de
um canal de comunicação direto, o segundo proporciona ao cliente um sentimento de fazer
parte de um grupo seleto com benefícios diferenciados e exclusivos, que o diferencia dos
demais e, o terceiro premia o cliente de acordo com o seu consumo, de forma proporcional
visando um aumento do consumo tradicional.
Como os clientes não são iguais e estão em constante assédio da concorrência, é fundamental
que se tenha bem definido quais são os clientes mais valiosos para o negócio, pois são para
estes clientes que os Programas de Fidelidade, em geral, são direcionados.
2
Um dos principais desafios dos programas de relacionamento é promover recompensas que
sejam atraentes aos seus clientes e que os mantenham fiéis ao negócio da empresa. Em grande
parte dos programas de relacionamento buscam-se recompensas que onerem pouco a empresa
e que gerem satisfação aos clientes. Mas nem sempre o que os clientes desejam é barato.
Então é muito importante saber o que oferecer e a quem oferecer. Dessa forma, outro desafio
desse negócio é selecionar o público-alvo do programa de relacionamento, pois embora o
programa seja para “todos os clientes”, dependendo do tipo de recompensa disponível, o custo
da mesma é alto e inviável para a empresa. Sendo assim, quais os clientes devem ser
priorizados no universo de recompensas? Como selecionar o verdadeiro público-alvo do
programa?
Tentando responder essas e outras perguntas, esse estudo pretende estabelecer um modelo de
segmentação de clientes de um programa de relacionamento de uma grande empresa de
telecomunicações brasileira e, ainda, estabelecer um critério de priorização destes clientes
frente ao programa de relacionamento de modo a torná-lo uma ferramenta eficiente e
importante na manutenção da fatia do mercado (market share) da empresa.
A fim de atingir esse objetivo, esse estudo utilizou-se do método de apoio a decisão
multicritério DRSA (Dominance-based Rough Set Approach) proposto por Greco, Matarazzo
& Slowinski (1998 a, 1999 a,b), que utiliza o princípio de dominância estabelecendo as
relações de dominância e aproximação das classes de decisão para gerar a segmentação dos
clientes através da inferência de regras de decisão do tipo “se..., então...”. Isto é, se o cliente
tem determinado perfil, então ele é classificado nessa classe de decisão e, assim, é
estabelecida a segmentação desses clientes.
3
2 PROBLEMA
2.1 CONTEXTUALIZAÇÃO DO PROBLEMA
Os programas de relacionamento têm sido uma das formas utilizadas por diversas empresas
para conquistar os clientes e fidelizados a sua marca. A grande dificuldade é ter um programa
atrativo que seja eficiente e que realmente consiga realizar seu principal papel: manter o
cliente vinculado à empresa. A proposta desse trabalho é ajudar uma empresa de
telecomunicações a identificar o grupo de clientes que deve ser priorizado nas suas ações de
incentivo ao resgate de recompensa de modo a manter a saúde financeira do programa.
2.2 FORMULAÇÃO DO PROBLEMA
O problema que será respondido nesse estudo é: Como tornar um programa de
relacionamento, utilizando técnicas de segmentação de mercado, uma ferramenta eficiente
para uma empresa, visando a manutenção da base de seus principais clientes?
2.3 OBJETIVOS
2.3.1 OBJETIVO PRINCIPAL
O objetivo principal do trabalho é identificar os grupos de clientes principais, segundo sua
propensão de resgate, de modo a orientar os tomadores de decisão no planejamento do
programa para o próximo ano.
2.3.2 OBJETIVO INTERMEDIÁRIO
Tem-se por objetivo intermediário desse trabalho, a criação de uma segmentação de clientes
segundo a propensão a resgate utilizando o método de apoio a decisão multicritério DRSA.
4
2.4 RELEVÂNCIA DO ESTUDO
Esse estudo será importante para as empresas do mercado de telecomunicações brasileiro ou
para qualquer outra empresa ou pessoa interessada em segmentar seus clientes e que desejam
investir ou criar programas de relacionamentos eficientes.
Além disto, proporciona conhecimento científico com a aplicação do método de apoio à
decisão multicritério na criação de uma segmentação para potencializar e direcionar um
programa de relacionamento de uma empresa de telecomunicações.
Há vários métodos na literatura que possibilitam a realização de uma segmentação, mas o
método DRSA permite gerar regras de classificação das mais variadas, a partir da relação de
preferência no domínio dos critérios escolhidos pelos tomadores de decisão, que possibilitarão
classificar os clientes de forma clara, levando em consideração a opinião dos tomadores de
decisão.
2.5 DELIMITAÇÃO DO ESTUDO
Apesar da existência de diversos métodos de apoio da decisão classificatórios utilizados
atualmente, esse estudo se limitará a utilizar o método de apoio à decisão multicritério DRSA
para ajudar no direcionamento dos tomadores de decisão de uma empresa de
telecomunicações.
O estudo se baseia na percepção do tomador de decisão com base nos critérios a priori
estabelecidos e observados pela companhia e pelas tendências apontadas pelos clientes dessa
empresa. Esse estudo não promoverá a segmentação completa da base de clientes dessa
5
empresa, ele mostrará como se deve proceder na aplicação do método de apoio a decisão
multicritério DRSA para uma amostra desses clientes, segundo as características do problema.
3 REVISÃO DA LITERATURA
3.1 SEGMENTAÇÃO DE MERCADO
Segundo Kotler (1998), “As empresas seriam espertas se conhecessem melhor seus clientes.
Toda companhia deve ter um grupo de clientes para ajudar a ler a mente em mudança do
consumidor.”
A segmentação de mercado é uma prática realizada por diversas empresas para conseguir
avaliar o mercado potencial de seus produtos, desenvolver posições competitivas para os
produtos frente os concorrentes e para direcionar suas ações de forma customizada e assertiva
para o público ou nichos escolhidos investirem em produtos ou serviços.
Segmentação de mercado é o processo de dividir um mercado em grupos de
compradores que tenham semelhantes necessidades e desejos, percepções de
valores ou comportamentos de compra. Os indivíduos ou organizações de cada
grupo – ou segmento – do mercado podem responder de maneira semelhante a
uma determinada estratégia de marketing. As empresas usam as informações
para decidir a quais segmentos de mercado podem atender de forma mais
lucrativa, enquanto as organizações sem fins lucrativos usam-nas para serem
mais eficientes no alcance de suas metas. O segmento específico de mercado
que uma organização seleciona para servir é chamado de mercado-alvo.
(CHURCHILL; PETER, 2000, p. 204-205)
6
Realizar uma segmentação não é algo simples e algumas etapas são necessárias, tais como:
levantamento de informações (através de entrevistas, grupos de foco, questionários ou bancos
de dados disponibilizados pelas empresas), análise (aplicações de técnicas estatísticas, tais
como a análise fatorial que ajudam a identificar as variáveis altamente correlacionadas e
análise de conglomerados ou de cluster e técnicas de regressão multivariada que determinam
os grupos segundo as características semelhantes) e desenvolvimento do perfil (detalhamento
de cada segmento segundo suas atitudes, comportamentos, fatores demográficos,
psicográficos e hábitos de mídia).
Conforme Churchill & Peter (2000); Kotler & Armstrong (1998); Kotler (1998); Simpson
(2001) a segmentação de mercado é realizada das seguintes formas:
Segmentação Geográfica (requer uma divisão do mercado em diferentes unidades
geográficas, como países, estados, regiões, cidades ou bairros.).
Segmentação Demográfica (divisão do mercado com base em variáveis demográficas,
tais como: sexo e idade, etc.).
Segmentação Psicográfica ou Socioeconômica (segmenta através dos perfis do estilo
de vida dos diferentes consumidores, classe social, na personalidade, nas atitudes e na
percepção).
Segmentação Comportamental (utiliza-se de características comportamentais, tais
como: conhecimento, atitude, uso ou resposta para um determinado produto para
segmentar os clientes.).
Segmentação por Multiatributos (esse tipo de segmentação de mercado parte do
princípio de conglomerados geográficos, que proporcionam informações mais ricas
sobre os consumidores.).
7
Segmentação baseada em Comportamento de Compra (o comportamento de compra
pode ser: prudente, impulsivo, pessimista, tradicional e confiante combinado com a
frequência de uso, situação de lealdade e situação de usuário ou ainda, a sensibilidade
a preços ou preferências de qualidade).
Segmentação de Mercados Industriais (utiliza-se das formas de segmentação de
consumidores, tais como: variáveis demográficas, operacionais, de abordagens de
compra, de fatores situacionais e de características pessoais.).
Segmentação dos Mercados Internacionais (utiliza-se de uma única variável ou de uma
combinação delas, tais como: regiões, nível de renda, estabilidade do governo,
receptividade e determinada característica cultural.).
Segmentação Intermercado (consumidores com hábitos semelhantes, mas em regiões
diferentes).
Depois de identificado os segmentos de mercado potenciais, esses deveriam ser analisados,
pois nem todas as formas de segmentação são efetivas. Os segmentos precisam ser:
Mensuráveis (que conseguem ser medidos), Substanciais (importantes), Acessíveis (que pode
ser compreendido com facilidade) e Acionáveis (que pode ser acionado), para serem úteis.
Na literatura há diversos trabalhos realizados no âmbito da segmentação de mercado, entre
eles, temos: Granat (2004), que fez uso da análise de cluster para segmentar os clientes de
uma empresa do ramo das telecomunicações e posteriormente determinar algoritmos que
descrevessem tais clusters; Coughlan & Soberman (2005), que segmentaram clientes de dois
fabricantes a partir de modelos probabilísticos baseados na preferência espacial, sensibilidade
de preço e serviço; Martins (2011), que segmentou clientes portugueses de marcas próprias
utilizando a análise fatorial e a análise de cluster.
8
3.2 MÉTODOS DE APOIO À DECISÃO DE MULTICRITÉRIO
O processo de tomada de decisão envolve múltiplos critérios, também denominados de
objetivos ou fatores, e variáveis qualitativas. Para Malczewski (1999), decisões são
necessárias quando uma oportunidade ou problema existe, ou quando algo não é o que deveria
ser ou, ainda, quando existe uma oportunidade de melhoria ou otimização. Segundo Gomes &
Gomes (2012), decidir é escolher uma alternativa em um conjunto de alternativas possíveis
sob a influência de pelo menos dois parâmetros conflitantes.
Para Gomes & Gomes (2012), a tomada de decisão complexa pode estar relacionada a
problemas que possuem pelo menos uma dessas características:
Os critérios de resolução do problema são pelo menos dois e que conflitam entre si;
Tanto os critérios ou alternativas de solução não são claramente definidos e as
consequências da escolha de dada alternativa com relação a pelo menos um critério
não são claramente compreendidas;
Os critérios e alternativas podem estar interligados;
A solução do problema depende de um conjunto de pessoas;
As restrições do problema não são bem definidas;
Alguns critérios são quantificáveis enquanto outros só o são por meio de julgamentos
em cima de escalas;
A escala para dado critério pode ser cardinal, verbal ou ordinal;
Várias outras complicações podem surgir de um problema real de tomada de decisão.
Na década de 70, surgiram os primeiros métodos voltados para problemas discretos de
decisão, no ambiente multicritério e multiobjetivo que utilizam uma abordagem diferenciada
para essa classe de problemas. Atualmente, existem vários métodos analíticos de Apoio
9
Multicritério à Decisão, que são oriundos de duas escolas de pensamento, segundo Clímaco &
Craveirinha (2005):
A Escola Americana, onde uma função de utilidade multiatributo (linear ou não) é
construída para apoiar a avaliação de um conjunto discreto de alternativas;
A Escola Francesa, também chamada de Escola Europeia, que introduz ordens parciais
ou relações de superação nos seus modelos.
Para Gomes (2007), o método MAUT - Multiple-Attribute Utility Theory (Keeney & Raiffa,
1976) e o AHP - Analytic Hierarchy Process (Saaty, 1980) são os mais representativos da
escola norte-americana, que procura agregar todas as informações por meio de uma grande
síntese. Enquanto que, os métodos Electre (Ehrgott , Figueira & Greco, 2010) e Prométhée
(Brans et al., 1984) pertencem a escola francesa, que agregam as informações a partir do
conceito de superação sem utilizar operações de síntese. Outros métodos também são
utilizados como MACBETH (Bana & Costa; Vansnick, 1995, 1997), TODIM (Gomes &
Rangel, 2009), etc.
A seguir, temos a tabela 1 que compara as principais características dos métodos da escola
norte-americana e francesa.
Métodos da Escola Francesa ou Escola
Europeia
Métodos da Escola Americana ou Teoria
de Utilidade Multiatributo
Permitem ordenar (pelo menos parcialmente)
as alternativas em termos relativos, mesmo
quando a informação de que dispõe sobre as
preferências critério a critério é pobre; no
entanto, não é possível a indicação do mérito
global de cada alternativa.
Possibilita definir uma medida de mérito
(global) para cada alternativa, indicadora da
sua posição relativa numa ordenação final;
no entanto, é necessário dispor de
informação completa (cardinal), sobre as
preferências intracritérios dos decisores, o
que em alguns casos práticos pode ser difícil.
10
Permitem quatro diferentes formas de
comparação entre alternativas: preferência
sem hesitação; preferência com hesitação;
indiferença e incomparabilidade.
Permite duas formas de comparação:
preferência e indiferença, não pressupõe a
existência de hesitação.
A hesitação é uma área fértil para aplicação
de teorias que trabalham com não
determinismo: Teoria dos Conjuntos
Nebulosos e Teoria dos Conjuntos
Aproximativos (TCA).
Existem trabalhos que aplicam as Teorias dos
Conjuntos Nebulosos e TCA para verificar a
sensibilidade dos resultados.
Não necessitam de uma função de utilidade,
utilizando-se de comparações paritárias e
gráficos de Kernel para representar a
dominância das alternativas.
Pressupõe a criação de uma função de
utilidade.
Não pressupõe transitividade. Pressupõe transitividade.
Pressupõem superação e análise paritária. Facilita o estabelecimento de hierarquias.
Tabela 1 – Comparativo entre os métodos da Escola Francesa e da Escola Norte-Americana
Fonte: Adaptada de Gomes & Gomes (2012)
Dias et al. (1996) identificam duas fases nos processos de apoio a decisão: a fase de
estruturação e a de avaliação. Ainda podemos identificar uma terceira fase: a recomendação
dos cursos da ação a serem seguidos.
A fase de estruturação, segundo Bana & Costa et al. (2000), representa 80% do total do
problema, pois trata da formulação do problema e da identificação dos objetivos. Essa fase
busca identificar, caracterizar e organizar os fatores considerados relevantes no processo de
apoio à decisão. Assim como, definir os objetivos do decisor, identificar as alternativas
viáveis, estabelecer os critérios que vão intervir no processo de decisão, entre outras etapas
que dependem do problema abordado.
11
A fase de avaliação pode ser dividida em fase de avaliação parcial das alternativas, segundo
cada critério, e a fase de avaliação global, considerando as diversas avaliações parciais. Para
realizar a avaliação é necessário escolher um dos métodos disponíveis, tradicionalmente
classificados em métodos para problemas multiatributos e multiobjetivos. Os problemas
multiatributos lidam com alternativas discretas enquanto que os problemas multiobjetivos
consideram um espaço contínuo de alternativas.
Segundo Gomes & Gomes (2012), podemos identificar quatro tipos de problemática de
referência no contexto de apoio à decisão em função do resultado pretendido em determinado
problema. A tabela 2 apresenta os tipos de problemática e seu resultado pretendido.
Tabela 2 – Tipos de Problemática e seus Objetivos.
Fonte: Adaptado de Gomes & Gomes (2012)
Na literatura, existem diferentes métodos multicritério de apoio à decisão para tratar essas
problemáticas. Caberá ao especialista ou tomador de decisão escolher o método que mais se
adéqua ao seu problema e a decisão que se pretende tomar.
Dado o objetivo desse estudo de classificar clientes de um programa de relacionamento,
optou-se por dois métodos que serão mais detalhados adiante, o RSA – Rough Set Approach
Tipos de Problemática Resultado Pretendido
Problemática P Realizar uma escolha ou um procedimento de seleção
Problemática P Realizar uma triagem ou um procedimento de classificação
Problemática P Realizar um arranjo ou um procedimento de ordenação
Problemática P Realizar uma descrição ou um procedimento cognitivo
12
(Pawlak, 1982) e o DRSA - Dominance-Based Rough Set Approach (Greco, Matarazzo &
Slowinski, 1998, 1999).
3.3 MÉTODO RSA – ROUGH SET APPROACH OU TCA – TEORIA DOS
CONJUNTOS APROXIMATIVOS
Proposta pelo matemático polonês Zdizslaw Pawlak, em 1982, a Teoria dos Conjuntos
Aproximativos (TCA) busca extrair de um banco de dados os atributos fundamentais para que
se possa chegar a uma regra de decisão. Na TCA, o tratamento da imprecisão dos dados é por
meio de aproximações inferior e superior de um conjunto de dados (Pawlak, 1991).
O conceito fundamental dessa teoria é o conceito de granularidade, que segundo Pawlak
(1991) está caracterizado na identificação das unidades observadas no exame dos vetores de
avaliações do conjunto de variáveis e na precisão na medição de cada variável. Para Pawlak &
Slowinski (1994), a granularidade na representação da informação pode ser a origem de
inconsistências nas decisões, dada a ambiguidade na explicação ou na prescrição da mesma
com base numa informação inconsistente.
Outra vantagem dessa teoria, segundo Pawlak e Skowron (2007), é que não são necessárias
informações preliminares ou adicionais aos dados, conforme acontece em outros métodos.
A TCA se aplica a muitos casos reais e em diversas áreas de estudo da administração, de
sistemas da informação, pesquisa operacional, etc. Algumas aplicações podem ser vistas em:
Ferreira & Gomes (1995), Pawlak et al. (1995), Gomes & Gomes (2001), Yiyu Yao & Yan
Zhao (2007) e Couto & Gomes (2010).
13
Para utilizar a TCA, o problema deve ter um sistema de informações com objetos, atributos
condicionantes e atributos de decisão ou classificação.
No início da aplicação do TCA, os objetos são agrupados em classes, onde aqueles agrupados
em uma mesma classe são considerados indiscerníveis, pois possuem as mesmas
características para os mesmos atributos analisados, sendo assim, considerados iguais diante
do banco de dados analisado.
A redução do número de atributos é desejável em um problema de classificação usando
múltiplos atributos, desde que se mantenha a mesma qualidade da classificação. Segundo
Ziarko (1993), a TCA é uma das ideias mais úteis para reduzir-se o número de critérios (ou
atributos). Uma etapa importante da TCA é a identificação dos redutos (reduct), que é o
conjunto mínimo de atributos de condição suficientes para identificar os conjuntos de
observações indiscerníveis pelo(s) atributo(s) de decisão, que mantém a classificação original.
Em outras palavras, o reduto é o conjunto mínimo de atributos de condição que permite tomar
as mesmas decisões caso fossem emregados todos os atributos de condição (Pawlak, 1991;
Pawlak & Slowinski, 1994; Pawlak, 2000). O número de redutos pode ser grande ou pequeno,
assim como o número de atributos em cada reduto, isso depende da granularidade na medição
de cada atributo.
Os atributos que aparecem em todos os redutos, isto é, as interseções desses conjuntos de
redutos, representam o núcleo (core) que corresponde à parte insubstituível da informação, ao
passo que os outros atributos mínimos podem ser intercambiáveis. O núcleo pode ser
interpretado como a parte mais importante de um sistema de informação (Pawlak, 1991;
Pawlak & Slowinski, 1994; Pawlak, 2000).
14
Durante essa etapa de identificação dos redutos, temos atributos que podem ser classificados
como dispensáveis e por isso acabam saindo do sistema de informação, pois a retirada deles
não afeta a classificação dos objetos que se mantêm as mesmas de antes (Pawlak, 1982).
A Teoria dos Conjuntos Aproximativos não distingue as inconsistências do seu sistema de
informações pela possibilidade de uma classificação em um valor imediatamente superior ou
inferior pelo atributo de decisão. Toda inconsistência tem o mesmo peso para o cálculo da
qualidade da aproximação (Patrício et al., 2005).
Para entender como funciona o TCA, é necessário entender algumas terminologias. Segundo
Pawlak & Slowinski (1994) o sistema de informação do TCA (S) é composto por uma
quádrupla S=<U,Q,V,>, onde:
U é um conjunto finito de objetos
Q é um conjunto finito de atributos
V= q ϵ Q Vq , Vq é o domínio do atributo q
: U x Q →V é uma função total tal que (x,q) ϵ Vq q ϵ Q, x ϵ U, denominada
função de informação. Todo par (q,v), q ϵ Q, v ϵ Vq é chamado descritor em S.
Dessa forma, o sistema de informação pode ser relacionado a uma matriz finita, onde cada
coluna é associada a um atributo, cada linha corresponde a um objeto e a célula localizada no
cruzamento da coluna q com a linha x tem o valor (x,q). Logo, cada linha da matriz
representa a informação de um objeto em S.
Se dois objetos quaisquer possuem os seus valores (x,q) pertencentes a um mesmo
subintervalo, diz-se que são indiscerníveis em relação a um atributo. De acordo com Pawlak
15
& Slowinski (1994), seja S=<U,Q,V,> um sistema de informação e P Q e x, y ϵ U. Os
objetos x e y são indiscerníveis pelo conjunto de atributos P em S se e somente se (x,q) =
(y,q) q ϵ P.
Portanto, todo P Q gera uma relação binária em U, denominada relação de
indiscernibilidade ou relação de equivalência segundo P, designada por IND (P). As classes
de equivalência de IND (P), são chamadas conjuntos P-elementares em S e a família de todas
as classes de equivalência da relação IND (P) em U é designada por U | IND (P) ou, em
termos abreviados, U | P.
A cada par (objeto, atributo) associa-se um descritor, sendo que cada linha da matriz contém
descritores representativos da informação sobre um particular objeto. DESP (x) designa uma
descrição do conjunto P-elementar x e U | P em termos dos valores dos atributos de P, ou seja,
DESP (x) = <(q, v) : (x, q) = v, x ϵ X, q ϵ P>.
Seja o sistema de informação estruturado como uma tabela de decisão, na qual Q = C D e C
D = , onde C é o conjunto de atributos de condição e D o conjunto de atributos de
decisão.
Uma tabela de decisão S = < U, C D, V, > é determinística se e somente se C D, caso
contrário essa tabela será não determinística. Se determinadas condições preestabelecidas para
a tomada de decisão são satisfeitas, a tabela é determinística e descreve univocamente as
decisões a serem tomadas. Se estas condições não forem estabelecidas, as decisões serão não
univocamente relacionadas e a tabela de decisão será não determinística. Neste caso será
definido um subconjunto de decisões que serão tomadas caso ocorram tais circunstâncias.
16
Sejam P Q e Y U. Define-se a aproximação P-inferior a Y, designada por P Y, e a
aproximação P-superior a Y, designada por P Y, pelas seguintes expressões (1):
P Y = {X ϵ U | P: X Y } e PY = {X ϵ U | P: X Y } (1)
Sendo assim, Y é um conjunto aproximativo em relação a P, se e somente se, P Y PY
(Pawlak, 1991).
Define-se ainda a P-fronteira do conjunto Y pela equação (2):
FP (Y) = P Y - P Y (2)
Onde, o conjunto P Y é o conjunto de todos os elementos de U que podem ser com certeza
classificados como elementos de Y, a partir do conjunto de atributos P eP Y é o conjunto dos
elementos que não podem, com certeza, ser classificados como elementos de Y utilizando-se
o conjunto de atributos P.
A cada subconjunto Y U associa-se uma precisão da aproximação ao conjunto Y pelo
conjunto de atributos P na quádrupla S (Pawlak & Slowinski, 1994). A precisão de Y é
indicada pela fórmula (3):
(3)
, onde card designa cardinalidade.
17
A precisão mede o quanto o conhecimento sobre o conjunto Y está completo. A falta de
exatidão de um conjunto é devido à existência da região de fronteira. Quanto maior a região
de fronteira, menor é a precisão (Pawlak, 1991).
Seja a partição y = {Y1, Y2,..., Yn} do conjunto de objetos U. Essa partição pode advir da
designação de cada objeto a uma categoria pré-definida por um especialista, caso em que a
origem da partição independe dos atributos em P. Sendo assim, os subconjuntos Yi, i = 1,..., n,
são classes (ou categorias) da partição Y. As aproximações P-inferior e P-superior de S são os
conjuntos PY = { PY1 , PY2 , ... , PYn} e PY = {PY1 , PY2 , ... , PYn}, respectivamente.
Entende-se por qualidade da aproximação da partição Y pelo conjunto de atributos P, também
denominada qualidade da classificação, o quociente dado pela fórmula (4):
(4)
O conjunto de atributos R Q depende do conjunto de atributos P Q em S, representado
por P R, se e somente se IND (P) IND (R). Seja um subconjunto mínimo R P Q , tal
que P (Y) = R (Y), denomina-se Y-redução de P, representada por REDY (P). Um sistema
pode possuir mais de uma Y-redução, a interseção de todas as Y-reduções é denominada Y-
núcleo de P, isto é, NUCY (P) = REDY (P).
Dada uma tabela de decisão, pode-se deduzir um conjunto de regras de decisão. Seja U | IND
(C) uma família de todos os conjuntos C-elementares denominados classes de condições e
designados por Xi ( i = 1, ... , m). Seja, também, a família U | IND (D) de todos os conjuntos
D-elementares designados por Yj (j = 1, ... , n) e denominados classes de decisões.
18
Define-se (C, D), a regra de decisão, como sendo a relação causal DESC (Xi) DESD (Yj).
Dada esta definição, as regras são declarações lógicas do tipo “se... então ... ” que relacionam
descrições de classes de condições de decisões.
Define-se ainda {rij} como o conjunto de regras de decisão para classes de decisões Yj (j =
1,..., n), isto é, {rij} = { DESC (Xi) DESD (Yj): Xi Yj, i = 1, ... , m}. Caso Xi Yj,
diz-se que a regra de decisão é determinística e, caso contrário, a regra é não determinística.
O problema de classificação multicritério consiste em descobrir regras de decisão, levando-se
em conta as avaliações (preferências) do especialista ou agente de decisão. Neste caso, tem-se
que card (C) > 1 e card (D) = 1.
Pode-se aplicar a TCA, através da construção de uma tabela de decisão, nos seguintes
problemas:
i. Descrição multicritério, onde card (C) > 1 e card (D) = 0;
ii. Avaliação multi-especialista, onde card (C) = 1 e card (D) > 1; e
iii. Classificação (ou avaliação) multicritério e multi-especialista, onde card (C) > 1 e card
(D) > 1.
Segundo Ziarko (1993; 1993a), a TCA apresenta algumas restrições, entre elas: a TCA é
sensível a pequenos erros de classificação, causados por problemas de dependência de
atributos e que as conclusões derivadas desse conjunto são aplicáveis somente a esse
conjunto, o que na prática, limita a generalização das conclusões para um conjunto maior de
informações. Como alternativa Ziarko (1993; 1993a) propõe o uso do modelo VP (Variable
Precision) que permite reconhecer a presença de dependência dos dados.
19
Além disso, Greco, Matarazzo & Slowinski (2005) observam que o princípio de
indiscernibilidade não é suficiente para cobrir toda a semântica de um conjunto de
informações e propõem a substituição do princípio de indiscernibilidade pelo princípio de
dominância.
De acordo como princípio de dominância proposto por Roy & Bouyssou (1993), se x domina
y, x é ao menos tão bom quanto y com relação a todos os critérios considerados, então x
deveria pertencer a uma classe não pior do que a classe y; se não, há uma inconsistência entre
x e y.
4 METODOLOGIA
4.1 MÉTODO DRSA – DOMINANCE –BASED ROUGH SET APPROACH
O método Dominance-Based Rough Set Approach (DRSA) proposto por Greco, Matarazzo &
Slowinski (1998, 1999, 2012) lida com problemas de classificação multicritério. Ele
generaliza o método Rough Set Approach (RSA) (Pawlak, 1982, 1991), substituindo a relação
indiscernibilidade, utilizada na RSA, por uma relação de dominância, permitindo a descoberta
de inconsistências no que diz respeito ao princípio de dominância. Além disso, o DRSA
prepara uma base conceitual para a aplicação de regras que tem sintaxe concordante com o
princípio da dominância.
No DRSA assim como no RSA, as informações dos objetos são representados por uma matriz
de dados, onde as linhas correspondem aos objetos, às colunas são os atributos e os valores da
matriz representam os valores dos objetos para cada atributo correspondente.
20
Na classificação multicritério, atributos de condição são critérios cuja noção envolve uma
ordem de preferência no seu domínio, enquanto os domínios de atributos, geralmente
considerados, não são ordenados pela preferência.
4.1.1 Entendendo o DRSA
Seja U um conjunto finito de objetos, Q um conjunto finito de atributos, Vq um domínio do
atributo q, e f (x, q) uma função onde para cada par objeto - atributo (x, q) temos um valor de
Vq. O conjunto Q em geral é dividido em conjunto C de atributos de condição e D do atributo
de decisão.
O atributo de decisão D divide U em um número finito de classes Cl = {Clt, t ∈ T}, T = {1, ...,
n}. Cada x ∈ U pertence a uma e somente uma classe Clt ∈ Cl . As classes Cl são ordenadas
de acordo com a ordem de preferência crescente dos índices da classe, ou seja, para todos r, s
∈ T, tal que r > s, os objetos de Clr são os preferidos aos objetos de Cls.
Dessa forma, devido à ordem de preferência no conjunto de classes Cl, os objetos são
aproximados por uniões para cima (upward) e uniões para baixo (downward) das classes,
respectivamente, pelas equações em (5):
e , t =1,…,n (5)
Onde, é o conjunto de objetos pertencentes à classe Clt ou a classe mais preferida,
enquanto é o conjunto de objetos pertencentes à classe Clt ou a classe menos preferida.
21
Note que para t = 2,..., n temos , ou seja, todos os objetos que não pertencem
a classe Clt , ou melhor, pertencem à classe de Clt-1 ou pior. Dessa forma, cada objeto, a partir
da união para cima , é preferido a cada objeto da união para baixo . É dessa forma
que o princípio de dominância é aplicado no DRSA.
Seja q uma relação de preferência fraca em U (Roy, 1985) que representa uma preferência
no conjunto de objetos com relação ao critério q; x q y significa "x é pelo menos tão bom
quanto y em relação ao critério de q". Dizemos que x domina y em relação a P ⊆ C (ou, x
P-domina y), denotado por xDpy , se x q y q ∈ P. Assumindo que, sem perda de
generalidade, todos os domínios de critérios são ordenados de modo que a preferência
aumenta com o valor, xDpy é equivalente a: f (x,q) ≥ f (y,q) q ∈ P. Observe que para cada x
∈ U, xDpx, ou seja, a relação de dominância é reflexiva .
Dado P ⊆ C e x ∈ U, os "grânulos de conhecimento" usados em DRSA para a aproximação
das uniões e são:
• um conjunto de objetos que dominam x, chamado conjunto P-dominante,
.
• um conjunto de objetos dominados por x, chamado conjunto P-dominado,
.
Dado um conjunto de critérios de P ⊆ C, a inclusão de um objeto x ∈ U para a união para
cima das classes , t = 2,..., n, cria uma inconsistência no sentido do princípio de
dominância se uma das seguintes condições ocorre:
22
• x pertence à classe Clt ou melhor, mas é P-dominado por um objeto y pertencente a uma
classe pior do que Clt, ou seja x ∈ , mas ,
• x pertence a uma classe pior do que Clt, mas P-domina um objeto y pertencente a classe Clt
ou melhor, isto é, x ∉ , mas .
Logo, se dado um conjunto de critérios P ⊆ C, a inclusão de x ∈ U para , t = 2, ... , n, cria
uma inconsistência no sentido do princípio de dominância, dizemos que x pertence a com
alguma ambiguidade. Assim, x pertence sem qualquer ambiguidade em relação ao P ⊆ C,
se x ∈ e não há nenhuma inconsistência no sentido do princípio de dominância. Isto
significa que todo objeto P-dominante x pertence a , isto é, ⊆ .
Além disso, x poderia pertencer a no que diz respeito a P ⊆ C, se uma das seguintes
condições ocorre:
1) de acordo com o atributo de decisão D, x pertence ,
2) de acordo com o atributo de decisão D, x não pertence a mas é inconsistente no sentido
do princípio de dominância com um objeto y pertencente a .
Em termos de ambiguidade, x poderia pertencer a no que diz respeito a P ⊆ C, se x
pertence com ou sem qualquer ambiguidade. Devido à reflexividade da relação de
dominância DP, as condições 1) e 2) podem ser sintetizados como segue: x poderia pertencer a
classe Clt ou melhor , no que diz respeito a P ⊆ C, se entre os objetos P- dominado por x há
um objeto y pertencente a classe Clt ou melhor, isto é , .
23
Para P ⊆ C, o conjunto de todos os objetos pertencentes a sem qualquer ambiguidade
constitui o P-menor aproximação de , indicado por P ( ), e o conjunto de todos os
objetos que poderiam pertencer à constitui a P-aproximação superior da , indicado por
P ( ) em (6):
P ( ) = { x ∈ U: ⊆ },P ( ) = { x ∈ U: } , para t = 1,..., n . (6)
De forma análoga, pode-se definir P- menor aproximação e P-aproximação superior da
como se segue em (7):
P ( ) = {x ∈ U: ⊆ }, P ( ) = { x ∈ U: } , para t =1,...,n. (7)
Todos os objetos pertencentes a e com alguma ambiguidade constituem a P- fronteira
de e , denotado pelo BnP ( ) e o BnP ( ), respectivamente. Eles podem ser
representados, em termos de aproximações superiores e inferiores como em (8):
BnP ( ) = P ( ) – P ( ) , BnP ( ) = P ( ) – P ( ) , para t=1,...,n. (8)
Aproximações P-inferiores e P-superiores da união de classes e têm uma propriedade
importante de complementaridade. Diz-se que se o objeto x pertence, sem qualquer
ambiguidade, a classe Clt ou melhor, é impossível que ele possa pertencer a classe Clt-1 ou
pior , ou seja, P ( ) = U -P( ). Devido à propriedade de complementaridade, tem-se
que a BnP ( ) = BnP ( ) , para t = 2,..., n , o que significa que, se x pertence à classe de
ambiguidade Clt ou melhor, ele também pertence à classe com a ambiguidade Clt-1 ou pior.
24
As aproximações P-inferiores da união de classes representam conhecimento certo fornecido
pelos critérios de P ⊆ C, enquanto as aproximações P-superiores representam o possível
conhecimento e as P-fronteiras contêm o conhecimento duvidoso. Essas definições de
aproximações são baseadas em uma aplicação estrita do princípio da dominância.
Para cada P ⊆ C, os objetos sendo consistentes no sentido do princípio de dominância com as
uniões de classes para cima e para baixo são P- classificadas corretamente. Para cada P ⊆ C, a
qualidade da aproximação da classificação multicritério Cl por um conjunto de critérios P é
definido como a razão entre o número de objetos P- classificados corretamente e o número de
todos os objetos no conjunto de amostra de dados. Uma vez que os objetos P- classificados
corretamente são aqueles que não pertencem a qualquer P-fronteira das uniões e ,
t= 1, ... , n, a qualidade da aproximação da classificação multicritério Cl pelo conjunto de
atributos P, pode ser escrita como em (9):
(9)
Onde, γp(Cl) pode ser visto como uma medida da qualidade do conhecimento que pode ser
extraída da matriz de dados, onde p é o conjunto de critérios e Cl é a classificação
considerada.
Cada subconjunto mínimo P⊆C, tal que γp(Cl) = γc(Cl), é chamado um reduto de Cl e, é
denotado por REDCl. Assim como em RSA, um conjunto de amostras de dados pode ter mais
de um reduto e a interseção de todos os redutos é chamada de núcleo e é denotada por
CORECl. Os critérios do CORECl não podem ser removidos do conjunto da amostra de dados
25
sem deteriorar o conhecimento da informação. Dessa forma, no conjunto C temos três
categorias de critérios:
1) Os critérios indispensáveis incluídos no núcleo,
2) os critérios permutáveis incluídos em alguns redutos mas não no núcleo,
3) os critérios redundantes que nem são indispensáveis nem passíveis de troca, portanto, não
incluídos em qualquer reduto.
4.1.2 Extraindo as regras de decisão
As aproximações das uniões de classes para cima e para baixo do DRSA podem servir para
induzir regras de decisão do tipo "se ... , então ..." para os objetos da matriz de dados.
Para uma dada união de classes para cima e para baixo, e , as regras de decisão
induzidas sob uma hipótese de que os objetos pertencentes a P( ) ou P( ) são positivos e
todos os outros negativos, e sugerem uma atribuição a "classe Clt ou melhor" ou a "classe Cls
ou pior" , respectivamente. Por outro lado, as regras de decisão induzidas sob a hipótese de
que os objetos pertencentes à intersecção P ( ) ∩ P ( ) são positivos e todos os outros
negativos, estão sugerindo uma atribuição para algumas classes entre Cls e Clt (s < t). Na
classificação multicritério é significativo considerar os seguintes cinco tipos de regras de
decisão:
1) Regras de decisão certas ( ): se f (x, q1 ) ≥ rq1 e f (x, q2) ≥ rq2 e ... f (x, qp) ≥ rqp, então
x ∈ ,
2) Regras de decisão possível ( ): se f (x, q1 ) ≥ rq1 e f (x, q2) ≥ rq2 e ... f (x, qp) ≥ rqp , então
x poderia pertencer a ,
26
3) Regras de decisão certas ( ): se f (x, q1 ) ≤ rq1 e f (x, q2) ≤ rq2 e ... f (x, qp) ≤ rqp, então
x ∈ ,
4) Regras de decisão possível ( ): se f (x, q1) ≤ rq1 e f (x, q2) ≤ rq2 e ... f (x, qp) ≤ rqp, então
x poderia pertencer a ,
5) Regras de decisão aproximativas ( ): se f (x, q1) ≥ rq1 e f (x, q2) rq2 ≥ e ... f (x, qk ) ≥ rqk
e f (x, qk +1) ≤ rqk+1 e ... f (x, qp ) ≤ rqp, então x ∈ Cls ∪ Cls+1 ∪ ... ∪ Clt ,
No lado esquerdo de uma regra de decisão podemos ter "f ( x , q) ≥ rq" e "f ( x , q) ≤ r'q" ,
onde rq ≤ r'q , para o mesmo q ∈ C. Além disso, se rq = r'q , as duas condições se resumem a
"f (x, q) = rq" .
As regras do tipo 1) e 3) representam um certo conhecimento extraído da matriz de dados,
uma vez que são aplicadas para objetos sem ambiguidade, enquanto as regras de tipo 2) e 4)
representam conhecimento possível e são aplicadas a objetos com ou sem qualquer
ambiguidade , e as regras de tipo 5) representam o conhecimento duvidoso, para objetos em
que não conseguimos discernir a sua classe e que pertence a união de todas as classes.
Um conjunto de regras de decisão está completo se for capaz de abranger todos os objetos a
partir da matriz de dados de tal forma que objetos consistentes são reclassificados para suas
classes originais e objetos inconsistentes são classificados para o grupo de classes que se
referem a esta inconsistência. Chamamos de mínimo (minimal) a cada conjunto de regras de
decisão que seja completo e não redundante, ou seja, a exclusão de qualquer regra deste
conjunto torna-o não completo.
27
Para induzir as regras, Greco et al. (2000b) usa o algoritmo chamado DOMLEM, construído
sobre a ideia de LEM2 (Grzymala-Busse , 1992), gera a descrição mínima (minimal).
Maiores detalhes desse algoritmo estão no anexo A.
Assim como o RSA, o DRSA pode ser aplicado em diversas áreas do conhecimento, alguns
exemplos de aplicação podem ser vistos em diversos artigos de Greco, Matarazzo &
Slowinski (2006, 2012).
5 ESTUDO DE CASO: SEGMENTAÇÃO DE CLIENTES DE UM PROGRAMA DE
RELACIONAMENTO
Uma empresa de telecomunicações brasileira deseja classificar os clientes que participam do
seu programa de relacionamento a fim de identificar o grupo de clientes mais atrativo para
suas campanhas de incentivo e publicidade.
Dado que um programa de relacionamento trabalha com uma verba limitada e, precisa gastar
o mínimo possível para não onerar o programa, é muito importante saber quais clientes
deverão ser foco de suas ações de modo a gerar um benefício para a empresa, tais como:
redução do churn (% de cancelamentos de linhas), manutenção do market share (fatia do
mercado) e valorização da marca. E, ainda, proporcionar a satisfação dos clientes.
Antes de mostrar como foi aplicado o método DRSA para realizar a segmentação dos clientes,
vamos entender como funciona o programa de relacionamento dessa empresa.
Quando o programa de relacionamento foi construído definiu-se que somente os clientes da
empresa que possuíam uma linha de telefonia móvel pós-paga ou um cartão de crédito dessa
28
empresa seriam elegíveis a participar do programa de relacionamento, porque eram produtos
novos que ainda estavam se fortalecendo no mercado.
Além disso, foi definido que todo o gasto em Reais desse cliente com serviços de
telecomunicações da empresa seria convertido em pontos, que poderiam ser usados no futuro
para o resgate de recompensas. Logo, apesar de somente ter uma parcela de clientes elegíveis
ao programa, a empresa possibilitou que todo o gasto em Reais com outros serviços da
empresa, tais como: Fixo e TV, por exemplo, fosse convertido em pontos, o que geraria um
acúmulo maior de pontos e, ainda, incentivaria os clientes a adquirirem outros produtos da
empresa a fim de acumular um volume maior de pontos para resgatar os prêmios disponíveis.
Hoje, o programa de relacionamento conta com diversos prêmios, tais como: aparelhos
celulares, tablets, bônus de SMS ou descontos em pacotes de dados 3G, ingressos para
espetáculos de teatro e shows, passagens aéreas, entre outros. Para adquirir esses prêmios o
cliente precisa acessar a página web da empresa e solicitar o resgate de pontos.
Esses prêmios, quando resgatados, geram uma despesa para a empresa que varia de acordo
com o prêmio. Além disso, há prêmios que possibilitam a fidelização dos clientes com a
empresa, isto é, os clientes ficam fidelizados a empresa por um ano, onde em caso do cliente
solicitar o cancelamento do serviço móvel, por exemplo, o cliente só o poderá fazer após
pagar uma multa proporcional ao valor do prêmio resgatado.
Dado que o universo de clientes dessa empresa de telecomunicações varia na grandeza de
milhões de clientes e que se deseja manter os clientes fiéis à empresa, seja por meio da
fidelização ou mesmo pela satisfação do cliente com o programa de recompensa, a empresa
precisa realizar uma comunicação direcionada sobre o programa para seus clientes, sem
29
causar um resgate em massa, pois é necessário manter o programa de relacionamento
funcionando de forma financeiramente saudável para a empresa.
Pensando nisso, a empresa alvo desse estudo precisa segmentar os clientes que participam de
seu programa de relacionamento, de modo a identificar os clientes que serão alvos da sua ação
de comunicação de incentivo ao resgate do próximo ano.
Diversas metodologias podem ser aplicadas para segmentar os clientes, tais como: a análise
de cluster, a regressão linear multivariada, etc. Contundo nesse trabalho, optou-se por utilizar
uma metodologia multicritério de apoio à decisão, conhecida como DRSA, utilizada em
diversas áreas do conhecimento, como pode ser visto em Greco, Matarazzo & Slowinski
(2006, 2012).
Esse método foi escolhido porque ele permite classificar objetos, nesse caso clientes, com
base em diferentes critérios, que podem ser quantitativos ou qualitativos, e que no fim
permitem gerar regras de classificação com base nesses critérios escolhidos. Além disso, leva
em consideração a opinião do tomador de decisão, o que não acontece na aplicação dos
métodos tradicionais.
O DRSA pode ser aplicado em grandes bancos de dados, mas a fim de simplificar o estudo,
optou-se em trabalhar com uma amostra de dez mil clientes do estado do Rio de Janeiro que
participam do programa de relacionamento dessa empresa de telecomunicações. Lembrando
que esse método pode ser aplicado em toda a base de clientes.
Essa amostra de clientes foi gerada de forma aleatória com base no CPF do cliente cadastrado
no programa de relacionamento e cujo endereço de correspondência estava com o CEP
30
associado ao estado do Rio de Janeiro. A partir do CPF do cliente, capturaram-se as demais
informações que compõem o BD (banco de dados) desse estudo. Mais adiante será
apresentada uma exemplificação do BD usado nesse estudo.
As principais questões a serem respondidas no estudo são as seguintes:
Quais os principais grupos de clientes, de acordo com a propensão de resgate que
deverão ser incentivados nas ações dessa empresa de telecomunicações?
Quais são os conjuntos mínimos de regras de decisão que permitem uma segmentação
de clientes de forma eficiente?
Quais são os redutos de critérios que garantem a mesma qualidade de aproximação da
classificação multicritério como todo o conjunto de critérios?
As informações contidas no banco de dados usado são consistentes?
Na aplicação do DRSA é necessário que seja identificado o(s) critério(s) sob os quais serão
gerados a classificação dos clientes. Nesse estudo, a escolha dos critérios foi realizada com
base na experiência de especialistas que fazem a gestão do programa de relacionamento e com
base nas informações fornecidas pelos seus gerentes. Os critérios estão descritos na tabela 3,
onde os cinco primeiros são variáveis contínuas e os demais são variáveis ordinais.
Variável
do BD Critério Descrição do Critério
A1 Saldo de Pontos do
Cliente
Volume de pontos acumulados pelo cliente e que
pode ser utilizado no processo de resgate da
recompensa.
A2 Média de Crédito de Média de pontos creditados no saldo do cliente nos
31
pontos dos últimos três
meses
últimos três meses.
A3 Gasto Médio dos últimos
três meses com serviços
de Telecom
Gasto Médio em Reais do cliente com a empresa nos
últimos três meses, que é a base para a conversão dos
pontos.
A4 Total de Pontos
Expirados do Programa
Total de pontos expirados do cliente desde o início do
programa.
A5 Total de Pontos
Expirados/ Total de
Pontos Creditados
Razão entre o total de pontos expirados do cliente em
relação ao total de pontos acumulados desde o início
do programa.
A6 Participação do Cliente
no Programa
Classificação usada pela empresa para identificar os
clientes que acessaram a página do programa de
relacionamento no site da empresa e, aceitaram o
regulamento do programa de relacionamento. Logo,
se A6=0 significa que o cliente ainda não aceitou o
regulamento do programa, se A6=1 significa que
cliente aceitou o regulamento do programa.
A7 Origem do cliente no
Programa
Produto pelo o qual o cliente iniciou sua participação
no programa. Se a origem no programa foi através da
aquisição de um cartão de crédito, A7=0. Se cliente
entrou no programa a partir da aquisição de um
móvel, A7=1.
A8 Idade do Cliente no
Programa
Tempo de participação do cliente no programa, isto é,
se cliente tem: até 6 meses no programa (A8=1), de 7
a 12 meses (A8=2), de 1 a 2 anos (A8=3) e acima de
2 anos (A8=4).
A9 Indicador de Resgate no
Programa
Identifica se cliente já realizou algum resgate no
programa (A9=1), em caso negativo, A9=0.
A10 Indicador de Cliente
Fidelizado
Identifica se cliente está com alguma fidelização com
a empresa (A10=1), em caso negativo, A10=0.
Tabela 3 – Descrição dos Critérios Usados no Estudo
32
A seguir, os dez critérios foram classificados com base na sua preferência de valor, onde (↑)
significa preferência crescente com o valor e (↓) significa preferência diminuindo com valor.
Essa classificação servirá para identificar a preferência de cada um dos critérios que será
colocada na aplicação do software usado para gerar o método.
• Saldo de Pontos do Cliente (A1): (↑), pois quanto maior o volume de pontos, maior a chance
de o cliente poder realizar um resgate.
• Média de Crédito de pontos dos últimos três meses (A2): (↑), pois quanto maior o volume de
crédito, maior a probabilidade de o cliente poder realizar um resgate.
• Gasto Médio dos últimos três meses com serviços de Telecom (A3): (↑), pois quanto maior
o gasto, maior o acúmulo de pontos e a chance de poder realizar um resgate.
• Total de Pontos Expirados do Programa (A4): (↓), pois quanto maior o volume de pontos
expirados, menor a chance de resgate do cliente, uma vez que o mesmo não percebe valor no
programa.
• Total de Pontos Expirados/ Total de Pontos Creditados (A5): (↓), pois quanto maior a razão,
menor a chance de resgate do cliente, uma vez que o mesmo não percebe valor no programa.
• Participação do Cliente no Programa (A6): (↑), pois se A6=0, cliente ainda não aceitou o
regulamento do programa. Se A6=1 significa que cliente aceitou o regulamento do programa.
• Origem de Entrada do cliente no Programa (A7): (↑), pois se A7=0 significa que cliente deu
entrada no programa por meio da aquisição de um cartão de crédito. Se A7=1 significa que o
cliente deu entrada no programa a partir da aquisição de um móvel.
• Idade do Cliente no Programa (A8): (↑), pois quanto maior o tempo de participação do
cliente no programa, maior a chance de acúmulo de pontos e realização de resgate. Logo, se
cliente tem até 6 meses no programa considera-se como muito novo (A8=1), de 7 a 12 meses
considera-se novo (A8=2), de 1 a 2 anos, antigo (A8=3) e acima de 2 anos, muito antigo
(A8=4).
33
• Indicação de Resgate no Programa (A9): (↓), pois embora a chance de resgate novamente
desse cliente seja maior, o foco da empresa nesse cliente é menor.
• Indicador de Cliente Fidelizado (A10): (↓), pois se cliente fidelizado (A10=1), o foco da
empresa nesse cliente é menor.
Além da determinação dos critérios, o método DRSA também sugere a determinação de uma
variável de decisão, que também pode ser simulada pelo modelo a partir das regras de decisão
que são geradas. Durante a aplicação do método, os especialistas sentiram necessidade de
determinar duas variáveis de decisão (V1 e V2).
A variável de decisão (V1) teve como premissa a metodologia utilizada por esses especialistas
na determinação de quais clientes serão alvos de suas comunicações. Onde, de acordo com o
saldo de pontos, os clientes são separados segundo a pontuação mínima exigida no resgate de
prêmio incentivado, de forma a obter quatro classes:
• V1 = ALTA (A) que corresponde ao cliente principal da ação de incentivo, que por ter saldo
de pontos mais elevado, é classificado com chance "Alta" de propensão a resgate.
• V1 = MEDIA (M) que corresponde ao segundo grupo da ação de incentivo, que por ter saldo
de pontos mediano, é classificado com “Média” chance de propensão a resgate.
• V1 = BAIXA (B) que corresponde ao grupo da ação de incentivo menos incentivado por ter
o menor saldo de pontos e consequentemente uma “Baixa" propensão a resgate.
• V1 = INEXISTENTE (I) que corresponde ao grupo de clientes com saldo insuficiente para
realizar qualquer tipo de resgate, logo é classificado como tendo propensão a resgate “Nula”
ou “Inexistente”.
34
Dessa forma, os subconjuntos de V1 foram denotados por um conjunto de classes Cl = {ClA ,
ClM, ClB, ClI} , onde: a classe ClA é melhor do que a ClM que é melhor que ClB que é melhor
que ClI.
Na tabela 4, foi apresentado o layout do banco de dados e de suas informações, descritas na
tabela 3, para os primeiros trinta clientes usados na aplicação do método.
Tabela 4 – Matriz de Dados (30 primeiros clientes da amostra de 10 mil clientes).
Além da variável de decisão V1, os especialistas optaram por criar uma variável de decisão
V2, seguindo a mesma nomenclatura usada em V1 (V2=ALTA (A); V2=MEDIA (M);
V2=BAIXA (B); V2=INEXISTENTE (I)), a partir da quantidade de eventos positivos ao
CLIENTE A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 V1 C00001 5251 152 456 738 12 0 1 4 0 0 ALTA C00002 1340,5 67 202 1104 24 1 1 4 1 1 ALTA C00003 161 31 93 0 0 0 0 1 0 0 INEXISTENTE C00004 2894,5 85 254 3146 51 1 1 4 0 0 BAIXA C00005 7326 199 596 3276 32 0 1 4 0 0 ALTA C00006 1875 54 161 943 34 0 1 4 0 0 BAIXA C00007 2243,5 133 397 0 0 1 1 3 1 1 MEDIA C00008 4612,5 191 571 0 0 1 1 4 1 0 ALTA C00009 2092,5 203 625 0 0 0 1 1 0 0 MEDIA C00010 669 128 384 0 0 0 1 1 0 0 ALTA C00011 11518 295 784 4696 28 1 1 4 0 0 ALTA C00012 1683,5 163 497 0 0 0 1 1 0 0 ALTA C00013 1123 105 315 0 0 0 1 1 0 0 ALTA C00014 627 153 459 0 0 0 1 4 0 0 ALTA C00015 6979,5 111 331 266 3 1 1 4 1 1 ALTA C00016 5140 189 564 1336 7 0 1 4 1 0 ALTA C00017 15794 427 1180 4210 19 1 1 4 1 0 ALTA C00018 1070 63 209 0 0 0 1 1 0 0 BAIXA C00019 421 46 205 0 0 0 1 1 0 0 INEXISTENTE C00020 5479 132 394 2832 33 1 1 4 0 0 ALTA C00021 1539 51 154 0 0 1 1 3 0 0 BAIXA C00022 4492 141 423 0 0 1 1 3 0 0 MEDIA C00023 1579 113 356 0 0 0 1 1 0 0 ALTA C00024 383 48 144 0 0 0 1 1 0 0 INEXISTENTE C00025 3817 96 287 3381 47 0 1 4 0 0 MEDIA C00026 0 0 0 0 0 0 1 3 0 0 INEXISTENTE C00027 8415 322 965 0 0 1 1 4 1 0 ALTA C00028 1663 145 434 0 0 0 1 1 0 0 ALTA C00029 564,5 40 119 0 0 0 1 1 0 0 INEXISTENTE C00030 5438 145 437 2186 30 1 1 4 0 0 ALTA
35
resgate. Para determinar os eventos positivos, levou-se em consideração uma série de fatores:
se cliente tem saldo de pontos diferente de zero, se cliente tem possibilidade de acúmulo de
pontos com maior velocidade, se cliente está fidelizado, se cliente não teve pontos expirados e
se cliente realizou algum resgate. Dessa forma, os clientes com o maior número de eventos
positivos ao resgate foram classificados como V2=ALTA, clientes com nenhum evento
positivo foram classificados como V2=INEXISTENTE, clientes com poucos eventos foram
classificados como V2=BAIXA e os demais como V2=MEDIA.
O método DRSA foi aplicado na amostra de dez mil clientes do Rio de Janeiro para classificá-
los segundo os critérios propostos e, determinar os clientes que serão o foco da empresa nas
ações do próximo ano.
A aplicação do DRSA foi realizada por duas perspectivas diferentes com relação ao atributo
de decisão e para aplicá-lo foi usado o programa jMAF (Blaszczynski et al.,2011). Os
resultados serão demonstrados na sequência.
A fim de facilitar o entendimento, vamos adotar:
Modelo 1 é aquele gerado com base na variável de decisão V1 e,
Modelo 2 é aquele gerado com base na variável de decisão V2.
O primeiro resultado do DRSA para o modelo 1 indicou que a qualidade para todas as
aproximações superiores e inferiores da união das classes foi igual a 1, o que indica
consistência nos dados, o que pode ser observado na figura 1. Já no modelo 2, observou-se
que a matriz de dados dessa amostra de dez mil clientes não é consistente para todos os
conjuntos aproximativos do critério de decisão V2, pois nem todas as aproximações inferiores
36
e superiores das classes , , , , , apresentaram a qualidade da
aproximação igual a 1, conforme mostra a figura 2.
Figura 1- Imagem Gerada no Software JMAF com os valores da qualidade da aproximação e da
quantidade de clientes dentro de cada aproximação superior e inferior das classes e a região de fronteira
para o modelo 1.
37
Figura 2 - Imagem Gerada no Software JMAF com os valores da qualidade da aproximação e da
quantidade de clientes dentro de cada aproximação superior e inferior das classes e a região de fronteira
para o modelo 2.
O segundo resultado do modelo 1 gerou um reduto com um único critério, saldo do cliente,
que foi alocado no núcleo. Logo, somente o saldo do cliente foi o atributo considerado como
indispensável, o mais importante. Em contrapartida, no modelo 2 não tivemos redutos
gerados, isto é, todas as variáveis foram consideradas indispensáveis ao modelo e foram
alocadas no núcleo. As figuras 3 e 4 mostram as saídas do programa para os modelos 1 e 2,
respectivamente.
38
Figura 3 - Imagem Gerada no Software JMAF com os redutos e núcleo do modelo 1.
Figura 4 - Imagem Gerada no Software JMAF com os redutos e núcleo do modelo 2.
O terceiro resultado do modelo, indicou volume de regras de decisão muito distintos entre o
modelo 1 e o modelo 2 descrevendo , , , , e . A tabela 5 apresenta
um comparativo entre o volume de regras geradas em cada modelo.
Tabela 5 – Comparativo entre o volume de regras geradas por Modelo.
Modelo 1 Modelo 2
1 8
1 46
1 21
1 76
1 59
1 19
Total 6 229
39
O modelo 1 só teve uma regra de decisão para determinar o segmento de clientes principal
(V1=ALTA) para o qual a empresa de telecomunicações deveria dar foco em suas
comunicações, dada pela regra:
1) se f(x, A1)>= 5000.5, então x ϵ .
Já para o modelo 2 foram geradas 19 regras de decisão para esse mesmo segmento
(V2=ALTA), mas pode-se observar que três critérios não entraram nas regras geradas para
esse segmento, os critérios A7, A9 e A10. Abaixo, estão as regras geradas para esse
segmento:
1) se f(x, A2)>=381, então x ϵ .
2) se f(x, A2)>=300,17 e f(x, A3)>=599,21, então x ϵ .
3) se f(x, A1)>=8474 e f(x, A2)>=27 e f(x, A8)>=4, então x ϵ .
4) se f(x, A2)>=298,17 e f(x, A3)>=1033,86, então x ϵ .
5) se f(x, A1)>=5469,5 e f(x, A3)>=146,97 e f(x, A4)<=1801, então x ϵ .
6) se f(x, A1)>=5469,5 e f(x, A5)<=31,63 e f(x, A8)>=4 , então x ϵ .
7) se f(x, A1)>=7821,5 e f(x, A3)>=116,85 e f(x, A8)>=4 , então x ϵ .
8) se f(x, A1)>=5306,5 e f(x, A3)>=405,63 e f(x, A5)<=5,26 , então x ϵ .
9) se f(x, A2)>=241,17 e f(x, A3)>=1068,81 e f(x, A6)>=1 , então x ϵ .
10) se f(x, A1)>=5000,5 e f(x, A2)>=209, então x ϵ .
11) se f(x, A1)>=5003,5 e f(x, A2)>=159,83 e f(x, A6)>=1, então x ϵ .
12) se f(x, A1)>=5003,5 e f(x, A3)>=195,58 e f(x, A8)>=4, então x ϵ .
13) se f(x, A1)>=5023,5 e f(x, A3)>=233,63 e f(x, A5)<=4,86, então x ϵ .
14) se f(x, A1)>=5204 e f(x, A5)<=23,02 e f(x, A6)>=1, então x ϵ .
40
15) se f(x, A1)>=4989 e f(x, A3)>=412,12 e f(x, A8)>=4, então x ϵ .
16) se f(x, A1)>=4969 e f(x, A4)<=1335,5 e f(x, A8)>=4, então x ϵ .
17) se f(x, A1)>=4456 e f(x, A2)>=26,67 e f(x, A4)<=283,5 e f(x, A8)>=4, então x ϵ .
18) se f(x, A3)>=181,36 e f(x, A5)<=24,37 e f(x, A8)>=4, então x ϵ .
19) se f(x, A3)>=197,75 e f(x, A5)<=24,94 e f(x, A8)>=4, então x ϵ .
No apêndice B, encontram-se todas as regras geradas para o modelo 1 e 2 nas figuras 5 a 13.
O quarto resultado retirado do DRSA foi a reclassificação dos objetos utilizando as regras
geradas pelos modelos. No modelo 2, tivemos 8,47% de classificações incorretas e 2,41% não
classificados. Quando se observa a classe (ClA) que seria o segmento foco da ação da
empresa, observamos que 83% desse grupo foi classificado de forma correta. Já no modelo 1,
vimos que 100% das classificações foram corretas, muito embora os resultados possam
indicar dependência entre o atributo de decisão V1 e o critério saldo do cliente que é usado na
regra de classificação. Nas figuras 14 a 17 do apêndice B, observamos essas informações.
Se a empresa considerasse a precisão de classificação de 89% dos clientes adequada, uma vez
que a maioria dos modelos estatísticos trabalham com precisões em torno de 50%,
poderíamos adotar o modelo 2 como sendo o mais adequado para se trabalhar, podendo ser
replicado para toda a base de clientes do Rio de Janeiro a partir das regras de decisão geradas
no modelo, que permitiriam classificar toda a base de dados.
Como os clientes do Rio de Janeiro podem ter perfis diferentes em relação aos clientes dos
demais estados, não podemos aplicar as regras do Rio de Janeiro para os demais estados.
Logo, para os demais estados brasileiros temos que rodar novamente o modelo usando como
base de dados uma amostra aleatória destes estados.
41
Caso a empresa desejasse obter uma classificação para todos os clientes, pode-se adotar uma
variação do método DRSA, o VCDRSA (Variable Consistency Dominance-based Rough Set
Approach) usado por Blazczynski et al. (2007) e Greco et al. (2000b), que propõe um
relaxamento na consistência da aproximação inferior dos objetos utilizando a adoção de
aproximações inferiores dos objetos suficientemente consistentes, e, não apenas consistentes
como ocorre no DRSA. A partir de diferentes medidas de consistência que permitem uma
maior flexibilização na classificação dos dados.
42
6 CONCLUSÃO
Classificação multicritério pelo método DRSA difere das abordagens tradicionais de
classificação, uma vez que envolve ordens de preferência em domínios dos atributos e do
conjunto de classes. Isto faz com que deficiências no banco de dados sejam reparadas pelo
método, aplicando o princípio de dominância.
Nesse estudo o método multicritério de apoio a decisão DRSA foi aplicado com o objetivo de
segmentar uma amostra de dez mil clientes do Rio de Janeiro de um programa de
relacionamento de uma empresa de telecomunicações. E, ainda, identificar o principal grupo
de clientes que deveria ser incentivado nas ações de comunicação de incentivo a resgate dessa
empresa.
Na aplicação do DRSA, observou-se que o mesmo é sensível quanto à opinião de diferentes
decisores em relação a melhor forma de realizar a segmentação dos clientes do programa de
relacionamento, ou melhor, na determinação do atributo de decisão e critérios usados.
No modelo 1, o qual considera o atributo de decisão V1 construído a partir da variável saldo
de pontos do clientes, viu-se que o modelo apresentou ótima qualidade de aproximações das
classes, o que pode estar diretamente relacionado à dependência entre o atributo de decisão e
o atributo saldo do cliente, que foi a única variável presente no reduto e a única que aparece
nas regras de decisão geradas. Quanto à determinação do grupo principal da ação de
comunicação da empresa, uma única regra de classificação foi gerada, que considera somente
os clientes com saldo de pontos acima de 5.000,5 pontos como alvo da empresa, que
corresponde a 2.511 clientes da amostra de dez mil clientes.
43
No segundo modelo tem-se uma qualidade de aproximação em torno de 70%, cuja estatística
é razoável ao lidar com grandes bases de dados. E, apesar do grande volume de regras de
classificação (229) geradas, esse resultado demonstra maior estratificação dos objetos frente
aos atributos analisados. Em relação à determinação do grupo principal, que deverá ser o foco
das ações de comunicação de incentivo ao resgate do programa de relacionamento da
empresa, o modelo 2 gerou 19 regras de classificação que contemplou basicamente todos os
critérios escolhidos com uma precisão de 83% na classificação dos clientes desse grupo,
levando a classificação de 4.930 clientes nesse grupo.
Pensando na melhor estratificação dos dados, o modelo 2 conseguiu atingir esse objetivo e
determinar: o conjunto de regras de classificação dos clientes do Rio de Janeiro do programa
de relacionamento dessa empresa estudada e o grupo de clientes de interesse da empresa, que
serão alvo das ações de comunicação do próximo ano. A partir dessas regras, a empresa
poderá classificar todos os clientes do Rio de Janeiro.
7 RECOMENDAÇÃO DE ESTUDOS FUTUROS
Para estudos futuros pode-se aplicar o método DRSA para segmentar os clientes dos demais
estados do programa de relacionamento dessa empresa e comparar os resultados obtidos.
Além disso, pode-se aplicar ao conjunto de dados analisado outro método de classificação
multicritério e avaliar se os resultados encontrados são muito diferentes. Entre os métodos já
usados na atualidade, o método VCDRSA seria uma boa opção, pois ele permite a obtenção
de uma classificação para a totalidade dos dados analisados, pois ele flexibiliza a aproximação
44
inferior dos objetos dentro das classes gerando uma classificação dos clientes com
aproximações suficientemente consistentes.
Pode-se também aplicar as técnicas estatísticas conhecidas para realizar segmentação de
clientes, tais como: regressão multivariada, análise de cluster, entre outras; e comparar com os
resultados obtidos nesse estudo.
Outro estudo interessante seria adotar a Regressão Ordinal Robusta, descrita no livro de
Ehrgott, Figueira & Greco (2010), em conjunto com o DRSA, aplicada em alguns estudos a
fim de reduzir os atributos, uma vez que trabalha com funções de utilidade e preferências
fracas. Esse estudo possibilitaria o uso de relações de preferência que consideraria as
informações dos tomadores de decisão que não podem ser capturadas em uma análise de
regressão que só leva em consideração a informação dos clientes presentes no banco de dados.
A metodologia do DRSA aplicada nesse estudo também pode ser utilizada pela empresa de
telecomunicações em outros setores da empresa, podendo ser aplicada na segmentação dos
clientes dos demais produtos da empresa, tais como: fixo, banda larga e etc.
Outro estudo que se pode realizar seria a aplicação de um método de apoio à decisão
multicritério para priorizar o portfólio de prêmios do programa de relacionamento frente a
cada segmento definido no modelo DRSA minimizando o custo do programa.
45
REFERÊNCIAS BIBLIOGRÁFICAS
ALVES, M., CARMO,E.R. "Segmentação de mercado com base no consumidor
segmentação demográfica”. Disponível em: < http://www.unioeste.br/campi/cascavel/ccsa/
IISeminario/trabalhos/Segmenta%C3%A7%C3%A3o%20de%20mercado%20com%20base%
20no%20consumidor.pdf>. Acesso em 5 mai. 2012
ALBUQUERQUE, T. Marketing de Relacionamento Dirigido.
Disponível em: <http://www.mktdireto.com.br/mrd.html>. Acesso em 8 mai. 2012.
BANA E COSTA, C.A., FERREIRA, J.A.A., CORREA, E.C. Metodologia multicritério de
apoio a avaliação de propostas em concursos públicos. In: ANTUNES,C.H.; TAVARES,
L.V. (Eds) Casos de Aplicação da Investigação Operacional, Amadora:bMcGraw Hill, 2000.
BANA E COSTA, C.A.; VANSNICK, J.C. Uma Nova Abordagem ao Problema da
Construção de uma Função de Valor Cardinal: MACBETH. Investigação Operacional,
Vol.15, p.15-35, 1995.
_______. Thoughts on a Theoretical Framework for Measuring Attractiveness by
Categorical Based Evaluation Technique (MACBETH). In: CLÍMACO, J.C.N. (Org).
Multicriteria Analysis. Berlim: springer-Verlag, 1997.
BLASZCZYNSKI, J.; GRECO, S.; MATARAZZO, B.; SLOWINSKI, R.; SZELAG, M.
JMAF – Dominance-based Rough Set Data Analysis Framework. Disponível em:
<http://www.cs.put.poznan.pl/jblaszczynski/Site/jRS.html>, Nov 10, 2011.
BLASZCZYNSKI, J.; GRECO, S.; SLOWINSKI, R. Multicriteria Classification – a New
Scheme for Application of Dominance-based Decision Rules. European Journal of
Operational Research, Vol.3, p.1030-1044, 2007.
BRANS,J.P.; MARESCHAL,B.; VINCKE,P.H. PROMETHEE: A New Family of
Outracking Methods in MCDM. IFORS, No.84, p.477-490, 1984.
CHURCHILL,G.A., PETER,J.J.P. Marketing: Criando Valor Para os Clientes. 2. ed.
São Paulo: Saraiva, 2000.
CLÍMACO, J.; CRAVEIRINHA,J. Multicriteria Analysis in Telecommunication Network
Planning and Design – Problems and Issues. In: FIGUEIRA,J.; GRECO,S.; EHRGOTT,M.
Multiple Criteria Decision Analysis: State of the Art Surveys. Boston: Springer Science,
2005.
COUGHLAN, A.T.; SOBERMAN, D.A. Strategic Segmentation Using Outlet Malls.
International Jounal of Research in Marketing, v.22, p.61-86, 2005.
COUTO, A.B.G. ; GOMES, L.F.A.M. A Tomada de Decisão em Recursos Humanos com
Dados Replicados e Inconsistentes: Uma Aplicação da Teoria dos Conjuntos
Aproximativos. Pesquisa Operacional, v.30, n.3, p.657-686, 2010.
46
DIAS,L.M.C., ALMEIDA,L.M.A.T., CLÍMACO,J.C.N. Apoio Multicritério à Decisão.
Coimbra: Universidade de Economia – Universidade de Coimbra, 1996.
EHRGOTT, M., FIGUEIRA,J.R., GRECO,S. Trends in Multiple Criteria Decision.
Vol.142, New York: Springer, 2010.
FERREIRA, F.H.G. “Segmentação de Mercado” . Biblioteca Temática do
Empreendedor – Sebrae. Disponível em: <http://www.bte.com.br >. Acesso em 5 mai.
2012.
FERREIRA,A.C.S.; GOMES, L.F.A.M. The Multicriteria ABC Analysis – An
Application of Rough Set Theory, Foundations of Computing and Decision Sciences,
Vol.20, N.3, 1995.
GOMES, L.F.A.M.; GOMES, C.F.S. Uma Técnica de Data Mining: Princípios Básicos dos
Conjuntos Aproximativos e suas Aplicações. Revista ANGRAD, Vol.2, p.13-22, 2001.
______. Tomada de Decisão Gerencial: Enfoque Multicritério. São Paulo: Atlas, 2012.
GOMES, L.F.A.M.; RANGEL, L.A.D. An Application of the TODIM Method to the
Multicriteria Rental Evaluation of Residential Properties. European Journal of
Operational Research, Poznan, Vol.193, n.2, p.204-211, 2009.
GRANAT, J. Mutlicriteria Analysis for Behavioral Segmentation. Journal of
Telecommunications and Information Technology, Vol.3, p.1-5, 2004.
GRECO, S.; MATARAZZO, B.; SLOWINSKI, R. A New Rough Set Approach to
Evaluation of Bankruptcy risk. In: ZOPOUNDINIS C. (Ed.), Operational Tools in the
Management of Financial Risk. Kluwer, Dordrecht, pp. 121-136, 1998a.
_______. Rough Approximation of a Preference Relation by Dominance Relations.
European J. Operational Research, Vol.117: p.63-83, 1999a.
_______. The Use of Rough Sets and Fuzzy Sets in MCDM. In: Gal T, Stewart t, Hanne T.
(EDS.) Advances in Multiple Criteria Decision Making. Kluwer, Dordrecht, pp.14.1 – 14.59,
1999b.
_______. Decision Rule Approach. In: Multiple criteria decision analysis state of the art
surveys [edited by J. Figueira, S. Greco and M. Ehrgott]. Springer Science, New York -
Business media, cap. 13, p. 507-561, 2005.
47
_______. Dominance-Based Rough Set Approach to Decision Involving Multiple
Decision Makers. In: Greco S., Hata Y., Hirano s., Inuiguchi M., Miyamoto S., Nguyen H.S.
& Slowinski R. (Eds.), Rough Sets and Current Trends In Computing (RSCTC 2006).
Springer LNCs 4259, Berlin, p. 306-317, 2006.
GRECO, S.; MATARAZZO, B.; SLOWINSKI, R.; STEFANOWSKI, J. An algorithm for
Induction of Decision Rules Consistent with the Dominance Principle. Proc. RSTC’2000
Conference, Banff (to appear), 2000b.
GRZYMALA-BUSSE, J.W. LERS – A System for Learning from Examples Based on
Rough Sets, In Slowinski, R., (ed.), Intelligent Decision Support. Handbook of Applications
and Advances of the Rough Sets Theory, Kluwer, Dordrecht, p.3-18, 1992.
KEENEY, R. & H. RAIFFA. Decision with Multiple Objectives: Preferences and Value
Tradeoffs. New York: Wiley, 1976. Reprinted in 1993 by Cambridge University Press.
KOTLER, P.; ARMSTRONG, G. Princípios de Marketing. Rio de Janeiro: Prentice-Hall do
Brasil, 1998.
KOTLER, P. Administração de Marketing: Análise, planejamento, Implementação e
Controle. 5ª ed. São Paulo: Atlas, 1998.
MALCZEWSKI, J. GIS and multicriteria decision analysis. New York: John Wiley, 1999.
MARTINS, A.E.C. Segmentação do Consumidor de Marcas Próprias – Caso Português ,
Instituto Politécnico de Lisboa, Lisboa, 2011. Disponível em: < http://repositorio
.ipl.pt/bitstream/10400.21/1051/1/Tese_mestrado.pdf >. Acesso em 4 fev. 2013.
MELO, B. “Philip Kotler fala sobre inovação, fidelidade, segmentação, sustentabilidade e
customização.” Mundo do Marketing, São Paulo, Jul.2007. Disponível em:
<http://mundodomarketing.com.br/entrevistas/1780/philip-kotler-fala-sobre-inovacao-
fidelidade-segmentacao-sustentabilidade-e-customizacao.html >. Acesso em 5 mai. 2012.
OLIVEIRA,V.F.; CAVENAGHI,V.; MÁSCULO,F.S.; SANT’ANNA,A.; COLOMBO,C.R.;
LACERDA,D.P.; NETO,J.A.; SOUZA, S.D.C.; CARVALHO,M.M. Tópicos Emergentes e
Desafios Metodológicos em Engenharia de Produção: Casos, Experiências e Proposições, Vol.5. Rio de Janeiro: ABEPRO, 2012.
PATRICIO, C.M.; PINTO, J.O.P.; SOUZA, C.C. Rough Sets – Técnica de Redução de
Atributos e Geração de Regras para Classificação de Dados. Anais do XXVIII CNMAC,
p.9-15. São Paulo, 2005.
PAWLAK, Z. Rough sets. International Journal of Information and Computer Sciences, Vol.
11, No. 5, p.341-356, 1982.
48
______. Rough sets. Theoretical Aspects of Reasoning About Data. Dordrecht, Kluwer,
1991.
______. Rough sets and decision analysis. Information Systems & Operational Research,
Vol. 38, No. 3, p.132-144, 2000.
PAWLAK, Z.; GRZYMALA-BUSSE, J.; SLOWINSKI,R.; ZIARKO,W. Rough Sets,
Communications of the ACM, Vol.38, N.11,1995.
PAWLAK, Z.; SKOWRON, A. Rudiments of Rough Sets, Information Sciencies, Vol.77, p.
3-27, 2007.
PAWLAK, Z.; SLOWINSKI, R. Rough Set Approach to Multi-Attribute Decision
Analysis. European Journal of Operational Research, Invited Review, Vol.72, p.443-459,
1994.
ROY, B.; BOUYSSOU, D. Aide Multicritère à la Décision: Méthodes et Cas. Economica,
Paris, 1993.
SAATY, T.L. The Analytic Hierarchy Process. Nova York: McGraw-Hill, 1980.
SIMPSON P.M., Marketing as melhores práticas. Porto Alegre: Bookman, 2001.
SLOWINSKI, R.; GRECO, S.; MATARAZZO, B. Rough Set and Rule-Based
Multicriteria Decision Aiding. SOBRAPO, Pesquisa Operacional, Vol. 32, No. 2, p.213-
269, 2012.
YAO,Y.; ZHAO,Y. Conflict Analysis Based on Discernibility and Indiscernibility.
Proceedings of IEEE Symposium on Foundations of Computational Intelligence, p.302-307,
2007.
ZIARKO, W. Analysis of uncertain information in the framework of variable precision
rough sets. Foundations of Computing and Decision Sciences, Vol.18 (3-4), p.381-396, 1993.
______. Variable precision rough set model. Journal of Computer and System Sciences,
46(1), p.39-59, 1993a.
49
APÊNDICE A
Na aplicação do DRSA foi utilizado o software JMAF – Dominance-based Rough Set Data
Analysis Framework (Blaszczynski et al., 2011). A seguir são apresentadas as etapas de
formatação do banco de dados usado para iniciar o estudo.
Para aplicar o JMAF o banco de dados deve estar no formato aceitável no programa. Utilizei
um editor de texto para descrever os critérios, as regras de preferência e carregar os dados.
Conforme abaixo:
**ATTRIBUTES
+A1:(continuous)
+A2:(continuous)
+A3:(continuous)
+A4:(continuous)
+A5:(continuous)
+A6:(integer)
+A7:(integer)
+A8:(integer)
+A9:(integer)
+A10:(integer)
+D:[INEXISTENTE,BAIXA,MEDIA,ALTA]
DECISION:D
**PREFERENCES
A1:GAIN
A2:GAIN
A3:GAIN
A4:COST
A5:COST
A6:GAIN
A7:GAIN
A8:GAIN
A9:COST
A10:COST
D:GAIN
**EXAMPLES
5251 152 456 738 12 0 1 4 0 0 BAIXA
1340.5 67 202 1104 24 1 1 4 1 1 MEDIA
161 31 93 0 0 0 0 1 0 0 BAIXA
2894.5 85 254 3146 51 1 1 4 0 0 MEDIA
7326 199 596 3276 32 0 1 4 0 0 BAIXA
1875 54 161 943 34 0 1 4 0 0 BAIXA
50
2243.5 133 397 0 0 1 1 3 1 1 ALTA
4612.5 191 571 0 0 1 1 4 1 0 ALTA
2092.5 203 625 0 0 0 1 1 0 0 ALTA
669 128 384 0 0 0 1 1 0 0 MEDIA
...
Após realizar as devidas configurações salvei o arquivo como amostra_2.isf para poder ser
aberto no JMAF.
APÊNDICE B
Abaixo estão as regras geradas na aplicação do DRSA para o modelo 1, figura x. Na
sequencia estão todas as regras geradas no modelo 2, figuras 5 a 13.
Figura 5 - Imagem Gerada no Software JMAF com as 6 regras de decisão para o modelo 1.
55
Figura 10 - Imagem Gerada no Software JMAF com as regras de decisão de 117 a 145 para o modelo 2.
56
Figura 11 - Imagem Gerada no Software JMAF com as regras de decisão de 146 a 174 para o modelo 2.
57
Figura 12 - Imagem Gerada no Software JMAF com as regras de decisão de 175 a 200 para o modelo 2.
58
Figura 13 - Imagem Gerada no Software JMAF com as regras de decisão de 201 a 229 para o modelo 2.
A seguir encontram-se as figuras 14 a 17 com o detalhe das reclassificações geradas para o
modelo 1 e 2.
Figura 14 - Imagem Gerada no Software JMAF com a reclassificação dos objetos segundo as regras
geradas pelo modelo 1.
59
Figura 15 - Imagem Gerada no Software JMAF com os volumes gerados na reclassificação dos objetos
segundo as regras geradas pelo modelo 1.
Figura 16 - Imagem Gerada no Software JMAF com a reclassificação dos objetos segundo as regras
geradas pelo modelo 2.
Figura 17 - Imagem Gerada no Software JMAF com os volumes gerados na reclassificação dos objetos
segundo as regras geradas pelo modelo 2.
60
ANEXO A – ALGORITMO DOMLEM
Procedure DOMLEM
(input: Lupp – a family of lower approximations of upward unions of decision classes:
{ P(Clt ≥ ), P(Cl
≥ t− 1),…, P(Cl2
≥)};output: R≥ set of D≥-decision rules);
begin
R≥:= ;
for each B∈ Lupp do
begin
E:=find_rules(B);
for each rule E ∈ E do
if E is a minimal rule then R≥ := R≥∪E;
end
end.
Function find_rules
(input: a set B; output: a set of rules E covering set B);
begin
G := B; {a set of objects from the given approximation}
E := ;
while G ≠ do
begin
E := ; {starting complex}
S := G; {set of objects currently covered by E}
while (E = ) or not ([E] ⊆ B) do
begin
best := ; {best candidate for elementary condition}
for each criterion qi ∈ P do begin
Cond:={(f(x,qi)≥rqi) : ∃ x∈ S (f(x,qi)=rqi)};
{for each positive object from S create an elementary
condition}
for each elem ∈ Cond do
if evaluate({elem}∪E) is_better_than evaluate({best}∪E) then
best:=elem;
end;{for}
E := E ∪ {best}; {add the best condition to the complex}
S := S ∩ [best];
end; {while not ([E] ⊆ B)}
for each elementary condition e ∈ E do
if [E − {e}] ⊆ B then E := E − {e};
create a rule on the basis of E;
E := E ∪ {E}; {add the induced rule}
G := B – ∪E∈E[E]; {remove examples covered by the rule}
end; {while G ≠ }
end {function}
Figura 18 - Algoritmo de DOMLEM
Fonte: Greco, Matarazzo, Slowinski & Stefanowski (2000b)