universidade federal de pernambucotg/2019-1/tg_si/tg_chnm.pdf · 2019. 7. 12. · universidade...
TRANSCRIPT
-
Universidade Federal de Pernambuco
Centro de Informática
Curso de Sistemas de Informação
Descoberta de padrões em campeonatos do League of Legends
usando algoritmos de descoberta de subgrupos
Trabalho de Conclusão de Curso de Graduação
por
Carlos Henrique do Nascimento Melo
Orientador: Prof. Leandro Maciel Almeida
Recife, Julho / 2019
-
Carlos Henrique do Nascimento Melo
Descoberta de padrões em campeonatos do League of Legends usando
algoritmos de descoberta de subgrupos
Monografia apresentada ao Curso deSistemas de Informação, como requisitoparcial para a obtenção do T́ıtulo deBacharel em Sistemas de Informação,Centro de Informática.
Orientador: Prof. Leandro Maciel Almeida
Recife
2019
-
UNIVERSIDADE FEDERAL DE PERNAMBUCO
CENTRO DE INFORMÁTICA
Carlos Henrique do Nascimento Melo Descoberta de padrões em campeonatos do League of Legends usando algoritmos
de descoberta de subgrupos
Monografia submetida ao corpo discente da Universidade Federal de Pernambuco, defendida e aprovada em ______ de __________________ de ______ . Banca Examinadora: Orientador: ________________________________________________
Leandro Maciel Almeida Examinador: _______________________________________________
Cleber Zanchettin
Recife 2019
-
Agradecimentos
Eu gostaria de agradeçer a todos vocês que me ajudaram
durante esta jornada, especialmente para:
Professores Leandro Almeida, Renato Vimieiro e Carla
Silva por toda mentoria e aconselhamento durante todos
esses anos.
Ao Professores Cleber Zanchettin por aceitar a participar
da minha banca de TCC.
A meu eterno grupo de amigos Augusto Lima, Pedro
Neto e Rafael Jordão, os Wild Cats.
A minha mãe que sempre lutou por mim, e a toda minha
famı́lia, além de Fernanda Costa que me deu motivação
de chegar até o fim.
Também ao time de E-Sport da UFRPE, o Blackbulls
Gaming, que me auxiliou na busca por um especialista
que pudesse avaliar meus resultados. E a Lucas Alves
Rodrigues que aceitou avaliar meus resultados.
Finalmente, eu gostaria de agradecer à Gil da lan house
que deu minha primeira motivação!
Obrigado a todos.
-
Qualquer tecnologia suficientemente
avançada é indistingúıvel de magia.
Arthur C. Clarke
-
RESUMO
O uso da mineração de dados pela busca de padrões caracteŕısticos não é uma novidade
em muitas áreas. No entanto, nos esportes eletrônicos uma grande quantidade de dados
é criada, mas com pouca exploração de seu uso como uma ajuda para tal competição. A
partir de estudos com técnicas de mineração de dados, é posśıvel adquirir caracteŕısticas
relevantes. Portanto, este trabalho tem como objetivo descobrir padrões nas vitórias de
jogos do campeonato de league of legends através da mineração de subgrupos, com base
nas ligas melhores colocadas nos campeonatos mundiais de 2017 e 2018. A partir dos re-
sultados, uma visualização dos subgrupos com melhor cobertura dos dados é apresentada
com uma análise das diferenças entre as regiões. Além disso, os resultados foram anali-
sados por um especialista do domı́nio dos esportes eletrônicos para apontar os subgrupos
mais interessantes para cada região e ano.
Palavras-chave: Mineração de subgrupos, Mineração de Dados, Esporte Eletrônico, Análise
de dados.
-
ABSTRACT
The use of data mining through the search for characteristic patterns is not new in many
areas. However, in electronic sports, a high amount of data is created but with a little
exploration of its use as an aid to such competition. From studies with data mining
techniques, it is possible to acquire relevant data patterns. Therefore, this work aims to
discover patterns in winning matches of the league of legends championships through the
mining of subgroups, based on the best leagues placed in the world cups of 2017 and 2018.
Based on the results, a visualization of the subgroups with better coverage of the data
is presented together with an analysis of the di↵erences between regions is performed.
Moreover, the results were analyzed by a specialist from the domain of electronic sports
to point out the most interesting subgroups for each region and year.
Keywords: Subgroup Discorvery, Data Mining, Electronic Sports, Data Analytics.
-
LISTA DE FIGURAS
Figura 1 Arena league of legends . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Figura 2 Algoritmo de seleção de subgrupos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Figura 3 Algoritmo RSS.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
Figura 4 Algoritmo DMS.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Figura 5 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, EULCS
2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Figura 6 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, EULCS
2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Figura 7 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, NALCS
2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Figura 8 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, NALCS
2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Figura 9 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, LCK
2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Figura 10 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, LCK
2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
-
LISTA DE TABELAS
Tabela 1 Cálculo participação dos jogadores em objetivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Tabela 2 Conjuntos de dados inicial - atributos e registros. . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
Tabela 3 Conjuntos de dados final - atributos e registros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Tabela 4 Custo computacional médio dos algoritmos nos conjuntos de dados em
minutos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Tabela 5 Custo computacional algoritmo x conjunto dados em minutos . . . . . . . . . . . . . 31
Tabela 6 Subgrupo com melhor cobertura EULCS - 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Tabela 7 Subgrupo - Especialista - EULCS ano 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
Tabela 8 Subgrupo com melhor cobertura EULCS - 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Tabela 9 Subgrupo - Especialista - EULCS ano 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Tabela 10 Subgrupo com melhor cobertura NALCS - 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
Tabela 11 Subgrupo - Especialista - NALCS ano 2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Tabela 12 Subgrupo com melhor cobertura NALCS - 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
Tabela 13 Subgrupo - Especialista - NALCS ano 2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Tabela 14 Subgrupos - Demonstração - NALCS ano 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Tabela 15 Subgrupo com melhor cobertura LCK - 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Tabela 16 Subgrupo - Especialista - LCK ano 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Tabela 17 Subgrupo com melhor cobertura LCK - 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Tabela 18 Subgrupo - Especialista - LCK ano 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Tabela 19 Dicionario Atributos dos Conjuntos de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
-
LISTA DE SIGLAS
lol League of Legends
UFPE Universidade Federal de Pernambuco
UTFPR Universidade Tecnológica Federal do Paraná
TUES Torneio Universitário de E-Sports
-
SUMÁRIO
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.1 Contexto e motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Organização de texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2 CONCEITOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1 Esportes Eletrônicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.1 League of Legends . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Mineração de Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.1 Algoritmo SD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1 Mineração de Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4 TRATAMENTO E IMPLEMENTAÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.1 Tratamento dos dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2.1 Regras de seleção de subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.2.2 Regras de seleção de subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3 Ferramentas e Aplicação do algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
5 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.1 Análise dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2 Campeonato Europeu League of Legendss - EULCS. . . . . . . . . . . . . . . . . . 32
5.3 Campeonato Norte-Americano de League of Legends - NA LCS . . 36
5.4 Campeonato Coreano de League of legends - LCK . . . . . . . . . . . . . . . . . . . 41
5.5 Disposições Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
6 CONCLUSÃO E TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
6.1 Dificuldades e lições aprendidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
6.2 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Appendices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
-
A DICIONÁRIO DOS DADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
-
12
1 INTRODUÇÃO
A presença de dispositivos eletrônicos para auxiliar na geração e obtenção de dados
tem-se demonstrado bastante relevante para estudos de melhora de desempenho. O surgi-
mento de um novo esporte que ocorre no meio eletrônico possibilitou a geração de dados
de mais acesśıveis. No qual, recebe o nome de esporte eletrônico ou E-sports, um esporte
que engloba torneios de jogos eletrônicos. Jogos de computadores, consoles e smartphones
deixam de ser apenas por diversão e se tornam torneios altamente competitivos. No ramo
de jogos para computador o league of legends tem recebido grande visibilidade com seus
grandes eventos de E-sports.
A geração de dados em um jogo de esporte eletrônico é realizada em tempo real,
onde cada ação realizada é salva e disponibilizada pela empresa do jogo. Muitas vezes
esses dados podem ser consultados enquanto as partidas ocorrem, para que desta forma
seja posśıvel avaliar os jogadores dentro do jogo. Assim sendo, as competições regionais e
mundiais de league of legends geram dados das caracteŕısticas das equipes nas partidas,
que são apresentadas através do site da empresa1. No mundial de league of legends (nos
anos de 2013 a 2017) um fato interessante ocorreu, uma única região dominou o cenário
por quatro anos seguidos. Ao observar isto é posśıvel ver que através do estudo dos
dados disponibilizados seria posśıvel encontrar padrões que fossem relevantes das partidas
vitoriosas em cada região.
1.1 Contexto e motivação
Utilizar dados gerados a partir de partidas em esporte eletrônicos com técnicas de
mineração de dados, pode possibilitar a geração de ferramentas que auxiliem analistas
de e-sport a melhorarem o desempenho de suas equipes, jogadores ou entenderem uma
região. Seria também posśıvel descobrir se a utilização de técnicas de esportes tradicionais,
como atletismo e esportes de alto desempenho, melhorariam a performance dos atletas
ou equipe no jogo eletrônico. Através da mineração de subgrupos (do inglês Subgroup
Discovery) é posśıvel realizar a busca de padrões em variáveis de interesse.
O estudo da mineração de dados é uma área com grande potencial de descoberta
de padrões, que podem ajudar a compreender um novo domı́nio. O e-sport é um novo es-
1Site: https://matchhistory.br.leagueoflegends.com/pt/page/landing-page
-
13
porte que gera e disponibiliza recursos necessários para a produção de estudos de padrões
na melhora de desempenho. Partindo disso, surge a possibilidade de utilizar técnicas de
mineração de dados para obter padrões de caracteŕısticas relevantes sobre times, regiões
e jogadores. Esses padrões serviriam para se obter uma clareza sobre as diferenças entre
regiões ou equipes. Com a utilização da mineração de subgrupos é posśıvel buscar por
padrões caracteŕısticos que possibilitam entender como uma única região foi tão superior
em campeonatos mundiais por cinco anos seguidos (2013 a 2017). Essa busca será reali-
zada através do algoritmo SD, junto com algoritmos de eliminação de redundâncias que
são apresentados por Gamberger e Lavrac [1], sobre conjuntos de dados de partidas de
league of legends disponibilizados pela Oracle’s Elixir 2.
1.2 Objetivo
O objetivo deste trabalho é descobrir padrões em partidas vitoriosas de campeona-
tos regionais de league of legends. No qual, será apresentado todo o custo computacional
desta descoberta e também os padrões a partir dos subgrupos com melhor cobertura
dos dados. Além disso, um especialista do domı́nio dos esportes eletrônicos analisará os
resultados e apontará os subgrupos mais interessantes para cada região e ano.
1.3 Organização de texto
Este documento é composto por seis caṕıtulos.
• Capitulo 2 - Conceitos: Apresenta as ferramentas e técnicas utilizadas por este
trabalho.
• Capitulo 3 - Trabalhos Relacionados: Apresenta em que estado esta a utilização da
técnica de mineração utilizada.
• Capitulo 4 - Tratamento e Implementação: Apresenta de qual forma os dados foram
tratados e como foi aplicado os algoritmo da mineração de subgrupos no conjunto
de dados.
• Capitulo 5 - Resultados: Apresenta os resultados da aplicação dos algoritmos da
mineração de subgrupos e a escolha dos melhores subgrupos pelo especialista.
2Site: https://oracleselixir.com/
-
14
• Capitulo 6 - Conclusão: Apresenta o que foi conclúıdo neste trabalho a partir dos
resultados obtidos.
-
15
2 CONCEITOS
Este caṕıtulo tem como objetivo apresentar os conceitos necessários sobre os dados,
área dos dados e algoritmos usados.
2.1 Esportes Eletrônicos
Esporte Eletrônico ou E-sports é uma nova modalidade de competição esportiva
que vem crescendo em muitos páıses nos últimos anos. Esse esporte engloba competições
organizadas de jogos no meio eletrônico (computadores, consoles, smartphones, etc) com
competidores que já são considerados cyber atletas. Tem ganhado grande visibilidade
com grandes competições apoiadas por empresas da área de computação, chipsets3 e as
próprias empresas desenvolvedoras dos jogos. Em alguns páıses esta modalidade já vem
sendo bastante difundida, como em regiões da América do Norte, Europa, e na Coreia do
Sul (Páıs conhecido como o berço dos E-Sport). Recentemente, o Brasil se tornou palco
de eventos de e-sports com uma grande quantidade de público, chegando a ser realizados
em estádios.
O esporte eletrônico teve seu maior crescimento a partir dos anos 2000, porém, a
primeira competição relatada de jogos eletrônicos foi em 1972 com o jogo spacewar para
estudantes da universidade de stanford na cidade dos Estados Unidos [3]. Esse crescimento
ocorreu devido à ampliação da internet, e isto possibilitou a modalidade passar de 10
campeonatos por ano para mais de 160. Além dessas mudanças também teve a mudança
nos seus formatos, que inicialmente eram torneios em lan com os competidores na mesma
rede de computadores. Deste modo, as competições além do formato tradicional em lan,
também surgiu a possibilidade de uma fase dos campeonatos onde as equipes jogavam de
suas gaming house’s4.
Dentro dos esportes eletrônicos há muitas modalidades de campeonatos como First
Person Shooter (FPS), Real-time strategy (RTS), futebol eletrônico, luta e Multiplayer
online battle arena (MOBA) que é o gênero de jogo abordado neste trabalho. MOBA é
um gênero de jogo onde jogadores batalham em uma arena em prol de um objetivo único,
que se obtido a equipe vence sua batalha.
3É um conjunto de circuitos integrados com objetivo de realizar a trocar informações entre os com-
ponentes em um computador. [2]4Residencia onde o jogadores das equipes treinam, jogam e muitas vezes moram.
-
16
2.1.1 League of Legends
Dentre os jogos do gênero MOBA no esporte eletrônico o conjunto de dados uti-
lizado neste trabalho origina-se do league of legends. Jogo que seu modo mais jogado
consiste em dois times batalhando em uma arena de três rotas (como exibido na Figura
1), buscando uma forma estratégica de alcançar o objetivo principal, destruir o nexus5 do
time adversário. O league of legends é sustentado pela empresa Riot Games e foi dispo-
nibilizado a partir de 27 de outubro de 2009. Teve em 2016 a segunda maior premiação
no valor de US$5 milhões de dólares, perdendo apenas para o Dota 26.
Figura 1: Arena league of legends
fonte: Techtudo [4]
No league of legends os principais torneios ocorrem em Summoner’s rift, mapa com
três rotas principais chamadas topo, meio e rota inferior. Onde, os jogadores são divididos
em cinco funções sendo elas top laner, um mid laner, dois na rota inferior e um selva. As
funções na rota inferior são suporte e atirador onde o suporte da utilidade e defesa para
o atirador que detém o dano da rota. Os jogadores da rota topo e meio são chamados de
solo laner’s, eles detêm o dano de suas rotas e a prinćıpio tem de obter seus recursos de
forma individual. O selva é a lane que fica responsável por executar os monstros neutros
e ajudar as outras três lanes efetuando ganks7. Abates e destruição de torres geram ouro
5Objetivo de vitória dos times, tendo na base de cada time.
6Jogo do mesmo gênero do league of legends distribuido pela empresa Valve.
7È quando um jogador de outra rota ajuda seu aliado da rota gankada a obter um abate ou objetivo
-
17
para todos que participaram e este ouro é convertido pelos jogadores como itens que
amplificam a capacidades dos personagens escolhidos. Além dos cinco jogadores tem o
Coach que é o responsável por montar as composições de personagens que será jogada,
além de ser o responsável pela estratégia inicial, dando a responsabilidade dos jogadores
de executa-la e tomar novas decisões durante o jogo.
No Brasil, atualmente grandes times de futebol criaram equipes para participarem
das competições de league of legends. O Clube do Remo em 2016 participou da liga Cir-
cuito Desafiante daquele ano8 se consagrando campeão da segunda etapa e conseguindo o
acesso ao Campeonato Brasileiro de League of legends (CBLOL). Assim como, o Clube de
Regatas do Flamengo e o Sport Club Corinthians Paulista também conseguiram acesso
para o CBLOL no ano de 2018, com as equipes Flamengo e-sport e Red Canids Corinthi-
ans. Partindo disto, é posśıvel ver a notoriedade que vem ganhando as competições de
league of legends. Em outras regiões do mundo também houveram times que criaram
equipes para as competições de league of legends como F.C. Schalke 04 da Alemanha,
Fenerbahçe Spor Kulübü da Turquia, entre outros.
No league of legends, ocorrem duas grandes competições oficiais que reúnem todas
as regiões. Uma é o Mid-Season Invitational (MSI) que ocorre na metade do ano e a outra
é o campeonato mundial, próximo ao fim do ano. Nos eventos atuais os times contam com
uma grande estrutura de organização tendo 5 jogadores para a partida, reservas, coach’s,
psicólogos entre outros. A estratégia em uma partida pode ser mudada, como aconteceu
na fase de entrada MSI de 2017 com a equipe Gigabyte Marines da região do sudeste da
ásia. O time utilizou-se da surpresa para obter suas vitórias mudando a forma como os
jogadores estavam no mapa. Desta forma eles chegaram a se classificar para a próxima
fase. Partindo deste ponto, a partir dos dados disponibilizados pelo śıtio web Oracle’s
Elixir [5] é posśıvel utiliza-los para encontra padrões significantes a respeito de times em
regiões distintas. Para desta forma entender o que foi mais interessante para que no jogo
se obtivesse uma vitória.
As regiões com os dados analisados neste trabalho foi a Europa (EULCS), a
América do Norte (NALCS) e a Coreia (LCK). Essas regiões foram selecionadas a partir
da posição dos times representantes no top 4 do mundial, onde a região que não pode ser
da rota.
8É a liga que da acesso ao Campeonato Brasileiro de League of legends (CBLOL), liga principal do
páıs.
-
18
analisada dentre elas foram a China, pois, os dados oferecidos pela Oracle’s Elixir desta
região eram faltantes. A Coreia nos anos anteriores apresentou um ótimo desempenho
obtendo o t́ıtulo dos mundiais de 2013 a 2017. A América do Norte e a Europa apresen-
taram uma melhora de desempenho quando comparado com os resultados anteriores. Já
a região da China conseguiu chegar a obter o t́ıtulo mundial de 2018.
2.2 Mineração de Subgrupos
A busca por conhecimentos espećıficos em diversas áreas tem se utilizado de recur-
sos disponibilizados por técnicas de mineração de dados. Dos quais, com o uso em dados
previamente obtidos é posśıvel encontrar caracteŕısticas interessantes a respeito de sua
área. A utilização destas técnicas com dados disponibilizados na Big Data9, realizados
em sua maioria por engenheiro de software, geram um amplo conhecimento de padrões,
grupos, previsões, etc. A busca pelo aprendizado de forma automática tem tornado a
utilização da mineração de dados uma tendência.
Este trabalho busca encontrar padrões caracteŕısticos que indiquem a forma como
as equipes obtiveram vitoria em suas regiões. Em virtude disso, dentre as técnicas exis-
tentes na mineração de dados a mineração de subgrupos foi escolhida, pois, se mostrou
mais adequado para objetivo deste trabalho. Além da mineração de subgrupos, podem
ser utilizadas técnicas de classificação ou agrupamento. Porém, de fato o interesse estava
em utilizar os resultados obtidos para entender a cerca de um peŕıodo especifico de forma
descritiva.
Mineração de subgrupos (do inglês subgroup discovery) é uma técnica de mineração
exploratória, de indução descritiva e supervisionada. Que busca a partir de um valor
de atributo alvo encontrar padrões do conjunto de dados que descrevam este valor. É
também segundo Carmona et al [6] “uma tarefa de mineração de dados amplamente
aplicável, destinada a descobrir relações interessantes e relevantes entre propriedades de
um conjunto de dados em relação a uma propriedade espećıfica que é de interesse para o
usuário.”
Comumente os algoritmos de mineração de subgrupos podem ser confundidos com
algoritmos de classificação. A mineração de subgrupos foca em obter padrões descritivos
de um atributo alvo com viés de entender ele, já a classificação obtém previsões para um
9É o grande volume de dados (estruturados e não estruturados), que são gerados diariamente.
-
19
novo dado a partir de padrões obtidos com dados históricos. A mineração de subgrupos foi
inicialmente introduzida por Klösgen [7] e Wrobel [8] como uma tarefa que o usuário não
está interessado em obter todos os grupos com padrões que são estatisticamente bons, mas
em obter o mais interessante ou que se mostre incomum a respeito da variável alvo. Estes
subgrupos consistem de um subconjunto dos valores de atributos que se correlacionam
com a variável de interesse, e que tenham relevância a partir de medidas de qualidades.
Os resultados da mineração de subgrupos são um conjunto de regras com padrões
caracteŕısticos relevantes. Onde, segundo Rodrigez [9] essas regras são representadas em
um conjunto de condições. São compostas de valores de atributos que são suas carac-
teŕısticas e implicam na variável alvo (condições ! variávelalvo). Assim como dizem
Carmona et al [10] os algoritmos de mineração de subgrupos são utilizados quando tem
por objetivo obter dados que descrevam um problema e tenham alta interpretabilidade a
respeito de uma variável alvo. Diante da literatura pode-se ver que esta técnica é muito
utilizada em problemas da bioinformática, marketing e/ou problemas de e � learning.
Dentre os algoritmos criados para a técnica de mineração de subgrupos, o utilizado neste
trabalho será o algoritmo SD.
2.2.1 Algoritmo SD
O algoritmo SD [1], é um algoritmo de indução de busca exaustiva, que encontra
padrões caracteŕısticos de uma variável alvo através da geração de beam’s (onde um
conjunto de padrões são mantidos ao encontrar as melhores soluções). O algoritmo é
executado em uma repetição que tem por condição de parada a não mudança dos beam’s
ou regras na relação, partindo do prinćıpio que enquanto há mudança existe melhora na
regra. Para encontrar as relações mais interessantes temos a medida de qualidade qg,
onde a seleção de novas regras para o beam é determinado pela maximização dela. A
medida de qualidade qg é representada como qg = TPFP+g , onde TP representa os positivos
verdadeiros, já o FP os falsos positivos encontrados pela regra, e g é o parâmetro de
generalização. Para g = 1 é induzido a encontrar uma regra com grande especificidade.
De modo que para g > 10 é obtido uma maior a porcentagem de erros [9].
Para melhorar os resultados e o desempenho do algoritmo SD, Gamberger e Lavrac
[1] apresentam dois algoritmos que retiram regras redundantes dos subgrupos gerados no
algoritmo. Estes são os algoritmos RSS e DMS, que diferem na forma em que executam
-
20
sobre os resultados do SD. O algoritmo RSS, necessita da execução externa do algoritmo
SD para ser aplicado sobre os seus resultados. Onde cria o pesos sobre as features nas
regras escolhidas do subgrupo, e a partir disto seleciona os subgrupos com maior peso.
Já o DMS executa o algoritmo SD de forma interna, onde passa os pesos das features
diretamente na medida de qualidade do algoritmo. Desta forma, os beam’s são executados
no SD capturando uma menor quantidade de regras que o padrão do algoritmo.
-
21
3 TRABALHOS RELACIONADOS
Este caṕıtulo apresenta o uso da mineração de subgrupos e seus algoritmos em
trabalhos relacionados.
3.1 Mineração de Subgrupos
A mineração de subgrupos vem sendo utilizada por muitos pesquisadores com
o objetivo de encontrar padrões descritivos de fácil entendimento a respeito de uma
variável alvo. Assim como visto, a mineração de subgrupos foi inicialmente introduzida
por Klösgen [7] e Wrobel [8], e em trabalhos mais recentes existem estudos exploratórios a
respeito do uso dos algoritmos da mineração de subgrupos. Este estudo foi realizado por
Rodriguez et al [9], em que demonstraram o uso de dois destes algoritmos em conjuntos
de dados públicos, sendo eles os algoritmos SD e CN2-SD. Nas áreas de bioinformática
e medicina o uso tem se dado pela busca por detecção precoce de grupos de risco do
paciente, prognósticos e outros. A aplicação de um algoritmo da mineração de subgrupos
junto a um outro, com intuito de avaliar seus resultados, também tem sido muito reali-
zado. Outro ponto explorado é a utilização dos algoritmos da mineração de subgrupos
com novas tarefas de buscas para que se otimize a busca dos padrões. Carmona et al usa
a mineração de subgrupos com uma tarefa de busca baseada em programação genética,
apresentando este algoritmo como Fuzzy Genetic Programming-based for Subgroup Dis-
covery (FuGePSD). Segundo Carmona et al [11] a sua programação genética “permite
aprender expressões compactas com o objetivo principal de obter regras para descrever
subgrupos simples, interessantes e interpretáveis”. A forma como o FuGePSD realiza a
busca, é empregando uma abordagem genética cooperativa-competitiva onde as regras da
população cooperam e competem entre si para obter a solução ótima. Ele evolui com base
em sua geração de populações de descendentes que se dá através da aplicação de vários
operadores genéticos. De fato a programação genética tem se relacionado a algoritmos
da mineração de subgrupos, e o uso destes algoritmos tem se visto mais empregados em
problemas da bioinformática.
No trabalho de Knobbe et al [12] é apresentado os desafios na investigação de um
projeto de análise de esportes em que foi explorado o uso da mineração de subgrupos e
regressão linear em um grande conjunto de dados de patinação de velocidade no gelo.
-
22
Com este conjunto de dados com registros de 15 anos, tiveram como objetivo encontrar
padrões caracteŕısticos significativos dos atletas. A partir do uso do algoritmo SD eles
procuraram obter parâmetros importantes que mostrassem que a partir de caracteŕısticas
f́ısicas especificas de atletas seria posśıvel atribuir horários predeterminados que otimizem
o desempenho do atleta. Para obter estes padrões os algoritmos foram aplicados em dois
parâmetros alternativos, um baseado no deslizamento e o outro em um modelo fisiológico
da forma como o corpo responde. Além do algoritmo SD utilizaram também regressão
linear, que teve o propósito de encontrar bons subconjuntos lineares. Para isso foi usado a
técnica LASSO, que explicam ser um método para estimar modelos lineares generalizados.
Os seus resultados não mostravam todas as partes pelo fato da regressão linear só obter
subconjuntos lineares. Então foi posśıvel observar que de fato não necessariamente isto
refletia nos dados de prática, pois, quando esperavam ter-se a curva U entre a carga
de treino e o tempo relativo, e não era o que ocorria. Knobbe et al [12] apresentam
um exemplo que “se um atleta treina consistentemente acima da carga ou com uma
intensidade ótima, nem todas as partes da curva em U estão a ser amostrado, e os dados
dispońıveis podem parecer ser bastante linear ou pelo menos monótona”. E de fato
somente com o algoritmo SD viram que foi suficiente para capturar comportamentos não-
lineares.
Este trabalho aborda o uso da mineração de subgrupos em um conjunto de dados
relacionado a torneios de esporte eletrônico. O uso foi realizado exclusivamente com o
algoritmo SD, sem a consulta de outra técnica. A forma de validar os resultados obtidos,
foi através da consulta a um especialista da área dos dados. Um coach de uma equipe
universitária de league of legends validou os resultados e encontrou os subgrupos mais
interessantes nos anos de 2017 e 2018.
-
23
4 TRATAMENTO E IMPLEMENTAÇÃO
Este caṕıtulo tem como propósito mostrar o tratamento realizado no conjunto de
dados, detalhes matemáticos dos algoritmos utilizados e como foi feito a implementação
e aplicação dos algoritmos.
4.1 Tratamento dos dados
O conjunto de dados utilizados neste trabalho é disponibilizado pela Oracle’s Elixir
[5], site que é mantido desde 2015 por Tim Sevenhuysen. Tendo como objetivo reunir
dados das partidas de campeonatos de todas as regiões de league of legends. O conjunto
de dados gerado por ele contém dados referentes aos times que jogam em cada partida, os
dados de cada jogador que estava nesse time e os dados referente aos objetivos e atributos
obtidos no mapa de cada jogo.
Devido a grandes mudanças que ocorreram entre os anos de 2016 – 2017 os conjun-
tos de dados utilizados são referentes aos anos de 2017 e 2018. Para cada partida havia 12
linhas no conjunto de dados usado. Estas linhas identificavam os dados dos 5 jogadores e
os dados gerais de cada equipe. O tratamento realizado nele foi feito em duas etapas:
1. A primeira etapa consistiu na conversão do conjunto de dados para dataframe, pois,
eram disponibilizados em microsoft excel, na retirada de linha que contivessem atri-
butos nulos. Estes tratamentos foram realizados com a ferramenta jupyter notebook,
na linguagem python. O motivo da retirada dos atributos de descrição da partida
foram porque não entravam no objetivo deste trabalho.
2. A segunda etapa consistiu na retirada de atributos que se tratavam de dados de
descrição da partida, como: url, gameid, league, split, date, week, game, patchno,
team, ban’s e pick’s, na criação de atributos que demonstravam a porcentagem de
participação dos jogadores nas partidas, e na remoção das linhas referentes as carac-
teŕısticas individuais na partida dos jogadores. Estes tratamentos foram realizados,
pois, o objetivo deste trabalho era de encontrar padrões dos times nas partidas
vitoriosas, então atributos individuais e de descrição da partida não se incluem.
Os atributos criados são apresentados na Tabela 1, que mostra o cálculo que foi
realizado para obter os valores apresentados no conjunto de dados final.
-
24
Tabela 1: Cálculo participação dos jogadores em objetivos.
Atributo Descrição Equação
ppgk participação em kill TAx(Total de abates do X)TA(Total de abates do time)
ppgd participação em damageTDx(Total de dano do x)
TD(Total de dano do time)
ppgw participação em sentinelas TWx(Total de wards posicionadas do x)TW (Total de de wards posicionadas do time)
ppgg participação em gold TGx(Total de gold do x)TG(Total de gold do time)
ppgcs participação em CS[farm] TCSx(Total de farm do x)TCS(Total de farm do time)
O conjunto de dados inicial era divido em três arquivos xlsx referentes aos anos de
2017 e 2018. Os arquivos continham dados pertencentes aos torneios de todas as regiões,
e dos grandes torneios que reúnem as melhores equipes de cada região. Na Tabela 2 é
posśıvel ver quantos atributos e registros havia no arquivo inicial.
Tabela 2: Conjuntos de dados inicial - atributos e registros.
Conjunto de dados Atributos Registros
DataSet LoL 2017 98 37.404
DataSet LoL 2018 Spring 98 15.900
DataSet LoL 2018 Summer 98 16.188
Apesar da quantidade de registros inicial, após o tratamento realizado nos dados
a quantidade de registros foi bem menor. Isto acontece devido a ser somente utilizado
dados de três regiões, e dos torneios regionais destas. A liga Europeia foi a que apresentou
menos registros, totalizando 653 registros nos anos de 2017 e 2018. Já a liga coreana foi a
que teve mais, totalizando 1019 registros, na Tabela 3 é demonstrado de forma detalhada
os registros e atributos para cada região e ano.
-
25
Tabela 3: Conjuntos de dados final - atributos e registros.
Conjunto de dados Atributos Registros
EULCS 2017 93 248
EULCS 2018 93 405
NALCS 2017 93 381
NALCS 2018 93 407
LCK 2017 93 347
LCK 2018 93 672
Os 93 atributos resultantes são de caracteŕısticas dos times durante a partida, que
eram importantes para o objetivo deste trabalho. O dicionário destes dados pode ser
encontrado no Apêndice A, com uma descrição do que são cada um dos atributos.
4.2 Algoritmos
4.2.1 Regras de seleção de subgrupos
Na Figura 2 é apresentado o pseudocódigo do algoritmo SD utilizado neste traba-
lho.
Figura 2: Algoritmo de seleção de subgrupos.
Fonte: Gamberger e Lavrac [1]
-
26
Assim como explicado por Gamberger e Lavrac [1] o algoritmo SD recebe como
entrada o conjunto E, que é a união de P (conjunto dos positivos, referente ao atributo
alvo) e N (conjunto dos negativos, os que não são do atributo alvo), e L que é o con-
junto de todas as features. Features são os valores dos atributos de forma descritiva, para
valores categóricos tem sua representação como Atributo = valor ou Atributo 6= valor.
Para valores numéricos são representados de duas formas: para reais representados por
Atributo > valor ou Atributo valor, e quando inteiros além dos anteriores são repre-
sentados também por Atributo = valor e Atributo 6= valor, a criação das features a serem
utilizadas no algoritmo é feita do seguinte modo:
• Quando os valores são discretos ou categóricos, geramos features no formato Ai = vixe Ai 6= wiy
• Quando são valores cont́ınuos [13], a criação das features é de forma mais espećıfica
onde são gerados Ai (vix + wiy)/2 para todos os que são vizinhos e pares dos
valores (vix, wiy), e Ai > (vix +wiy)/2, para todos os vizinhos e ı́mpares dos valores
(wiy, vix).
• E por último para valores inteiros, a criação de suas features são iguais aos dos
valores discretos e também aos dos valores cont́ınuos sendo representados nas formas:
Ai = vix, Ai 6= wiy, Ai (vix + wiy)/2 e Ai > (vix + wiy)/2
Os dados de entrada são inicializados com dois conjuntos de beam0s (linha 1), beam
e new beam. Que tem seu tamanho especificado por beam witdth, e são inicializados com
um conjunto vazio, para os conjuntos de features, e a regra de qualidade deste conjunto é
inicializada igual a 0. Então entra em uma repetição com sua condição de parada sendo
a não mudança dos beam0s em new beam, na repetição (linha 2 a 12) para cada beam de
i = 1 até o beam witdth (linha 3 a 10). Todas as features são executadas no conjunto de
condições (linha 4 a 9) onde observa-se se há uma melhora com a nova feature adicionada
ao conjunto já presente no beam (linha 5). Se TP|E| > min support e houver melhoria na
qualidade qg(i) de new beam (linha 7) então essa feature é adicionada ao conjunto e
a qualidade anterior é substitúıda pela qualidade melhorada com a feature adicionada
(linha 8). Se houver mudança em new beam o beam é substitúıdo por new beam, e se
substitúıdo então houve mudança e a repetição continua até que não haja mais mudanças.
-
27
4.2.2 Regras de seleção de subgrupos
Com a intenção de selecionar as melhores regras e mais espećıficas Gamberger e
Lavrac [1] apresentam o uso de dois algoritmos que utilizam o SD para selecionar os
subgrupos menos redundantes, sendo eles algoritmo RSS e DMS.
Este trabalho utilizou os dois algoritmos para comparar seus resultados, retirar as
regras redundantes geradas no algoritmo SD, e ver qual o custo computacional que elas
tiveram. Na Figura 3 é apresentado o algoritmo RSS, que ainda que não dê garantia de
ter uma liberdade estat́ıstica, garante uma grande diversidade de subgrupos que serão
gerados.
Figura 3: Algoritmo RSS.
Fonte: Gamberger e Lavrac [1]
A entrada do algoritmo RSS é o conjunto de subgrupos S gerados para a variável
alvo e o conjunto de features P [1], e retorna como sáıda um conjunto reduzido de sub-
grupos SS. Tem o numero de subgrupos de sáıda ajustável. O algoritmo inicializa SS
vazio (linha 1), para todas as features e 2 P no conjunto c recebe 1 c(e) 1 (linha 2),
entra então numa repetição pelo numero de subgrupos de sáıda optado (linha 3 a 8), no
conjunto S é selecionado o subgrupo com maior pesoP
1c(e) sendo a soma dos pesos das
features na regra escolhida do conjunto P (linha 4), para cada feature e no subgrupo
es colhido é somado 1 ao seu peso (linha 5), após o subgrupo escolhido é exclúıdo do
conjunto S (linha 6) e adicionado no conjunto SS (linha 7).
Diferente do algoritmo RSS o algoritmo o DMS, que é denominado Data Mining
Sever, roda o algoritmo SD de forma interna. Já o RSS depende que os dados sejam
rodado no algoritmo SD previamente para poder assim utiliza-lo para pegar os subgrupos
-
28
mais interessante. Na Figura 4 é apresentado o algoritmo DMS.
Figura 4: Algoritmo DMS.
Fonte: Gamberger e Lavrac [1]
O algoritmo DMS inicializa com o conjunto L de todas as caracteŕısticas e o con-
junto E que é a união do conjunto P dos positivos e N dos negativos do atributo alvo. É
passado o numero n de subgrupos escolhidos, a qualidade g, o valor de suporte mı́nimo
e o beamwidth, e tem por sáıda a o conjunto SS, sendo a regra de subgrupos que são
selecionados a partir do algoritmo SD com a medida de qualidade qg =P
TP 1c(e)FP+g . Onde
c(e) é o peso das features que já foram escolhidas para que assim seja obtida apenas as
regras menos redundantes.
4.3 Ferramentas e Aplicação do algoritmo
A aplicação do algoritmo SD foi feita utilizando a variável de interesse result com
valor 1, que condiz com uma vitoria. Todo o algoritmo foi executado em python 3 e seu
tempo de execução, por ser um algoritmo de busca exaustiva, foi longo (durando cerca
de um mês para que todos os algoritmos tivessem executados). Os algoritmos que foram
usados são o SD, RSS e o DMS apresentados por Gamberger e Lavrac [1]. Eles estavam
em pseudocódigo e foram implementados em código computacional na linguagem python.
O professor Renato Vimieiro, que estuda algoritmos de mineração de subgrupos, imple-
mentou os algoritmos de criação das features e beams deste trabalho. Os algoritmos SD,
RSS e DMS foram implementados de pseudocódigo para código computacional desde o
-
29
inicio. Os resultados apresentados nos três algoritmos aplicados foram iguais, e por este
motivo os apresentados neste trabalho são os do DMS. Além de apresentar os mesmos
resultados, também teve um tempo de execução menor. Além disto, após a obtenção dos
resultados foi feita a visualização em imagens no formato PNG através da biblioteca ima-
gekit para que fossem apresentados ao especialista Lucas Alves Rodrigues, estudante da
Universidade Tecnológica Federal do Paraná (UTFPR) e ex-Coach de league of legends.
-
30
5 RESULTADOS
Este caṕıtulo tem o propósito de apresentar os resultados obtidos através do al-
goritmo SD para os conjuntos de dados de campeonatos regionais de league of legends
nos anos de 2017 e 2018. Estes resultados foram analisados pelo especialista na área de
esporte eletrônico Lucas Alves Rodrigues que atuou como Coach da equipe de league of
legends na Avalanche E-Sports UTFPR. Equipe que disputou o torneio universitário de
e-Sports - TUES. Ele também atuou pela Wasdevils UTFPR, nas funções de Top laner
e Selva, onde conseguiu dois vice campeonatos no ano de 2017 (Nos campeonatos TUES
2017.1 e Brasil Game Cup 2017- UNILoL).
O especialista analisou as caracteŕısticas contidas em cada subgrupo e buscou en-
contrar uma relação entre os padrões vistos e a forma que as equipes jogaram em suas
regiões. Após as análises, escolheu os subgrupos que observou ter maior relevância das
caracteŕısticas com as regiões.
5.1 Análise dos Resultados
A descoberta de subgrupos com o algoritmo SD gerou mais de 300 subgrupos
diferentes. Onde, a análise dos subgrupos obtidos foi realizada em duas etapas. A pri-
meira etapa foi a análise geral dos subgrupos obtidos para encontrar atributos comuns,
e subgrupos mais recorrentes e significantes, nesta etapa não houve a participação do
especialista, a segunda etapa foi a análise do especialista com a escolha dos subgrupos
mais interessantes que demonstrasse melhor a região e o ano.
O custo computacional dos algoritmos deste trabalho foi medido em tempo de
execução. Foi observado para cada um dos algoritmos qual foi sua média de tempo em
relação aos outros. Isto foi necessário para que se pudesse ver qual dos algoritmos de me-
lhora de desempenho do algoritmo SD tinha maior relevância. Esta relação é apresentada
na tabela Tabela 4.
-
31
Tabela 4: Custo computacional médio dos algoritmos nos conjuntos de dados em minutos
Algoritmo Custo Computacional (min)
Algoritmo SD 34
Algoritmo RSS 39
Algoritmo DMS 18
O tempo médio para o algoritmo RSS é a soma do tempo de execução do algo-
ritmo SD com a execução do RSS, pois, existe a dependência da execução externa do SD.
Nos resultados obtidos pelos algoritmos observou-se que todos tinham os mesmos subgru-
pos, no que difere somente a exclusão dos subgrupos redundantes. Então os subgrupos
apresentados neste trabalho originam-se do Algoritmo DMS.
Tabela 5: Custo computacional algoritmo x conjunto dados em minutos
Algoritmo EULCS LCK NALCS
Algoritmo SD 30 37 36
Algoritmo RSS 35 42 41
Algoritmo DMS 15 20 20
O custo computacional que os conjuntos de dados tiveram em relação aos algo-
ritmos foram diferentes devido à quantidade de partidas que ocorriam para cada uma
das regiões analisadas. O conjunto de dados referente a liga europeia era o mais rápido,
enquanto os da liga coreana e norte-americana tinham um custo relativamente próximo.
Todos os custos foram medidos no tempo médio de execução para as bases e apresentados
na tabela Tabela 5. Os resultados foram obtidos de forma automática para um número
de beam’s predefinidos e executados semanalmente e enviados para o repositório ao final
da execução.
Os subgrupos obtidos revelaram padrões similares dentre as regiões. Os padrões
que mais apareceram foram a derrubada de torres e o ganho de ouro no jogo. A derrubada
de torre é uma caracteŕıstica principal, pois, para se ganhar a partida é necessário derrubar
no mı́nimo cinco torres para liberar o nexus, objetivo de vitória da partida. Devido a este
fator este padrão é de fato o mais comum dentre os que apareceram. O ganho de ouro é
outra caracteŕıstica importante, pois, através do ouro os jogadores ganham mais vantagens
com a compra de itens. Nas próximas seções serão apresentadas as regiões, uma análise
-
32
geral de seus resultados e o subgrupo de escolha do especialista com observações do que
é apresentado.
5.2 Campeonato Europeu League of Legendss - EULCS
A liga da Europa(EULCS) foi a única região do ocidente que conseguiu conquistar
o campeonato mundial de league of legends, conquistando em sua primeira edição. Após
isto o campeonato foi dominado por regiões do oriente, a liga europeia conseguiu estar
presente em todas as edições. A utilização dos dados desta região se deu pelos seus
resultados mais próximos tendo equipes entre os 8 mais bem colocados no mundial dos
anos de 2017 e 2018.
Os padrões resultantes do algoritmo SD para esta região no ano de 2017 demons-
traram que as vitórias estavam ligadas ao ganho de ouro, torres conquistadas, abates e
as mortes do time. Em alguns dos padrões encontrados até o tempo do jogo influenciou
nesta vitoria. Na regra R210 da tabela Tabela 6 é apresentado o subgrupo com maior
cobertura que ilustra as caracteŕısticas mais recorrentes, e na regra R0 do mesmo beam é
posśıvel ver outras caracteŕısticas que a região apresentou.
Tabela 6: Subgrupo com melhor cobertura EULCS - 2018
Subgrupo g sig
R2 EULCS2017 Torres derrubadas pelo time maior que 6 E 64 99.95%
Torres derrubadas pelo time adversário me-
nor ou igual a 8 E
Total de ouro gasto menor ou igual a 84462.5
R0 EULCS2017 Ganho de ouro maior que 1146.5 E 64 99.95%
Mortes menor ou igual a 19 E
Abates do time menor ou igual a 31 E
Abates de Barão de Nasho’r menor ou igual
a 2 E
Torres derrubadas pelo time diferente de 5Os subgrupos são induzidos a partir de conjuntos de caracteŕısticas diferentes com valores de
parâmetros g correspondentes aos dados na coluna g. A última coluna Sig contém informações sobre a
significância das regras calculadas pelo teste X2.
10R nas tabelas referem-se as regras contidas nos subgrupos.
-
33
O ganho de ouro e a derrubada de torres são padrões muito comuns por serem
objetivos principais de vitória. Porém, em 2017 outras caracteŕısticas como a quantidade
de abates foi muito presente nessa região. Os times que conseguiam mais abates e entrega-
vam menos mortes obtinham as vitórias, além disso, foi posśıvel ver também objetivos de
mapa como o Barão de Nasho’r. Esta caracteŕıstica não foi muito recorrente, aparecendo
somente em alguns dos subgrupos, o que mostra que nesse ano não era um grande foco da
região. O subgrupo escolhido como interessante para esta região em 2017 pelo espacialista
é apresentado na Tabela 7.
Tabela 7: Subgrupo - Especialista - EULCS ano 2017
Subgrupo g sig
R0 EULCS2017 Ganho de ouro por minuto maior que
1146.59 E
52 99.98%
Mortes menor ou igual a 19 E
Dragão ancião feito pelo adversário menor
ou igual a 0.0 E
Tempo de jogo menor ou igual a 53.3 E
Ouro aos 10 minutos do time adversário
menor ou igual a 16937.5
O que foi analisado neste subgrupo escolhido foi que, para conquistar as vitórias
as equipes tiveram caracteŕıstica que mostraram alto foco na obtenção de recursos por
abates. As equipes morriam muito quando considerado que uma equipe hoje em ligas de
alto ńıvel entregam menos que 10 abates. Os dragões anciãos, que para aquele ano era
uma novidade no campeonato, era um fator de virada de jogo então as equipes vitoriosas
dependiam da não execução do mesmo pelo oponente. E, por fim o jogo detinha uma longa
duração, quando se comparado a partidas mais recentes onde um jogo chega a terminar
aos 40 minutos. Os jogos eram mais longos e tinham mais abates, a execução de objetivos
como arauto, dragões elementais e barão não foram um fator de vitória encontrada como
padrão pelo algoritmo. Já objetivos ligados a derrubadas de torres e ganho de ouro foram
bastantes encontrados, visto que uma equipe só alcança a vitória se derrubar no mı́nimo
cinco torres e o nexus.
A Figura 5 apresenta um gráfico com a quantidade de vezes que uma caracteŕıstica
-
34
foi escolhida nos subgrupos, para o ano de 2017. Através dela, é posśıvel ver que as
caracteŕısticas que foram mais recorrentes são a queda de torres e o ganho de ouro,
sendo apresentados como opptowerkills e earnedgpm11 receptivamente. Com isto, pode-
se perceber que as caracteŕısticas referentes a derrubada de torres, que influenciou na
construção dos subgrupos do ano de 2017, corresponde ao quanto o oponente obteve.
Figura 5: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, EULCS2017.
Já no ano de 2018 a região da Europa apresentou uma mudança no quesito de
abates. Deixou de ser um padrão recorrente a quantidade de abates ou mortes do time,
e a região apresentou mais foco em objetivos de mapa como torres e monstros neutros.
Segundo os resultados obtidos, os times da Europa em 2018 buscaram suas vitórias exe-
cutando o mapa e não buscando lutas. No ano de 2018 houveram muitas mudanças em
objetivos como Barão Nashor, dragões elementais e dragões anciões e ao que é demons-
trado os objetivos se tornaram mais importantes assim. Através do subgrupo com melhor
cobertura é posśıvel apresentado na regra R2 da Tabela 8 pode ser visto o foco no abate
de monstros neutros que se caracteriza como objetivo de mapa.
11Descrição das caracteŕısticas são apresentadas no dicionário do Apêndice A
-
35
Tabela 8: Subgrupo com melhor cobertura EULCS - 2018
Subgrupo g sig
R2 EULCS2018 Torres derrubadas pelo time maior que 7
E
59 99.73%
Torres derrubadas pelo time adversário
menor ou igual a 7 E
Monstros neutros abatidos menor ou igual
a 313
A mudança não indica que padrões como ganho de ouro tenham sáıdo, pois, o
abate de monstros neutros no league of legends gera ouro para que seja convertido em
itens que deem vantagem ao jogador na partida. Após a análise do especialista, ele viu
que a região em 2018 ainda assim apresentava caracteŕısticas iguais ao do ano anterior,
mas com uma diminuição no foco em abates. Isto é posśıvel ser visto na Tabela 9, que é
o subgrupo considerado mais interessante pelo especialista.
Tabela 9: Subgrupo - Especialista - EULCS ano 2018
Subgrupo g sig
R1 EULCS2018 Torres derrubadas pelo time adversário
menor ou igual a 6.5 E
60 99.74%
Ganho de ouro por minuto maior que
1062.89 E
Abates por minuto maior que 0.18 E
Torres Derrubadas pelo time maior que 5
O subgrupo escolhido para o ano de 2018 demonstra muito dessa mudança. Pode-
se ver que as equipes focaram mais em torres e ganho de recursos e menos nos abates. Os
resultados encontrados indicam que os times morreram menos e buscaram menos abates
onde não é visto nenhum padrão indicando numero de mortes ou abates elevados como
ocorria para o ano de 2017.
O gráfico apresentado na Figura 6, condiz com as caracteŕısticas mais escolhidas
pelos subgrupos no ano de 2018. Diferente de 2017, este gráfico apresenta uma maior
influência das derrubadas de torres do próprio time como um padrão, sendo visto como
-
36
teamtowerskills. E além desta caracteŕıstica, outra muito recorrente foi a de abates por
minuto, apresentada como kpm. Estas caracteŕısticas apareceram no subgrupo de escolha
do especialista e no de melhor cobertura dos dados. Isto mostra que elas influenciaram
na construção das regras nos subgrupos e foram caracteŕısticas relevantes da região.
Figura 6: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, EULCS2018.
Como foi posśıvel observar entres os resultados dos dois anos, as equipes da Europa
tiveram uma mudança na forma em como jogam o mapa. As partidas deixando de ser tão
focadas em abastes e jogos longos e se tornando jogos pouco mais focados em executar
objetivos de mapa. No ano de 2018, após três anos sem a EULCS chegar entre os quatro
melhores, a região conseguiu uma vaga na final terminando em segundo colocado dentre
os times. Esta mudança ainda que não sendo tão grande, pois, ainda houve indicação do
uso de abates para vitória, forram suficiente para caracterizar a melhora que a região teve
no mundial.
O especialista observou que a região Europeia conseguiu ter uma mudança relevante
nos anos de 2017 e 2018. Onde, as equipes vitoriosas deixaram de ter um grande foco na
vitória através de abates e focou, em 2018, mais em objetivos neutros de mapa. Além
disto, foi viśıvel que a região ainda em 2017 já tinha um pequeno foco em objetivos de
mapa, e visão de jogo.
5.3 Campeonato Norte-Americano de League of Legends - NA LCS
A liga Norte-Americana de league of legends (NALCS) é muito conhecida por
usarem em seus times muito jogadores coreanos. Estes jogadores acabam por acrescentar
aos time bastante experiencia e tática de jogo. Assim como a liga europeia a liga Norte-
-
37
Americana também conseguiu nos mundiais mais recentes obter uma colocação entre os
oito melhores times. Com o intuito de encontrar as caracteŕısticas que melhoraram nos
dois últimos anos para terem alcançado o terceiro lugar no mundial de 2018 quando em
2017 somente alcançaram o oitavo lugar.
A NALCS apresentou caracteŕısticas que indicaram que em 2017 as equipes que
obtiveram vitoria conseguiam bastantes abates, morreram muito, mas focavam em obter
objetivos de principais como torres para assim equilibrar o ouro obtido. Na regra R2 da
Tabela 10 é apresentado o subgrupo com melhor cobertura. Nele é posśıvel ver como
os abates influenciaram em seus resultados, vistos como assistências. Na regra R1 do
mesmo beam é posśıvel ver padrões diferentes dos mais recorrentes, como monstros neutros
abatidos e mortes da equipe. Estes padrões influenciaram no ganho de ouro da equipe
aliada e adversaria, então são padrões que implicam em ganho de ouro. Além de ter sido
posśıvel ver o foco em abates de monstro neutro que se caracteriza em objetivo de mapa,
também é visto a tirada desse objetivo do time adversário.
Tabela 10: Subgrupo com melhor cobertura NALCS - 2017
Subgrupo g sig
R2 NALCS2017 Torres derrubadas pelo time adversário
menor ou igual a 7 E
96 99.99%
Assistências diferente de 7
R1 NALCS2017 Ganho de ouro por minuto maior que
1164.94 E
96 99.99%
Torres derrubadas pelo time diferente de
5 E
Mortes do time menor ou igual a 22 E
Monstros neutros abatidos pela selva do
time adversário maior que 4.5 E
Mortes do time diferente de 16
Após a análise dos resultados pelo especialista, observou-se que o subgrupo com
maior relevância indicava foco em abates, ganho de ouro e derrubada de torres. Na Tabela
11 é apresentado o subgrupo escolhido pelo especialista.
-
38
Tabela 11: Subgrupo - Especialista - NALCS ano 2017
Subgrupo g sig
R0 NALCS2017 Ganho de ouro por minuto maior que
1166.66 E
96 99.99%
Torres derrubadas pelo time maior que 6
E
Mortes menor ou igual que 22 E
Mortes do time diferente de 16
Assim como visto, o subgrupo mostra que as equipes no ano de 2017 mesmo en-
tregando uma alta quantidade de abates conseguiam obter a vitória. Basicamente apesar
de as equipes morrerem muito, ainda assim conseguiam através de recursos dos principais
voltar para o jogo e obter a vitória. Porém, visto que a morte é recurso para a equipe
adversaria pode-se entender que o jogo dependia de quem conseguisse converter isso em
torres. Estas são caracteŕısticas que também foram vistas em outras regiões, e que acabam
por ser padrões recorrentes do ano.
Na Figura 7 é apresentado as caracteŕısticas mais escolhidas nos subgrupos do ano
de 2017, sendo visto grande influência do abate de torres pelo time na construção das
regras. Porém, assim como na região da Europa, a derrubadas de torre pelo oponente
também foi uma caracteŕıstica comum. Mas nesta região, a quantidade de abates foi
selecionada em muitas regras, sendo visto no subgrupo de escolha do especialista e de
maior cobertura dos dados, no gráfico apresentado como d.
Figura 7: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, NALCS2017.
-
39
Já no ano de 2018 na NALCS os resultados demonstraram que a região passou
a focar mais em grandes objetivos como dragões e também em obtenção de ouro em
monstros neutros, mas também continuo um amplo foco nos abates. Então a região
não demonstrou ter uma grande mudança, com caracteŕısticas semelhantes as do ano
anterior. Na Tabela 12 a regra R2 representa o subgrupo com melhor cobertura de 2018
e que tem as caracteŕısticas anteriormente ditas. A regra R0 do mesmo beam apresenta
caracteŕısticas de objetivo de mapa, que também foram vistas no ano de 2017, porém,
em 2018 apresentou um maior foco neles. O que coincide com as mudanças obtidas nos
subgrupos de 2018 em todas as regiões.
Tabela 12: Subgrupo com melhor cobertura NALCS - 2017
Subgrupo g sig
R2 NALCS2018 Torres derrubadas pelo time adversário
menor ou igual a 6 E
100 99.97%
Assistências maior que 13 E
Mortes do time menor o igual a 17
R0 NALCS2018 Ganho de ouro por minuto maior que
1140.24 E
100 99.97%
Torres derrubadas pelo time adversário
menor ou igual a 8 E
Mortes menor ou igual a 18 E
Abates por minuto maior que 0.13 E
Monstros neutros abatidos na selva do
time menor ou igual a 218.5
Foi observado pelo especialista que a região não teve muitas mudanças,e que o foco
em objetivos principais de mapa foi mais prioritário pelas equipes. Isso é apresentado na
Tabela 13 com a escolha do subgrupo com maior relevância do especialista.
-
40
Tabela 13: Subgrupo - Especialista - NALCS ano 2018
Subgrupo g sig
R1 NALCS2017 Ganho de ouro por minuto maior que
1189.38 E
84 99.89%
Torres derrubadas pelo time maior que 6
E
Total de ouro obtido menor ou igual a
103406
Este subgrupo demonstra um foco maior no ouro e objetivos principais, onde um
grande ganho e uso desse ouro era convertido em objetivos principais para que as equipes
alcançassem a vitória, além desse subgrupo que mostra um foco claro nos objetivos prin-
cipais de vitória, o algoritmo para este ano também conseguiu encontrar os padrões que
demonstraram que as equipes também focassem nos objetivos de mapa como dragões e
distribuição destes recursos, na Tabela 14 é posśıvel ver o subgrupo que demonstra este
outro foco que as equipes tomaram.
Tabela 14: Subgrupos - Demonstração - NALCS ano 2018
Subgrupo g sig
R2 NALCS2017 Ganho de ouro por minuto maior que
1145.65 E
84 99.89%
Torres derrubadas pelo time adversario
menor ou igual a 8 E
Mortes menor ou igual a 18 E
Abates por minuto maior que 0.14 E
Total de ouro gasto menor ou igual a
98074.5 E
Dragão da terra menor ou igual a 2
É posśıvel ver que além dos abates e mortes que as equipes detinham um fator
que acabou sendo encontrado foram dragões elementais. O que neste subgrupo mostra é
o da terra, este dragão especificamente dá mais dano em objetivos como torre e dragões,
arautos e barões. Claro que no jogo os dragões aparecem de forma aleatória, e que o
-
41
aparecimento de dois elementais iguais é um fator de sorte e um foco bom a ser obtido
para se conseguir a vitoriar.
Assim como foi visto no subgrupo de escolha do especialista e de maior cobertura
dos dados, as caracteŕısticas mais escolhidas apresentadas na Figura 8 mostram que se
perdeu o foco em abates. Houve uma maior aparição de dragões da montanha feitos
(apresentados como earthdrakes) como uma caracteŕıstica nos subgrupos. A partir disto,
é posśıvel ver que assim como foi analisado nos subgrupos, a escolha das caracteŕısticas
também mostrou um maior foco em objetivos de mapa pela região no ano de 2018.
Figura 8: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, NALCS2018.
É viśıvel que entre os anos de 2017 e 2018 não ouve uma grande mudança, o
especialista pontuou isto como uma caracteŕıstica da própria região. Os abates e mortes
na região foi um recurso de ganho de vantagem sobre os adversários. Ele também mostrou
que apesar de ter continuado este foco no ano de 2018 as equipes também focaram em
objetivos neutros de mapa assim como nas demais regiões. Este fato, ele aponta como
um motivo de melhora das esquipes Norte-Americanas no mundial deste ano, conseguindo
melhores colocações que no ano anterior.
5.4 Campeonato Coreano de League of legends - LCK
A liga Coreana de league of legends (LCK), remete a coreia do sul, liga que detém
maior parte dos t́ıtulos mundiais tendo conquistado cinco das oito edições mundiais ocorri-
das até aqui. Sendo considerada a região mais forte, esta região revelou grandes jogadores
e grandes times, que acabaram por ser contratados por times de outras regiões como Bra-
sil. Um dos times que mais conquistaram t́ıtulos desta região foi a South Korean Telecom
-
42
Team 1 ou SK Telecom T1, que obteve 3 t́ıtulos dos cinco mundiais alcançados pela liga.
No último ano a liga teve uma grande queda, onde os times não conseguiram alcançar
as semifinais do mundial de 2018. Com intuito de entender quais padrões a liga tinha e
quais deixaram de ter o algoritmo foi utilizado para os dados da LCK do ano de 2017 e
2018.
Nesta região uma caracteŕıstica muito recorrente foi o posicionamento de sentinelas
viśıveis e inviśıveis, e a participação do suporte no posicionamento delas. Estes padrões
são apresentados na regra R1 na Tabela 15 e na regra R0 é posśıvel ver que a participação
do suporte na colocação destas sentinelas. A partir disto é aceitável dizer que o posicio-
namento de sentinelas pelos suportes influenciaram nas partidas da liga coreana de forma
positiva.
Tabela 15: Subgrupo com melhor cobertura LCK - 2017
Subgrupo g sig
R1 LCK2017 Torres derrubadas pelo time adversário
menor ou igual a 6 E
88 99.92%
Mortes diferente de 16 E
Sentinelas viśıveis diferente de 62
R0 LCK2017 Ganho de ouro por minuto maior que
1190.08 E
88 99.92%
Torres derrubadas pelo time adversário
menor ou igual a 10 E
Sentinelas viśıveis posicionadas diferente
de 67 E
Torres derrubadas pelo time adversário di-
ferente de 9 E
Participação do suporte nas sentinelas po-
sicionadas menor ou igual a 44%
Assim como nas outras regiões, a liga Americana também possúıa abates e mortes
como caracteŕısticas recorrentes em 2017. O que indica que naquele ano o meta12 consistiu
12É o estilo de jogo que ao longo do tempo (peŕıodo curto ou longo) se mostra melhor que os outros
por ser mais efetivo.
-
43
em abates para se alcançar a vitória. Essa diferença encontrada na liga coreana em 2017
demonstrar ser um dos motivos da região ter tido os times mais fortes, e obtido o t́ıtulo do
campeonato mundial daquele ano. A escolha de subgrupo do espacialista foi mais focada
nos objetivos principais em game e é posśıvel ser vista na Tabela 16.
Tabela 16: Subgrupo - Especialista - LCK ano 2017
Subgrupo g sig
R2 LCK2017 Ganho de ouro por minuto maior que
1215.06 E
08 99.83%
Mortes menor ou igual a 15
Este subgrupo escolhido mostra grande foco no ganho de recursos e poucas mortes
para vitórias. É um subgrupo simples que mostra objetivos prioritários de vitória na liga.
Uma observação do especialista para o ano de 2017 é que para este ano a liga coreana
vinha com um foco de visão tremendo onde os times brigavam mais para obter visão no
mapa do que chegavam a ir atrás de abates. O foco era tão alto que chegava ao ponto de
um time posicionar sentinelas em vários pontos do mapa e o time oponente chegar lá e
retirar para pôr as de sua equipe. O time que conseguia ter um melhor posicionamento
de sentinelas e obter mais visão, conseguia converter isto em vitória.
O gráfico de quantidade de seleção das caracteŕısticas pelos subgrupos, apresentado
na Figura 9, mostra que o abate de torres pelo oponente, ganho de ouro e sentinelas
posicionadas foram as que mais apareceram nas regras dos subgrupos. Apresentadas como
opptowerkills, earnedgpm e visionwards respectivamente, essas caracteŕısticas também
foram vistas no subgrupo de maior cobertura dos dados, sendo assim vistas como as mais
relevantes na construção dos subgrupos de 2017 na região da Coreia.
-
44
Figura 9: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, LCK 2017.
No ano de 2018 os resultados obtidos pelo algoritmo mostraram que o posiciona-
mento de sentinelas deixou de ser um fator comum de vitória na liga coreana. O subgrupo
com melhor cobertura apresentou a perca do foco no posicionamento de sentinelas, que
resultou na diminuição do domı́nio de visão que a região detinha quando foi campeã. A
regra R2 na Tabela 17 apresenta o subgrupo com melhor cobertura, e este mostra padrões
que também foram vistos nas outras regiões. Isto indica que a região coreana começou a
se equiparar com as outras regiões top 4 no mundial de 2018. O motivo encontrado da
queda de rendimento na região através dos padrões obtidos nos subgrupos com melhor
cobertura foi esta equiparação em objetivos com as outras regiões.
Tabela 17: Subgrupo com melhor cobertura LCK - 2018
Subgrupo g sig
R2 LCK2018 Torres derrubadas pelo time maior que 6
E
85 99.99%
Mortes menor ou igual a 13 E
Torres derrubadas pelo time adversario
menor ou igual a 9 E
Tempo para derrubar a primeira torre me-
nor ou igual a 22.87 E
Experiencia ganha aos 10 minutos maior
que 17439.5 E
Participação do atirador nas sentinelas co-
locadas maior que 5%
-
45
Essa equiparação da liga coreana com as outras, resultou em equipes como a SK
Telecom T1 não conseguir da fase eliminatória do mundial de 2018, depois de 12 etapas
sempre se classificando. Com a análise do especialista é posśıvel ver também mais das
caracteŕısticas que indicaram esse nivelamento dos padrões das regiões. A Tabela 18
apresenta o subgrupo considerado mais relevante pelo especialista para o ano de 2018.
Tabela 18: Subgrupo - Especialista - LCK ano 2018
Subgrupo g sig
R2 LCK2017 Torres derrubadas pelo time maior que 6
E
76 99.99%
Mortes menor ou igual a 13 E
Torres derrubadas pelo time adversário
menor ou igual a 7 E
Experiencia ganha aos 10 minutos maior
que 17439.5 E
Participação do atirador nas sentinelas co-
locadas maior que 5%
Este subgrupo mostra novamente que a região focou menos em posicionamento de
sentinelas, e focou mais em abates, torres, ganho de ouro e experiencia. Esta mudança
efetivou em uma grande queda da região que foi vista nos resultados do mundial de league
of legends de 2018, onde nos anos anteriores as equipes desta região obtiveram os t́ıtulos.
Assim como visto nos subgrupos do ano de 2018, a quantidade de caracteŕısticas
selecionadas, relacionado a posicionamento de sentinela caiu bastante. Por outro lado,
as mais presentes foram de abates de torres, quantidade de mortes do time e tempo de
derrubada de torres, isto é apresentado na Figura 10. O que mostra que houve uma queda
na relevância do posicionamento de sentinelas na construção dos subgrupos para o ano
de 2018, que havia no ano de 2017.
-
46
Figura 10: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, LCK 2018.
O especialista observou que na região da coreia, as equipes no ano de 2017 detinham
uma grande superioridade no mundial, e na sua região tinha caracteŕısticas mais focadas
na visão de mapa, como: posicionamento e participação no posicionamento de sentinelas.
Este padrão da região não se repetiu para o ano seguinte, que coincidiu com a queda de
desempenho das equipes no mundial. A região passou a focar em objetivos de mapa como
as demais.
5.5 Disposições Finais
Através das análises realizadas foi posśıvel analisar que o número de abates foi
uma influência constante em todas as regiões no ano de 2017, que difere de 2018 por ter
objetivos de mapa como influente. Isto acontece, pois, no jogo ocorrem mudanças de meta
que por vezes diminui a importância de algo no jogo, como o tempo da queda de torres
e dos abates. Cada região apresentou caracteŕısticas próprias, e algumas bem próximas
das outras como a Europa e a América do Norte. Estes fatores foram também analisados
por um especialista que, como já apresentado anteriormente, foi coach de uma equipe
universitária de league of legends.
Com a descoberta de padrões através da mineração de subgrupos foi posśıvel reali-
zar uma análise criteriosa das caracteŕısticas em partidas vitoriosas. Esta análise demons-
trou que seus resultados inferiam em caracteŕısticas de meta de jogo, região e objetivos
principais. Sendo posśıvel identificar uma força que uma região tinha, e não se repetia
nas outras. A ajuda de um especialista da área dos dados foi significativo para validar
os resultados obtidos pelos algoritmos. Com a validação dos resultados foi medido qual
a precisão dos algoritmos utilizados, os seus resultados demonstraram para o especialista
-
47
grande valor de estudo. Através dele foi entendido o porquê de uma região forte como a
coreia ter cáıdo de rendimento em 2018, e de como todas as regiões se equipararam no
mesmo ano em valores caracteŕısticos.
-
48
6 CONCLUSÃO E TRABALHOS FUTUROS
Este trabalho mostrou a utilização de uma técnica da mineração de dados no es-
porte eletrônico com o intuito de buscar padrões significativos. A mineração de subgrupos
foi aplicada a um conjunto de dados de torneios de league of legends utilizando um es-
pecialista para validar seus resultados. Realizou-se a busca de padrões de caracteŕısticas
em partidas vitoriosas de torneios de três regiões, escolhidas a partir de colocação das
equipes. A análise dessas caracteŕısticas tinha como proposito encontrar motivos das
regiões serem fortes em relação a outras, e o porquê de ter uma queda de desempenho.
Além disto, também buscou-se encontrar padrões que pudessem ser usados no esporte
eletrônico e fossem validados através de um especialista. Os algoritmos SD, RSS e DMS
foram disponibilizados em pseudocódigo e implementados neste trabalho em python, e os
algoritmos de geração de features e beam’s foram iniciados pelo Professor Renato Vimieiro
e conclúıdos neste trabalho.
A união da mineração de dados com o esporte eletrônico se mostra eficaz, pois, os
dados gerados em seus jogos são disponibilizados de forma simples para serem estudados.
Além disto, por se tratar de uma nova área abre a possibilidade de utilizar novas ferra-
mentas para melhoria de desempenho e apoio em tomadas de decisões pré jogo. O estudo
de dados vem crescendo e se tornando cada vez mais importante na tomada de decisões, e
a utilização de analista de equipe em um time de esporte eletrônico vem se tornando cada
vez mais comum. Esta análise pode também ser feita com base em estudos por técnicas de
ciência dos dados podendo prover como uma nova grande área a ser explorada e utilizada
como temas de estudo.
Com o resultado obtido foi posśıvel ver caracteŕısticas que indicaram padrões do
meta do ano em torneios de league of legends, que demonstraram que equipes vitoriosas
seguiam um estilo de jogo igual. Além disto, são viśıveis padrões que indicaram motivos
das equipes coreanas em 2017 ter tanta superioridade em relações as outras. Onde foi
mostrado que as equipes focaram em posicionamento de sentinelas e as outras regiões
em abates. Também foi viśıvel que no ano de 2018 as equipes coreanas perderam seu
foco em posicionamento de sentinelas, e assim como as outras regiões focaram os obter
recursos através de objetivos de mapa, como monstros neutros, dragões, arauto e barões.
Com a análise do especialista, foi posśıvel validar que as caracteŕısticas obtidas através
-
49
dos algoritmos demonstraram ser úteis. Em resposta o especialista demonstrou grande
interesse no que os resultados demonstraram. Onde foi posśıvel ver que cada liga tinha
seu próprio estilo de jogo, sendo também viśıvel o meta de visão que as equipes coreanas
tinham em 2017.
6.1 Dificuldades e lições aprendidas
A etapa que demonstrou ter maior dificuldade foi na execução dos algoritmos,
apesar de os conjuntos de dados não serem de fato tão grandes os algoritmos demoraram
cerca de um mês para que fossem completamente executados. Isto aconteceu devido ao
algoritmo SD ser um algoritmo de busca exaustiva, conhecidos como algoritmo guloso
(que expande toda uma árvore de possibilidades para que se alcance o melhor resultado).
A dependência dos resultados para a análise deles foi grande, e foi preciso dispor de
tempo para o especialista realizar as análises e retornar suas escolhas de subgrupos com
as observações.
Uma das lições aprendidas neste trabalho, é que de fato com tempo, um conjunto
de dados adequadamente formatado e a utilização de técnicas de mineração de dados é
posśıvel encontrar caracteŕısticas que possam ser de grande valor. E venham a ser usadas
como ponto de referência na busca de melhora de desempenho ou tomada de decisões.
Assim como havia o interesse neste trabalho de ver se tinha possibilidade dos padrões
encontrados serem de utilidade de técnicos ou analistas de esporte eletrônico.
6.2 Trabalhos futuros
Neste trabalho o tratamento realizado nos dados teve o viés de obter resultados
principais das equipes e algumas participações individuais dos jogadores. Poderia ser
observada outras caracteŕısticas de jogadores, porém, que necessitaria de mais tempo para
poder cobrir todo o escopo necessário para isto. Foi imposta uma limitação das melhores
equipes colocadas no mundial, onde não foi posśıvel a utilização da liga chinesa a LPL,
pois, seus dados disponibilizados pela Oraclre’s elixir não estavam completos devido à
região não permitir divulgação de diversos atributos dos jogos realizados por ela.
Como posśıveis trabalhos futuros, pode-se apontar a utilização de um conjunto de
dados completo que disponibilize todas as regiões com mais caracteŕısticas individuais de
-
50
jogadores. A utilização do algoritmo SD com outra técnica de mineração de dados para
se avaliar seus resultados. E também um acesso a um maior número de especialista com
um maior contato para que se tenha um amplo número de validação dos resultados do
algoritmo e observações.
-
51
REFERÊNCIAS
[1] GAMBERGER, D.; LAVRAC, N. Expert-guided subgroup discovery: Methodology
and application. Journal of Artificial Intelligence Research, v. 17, p. 501–527, 2002.
[2] Pedro Cipoli.
[3] Wikipedia. Esporte eletrônico. Available at: . Accessed in: 26/05/2019.
[4] LIMA, L. F. Bem-vindo a Summoner’s Rift! Conheça o mapa competi-
tivo do LoL. Available at: . Accessed
in: 18/05/2019.
[5] ORACLES Elixir. Available at: . Accessed in:
27/05/2019.
[6] CARMONA, C. J. et al. Fuzzy rules for describing subgroups from Influenza A virus
using a multi-objective evolutionary algorithm. Applied Soft Computing, v. 13, n. 8, p.
3439–3448, 2013.
[7] KLÖSGEN, W. Explora: A multipattern and multistrategy discovery assistant. In:
AMERICAN ASSOCIATION FOR ARTIFICIAL INTELLIGENCE. Advances in kno-
wledge discovery and data mining. [S.l.], 1996. p. 249–271.
[8] WROBEL, S. An algorithm for multi-relational discovery of subgroups. In: SPRIN-
GER. European Symposium on Principles of Data Mining and Knowledge Discovery.
[S.l.], 1997. p. 78–87.
[9] RODRIGUEZ, D. et al. A study of subgroup discovery approaches for defect predic-
tion. Information and Software Technology, Elsevier, v. 55, n. 10, p. 1810–1822, 2013.
[10] CARMONA, C. J. et al. An analysis on the use of pre-processing methods in evoluti-
onary fuzzy systems for subgroup discovery. Expert Systems with Applications, Elsevier,
v. 39, n. 13, p. 11404–11412, 2012.
-
52
[11] CARMONA, C. J. et al. A fuzzy genetic programming-based algorithm for subgroup
discovery and the application to one problem of pathogenesis of acute sore throat
conditions in humans. Information Sciences, Elsevier, v. 298, p. 180–197, 2015.
[12] KNOBBE, A. et al. Sports analytics for professional speed skating. Data Mining and
Knowledge Discovery, Springer, v. 31, n. 6, p. 1872–1902, 2017.
[13] FAYYAD, U. M.; IRANI, K. B. On the handling of continuous-valued attributes
in decision tree generation. Machine Learning, v. 8, n. 1, p. 87–102, Jan 1992. ISSN
1573-0565. Available at: .
-
53
Appendices
-
54
A DICIONÁRIO DOS DADOS
Tabela 19: Dicionario Atributos dos Conjuntos de dados
Atributo Descrição
side Lado que o time jogou (Azul, Vermelho)
gamelength Tempo de jogo em minutos e segundos.
result Resultado do jogo (0 - derrota, 1 - vitoria)
k Total abates
d Total mortes
a Total assistencias
teamkills Total abates do time
teamdeaths Total mortes do time
fb Tempo do prim