universidade federal de pernambucotg/2019-1/tg_si/tg_chnm.pdf · 2019. 7. 12. · universidade...

58
Universidade Federal de Pernambuco Centro de Inform´atica Curso de Sistemas de Informa¸c˜ ao Descoberta de padr˜oes em campeonatos do League of Legends usando algoritmos de descoberta de subgrupos Trabalho de Conclus˜ ao de Curso de Gradua¸c˜ao por Carlos Henrique do Nascimento Melo Orientador: Prof. Leandro Maciel Almeida Recife, Julho / 2019

Upload: others

Post on 14-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • Universidade Federal de Pernambuco

    Centro de Informática

    Curso de Sistemas de Informação

    Descoberta de padrões em campeonatos do League of Legends

    usando algoritmos de descoberta de subgrupos

    Trabalho de Conclusão de Curso de Graduação

    por

    Carlos Henrique do Nascimento Melo

    Orientador: Prof. Leandro Maciel Almeida

    Recife, Julho / 2019

  • Carlos Henrique do Nascimento Melo

    Descoberta de padrões em campeonatos do League of Legends usando

    algoritmos de descoberta de subgrupos

    Monografia apresentada ao Curso deSistemas de Informação, como requisitoparcial para a obtenção do T́ıtulo deBacharel em Sistemas de Informação,Centro de Informática.

    Orientador: Prof. Leandro Maciel Almeida

    Recife

    2019

  • UNIVERSIDADE FEDERAL DE PERNAMBUCO

    CENTRO DE INFORMÁTICA

    Carlos Henrique do Nascimento Melo Descoberta de padrões em campeonatos do League of Legends usando algoritmos

    de descoberta de subgrupos

    Monografia submetida ao corpo discente da Universidade Federal de Pernambuco, defendida e aprovada em ______ de __________________ de ______ . Banca Examinadora: Orientador: ________________________________________________

    Leandro Maciel Almeida Examinador: _______________________________________________

    Cleber Zanchettin

    Recife 2019

  • Agradecimentos

    Eu gostaria de agradeçer a todos vocês que me ajudaram

    durante esta jornada, especialmente para:

    Professores Leandro Almeida, Renato Vimieiro e Carla

    Silva por toda mentoria e aconselhamento durante todos

    esses anos.

    Ao Professores Cleber Zanchettin por aceitar a participar

    da minha banca de TCC.

    A meu eterno grupo de amigos Augusto Lima, Pedro

    Neto e Rafael Jordão, os Wild Cats.

    A minha mãe que sempre lutou por mim, e a toda minha

    famı́lia, além de Fernanda Costa que me deu motivação

    de chegar até o fim.

    Também ao time de E-Sport da UFRPE, o Blackbulls

    Gaming, que me auxiliou na busca por um especialista

    que pudesse avaliar meus resultados. E a Lucas Alves

    Rodrigues que aceitou avaliar meus resultados.

    Finalmente, eu gostaria de agradecer à Gil da lan house

    que deu minha primeira motivação!

    Obrigado a todos.

  • Qualquer tecnologia suficientemente

    avançada é indistingúıvel de magia.

    Arthur C. Clarke

  • RESUMO

    O uso da mineração de dados pela busca de padrões caracteŕısticos não é uma novidade

    em muitas áreas. No entanto, nos esportes eletrônicos uma grande quantidade de dados

    é criada, mas com pouca exploração de seu uso como uma ajuda para tal competição. A

    partir de estudos com técnicas de mineração de dados, é posśıvel adquirir caracteŕısticas

    relevantes. Portanto, este trabalho tem como objetivo descobrir padrões nas vitórias de

    jogos do campeonato de league of legends através da mineração de subgrupos, com base

    nas ligas melhores colocadas nos campeonatos mundiais de 2017 e 2018. A partir dos re-

    sultados, uma visualização dos subgrupos com melhor cobertura dos dados é apresentada

    com uma análise das diferenças entre as regiões. Além disso, os resultados foram anali-

    sados por um especialista do domı́nio dos esportes eletrônicos para apontar os subgrupos

    mais interessantes para cada região e ano.

    Palavras-chave: Mineração de subgrupos, Mineração de Dados, Esporte Eletrônico, Análise

    de dados.

  • ABSTRACT

    The use of data mining through the search for characteristic patterns is not new in many

    areas. However, in electronic sports, a high amount of data is created but with a little

    exploration of its use as an aid to such competition. From studies with data mining

    techniques, it is possible to acquire relevant data patterns. Therefore, this work aims to

    discover patterns in winning matches of the league of legends championships through the

    mining of subgroups, based on the best leagues placed in the world cups of 2017 and 2018.

    Based on the results, a visualization of the subgroups with better coverage of the data

    is presented together with an analysis of the di↵erences between regions is performed.

    Moreover, the results were analyzed by a specialist from the domain of electronic sports

    to point out the most interesting subgroups for each region and year.

    Keywords: Subgroup Discorvery, Data Mining, Electronic Sports, Data Analytics.

  • LISTA DE FIGURAS

    Figura 1 Arena league of legends . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    Figura 2 Algoritmo de seleção de subgrupos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

    Figura 3 Algoritmo RSS.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    Figura 4 Algoritmo DMS.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    Figura 5 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, EULCS

    2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    Figura 6 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, EULCS

    2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    Figura 7 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, NALCS

    2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    Figura 8 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, NALCS

    2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

    Figura 9 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, LCK

    2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    Figura 10 Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, LCK

    2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

  • LISTA DE TABELAS

    Tabela 1 Cálculo participação dos jogadores em objetivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

    Tabela 2 Conjuntos de dados inicial - atributos e registros. . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

    Tabela 3 Conjuntos de dados final - atributos e registros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

    Tabela 4 Custo computacional médio dos algoritmos nos conjuntos de dados em

    minutos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

    Tabela 5 Custo computacional algoritmo x conjunto dados em minutos . . . . . . . . . . . . . 31

    Tabela 6 Subgrupo com melhor cobertura EULCS - 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    Tabela 7 Subgrupo - Especialista - EULCS ano 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    Tabela 8 Subgrupo com melhor cobertura EULCS - 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    Tabela 9 Subgrupo - Especialista - EULCS ano 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    Tabela 10 Subgrupo com melhor cobertura NALCS - 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    Tabela 11 Subgrupo - Especialista - NALCS ano 2017. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

    Tabela 12 Subgrupo com melhor cobertura NALCS - 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

    Tabela 13 Subgrupo - Especialista - NALCS ano 2018. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    Tabela 14 Subgrupos - Demonstração - NALCS ano 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    Tabela 15 Subgrupo com melhor cobertura LCK - 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    Tabela 16 Subgrupo - Especialista - LCK ano 2017 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    Tabela 17 Subgrupo com melhor cobertura LCK - 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

    Tabela 18 Subgrupo - Especialista - LCK ano 2018 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

    Tabela 19 Dicionario Atributos dos Conjuntos de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

  • LISTA DE SIGLAS

    lol League of Legends

    UFPE Universidade Federal de Pernambuco

    UTFPR Universidade Tecnológica Federal do Paraná

    TUES Torneio Universitário de E-Sports

  • SUMÁRIO

    1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    1.1 Contexto e motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    1.2 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    1.3 Organização de texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

    2 CONCEITOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    2.1 Esportes Eletrônicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

    2.1.1 League of Legends . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    2.2 Mineração de Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    2.2.1 Algoritmo SD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    3 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    3.1 Mineração de Subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    4 TRATAMENTO E IMPLEMENTAÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    4.1 Tratamento dos dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

    4.2 Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

    4.2.1 Regras de seleção de subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

    4.2.2 Regras de seleção de subgrupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    4.3 Ferramentas e Aplicação do algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

    5 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    5.1 Análise dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

    5.2 Campeonato Europeu League of Legendss - EULCS. . . . . . . . . . . . . . . . . . 32

    5.3 Campeonato Norte-Americano de League of Legends - NA LCS . . 36

    5.4 Campeonato Coreano de League of legends - LCK . . . . . . . . . . . . . . . . . . . 41

    5.5 Disposições Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    6 CONCLUSÃO E TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

    6.1 Dificuldades e lições aprendidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    6.2 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

    Appendices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

  • A DICIONÁRIO DOS DADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

  • 12

    1 INTRODUÇÃO

    A presença de dispositivos eletrônicos para auxiliar na geração e obtenção de dados

    tem-se demonstrado bastante relevante para estudos de melhora de desempenho. O surgi-

    mento de um novo esporte que ocorre no meio eletrônico possibilitou a geração de dados

    de mais acesśıveis. No qual, recebe o nome de esporte eletrônico ou E-sports, um esporte

    que engloba torneios de jogos eletrônicos. Jogos de computadores, consoles e smartphones

    deixam de ser apenas por diversão e se tornam torneios altamente competitivos. No ramo

    de jogos para computador o league of legends tem recebido grande visibilidade com seus

    grandes eventos de E-sports.

    A geração de dados em um jogo de esporte eletrônico é realizada em tempo real,

    onde cada ação realizada é salva e disponibilizada pela empresa do jogo. Muitas vezes

    esses dados podem ser consultados enquanto as partidas ocorrem, para que desta forma

    seja posśıvel avaliar os jogadores dentro do jogo. Assim sendo, as competições regionais e

    mundiais de league of legends geram dados das caracteŕısticas das equipes nas partidas,

    que são apresentadas através do site da empresa1. No mundial de league of legends (nos

    anos de 2013 a 2017) um fato interessante ocorreu, uma única região dominou o cenário

    por quatro anos seguidos. Ao observar isto é posśıvel ver que através do estudo dos

    dados disponibilizados seria posśıvel encontrar padrões que fossem relevantes das partidas

    vitoriosas em cada região.

    1.1 Contexto e motivação

    Utilizar dados gerados a partir de partidas em esporte eletrônicos com técnicas de

    mineração de dados, pode possibilitar a geração de ferramentas que auxiliem analistas

    de e-sport a melhorarem o desempenho de suas equipes, jogadores ou entenderem uma

    região. Seria também posśıvel descobrir se a utilização de técnicas de esportes tradicionais,

    como atletismo e esportes de alto desempenho, melhorariam a performance dos atletas

    ou equipe no jogo eletrônico. Através da mineração de subgrupos (do inglês Subgroup

    Discovery) é posśıvel realizar a busca de padrões em variáveis de interesse.

    O estudo da mineração de dados é uma área com grande potencial de descoberta

    de padrões, que podem ajudar a compreender um novo domı́nio. O e-sport é um novo es-

    1Site: https://matchhistory.br.leagueoflegends.com/pt/page/landing-page

  • 13

    porte que gera e disponibiliza recursos necessários para a produção de estudos de padrões

    na melhora de desempenho. Partindo disso, surge a possibilidade de utilizar técnicas de

    mineração de dados para obter padrões de caracteŕısticas relevantes sobre times, regiões

    e jogadores. Esses padrões serviriam para se obter uma clareza sobre as diferenças entre

    regiões ou equipes. Com a utilização da mineração de subgrupos é posśıvel buscar por

    padrões caracteŕısticos que possibilitam entender como uma única região foi tão superior

    em campeonatos mundiais por cinco anos seguidos (2013 a 2017). Essa busca será reali-

    zada através do algoritmo SD, junto com algoritmos de eliminação de redundâncias que

    são apresentados por Gamberger e Lavrac [1], sobre conjuntos de dados de partidas de

    league of legends disponibilizados pela Oracle’s Elixir 2.

    1.2 Objetivo

    O objetivo deste trabalho é descobrir padrões em partidas vitoriosas de campeona-

    tos regionais de league of legends. No qual, será apresentado todo o custo computacional

    desta descoberta e também os padrões a partir dos subgrupos com melhor cobertura

    dos dados. Além disso, um especialista do domı́nio dos esportes eletrônicos analisará os

    resultados e apontará os subgrupos mais interessantes para cada região e ano.

    1.3 Organização de texto

    Este documento é composto por seis caṕıtulos.

    • Capitulo 2 - Conceitos: Apresenta as ferramentas e técnicas utilizadas por este

    trabalho.

    • Capitulo 3 - Trabalhos Relacionados: Apresenta em que estado esta a utilização da

    técnica de mineração utilizada.

    • Capitulo 4 - Tratamento e Implementação: Apresenta de qual forma os dados foram

    tratados e como foi aplicado os algoritmo da mineração de subgrupos no conjunto

    de dados.

    • Capitulo 5 - Resultados: Apresenta os resultados da aplicação dos algoritmos da

    mineração de subgrupos e a escolha dos melhores subgrupos pelo especialista.

    2Site: https://oracleselixir.com/

  • 14

    • Capitulo 6 - Conclusão: Apresenta o que foi conclúıdo neste trabalho a partir dos

    resultados obtidos.

  • 15

    2 CONCEITOS

    Este caṕıtulo tem como objetivo apresentar os conceitos necessários sobre os dados,

    área dos dados e algoritmos usados.

    2.1 Esportes Eletrônicos

    Esporte Eletrônico ou E-sports é uma nova modalidade de competição esportiva

    que vem crescendo em muitos páıses nos últimos anos. Esse esporte engloba competições

    organizadas de jogos no meio eletrônico (computadores, consoles, smartphones, etc) com

    competidores que já são considerados cyber atletas. Tem ganhado grande visibilidade

    com grandes competições apoiadas por empresas da área de computação, chipsets3 e as

    próprias empresas desenvolvedoras dos jogos. Em alguns páıses esta modalidade já vem

    sendo bastante difundida, como em regiões da América do Norte, Europa, e na Coreia do

    Sul (Páıs conhecido como o berço dos E-Sport). Recentemente, o Brasil se tornou palco

    de eventos de e-sports com uma grande quantidade de público, chegando a ser realizados

    em estádios.

    O esporte eletrônico teve seu maior crescimento a partir dos anos 2000, porém, a

    primeira competição relatada de jogos eletrônicos foi em 1972 com o jogo spacewar para

    estudantes da universidade de stanford na cidade dos Estados Unidos [3]. Esse crescimento

    ocorreu devido à ampliação da internet, e isto possibilitou a modalidade passar de 10

    campeonatos por ano para mais de 160. Além dessas mudanças também teve a mudança

    nos seus formatos, que inicialmente eram torneios em lan com os competidores na mesma

    rede de computadores. Deste modo, as competições além do formato tradicional em lan,

    também surgiu a possibilidade de uma fase dos campeonatos onde as equipes jogavam de

    suas gaming house’s4.

    Dentro dos esportes eletrônicos há muitas modalidades de campeonatos como First

    Person Shooter (FPS), Real-time strategy (RTS), futebol eletrônico, luta e Multiplayer

    online battle arena (MOBA) que é o gênero de jogo abordado neste trabalho. MOBA é

    um gênero de jogo onde jogadores batalham em uma arena em prol de um objetivo único,

    que se obtido a equipe vence sua batalha.

    3É um conjunto de circuitos integrados com objetivo de realizar a trocar informações entre os com-

    ponentes em um computador. [2]4Residencia onde o jogadores das equipes treinam, jogam e muitas vezes moram.

  • 16

    2.1.1 League of Legends

    Dentre os jogos do gênero MOBA no esporte eletrônico o conjunto de dados uti-

    lizado neste trabalho origina-se do league of legends. Jogo que seu modo mais jogado

    consiste em dois times batalhando em uma arena de três rotas (como exibido na Figura

    1), buscando uma forma estratégica de alcançar o objetivo principal, destruir o nexus5 do

    time adversário. O league of legends é sustentado pela empresa Riot Games e foi dispo-

    nibilizado a partir de 27 de outubro de 2009. Teve em 2016 a segunda maior premiação

    no valor de US$5 milhões de dólares, perdendo apenas para o Dota 26.

    Figura 1: Arena league of legends

    fonte: Techtudo [4]

    No league of legends os principais torneios ocorrem em Summoner’s rift, mapa com

    três rotas principais chamadas topo, meio e rota inferior. Onde, os jogadores são divididos

    em cinco funções sendo elas top laner, um mid laner, dois na rota inferior e um selva. As

    funções na rota inferior são suporte e atirador onde o suporte da utilidade e defesa para

    o atirador que detém o dano da rota. Os jogadores da rota topo e meio são chamados de

    solo laner’s, eles detêm o dano de suas rotas e a prinćıpio tem de obter seus recursos de

    forma individual. O selva é a lane que fica responsável por executar os monstros neutros

    e ajudar as outras três lanes efetuando ganks7. Abates e destruição de torres geram ouro

    5Objetivo de vitória dos times, tendo na base de cada time.

    6Jogo do mesmo gênero do league of legends distribuido pela empresa Valve.

    7È quando um jogador de outra rota ajuda seu aliado da rota gankada a obter um abate ou objetivo

  • 17

    para todos que participaram e este ouro é convertido pelos jogadores como itens que

    amplificam a capacidades dos personagens escolhidos. Além dos cinco jogadores tem o

    Coach que é o responsável por montar as composições de personagens que será jogada,

    além de ser o responsável pela estratégia inicial, dando a responsabilidade dos jogadores

    de executa-la e tomar novas decisões durante o jogo.

    No Brasil, atualmente grandes times de futebol criaram equipes para participarem

    das competições de league of legends. O Clube do Remo em 2016 participou da liga Cir-

    cuito Desafiante daquele ano8 se consagrando campeão da segunda etapa e conseguindo o

    acesso ao Campeonato Brasileiro de League of legends (CBLOL). Assim como, o Clube de

    Regatas do Flamengo e o Sport Club Corinthians Paulista também conseguiram acesso

    para o CBLOL no ano de 2018, com as equipes Flamengo e-sport e Red Canids Corinthi-

    ans. Partindo disto, é posśıvel ver a notoriedade que vem ganhando as competições de

    league of legends. Em outras regiões do mundo também houveram times que criaram

    equipes para as competições de league of legends como F.C. Schalke 04 da Alemanha,

    Fenerbahçe Spor Kulübü da Turquia, entre outros.

    No league of legends, ocorrem duas grandes competições oficiais que reúnem todas

    as regiões. Uma é o Mid-Season Invitational (MSI) que ocorre na metade do ano e a outra

    é o campeonato mundial, próximo ao fim do ano. Nos eventos atuais os times contam com

    uma grande estrutura de organização tendo 5 jogadores para a partida, reservas, coach’s,

    psicólogos entre outros. A estratégia em uma partida pode ser mudada, como aconteceu

    na fase de entrada MSI de 2017 com a equipe Gigabyte Marines da região do sudeste da

    ásia. O time utilizou-se da surpresa para obter suas vitórias mudando a forma como os

    jogadores estavam no mapa. Desta forma eles chegaram a se classificar para a próxima

    fase. Partindo deste ponto, a partir dos dados disponibilizados pelo śıtio web Oracle’s

    Elixir [5] é posśıvel utiliza-los para encontra padrões significantes a respeito de times em

    regiões distintas. Para desta forma entender o que foi mais interessante para que no jogo

    se obtivesse uma vitória.

    As regiões com os dados analisados neste trabalho foi a Europa (EULCS), a

    América do Norte (NALCS) e a Coreia (LCK). Essas regiões foram selecionadas a partir

    da posição dos times representantes no top 4 do mundial, onde a região que não pode ser

    da rota.

    8É a liga que da acesso ao Campeonato Brasileiro de League of legends (CBLOL), liga principal do

    páıs.

  • 18

    analisada dentre elas foram a China, pois, os dados oferecidos pela Oracle’s Elixir desta

    região eram faltantes. A Coreia nos anos anteriores apresentou um ótimo desempenho

    obtendo o t́ıtulo dos mundiais de 2013 a 2017. A América do Norte e a Europa apresen-

    taram uma melhora de desempenho quando comparado com os resultados anteriores. Já

    a região da China conseguiu chegar a obter o t́ıtulo mundial de 2018.

    2.2 Mineração de Subgrupos

    A busca por conhecimentos espećıficos em diversas áreas tem se utilizado de recur-

    sos disponibilizados por técnicas de mineração de dados. Dos quais, com o uso em dados

    previamente obtidos é posśıvel encontrar caracteŕısticas interessantes a respeito de sua

    área. A utilização destas técnicas com dados disponibilizados na Big Data9, realizados

    em sua maioria por engenheiro de software, geram um amplo conhecimento de padrões,

    grupos, previsões, etc. A busca pelo aprendizado de forma automática tem tornado a

    utilização da mineração de dados uma tendência.

    Este trabalho busca encontrar padrões caracteŕısticos que indiquem a forma como

    as equipes obtiveram vitoria em suas regiões. Em virtude disso, dentre as técnicas exis-

    tentes na mineração de dados a mineração de subgrupos foi escolhida, pois, se mostrou

    mais adequado para objetivo deste trabalho. Além da mineração de subgrupos, podem

    ser utilizadas técnicas de classificação ou agrupamento. Porém, de fato o interesse estava

    em utilizar os resultados obtidos para entender a cerca de um peŕıodo especifico de forma

    descritiva.

    Mineração de subgrupos (do inglês subgroup discovery) é uma técnica de mineração

    exploratória, de indução descritiva e supervisionada. Que busca a partir de um valor

    de atributo alvo encontrar padrões do conjunto de dados que descrevam este valor. É

    também segundo Carmona et al [6] “uma tarefa de mineração de dados amplamente

    aplicável, destinada a descobrir relações interessantes e relevantes entre propriedades de

    um conjunto de dados em relação a uma propriedade espećıfica que é de interesse para o

    usuário.”

    Comumente os algoritmos de mineração de subgrupos podem ser confundidos com

    algoritmos de classificação. A mineração de subgrupos foca em obter padrões descritivos

    de um atributo alvo com viés de entender ele, já a classificação obtém previsões para um

    9É o grande volume de dados (estruturados e não estruturados), que são gerados diariamente.

  • 19

    novo dado a partir de padrões obtidos com dados históricos. A mineração de subgrupos foi

    inicialmente introduzida por Klösgen [7] e Wrobel [8] como uma tarefa que o usuário não

    está interessado em obter todos os grupos com padrões que são estatisticamente bons, mas

    em obter o mais interessante ou que se mostre incomum a respeito da variável alvo. Estes

    subgrupos consistem de um subconjunto dos valores de atributos que se correlacionam

    com a variável de interesse, e que tenham relevância a partir de medidas de qualidades.

    Os resultados da mineração de subgrupos são um conjunto de regras com padrões

    caracteŕısticos relevantes. Onde, segundo Rodrigez [9] essas regras são representadas em

    um conjunto de condições. São compostas de valores de atributos que são suas carac-

    teŕısticas e implicam na variável alvo (condições ! variávelalvo). Assim como dizem

    Carmona et al [10] os algoritmos de mineração de subgrupos são utilizados quando tem

    por objetivo obter dados que descrevam um problema e tenham alta interpretabilidade a

    respeito de uma variável alvo. Diante da literatura pode-se ver que esta técnica é muito

    utilizada em problemas da bioinformática, marketing e/ou problemas de e � learning.

    Dentre os algoritmos criados para a técnica de mineração de subgrupos, o utilizado neste

    trabalho será o algoritmo SD.

    2.2.1 Algoritmo SD

    O algoritmo SD [1], é um algoritmo de indução de busca exaustiva, que encontra

    padrões caracteŕısticos de uma variável alvo através da geração de beam’s (onde um

    conjunto de padrões são mantidos ao encontrar as melhores soluções). O algoritmo é

    executado em uma repetição que tem por condição de parada a não mudança dos beam’s

    ou regras na relação, partindo do prinćıpio que enquanto há mudança existe melhora na

    regra. Para encontrar as relações mais interessantes temos a medida de qualidade qg,

    onde a seleção de novas regras para o beam é determinado pela maximização dela. A

    medida de qualidade qg é representada como qg = TPFP+g , onde TP representa os positivos

    verdadeiros, já o FP os falsos positivos encontrados pela regra, e g é o parâmetro de

    generalização. Para g = 1 é induzido a encontrar uma regra com grande especificidade.

    De modo que para g > 10 é obtido uma maior a porcentagem de erros [9].

    Para melhorar os resultados e o desempenho do algoritmo SD, Gamberger e Lavrac

    [1] apresentam dois algoritmos que retiram regras redundantes dos subgrupos gerados no

    algoritmo. Estes são os algoritmos RSS e DMS, que diferem na forma em que executam

  • 20

    sobre os resultados do SD. O algoritmo RSS, necessita da execução externa do algoritmo

    SD para ser aplicado sobre os seus resultados. Onde cria o pesos sobre as features nas

    regras escolhidas do subgrupo, e a partir disto seleciona os subgrupos com maior peso.

    Já o DMS executa o algoritmo SD de forma interna, onde passa os pesos das features

    diretamente na medida de qualidade do algoritmo. Desta forma, os beam’s são executados

    no SD capturando uma menor quantidade de regras que o padrão do algoritmo.

  • 21

    3 TRABALHOS RELACIONADOS

    Este caṕıtulo apresenta o uso da mineração de subgrupos e seus algoritmos em

    trabalhos relacionados.

    3.1 Mineração de Subgrupos

    A mineração de subgrupos vem sendo utilizada por muitos pesquisadores com

    o objetivo de encontrar padrões descritivos de fácil entendimento a respeito de uma

    variável alvo. Assim como visto, a mineração de subgrupos foi inicialmente introduzida

    por Klösgen [7] e Wrobel [8], e em trabalhos mais recentes existem estudos exploratórios a

    respeito do uso dos algoritmos da mineração de subgrupos. Este estudo foi realizado por

    Rodriguez et al [9], em que demonstraram o uso de dois destes algoritmos em conjuntos

    de dados públicos, sendo eles os algoritmos SD e CN2-SD. Nas áreas de bioinformática

    e medicina o uso tem se dado pela busca por detecção precoce de grupos de risco do

    paciente, prognósticos e outros. A aplicação de um algoritmo da mineração de subgrupos

    junto a um outro, com intuito de avaliar seus resultados, também tem sido muito reali-

    zado. Outro ponto explorado é a utilização dos algoritmos da mineração de subgrupos

    com novas tarefas de buscas para que se otimize a busca dos padrões. Carmona et al usa

    a mineração de subgrupos com uma tarefa de busca baseada em programação genética,

    apresentando este algoritmo como Fuzzy Genetic Programming-based for Subgroup Dis-

    covery (FuGePSD). Segundo Carmona et al [11] a sua programação genética “permite

    aprender expressões compactas com o objetivo principal de obter regras para descrever

    subgrupos simples, interessantes e interpretáveis”. A forma como o FuGePSD realiza a

    busca, é empregando uma abordagem genética cooperativa-competitiva onde as regras da

    população cooperam e competem entre si para obter a solução ótima. Ele evolui com base

    em sua geração de populações de descendentes que se dá através da aplicação de vários

    operadores genéticos. De fato a programação genética tem se relacionado a algoritmos

    da mineração de subgrupos, e o uso destes algoritmos tem se visto mais empregados em

    problemas da bioinformática.

    No trabalho de Knobbe et al [12] é apresentado os desafios na investigação de um

    projeto de análise de esportes em que foi explorado o uso da mineração de subgrupos e

    regressão linear em um grande conjunto de dados de patinação de velocidade no gelo.

  • 22

    Com este conjunto de dados com registros de 15 anos, tiveram como objetivo encontrar

    padrões caracteŕısticos significativos dos atletas. A partir do uso do algoritmo SD eles

    procuraram obter parâmetros importantes que mostrassem que a partir de caracteŕısticas

    f́ısicas especificas de atletas seria posśıvel atribuir horários predeterminados que otimizem

    o desempenho do atleta. Para obter estes padrões os algoritmos foram aplicados em dois

    parâmetros alternativos, um baseado no deslizamento e o outro em um modelo fisiológico

    da forma como o corpo responde. Além do algoritmo SD utilizaram também regressão

    linear, que teve o propósito de encontrar bons subconjuntos lineares. Para isso foi usado a

    técnica LASSO, que explicam ser um método para estimar modelos lineares generalizados.

    Os seus resultados não mostravam todas as partes pelo fato da regressão linear só obter

    subconjuntos lineares. Então foi posśıvel observar que de fato não necessariamente isto

    refletia nos dados de prática, pois, quando esperavam ter-se a curva U entre a carga

    de treino e o tempo relativo, e não era o que ocorria. Knobbe et al [12] apresentam

    um exemplo que “se um atleta treina consistentemente acima da carga ou com uma

    intensidade ótima, nem todas as partes da curva em U estão a ser amostrado, e os dados

    dispońıveis podem parecer ser bastante linear ou pelo menos monótona”. E de fato

    somente com o algoritmo SD viram que foi suficiente para capturar comportamentos não-

    lineares.

    Este trabalho aborda o uso da mineração de subgrupos em um conjunto de dados

    relacionado a torneios de esporte eletrônico. O uso foi realizado exclusivamente com o

    algoritmo SD, sem a consulta de outra técnica. A forma de validar os resultados obtidos,

    foi através da consulta a um especialista da área dos dados. Um coach de uma equipe

    universitária de league of legends validou os resultados e encontrou os subgrupos mais

    interessantes nos anos de 2017 e 2018.

  • 23

    4 TRATAMENTO E IMPLEMENTAÇÃO

    Este caṕıtulo tem como propósito mostrar o tratamento realizado no conjunto de

    dados, detalhes matemáticos dos algoritmos utilizados e como foi feito a implementação

    e aplicação dos algoritmos.

    4.1 Tratamento dos dados

    O conjunto de dados utilizados neste trabalho é disponibilizado pela Oracle’s Elixir

    [5], site que é mantido desde 2015 por Tim Sevenhuysen. Tendo como objetivo reunir

    dados das partidas de campeonatos de todas as regiões de league of legends. O conjunto

    de dados gerado por ele contém dados referentes aos times que jogam em cada partida, os

    dados de cada jogador que estava nesse time e os dados referente aos objetivos e atributos

    obtidos no mapa de cada jogo.

    Devido a grandes mudanças que ocorreram entre os anos de 2016 – 2017 os conjun-

    tos de dados utilizados são referentes aos anos de 2017 e 2018. Para cada partida havia 12

    linhas no conjunto de dados usado. Estas linhas identificavam os dados dos 5 jogadores e

    os dados gerais de cada equipe. O tratamento realizado nele foi feito em duas etapas:

    1. A primeira etapa consistiu na conversão do conjunto de dados para dataframe, pois,

    eram disponibilizados em microsoft excel, na retirada de linha que contivessem atri-

    butos nulos. Estes tratamentos foram realizados com a ferramenta jupyter notebook,

    na linguagem python. O motivo da retirada dos atributos de descrição da partida

    foram porque não entravam no objetivo deste trabalho.

    2. A segunda etapa consistiu na retirada de atributos que se tratavam de dados de

    descrição da partida, como: url, gameid, league, split, date, week, game, patchno,

    team, ban’s e pick’s, na criação de atributos que demonstravam a porcentagem de

    participação dos jogadores nas partidas, e na remoção das linhas referentes as carac-

    teŕısticas individuais na partida dos jogadores. Estes tratamentos foram realizados,

    pois, o objetivo deste trabalho era de encontrar padrões dos times nas partidas

    vitoriosas, então atributos individuais e de descrição da partida não se incluem.

    Os atributos criados são apresentados na Tabela 1, que mostra o cálculo que foi

    realizado para obter os valores apresentados no conjunto de dados final.

  • 24

    Tabela 1: Cálculo participação dos jogadores em objetivos.

    Atributo Descrição Equação

    ppgk participação em kill TAx(Total de abates do X)TA(Total de abates do time)

    ppgd participação em damageTDx(Total de dano do x)

    TD(Total de dano do time)

    ppgw participação em sentinelas TWx(Total de wards posicionadas do x)TW (Total de de wards posicionadas do time)

    ppgg participação em gold TGx(Total de gold do x)TG(Total de gold do time)

    ppgcs participação em CS[farm] TCSx(Total de farm do x)TCS(Total de farm do time)

    O conjunto de dados inicial era divido em três arquivos xlsx referentes aos anos de

    2017 e 2018. Os arquivos continham dados pertencentes aos torneios de todas as regiões,

    e dos grandes torneios que reúnem as melhores equipes de cada região. Na Tabela 2 é

    posśıvel ver quantos atributos e registros havia no arquivo inicial.

    Tabela 2: Conjuntos de dados inicial - atributos e registros.

    Conjunto de dados Atributos Registros

    DataSet LoL 2017 98 37.404

    DataSet LoL 2018 Spring 98 15.900

    DataSet LoL 2018 Summer 98 16.188

    Apesar da quantidade de registros inicial, após o tratamento realizado nos dados

    a quantidade de registros foi bem menor. Isto acontece devido a ser somente utilizado

    dados de três regiões, e dos torneios regionais destas. A liga Europeia foi a que apresentou

    menos registros, totalizando 653 registros nos anos de 2017 e 2018. Já a liga coreana foi a

    que teve mais, totalizando 1019 registros, na Tabela 3 é demonstrado de forma detalhada

    os registros e atributos para cada região e ano.

  • 25

    Tabela 3: Conjuntos de dados final - atributos e registros.

    Conjunto de dados Atributos Registros

    EULCS 2017 93 248

    EULCS 2018 93 405

    NALCS 2017 93 381

    NALCS 2018 93 407

    LCK 2017 93 347

    LCK 2018 93 672

    Os 93 atributos resultantes são de caracteŕısticas dos times durante a partida, que

    eram importantes para o objetivo deste trabalho. O dicionário destes dados pode ser

    encontrado no Apêndice A, com uma descrição do que são cada um dos atributos.

    4.2 Algoritmos

    4.2.1 Regras de seleção de subgrupos

    Na Figura 2 é apresentado o pseudocódigo do algoritmo SD utilizado neste traba-

    lho.

    Figura 2: Algoritmo de seleção de subgrupos.

    Fonte: Gamberger e Lavrac [1]

  • 26

    Assim como explicado por Gamberger e Lavrac [1] o algoritmo SD recebe como

    entrada o conjunto E, que é a união de P (conjunto dos positivos, referente ao atributo

    alvo) e N (conjunto dos negativos, os que não são do atributo alvo), e L que é o con-

    junto de todas as features. Features são os valores dos atributos de forma descritiva, para

    valores categóricos tem sua representação como Atributo = valor ou Atributo 6= valor.

    Para valores numéricos são representados de duas formas: para reais representados por

    Atributo > valor ou Atributo valor, e quando inteiros além dos anteriores são repre-

    sentados também por Atributo = valor e Atributo 6= valor, a criação das features a serem

    utilizadas no algoritmo é feita do seguinte modo:

    • Quando os valores são discretos ou categóricos, geramos features no formato Ai = vixe Ai 6= wiy

    • Quando são valores cont́ınuos [13], a criação das features é de forma mais espećıfica

    onde são gerados Ai (vix + wiy)/2 para todos os que são vizinhos e pares dos

    valores (vix, wiy), e Ai > (vix +wiy)/2, para todos os vizinhos e ı́mpares dos valores

    (wiy, vix).

    • E por último para valores inteiros, a criação de suas features são iguais aos dos

    valores discretos e também aos dos valores cont́ınuos sendo representados nas formas:

    Ai = vix, Ai 6= wiy, Ai (vix + wiy)/2 e Ai > (vix + wiy)/2

    Os dados de entrada são inicializados com dois conjuntos de beam0s (linha 1), beam

    e new beam. Que tem seu tamanho especificado por beam witdth, e são inicializados com

    um conjunto vazio, para os conjuntos de features, e a regra de qualidade deste conjunto é

    inicializada igual a 0. Então entra em uma repetição com sua condição de parada sendo

    a não mudança dos beam0s em new beam, na repetição (linha 2 a 12) para cada beam de

    i = 1 até o beam witdth (linha 3 a 10). Todas as features são executadas no conjunto de

    condições (linha 4 a 9) onde observa-se se há uma melhora com a nova feature adicionada

    ao conjunto já presente no beam (linha 5). Se TP|E| > min support e houver melhoria na

    qualidade qg(i) de new beam (linha 7) então essa feature é adicionada ao conjunto e

    a qualidade anterior é substitúıda pela qualidade melhorada com a feature adicionada

    (linha 8). Se houver mudança em new beam o beam é substitúıdo por new beam, e se

    substitúıdo então houve mudança e a repetição continua até que não haja mais mudanças.

  • 27

    4.2.2 Regras de seleção de subgrupos

    Com a intenção de selecionar as melhores regras e mais espećıficas Gamberger e

    Lavrac [1] apresentam o uso de dois algoritmos que utilizam o SD para selecionar os

    subgrupos menos redundantes, sendo eles algoritmo RSS e DMS.

    Este trabalho utilizou os dois algoritmos para comparar seus resultados, retirar as

    regras redundantes geradas no algoritmo SD, e ver qual o custo computacional que elas

    tiveram. Na Figura 3 é apresentado o algoritmo RSS, que ainda que não dê garantia de

    ter uma liberdade estat́ıstica, garante uma grande diversidade de subgrupos que serão

    gerados.

    Figura 3: Algoritmo RSS.

    Fonte: Gamberger e Lavrac [1]

    A entrada do algoritmo RSS é o conjunto de subgrupos S gerados para a variável

    alvo e o conjunto de features P [1], e retorna como sáıda um conjunto reduzido de sub-

    grupos SS. Tem o numero de subgrupos de sáıda ajustável. O algoritmo inicializa SS

    vazio (linha 1), para todas as features e 2 P no conjunto c recebe 1 c(e) 1 (linha 2),

    entra então numa repetição pelo numero de subgrupos de sáıda optado (linha 3 a 8), no

    conjunto S é selecionado o subgrupo com maior pesoP

    1c(e) sendo a soma dos pesos das

    features na regra escolhida do conjunto P (linha 4), para cada feature e no subgrupo

    es colhido é somado 1 ao seu peso (linha 5), após o subgrupo escolhido é exclúıdo do

    conjunto S (linha 6) e adicionado no conjunto SS (linha 7).

    Diferente do algoritmo RSS o algoritmo o DMS, que é denominado Data Mining

    Sever, roda o algoritmo SD de forma interna. Já o RSS depende que os dados sejam

    rodado no algoritmo SD previamente para poder assim utiliza-lo para pegar os subgrupos

  • 28

    mais interessante. Na Figura 4 é apresentado o algoritmo DMS.

    Figura 4: Algoritmo DMS.

    Fonte: Gamberger e Lavrac [1]

    O algoritmo DMS inicializa com o conjunto L de todas as caracteŕısticas e o con-

    junto E que é a união do conjunto P dos positivos e N dos negativos do atributo alvo. É

    passado o numero n de subgrupos escolhidos, a qualidade g, o valor de suporte mı́nimo

    e o beamwidth, e tem por sáıda a o conjunto SS, sendo a regra de subgrupos que são

    selecionados a partir do algoritmo SD com a medida de qualidade qg =P

    TP 1c(e)FP+g . Onde

    c(e) é o peso das features que já foram escolhidas para que assim seja obtida apenas as

    regras menos redundantes.

    4.3 Ferramentas e Aplicação do algoritmo

    A aplicação do algoritmo SD foi feita utilizando a variável de interesse result com

    valor 1, que condiz com uma vitoria. Todo o algoritmo foi executado em python 3 e seu

    tempo de execução, por ser um algoritmo de busca exaustiva, foi longo (durando cerca

    de um mês para que todos os algoritmos tivessem executados). Os algoritmos que foram

    usados são o SD, RSS e o DMS apresentados por Gamberger e Lavrac [1]. Eles estavam

    em pseudocódigo e foram implementados em código computacional na linguagem python.

    O professor Renato Vimieiro, que estuda algoritmos de mineração de subgrupos, imple-

    mentou os algoritmos de criação das features e beams deste trabalho. Os algoritmos SD,

    RSS e DMS foram implementados de pseudocódigo para código computacional desde o

  • 29

    inicio. Os resultados apresentados nos três algoritmos aplicados foram iguais, e por este

    motivo os apresentados neste trabalho são os do DMS. Além de apresentar os mesmos

    resultados, também teve um tempo de execução menor. Além disto, após a obtenção dos

    resultados foi feita a visualização em imagens no formato PNG através da biblioteca ima-

    gekit para que fossem apresentados ao especialista Lucas Alves Rodrigues, estudante da

    Universidade Tecnológica Federal do Paraná (UTFPR) e ex-Coach de league of legends.

  • 30

    5 RESULTADOS

    Este caṕıtulo tem o propósito de apresentar os resultados obtidos através do al-

    goritmo SD para os conjuntos de dados de campeonatos regionais de league of legends

    nos anos de 2017 e 2018. Estes resultados foram analisados pelo especialista na área de

    esporte eletrônico Lucas Alves Rodrigues que atuou como Coach da equipe de league of

    legends na Avalanche E-Sports UTFPR. Equipe que disputou o torneio universitário de

    e-Sports - TUES. Ele também atuou pela Wasdevils UTFPR, nas funções de Top laner

    e Selva, onde conseguiu dois vice campeonatos no ano de 2017 (Nos campeonatos TUES

    2017.1 e Brasil Game Cup 2017- UNILoL).

    O especialista analisou as caracteŕısticas contidas em cada subgrupo e buscou en-

    contrar uma relação entre os padrões vistos e a forma que as equipes jogaram em suas

    regiões. Após as análises, escolheu os subgrupos que observou ter maior relevância das

    caracteŕısticas com as regiões.

    5.1 Análise dos Resultados

    A descoberta de subgrupos com o algoritmo SD gerou mais de 300 subgrupos

    diferentes. Onde, a análise dos subgrupos obtidos foi realizada em duas etapas. A pri-

    meira etapa foi a análise geral dos subgrupos obtidos para encontrar atributos comuns,

    e subgrupos mais recorrentes e significantes, nesta etapa não houve a participação do

    especialista, a segunda etapa foi a análise do especialista com a escolha dos subgrupos

    mais interessantes que demonstrasse melhor a região e o ano.

    O custo computacional dos algoritmos deste trabalho foi medido em tempo de

    execução. Foi observado para cada um dos algoritmos qual foi sua média de tempo em

    relação aos outros. Isto foi necessário para que se pudesse ver qual dos algoritmos de me-

    lhora de desempenho do algoritmo SD tinha maior relevância. Esta relação é apresentada

    na tabela Tabela 4.

  • 31

    Tabela 4: Custo computacional médio dos algoritmos nos conjuntos de dados em minutos

    Algoritmo Custo Computacional (min)

    Algoritmo SD 34

    Algoritmo RSS 39

    Algoritmo DMS 18

    O tempo médio para o algoritmo RSS é a soma do tempo de execução do algo-

    ritmo SD com a execução do RSS, pois, existe a dependência da execução externa do SD.

    Nos resultados obtidos pelos algoritmos observou-se que todos tinham os mesmos subgru-

    pos, no que difere somente a exclusão dos subgrupos redundantes. Então os subgrupos

    apresentados neste trabalho originam-se do Algoritmo DMS.

    Tabela 5: Custo computacional algoritmo x conjunto dados em minutos

    Algoritmo EULCS LCK NALCS

    Algoritmo SD 30 37 36

    Algoritmo RSS 35 42 41

    Algoritmo DMS 15 20 20

    O custo computacional que os conjuntos de dados tiveram em relação aos algo-

    ritmos foram diferentes devido à quantidade de partidas que ocorriam para cada uma

    das regiões analisadas. O conjunto de dados referente a liga europeia era o mais rápido,

    enquanto os da liga coreana e norte-americana tinham um custo relativamente próximo.

    Todos os custos foram medidos no tempo médio de execução para as bases e apresentados

    na tabela Tabela 5. Os resultados foram obtidos de forma automática para um número

    de beam’s predefinidos e executados semanalmente e enviados para o repositório ao final

    da execução.

    Os subgrupos obtidos revelaram padrões similares dentre as regiões. Os padrões

    que mais apareceram foram a derrubada de torres e o ganho de ouro no jogo. A derrubada

    de torre é uma caracteŕıstica principal, pois, para se ganhar a partida é necessário derrubar

    no mı́nimo cinco torres para liberar o nexus, objetivo de vitória da partida. Devido a este

    fator este padrão é de fato o mais comum dentre os que apareceram. O ganho de ouro é

    outra caracteŕıstica importante, pois, através do ouro os jogadores ganham mais vantagens

    com a compra de itens. Nas próximas seções serão apresentadas as regiões, uma análise

  • 32

    geral de seus resultados e o subgrupo de escolha do especialista com observações do que

    é apresentado.

    5.2 Campeonato Europeu League of Legendss - EULCS

    A liga da Europa(EULCS) foi a única região do ocidente que conseguiu conquistar

    o campeonato mundial de league of legends, conquistando em sua primeira edição. Após

    isto o campeonato foi dominado por regiões do oriente, a liga europeia conseguiu estar

    presente em todas as edições. A utilização dos dados desta região se deu pelos seus

    resultados mais próximos tendo equipes entre os 8 mais bem colocados no mundial dos

    anos de 2017 e 2018.

    Os padrões resultantes do algoritmo SD para esta região no ano de 2017 demons-

    traram que as vitórias estavam ligadas ao ganho de ouro, torres conquistadas, abates e

    as mortes do time. Em alguns dos padrões encontrados até o tempo do jogo influenciou

    nesta vitoria. Na regra R210 da tabela Tabela 6 é apresentado o subgrupo com maior

    cobertura que ilustra as caracteŕısticas mais recorrentes, e na regra R0 do mesmo beam é

    posśıvel ver outras caracteŕısticas que a região apresentou.

    Tabela 6: Subgrupo com melhor cobertura EULCS - 2018

    Subgrupo g sig

    R2 EULCS2017 Torres derrubadas pelo time maior que 6 E 64 99.95%

    Torres derrubadas pelo time adversário me-

    nor ou igual a 8 E

    Total de ouro gasto menor ou igual a 84462.5

    R0 EULCS2017 Ganho de ouro maior que 1146.5 E 64 99.95%

    Mortes menor ou igual a 19 E

    Abates do time menor ou igual a 31 E

    Abates de Barão de Nasho’r menor ou igual

    a 2 E

    Torres derrubadas pelo time diferente de 5Os subgrupos são induzidos a partir de conjuntos de caracteŕısticas diferentes com valores de

    parâmetros g correspondentes aos dados na coluna g. A última coluna Sig contém informações sobre a

    significância das regras calculadas pelo teste X2.

    10R nas tabelas referem-se as regras contidas nos subgrupos.

  • 33

    O ganho de ouro e a derrubada de torres são padrões muito comuns por serem

    objetivos principais de vitória. Porém, em 2017 outras caracteŕısticas como a quantidade

    de abates foi muito presente nessa região. Os times que conseguiam mais abates e entrega-

    vam menos mortes obtinham as vitórias, além disso, foi posśıvel ver também objetivos de

    mapa como o Barão de Nasho’r. Esta caracteŕıstica não foi muito recorrente, aparecendo

    somente em alguns dos subgrupos, o que mostra que nesse ano não era um grande foco da

    região. O subgrupo escolhido como interessante para esta região em 2017 pelo espacialista

    é apresentado na Tabela 7.

    Tabela 7: Subgrupo - Especialista - EULCS ano 2017

    Subgrupo g sig

    R0 EULCS2017 Ganho de ouro por minuto maior que

    1146.59 E

    52 99.98%

    Mortes menor ou igual a 19 E

    Dragão ancião feito pelo adversário menor

    ou igual a 0.0 E

    Tempo de jogo menor ou igual a 53.3 E

    Ouro aos 10 minutos do time adversário

    menor ou igual a 16937.5

    O que foi analisado neste subgrupo escolhido foi que, para conquistar as vitórias

    as equipes tiveram caracteŕıstica que mostraram alto foco na obtenção de recursos por

    abates. As equipes morriam muito quando considerado que uma equipe hoje em ligas de

    alto ńıvel entregam menos que 10 abates. Os dragões anciãos, que para aquele ano era

    uma novidade no campeonato, era um fator de virada de jogo então as equipes vitoriosas

    dependiam da não execução do mesmo pelo oponente. E, por fim o jogo detinha uma longa

    duração, quando se comparado a partidas mais recentes onde um jogo chega a terminar

    aos 40 minutos. Os jogos eram mais longos e tinham mais abates, a execução de objetivos

    como arauto, dragões elementais e barão não foram um fator de vitória encontrada como

    padrão pelo algoritmo. Já objetivos ligados a derrubadas de torres e ganho de ouro foram

    bastantes encontrados, visto que uma equipe só alcança a vitória se derrubar no mı́nimo

    cinco torres e o nexus.

    A Figura 5 apresenta um gráfico com a quantidade de vezes que uma caracteŕıstica

  • 34

    foi escolhida nos subgrupos, para o ano de 2017. Através dela, é posśıvel ver que as

    caracteŕısticas que foram mais recorrentes são a queda de torres e o ganho de ouro,

    sendo apresentados como opptowerkills e earnedgpm11 receptivamente. Com isto, pode-

    se perceber que as caracteŕısticas referentes a derrubada de torres, que influenciou na

    construção dos subgrupos do ano de 2017, corresponde ao quanto o oponente obteve.

    Figura 5: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, EULCS2017.

    Já no ano de 2018 a região da Europa apresentou uma mudança no quesito de

    abates. Deixou de ser um padrão recorrente a quantidade de abates ou mortes do time,

    e a região apresentou mais foco em objetivos de mapa como torres e monstros neutros.

    Segundo os resultados obtidos, os times da Europa em 2018 buscaram suas vitórias exe-

    cutando o mapa e não buscando lutas. No ano de 2018 houveram muitas mudanças em

    objetivos como Barão Nashor, dragões elementais e dragões anciões e ao que é demons-

    trado os objetivos se tornaram mais importantes assim. Através do subgrupo com melhor

    cobertura é posśıvel apresentado na regra R2 da Tabela 8 pode ser visto o foco no abate

    de monstros neutros que se caracteriza como objetivo de mapa.

    11Descrição das caracteŕısticas são apresentadas no dicionário do Apêndice A

  • 35

    Tabela 8: Subgrupo com melhor cobertura EULCS - 2018

    Subgrupo g sig

    R2 EULCS2018 Torres derrubadas pelo time maior que 7

    E

    59 99.73%

    Torres derrubadas pelo time adversário

    menor ou igual a 7 E

    Monstros neutros abatidos menor ou igual

    a 313

    A mudança não indica que padrões como ganho de ouro tenham sáıdo, pois, o

    abate de monstros neutros no league of legends gera ouro para que seja convertido em

    itens que deem vantagem ao jogador na partida. Após a análise do especialista, ele viu

    que a região em 2018 ainda assim apresentava caracteŕısticas iguais ao do ano anterior,

    mas com uma diminuição no foco em abates. Isto é posśıvel ser visto na Tabela 9, que é

    o subgrupo considerado mais interessante pelo especialista.

    Tabela 9: Subgrupo - Especialista - EULCS ano 2018

    Subgrupo g sig

    R1 EULCS2018 Torres derrubadas pelo time adversário

    menor ou igual a 6.5 E

    60 99.74%

    Ganho de ouro por minuto maior que

    1062.89 E

    Abates por minuto maior que 0.18 E

    Torres Derrubadas pelo time maior que 5

    O subgrupo escolhido para o ano de 2018 demonstra muito dessa mudança. Pode-

    se ver que as equipes focaram mais em torres e ganho de recursos e menos nos abates. Os

    resultados encontrados indicam que os times morreram menos e buscaram menos abates

    onde não é visto nenhum padrão indicando numero de mortes ou abates elevados como

    ocorria para o ano de 2017.

    O gráfico apresentado na Figura 6, condiz com as caracteŕısticas mais escolhidas

    pelos subgrupos no ano de 2018. Diferente de 2017, este gráfico apresenta uma maior

    influência das derrubadas de torres do próprio time como um padrão, sendo visto como

  • 36

    teamtowerskills. E além desta caracteŕıstica, outra muito recorrente foi a de abates por

    minuto, apresentada como kpm. Estas caracteŕısticas apareceram no subgrupo de escolha

    do especialista e no de melhor cobertura dos dados. Isto mostra que elas influenciaram

    na construção das regras nos subgrupos e foram caracteŕısticas relevantes da região.

    Figura 6: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, EULCS2018.

    Como foi posśıvel observar entres os resultados dos dois anos, as equipes da Europa

    tiveram uma mudança na forma em como jogam o mapa. As partidas deixando de ser tão

    focadas em abastes e jogos longos e se tornando jogos pouco mais focados em executar

    objetivos de mapa. No ano de 2018, após três anos sem a EULCS chegar entre os quatro

    melhores, a região conseguiu uma vaga na final terminando em segundo colocado dentre

    os times. Esta mudança ainda que não sendo tão grande, pois, ainda houve indicação do

    uso de abates para vitória, forram suficiente para caracterizar a melhora que a região teve

    no mundial.

    O especialista observou que a região Europeia conseguiu ter uma mudança relevante

    nos anos de 2017 e 2018. Onde, as equipes vitoriosas deixaram de ter um grande foco na

    vitória através de abates e focou, em 2018, mais em objetivos neutros de mapa. Além

    disto, foi viśıvel que a região ainda em 2017 já tinha um pequeno foco em objetivos de

    mapa, e visão de jogo.

    5.3 Campeonato Norte-Americano de League of Legends - NA LCS

    A liga Norte-Americana de league of legends (NALCS) é muito conhecida por

    usarem em seus times muito jogadores coreanos. Estes jogadores acabam por acrescentar

    aos time bastante experiencia e tática de jogo. Assim como a liga europeia a liga Norte-

  • 37

    Americana também conseguiu nos mundiais mais recentes obter uma colocação entre os

    oito melhores times. Com o intuito de encontrar as caracteŕısticas que melhoraram nos

    dois últimos anos para terem alcançado o terceiro lugar no mundial de 2018 quando em

    2017 somente alcançaram o oitavo lugar.

    A NALCS apresentou caracteŕısticas que indicaram que em 2017 as equipes que

    obtiveram vitoria conseguiam bastantes abates, morreram muito, mas focavam em obter

    objetivos de principais como torres para assim equilibrar o ouro obtido. Na regra R2 da

    Tabela 10 é apresentado o subgrupo com melhor cobertura. Nele é posśıvel ver como

    os abates influenciaram em seus resultados, vistos como assistências. Na regra R1 do

    mesmo beam é posśıvel ver padrões diferentes dos mais recorrentes, como monstros neutros

    abatidos e mortes da equipe. Estes padrões influenciaram no ganho de ouro da equipe

    aliada e adversaria, então são padrões que implicam em ganho de ouro. Além de ter sido

    posśıvel ver o foco em abates de monstro neutro que se caracteriza em objetivo de mapa,

    também é visto a tirada desse objetivo do time adversário.

    Tabela 10: Subgrupo com melhor cobertura NALCS - 2017

    Subgrupo g sig

    R2 NALCS2017 Torres derrubadas pelo time adversário

    menor ou igual a 7 E

    96 99.99%

    Assistências diferente de 7

    R1 NALCS2017 Ganho de ouro por minuto maior que

    1164.94 E

    96 99.99%

    Torres derrubadas pelo time diferente de

    5 E

    Mortes do time menor ou igual a 22 E

    Monstros neutros abatidos pela selva do

    time adversário maior que 4.5 E

    Mortes do time diferente de 16

    Após a análise dos resultados pelo especialista, observou-se que o subgrupo com

    maior relevância indicava foco em abates, ganho de ouro e derrubada de torres. Na Tabela

    11 é apresentado o subgrupo escolhido pelo especialista.

  • 38

    Tabela 11: Subgrupo - Especialista - NALCS ano 2017

    Subgrupo g sig

    R0 NALCS2017 Ganho de ouro por minuto maior que

    1166.66 E

    96 99.99%

    Torres derrubadas pelo time maior que 6

    E

    Mortes menor ou igual que 22 E

    Mortes do time diferente de 16

    Assim como visto, o subgrupo mostra que as equipes no ano de 2017 mesmo en-

    tregando uma alta quantidade de abates conseguiam obter a vitória. Basicamente apesar

    de as equipes morrerem muito, ainda assim conseguiam através de recursos dos principais

    voltar para o jogo e obter a vitória. Porém, visto que a morte é recurso para a equipe

    adversaria pode-se entender que o jogo dependia de quem conseguisse converter isso em

    torres. Estas são caracteŕısticas que também foram vistas em outras regiões, e que acabam

    por ser padrões recorrentes do ano.

    Na Figura 7 é apresentado as caracteŕısticas mais escolhidas nos subgrupos do ano

    de 2017, sendo visto grande influência do abate de torres pelo time na construção das

    regras. Porém, assim como na região da Europa, a derrubadas de torre pelo oponente

    também foi uma caracteŕıstica comum. Mas nesta região, a quantidade de abates foi

    selecionada em muitas regras, sendo visto no subgrupo de escolha do especialista e de

    maior cobertura dos dados, no gráfico apresentado como d.

    Figura 7: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, NALCS2017.

  • 39

    Já no ano de 2018 na NALCS os resultados demonstraram que a região passou

    a focar mais em grandes objetivos como dragões e também em obtenção de ouro em

    monstros neutros, mas também continuo um amplo foco nos abates. Então a região

    não demonstrou ter uma grande mudança, com caracteŕısticas semelhantes as do ano

    anterior. Na Tabela 12 a regra R2 representa o subgrupo com melhor cobertura de 2018

    e que tem as caracteŕısticas anteriormente ditas. A regra R0 do mesmo beam apresenta

    caracteŕısticas de objetivo de mapa, que também foram vistas no ano de 2017, porém,

    em 2018 apresentou um maior foco neles. O que coincide com as mudanças obtidas nos

    subgrupos de 2018 em todas as regiões.

    Tabela 12: Subgrupo com melhor cobertura NALCS - 2017

    Subgrupo g sig

    R2 NALCS2018 Torres derrubadas pelo time adversário

    menor ou igual a 6 E

    100 99.97%

    Assistências maior que 13 E

    Mortes do time menor o igual a 17

    R0 NALCS2018 Ganho de ouro por minuto maior que

    1140.24 E

    100 99.97%

    Torres derrubadas pelo time adversário

    menor ou igual a 8 E

    Mortes menor ou igual a 18 E

    Abates por minuto maior que 0.13 E

    Monstros neutros abatidos na selva do

    time menor ou igual a 218.5

    Foi observado pelo especialista que a região não teve muitas mudanças,e que o foco

    em objetivos principais de mapa foi mais prioritário pelas equipes. Isso é apresentado na

    Tabela 13 com a escolha do subgrupo com maior relevância do especialista.

  • 40

    Tabela 13: Subgrupo - Especialista - NALCS ano 2018

    Subgrupo g sig

    R1 NALCS2017 Ganho de ouro por minuto maior que

    1189.38 E

    84 99.89%

    Torres derrubadas pelo time maior que 6

    E

    Total de ouro obtido menor ou igual a

    103406

    Este subgrupo demonstra um foco maior no ouro e objetivos principais, onde um

    grande ganho e uso desse ouro era convertido em objetivos principais para que as equipes

    alcançassem a vitória, além desse subgrupo que mostra um foco claro nos objetivos prin-

    cipais de vitória, o algoritmo para este ano também conseguiu encontrar os padrões que

    demonstraram que as equipes também focassem nos objetivos de mapa como dragões e

    distribuição destes recursos, na Tabela 14 é posśıvel ver o subgrupo que demonstra este

    outro foco que as equipes tomaram.

    Tabela 14: Subgrupos - Demonstração - NALCS ano 2018

    Subgrupo g sig

    R2 NALCS2017 Ganho de ouro por minuto maior que

    1145.65 E

    84 99.89%

    Torres derrubadas pelo time adversario

    menor ou igual a 8 E

    Mortes menor ou igual a 18 E

    Abates por minuto maior que 0.14 E

    Total de ouro gasto menor ou igual a

    98074.5 E

    Dragão da terra menor ou igual a 2

    É posśıvel ver que além dos abates e mortes que as equipes detinham um fator

    que acabou sendo encontrado foram dragões elementais. O que neste subgrupo mostra é

    o da terra, este dragão especificamente dá mais dano em objetivos como torre e dragões,

    arautos e barões. Claro que no jogo os dragões aparecem de forma aleatória, e que o

  • 41

    aparecimento de dois elementais iguais é um fator de sorte e um foco bom a ser obtido

    para se conseguir a vitoriar.

    Assim como foi visto no subgrupo de escolha do especialista e de maior cobertura

    dos dados, as caracteŕısticas mais escolhidas apresentadas na Figura 8 mostram que se

    perdeu o foco em abates. Houve uma maior aparição de dragões da montanha feitos

    (apresentados como earthdrakes) como uma caracteŕıstica nos subgrupos. A partir disto,

    é posśıvel ver que assim como foi analisado nos subgrupos, a escolha das caracteŕısticas

    também mostrou um maior foco em objetivos de mapa pela região no ano de 2018.

    Figura 8: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, NALCS2018.

    É viśıvel que entre os anos de 2017 e 2018 não ouve uma grande mudança, o

    especialista pontuou isto como uma caracteŕıstica da própria região. Os abates e mortes

    na região foi um recurso de ganho de vantagem sobre os adversários. Ele também mostrou

    que apesar de ter continuado este foco no ano de 2018 as equipes também focaram em

    objetivos neutros de mapa assim como nas demais regiões. Este fato, ele aponta como

    um motivo de melhora das esquipes Norte-Americanas no mundial deste ano, conseguindo

    melhores colocações que no ano anterior.

    5.4 Campeonato Coreano de League of legends - LCK

    A liga Coreana de league of legends (LCK), remete a coreia do sul, liga que detém

    maior parte dos t́ıtulos mundiais tendo conquistado cinco das oito edições mundiais ocorri-

    das até aqui. Sendo considerada a região mais forte, esta região revelou grandes jogadores

    e grandes times, que acabaram por ser contratados por times de outras regiões como Bra-

    sil. Um dos times que mais conquistaram t́ıtulos desta região foi a South Korean Telecom

  • 42

    Team 1 ou SK Telecom T1, que obteve 3 t́ıtulos dos cinco mundiais alcançados pela liga.

    No último ano a liga teve uma grande queda, onde os times não conseguiram alcançar

    as semifinais do mundial de 2018. Com intuito de entender quais padrões a liga tinha e

    quais deixaram de ter o algoritmo foi utilizado para os dados da LCK do ano de 2017 e

    2018.

    Nesta região uma caracteŕıstica muito recorrente foi o posicionamento de sentinelas

    viśıveis e inviśıveis, e a participação do suporte no posicionamento delas. Estes padrões

    são apresentados na regra R1 na Tabela 15 e na regra R0 é posśıvel ver que a participação

    do suporte na colocação destas sentinelas. A partir disto é aceitável dizer que o posicio-

    namento de sentinelas pelos suportes influenciaram nas partidas da liga coreana de forma

    positiva.

    Tabela 15: Subgrupo com melhor cobertura LCK - 2017

    Subgrupo g sig

    R1 LCK2017 Torres derrubadas pelo time adversário

    menor ou igual a 6 E

    88 99.92%

    Mortes diferente de 16 E

    Sentinelas viśıveis diferente de 62

    R0 LCK2017 Ganho de ouro por minuto maior que

    1190.08 E

    88 99.92%

    Torres derrubadas pelo time adversário

    menor ou igual a 10 E

    Sentinelas viśıveis posicionadas diferente

    de 67 E

    Torres derrubadas pelo time adversário di-

    ferente de 9 E

    Participação do suporte nas sentinelas po-

    sicionadas menor ou igual a 44%

    Assim como nas outras regiões, a liga Americana também possúıa abates e mortes

    como caracteŕısticas recorrentes em 2017. O que indica que naquele ano o meta12 consistiu

    12É o estilo de jogo que ao longo do tempo (peŕıodo curto ou longo) se mostra melhor que os outros

    por ser mais efetivo.

  • 43

    em abates para se alcançar a vitória. Essa diferença encontrada na liga coreana em 2017

    demonstrar ser um dos motivos da região ter tido os times mais fortes, e obtido o t́ıtulo do

    campeonato mundial daquele ano. A escolha de subgrupo do espacialista foi mais focada

    nos objetivos principais em game e é posśıvel ser vista na Tabela 16.

    Tabela 16: Subgrupo - Especialista - LCK ano 2017

    Subgrupo g sig

    R2 LCK2017 Ganho de ouro por minuto maior que

    1215.06 E

    08 99.83%

    Mortes menor ou igual a 15

    Este subgrupo escolhido mostra grande foco no ganho de recursos e poucas mortes

    para vitórias. É um subgrupo simples que mostra objetivos prioritários de vitória na liga.

    Uma observação do especialista para o ano de 2017 é que para este ano a liga coreana

    vinha com um foco de visão tremendo onde os times brigavam mais para obter visão no

    mapa do que chegavam a ir atrás de abates. O foco era tão alto que chegava ao ponto de

    um time posicionar sentinelas em vários pontos do mapa e o time oponente chegar lá e

    retirar para pôr as de sua equipe. O time que conseguia ter um melhor posicionamento

    de sentinelas e obter mais visão, conseguia converter isto em vitória.

    O gráfico de quantidade de seleção das caracteŕısticas pelos subgrupos, apresentado

    na Figura 9, mostra que o abate de torres pelo oponente, ganho de ouro e sentinelas

    posicionadas foram as que mais apareceram nas regras dos subgrupos. Apresentadas como

    opptowerkills, earnedgpm e visionwards respectivamente, essas caracteŕısticas também

    foram vistas no subgrupo de maior cobertura dos dados, sendo assim vistas como as mais

    relevantes na construção dos subgrupos de 2017 na região da Coreia.

  • 44

    Figura 9: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, LCK 2017.

    No ano de 2018 os resultados obtidos pelo algoritmo mostraram que o posiciona-

    mento de sentinelas deixou de ser um fator comum de vitória na liga coreana. O subgrupo

    com melhor cobertura apresentou a perca do foco no posicionamento de sentinelas, que

    resultou na diminuição do domı́nio de visão que a região detinha quando foi campeã. A

    regra R2 na Tabela 17 apresenta o subgrupo com melhor cobertura, e este mostra padrões

    que também foram vistos nas outras regiões. Isto indica que a região coreana começou a

    se equiparar com as outras regiões top 4 no mundial de 2018. O motivo encontrado da

    queda de rendimento na região através dos padrões obtidos nos subgrupos com melhor

    cobertura foi esta equiparação em objetivos com as outras regiões.

    Tabela 17: Subgrupo com melhor cobertura LCK - 2018

    Subgrupo g sig

    R2 LCK2018 Torres derrubadas pelo time maior que 6

    E

    85 99.99%

    Mortes menor ou igual a 13 E

    Torres derrubadas pelo time adversario

    menor ou igual a 9 E

    Tempo para derrubar a primeira torre me-

    nor ou igual a 22.87 E

    Experiencia ganha aos 10 minutos maior

    que 17439.5 E

    Participação do atirador nas sentinelas co-

    locadas maior que 5%

  • 45

    Essa equiparação da liga coreana com as outras, resultou em equipes como a SK

    Telecom T1 não conseguir da fase eliminatória do mundial de 2018, depois de 12 etapas

    sempre se classificando. Com a análise do especialista é posśıvel ver também mais das

    caracteŕısticas que indicaram esse nivelamento dos padrões das regiões. A Tabela 18

    apresenta o subgrupo considerado mais relevante pelo especialista para o ano de 2018.

    Tabela 18: Subgrupo - Especialista - LCK ano 2018

    Subgrupo g sig

    R2 LCK2017 Torres derrubadas pelo time maior que 6

    E

    76 99.99%

    Mortes menor ou igual a 13 E

    Torres derrubadas pelo time adversário

    menor ou igual a 7 E

    Experiencia ganha aos 10 minutos maior

    que 17439.5 E

    Participação do atirador nas sentinelas co-

    locadas maior que 5%

    Este subgrupo mostra novamente que a região focou menos em posicionamento de

    sentinelas, e focou mais em abates, torres, ganho de ouro e experiencia. Esta mudança

    efetivou em uma grande queda da região que foi vista nos resultados do mundial de league

    of legends de 2018, onde nos anos anteriores as equipes desta região obtiveram os t́ıtulos.

    Assim como visto nos subgrupos do ano de 2018, a quantidade de caracteŕısticas

    selecionadas, relacionado a posicionamento de sentinela caiu bastante. Por outro lado,

    as mais presentes foram de abates de torres, quantidade de mortes do time e tempo de

    derrubada de torres, isto é apresentado na Figura 10. O que mostra que houve uma queda

    na relevância do posicionamento de sentinelas na construção dos subgrupos para o ano

    de 2018, que havia no ano de 2017.

  • 46

    Figura 10: Gráfico - Quantidade de seleção das caracteŕısticas nos subgrupos, LCK 2018.

    O especialista observou que na região da coreia, as equipes no ano de 2017 detinham

    uma grande superioridade no mundial, e na sua região tinha caracteŕısticas mais focadas

    na visão de mapa, como: posicionamento e participação no posicionamento de sentinelas.

    Este padrão da região não se repetiu para o ano seguinte, que coincidiu com a queda de

    desempenho das equipes no mundial. A região passou a focar em objetivos de mapa como

    as demais.

    5.5 Disposições Finais

    Através das análises realizadas foi posśıvel analisar que o número de abates foi

    uma influência constante em todas as regiões no ano de 2017, que difere de 2018 por ter

    objetivos de mapa como influente. Isto acontece, pois, no jogo ocorrem mudanças de meta

    que por vezes diminui a importância de algo no jogo, como o tempo da queda de torres

    e dos abates. Cada região apresentou caracteŕısticas próprias, e algumas bem próximas

    das outras como a Europa e a América do Norte. Estes fatores foram também analisados

    por um especialista que, como já apresentado anteriormente, foi coach de uma equipe

    universitária de league of legends.

    Com a descoberta de padrões através da mineração de subgrupos foi posśıvel reali-

    zar uma análise criteriosa das caracteŕısticas em partidas vitoriosas. Esta análise demons-

    trou que seus resultados inferiam em caracteŕısticas de meta de jogo, região e objetivos

    principais. Sendo posśıvel identificar uma força que uma região tinha, e não se repetia

    nas outras. A ajuda de um especialista da área dos dados foi significativo para validar

    os resultados obtidos pelos algoritmos. Com a validação dos resultados foi medido qual

    a precisão dos algoritmos utilizados, os seus resultados demonstraram para o especialista

  • 47

    grande valor de estudo. Através dele foi entendido o porquê de uma região forte como a

    coreia ter cáıdo de rendimento em 2018, e de como todas as regiões se equipararam no

    mesmo ano em valores caracteŕısticos.

  • 48

    6 CONCLUSÃO E TRABALHOS FUTUROS

    Este trabalho mostrou a utilização de uma técnica da mineração de dados no es-

    porte eletrônico com o intuito de buscar padrões significativos. A mineração de subgrupos

    foi aplicada a um conjunto de dados de torneios de league of legends utilizando um es-

    pecialista para validar seus resultados. Realizou-se a busca de padrões de caracteŕısticas

    em partidas vitoriosas de torneios de três regiões, escolhidas a partir de colocação das

    equipes. A análise dessas caracteŕısticas tinha como proposito encontrar motivos das

    regiões serem fortes em relação a outras, e o porquê de ter uma queda de desempenho.

    Além disto, também buscou-se encontrar padrões que pudessem ser usados no esporte

    eletrônico e fossem validados através de um especialista. Os algoritmos SD, RSS e DMS

    foram disponibilizados em pseudocódigo e implementados neste trabalho em python, e os

    algoritmos de geração de features e beam’s foram iniciados pelo Professor Renato Vimieiro

    e conclúıdos neste trabalho.

    A união da mineração de dados com o esporte eletrônico se mostra eficaz, pois, os

    dados gerados em seus jogos são disponibilizados de forma simples para serem estudados.

    Além disto, por se tratar de uma nova área abre a possibilidade de utilizar novas ferra-

    mentas para melhoria de desempenho e apoio em tomadas de decisões pré jogo. O estudo

    de dados vem crescendo e se tornando cada vez mais importante na tomada de decisões, e

    a utilização de analista de equipe em um time de esporte eletrônico vem se tornando cada

    vez mais comum. Esta análise pode também ser feita com base em estudos por técnicas de

    ciência dos dados podendo prover como uma nova grande área a ser explorada e utilizada

    como temas de estudo.

    Com o resultado obtido foi posśıvel ver caracteŕısticas que indicaram padrões do

    meta do ano em torneios de league of legends, que demonstraram que equipes vitoriosas

    seguiam um estilo de jogo igual. Além disto, são viśıveis padrões que indicaram motivos

    das equipes coreanas em 2017 ter tanta superioridade em relações as outras. Onde foi

    mostrado que as equipes focaram em posicionamento de sentinelas e as outras regiões

    em abates. Também foi viśıvel que no ano de 2018 as equipes coreanas perderam seu

    foco em posicionamento de sentinelas, e assim como as outras regiões focaram os obter

    recursos através de objetivos de mapa, como monstros neutros, dragões, arauto e barões.

    Com a análise do especialista, foi posśıvel validar que as caracteŕısticas obtidas através

  • 49

    dos algoritmos demonstraram ser úteis. Em resposta o especialista demonstrou grande

    interesse no que os resultados demonstraram. Onde foi posśıvel ver que cada liga tinha

    seu próprio estilo de jogo, sendo também viśıvel o meta de visão que as equipes coreanas

    tinham em 2017.

    6.1 Dificuldades e lições aprendidas

    A etapa que demonstrou ter maior dificuldade foi na execução dos algoritmos,

    apesar de os conjuntos de dados não serem de fato tão grandes os algoritmos demoraram

    cerca de um mês para que fossem completamente executados. Isto aconteceu devido ao

    algoritmo SD ser um algoritmo de busca exaustiva, conhecidos como algoritmo guloso

    (que expande toda uma árvore de possibilidades para que se alcance o melhor resultado).

    A dependência dos resultados para a análise deles foi grande, e foi preciso dispor de

    tempo para o especialista realizar as análises e retornar suas escolhas de subgrupos com

    as observações.

    Uma das lições aprendidas neste trabalho, é que de fato com tempo, um conjunto

    de dados adequadamente formatado e a utilização de técnicas de mineração de dados é

    posśıvel encontrar caracteŕısticas que possam ser de grande valor. E venham a ser usadas

    como ponto de referência na busca de melhora de desempenho ou tomada de decisões.

    Assim como havia o interesse neste trabalho de ver se tinha possibilidade dos padrões

    encontrados serem de utilidade de técnicos ou analistas de esporte eletrônico.

    6.2 Trabalhos futuros

    Neste trabalho o tratamento realizado nos dados teve o viés de obter resultados

    principais das equipes e algumas participações individuais dos jogadores. Poderia ser

    observada outras caracteŕısticas de jogadores, porém, que necessitaria de mais tempo para

    poder cobrir todo o escopo necessário para isto. Foi imposta uma limitação das melhores

    equipes colocadas no mundial, onde não foi posśıvel a utilização da liga chinesa a LPL,

    pois, seus dados disponibilizados pela Oraclre’s elixir não estavam completos devido à

    região não permitir divulgação de diversos atributos dos jogos realizados por ela.

    Como posśıveis trabalhos futuros, pode-se apontar a utilização de um conjunto de

    dados completo que disponibilize todas as regiões com mais caracteŕısticas individuais de

  • 50

    jogadores. A utilização do algoritmo SD com outra técnica de mineração de dados para

    se avaliar seus resultados. E também um acesso a um maior número de especialista com

    um maior contato para que se tenha um amplo número de validação dos resultados do

    algoritmo e observações.

  • 51

    REFERÊNCIAS

    [1] GAMBERGER, D.; LAVRAC, N. Expert-guided subgroup discovery: Methodology

    and application. Journal of Artificial Intelligence Research, v. 17, p. 501–527, 2002.

    [2] Pedro Cipoli.

    [3] Wikipedia. Esporte eletrônico. Available at: . Accessed in: 26/05/2019.

    [4] LIMA, L. F. Bem-vindo a Summoner’s Rift! Conheça o mapa competi-

    tivo do LoL. Available at: . Accessed

    in: 18/05/2019.

    [5] ORACLES Elixir. Available at: . Accessed in:

    27/05/2019.

    [6] CARMONA, C. J. et al. Fuzzy rules for describing subgroups from Influenza A virus

    using a multi-objective evolutionary algorithm. Applied Soft Computing, v. 13, n. 8, p.

    3439–3448, 2013.

    [7] KLÖSGEN, W. Explora: A multipattern and multistrategy discovery assistant. In:

    AMERICAN ASSOCIATION FOR ARTIFICIAL INTELLIGENCE. Advances in kno-

    wledge discovery and data mining. [S.l.], 1996. p. 249–271.

    [8] WROBEL, S. An algorithm for multi-relational discovery of subgroups. In: SPRIN-

    GER. European Symposium on Principles of Data Mining and Knowledge Discovery.

    [S.l.], 1997. p. 78–87.

    [9] RODRIGUEZ, D. et al. A study of subgroup discovery approaches for defect predic-

    tion. Information and Software Technology, Elsevier, v. 55, n. 10, p. 1810–1822, 2013.

    [10] CARMONA, C. J. et al. An analysis on the use of pre-processing methods in evoluti-

    onary fuzzy systems for subgroup discovery. Expert Systems with Applications, Elsevier,

    v. 39, n. 13, p. 11404–11412, 2012.

  • 52

    [11] CARMONA, C. J. et al. A fuzzy genetic programming-based algorithm for subgroup

    discovery and the application to one problem of pathogenesis of acute sore throat

    conditions in humans. Information Sciences, Elsevier, v. 298, p. 180–197, 2015.

    [12] KNOBBE, A. et al. Sports analytics for professional speed skating. Data Mining and

    Knowledge Discovery, Springer, v. 31, n. 6, p. 1872–1902, 2017.

    [13] FAYYAD, U. M.; IRANI, K. B. On the handling of continuous-valued attributes

    in decision tree generation. Machine Learning, v. 8, n. 1, p. 87–102, Jan 1992. ISSN

    1573-0565. Available at: .

  • 53

    Appendices

  • 54

    A DICIONÁRIO DOS DADOS

    Tabela 19: Dicionario Atributos dos Conjuntos de dados

    Atributo Descrição

    side Lado que o time jogou (Azul, Vermelho)

    gamelength Tempo de jogo em minutos e segundos.

    result Resultado do jogo (0 - derrota, 1 - vitoria)

    k Total abates

    d Total mortes

    a Total assistencias

    teamkills Total abates do time

    teamdeaths Total mortes do time

    fb Tempo do prim