image.png

Uma análise sobre a maior comunidade de Board Games do mundo (BoardGameGeek)

Por Rômulo F. Filho

Como muito bem exemplificou o SP TV da Rede Globo, nos últimos anos os jogos de tabuleiro tem se diversificado tanto em variedade de temas quanto em complexidade de sistemas. Dos tradicionais Jogo da Vida e Banco ImobiliÔrio, passando por clÔssicos como Catan e Carcassone, até chegar a jogos extremamente complexos com partidas que duram vÔrias horas, como Gloomhaven ou War of the Rings.

Com um universo de possibilidades que cresce mais a cada dia, os "Boardgamers" se organizaram em comunidades tanto locais ao redor de luderias quanto online. No Brasil, a mais famosa Ć© a Ludopedia, que segue o formato do BoardGameGeek (BGG), a maior rede social de jogos de tabuleiro do mundo.

Dessa forma, busco com este trabalho analisar um conjunto de dados do BGG disponĆ­vel no Kaggle e responder as seguintes perguntas:

  1. Quais os jogos mais bem avaliados?
  2. Quem são os melhores Game Designers?
  3. O que define um bom jogo de tabuleiro?
  4. Qual a influĆŖncia da dificuldade na nota?
  5. Existe uma quantidade ideal de jogadores que influencie na nota?

Baixe Aqui

Pré-processamento

Como o objeto de estudo desse trabalho são apenas jogos de tabuleiro vamos utilizar apenas as entradas do dataset cujo atributo game.type, que representa o tipo de jogo, é igual a boardgame. Assim podemos remover as expansões e possíveis erros.

Agora, vamos excluir jogos que não possuem data de publicação, pois o Board Game Geek possibilita que jogos não lançados sejam adicionados ao site. Normalmente, estes são jogos criados de forma amadora, modificações não oficiais ou protótipos de outros jogos. Também vamos remover todos os jogos que possuem menos de 10 avaliações.

O dataset disponibilizado inclui uma grande quantidade de dados que não serão úteis para responder as perguntas guia deste trabalho. Por isso, iremos remover algumas colunas. Começamos removendo as colunas do tipo polls que representam enquetes criadas nos fóruns do BGG. Também removemos as colunas do tipo family que representam a "família" do gênero do jogo e subtype, pois contém apenas informações secundÔrias e irrelevantes para este trabalho.

Esta célula é utilizada para investigar linhas específicas do dataset

No exemplo abaixo, podemos visualizar todos os jogos criados pelo game designer Stefan Feld, um dos mais conhecidos e renomados da indĆŗstria.

1. Quais são os jogos mais bem avaliados?

Iniciando a anĆ”lise direcionada as perguntas guia, vamos verificar que jogos estĆ£o no top 20 do BGG. Ɖ importante ressaltar que este conjunto de dados Ć© de 2017, ou seja, nĆ£o representa o top 20 atual do site.

O grƔfico nos mostra que Tournament at Camelot Ʃ o jogo mais bem avaliado atƩ o momento. A cƩlula abaixo nos mostra que o jogo era um lancamento recente de 2017 e, na Ʃpoca em que os dados foram coletados, apenas 34 usuƔrios tinham avaliado o jogo. Hoje, o jogo conta com mais de 900 avaliaƧƵes e sua nota mƩdia Ʃ de 7.2 pontos.

camelot

2. Quem são os melhores game designers?

Agora que sabemos os jogos melhor avaliados, vamos descobrir quem são os Game Designers queridinhos da comunidade do Board Game Geek. Para isso, vamos pegar a média das avaliações dos jogos de cada autor.

Em primeiro lugar, encontramos um grupo de autores, mas vamos reparar na nota mƩdia que seus jogos receberam: 9.41. Se compararmos com a nota do primeiro lugar dentre os jogos, vemos que trata-se do mesmo jogo. Vamos confirmar isso na cƩlula a seguir

3. O que define um bom jogo de tabuleiro?

Podemos verificar a correlação entre a nota do jogo, descrita por stats.average com os outros parâmetros, por exemplo, o nível de dificuldade stats.averageweight, a idade mínima details.minage e a quantidade mÔxima e mínima de jogadores, respectivamente stats.maxplayers e stats.minplayers.

Para essa anÔlise, iremos utilizar apenas os jogos que possuem mais de 100 avaliações, dessa forma, podemos remover jogos que tiveram poucos jogadores, ou seja, que não são tão relevantes para a comunidade em si ou são muito novos e ainda não estabilizaram seu lugar dentro do ranking.

Matriz de correlação

Avaliando a matriz de correlação acima, identificamos alguns padrƵes jĆ” esperados, por exemplo, a alta correlação entre o tempo de jogo dos usuĆ”rios, representado por details.playingtime, e os tempos mĆ­nimos e mĆ”ximos esperados, respectivamente details.minplaytime e details.maxplaytime. Ɖ interessante notar tambĆ©m a alta correlação entre a nota do jogo (stats.average) e sua dificuldade (stats.averageweight). Isso indica que, de acordo com a comunidade, jogos mais difĆ­ceis tendem ter notas mais altas.

Podemos ver que existe uma certa correlação entre a duração de uma partida e sua dificuldade. De fato, por experiência própria, posso dizer que jogos mais difíceis e complexos, ou seja, com valor de stats.averageweight alto, tendem a ter partidas bem mais longas que jogos mais simples, os chamados party games ou fillers. Também podemos identificar um grau de correlação entre a dificuldade do jogo e a idade mínima, o que jÔ é esperado, visto que crianças muito novas teriam dificuldades com jogos complexos, como Twilight Imperium e Mage Knight.

A dificuldade é tão importante assim?

De acordo com a matriz de correlação acima, jogos mais difíceis são os favoritos dos usuÔrios do BGG, mas, como podemos ver abaixo, eles não são a maioria! Na verdade, a maior parte dos jogos estÔ no nível de dificuldade considerado "Simples", entre 2 e 3.

4. Qual a influência da dificuldade na nota?

Vamos verificar a relação entre dificuldade e nota em cada jogo, assim poderemos descobrir se hÔ mesmo uma tendência dos jogos mais difíceis serem melhor avaliados.