image.png

Uma análise sobre a maior comunidade de Board Games do mundo (BoardGameGeek)

Por Rômulo F. Filho

Como muito bem exemplificou o SP TV da Rede Globo, nos últimos anos os jogos de tabuleiro tem se diversificado tanto em variedade de temas quanto em complexidade de sistemas. Dos tradicionais Jogo da Vida e Banco Imobiliário, passando por clássicos como Catan e Carcassone, até chegar a jogos extremamente complexos com partidas que duram várias horas, como Gloomhaven ou War of the Rings.

Com um universo de possibilidades que cresce mais a cada dia, os "Boardgamers" se organizaram em comunidades tanto locais ao redor de luderias quanto online. No Brasil, a mais famosa é a Ludopedia, que segue o formato do BoardGameGeek (BGG), a maior rede social de jogos de tabuleiro do mundo.

Dessa forma, busco com este trabalho analisar um conjunto de dados do BGG disponível no Kaggle e responder as seguintes perguntas:

  1. Quais os jogos mais bem avaliados?
  2. Quem são os melhores Game Designers?
  3. O que define um bom jogo de tabuleiro?
  4. Qual a influência da dificuldade na nota?
  5. Existe uma quantidade ideal de jogadores que influencie na nota?

Baixe Aqui

Pré-processamento

Como o objeto de estudo desse trabalho são apenas jogos de tabuleiro vamos utilizar apenas as entradas do dataset cujo atributo game.type, que representa o tipo de jogo, é igual a boardgame. Assim podemos remover as expansões e possíveis erros.

Agora, vamos excluir jogos que não possuem data de publicação, pois o Board Game Geek possibilita que jogos não lançados sejam adicionados ao site. Normalmente, estes são jogos criados de forma amadora, modificações não oficiais ou protótipos de outros jogos. Também vamos remover todos os jogos que possuem menos de 10 avaliações.

O dataset disponibilizado inclui uma grande quantidade de dados que não serão úteis para responder as perguntas guia deste trabalho. Por isso, iremos remover algumas colunas. Começamos removendo as colunas do tipo polls que representam enquetes criadas nos fóruns do BGG. Também removemos as colunas do tipo family que representam a "família" do gênero do jogo e subtype, pois contém apenas informações secundárias e irrelevantes para este trabalho.

Esta célula é utilizada para investigar linhas específicas do dataset

No exemplo abaixo, podemos visualizar todos os jogos criados pelo game designer Stefan Feld, um dos mais conhecidos e renomados da indústria.

1. Quais são os jogos mais bem avaliados?

Iniciando a análise direcionada as perguntas guia, vamos verificar que jogos estão no top 20 do BGG. É importante ressaltar que este conjunto de dados é de 2017, ou seja, não representa o top 20 atual do site.

O gráfico nos mostra que Tournament at Camelot é o jogo mais bem avaliado até o momento. A célula abaixo nos mostra que o jogo era um lancamento recente de 2017 e, na época em que os dados foram coletados, apenas 34 usuários tinham avaliado o jogo. Hoje, o jogo conta com mais de 900 avaliações e sua nota média é de 7.2 pontos.

camelot

2. Quem são os melhores game designers?

Agora que sabemos os jogos melhor avaliados, vamos descobrir quem são os Game Designers queridinhos da comunidade do Board Game Geek. Para isso, vamos pegar a média das avaliações dos jogos de cada autor.

Em primeiro lugar, encontramos um grupo de autores, mas vamos reparar na nota média que seus jogos receberam: 9.41. Se compararmos com a nota do primeiro lugar dentre os jogos, vemos que trata-se do mesmo jogo. Vamos confirmar isso na célula a seguir

3. O que define um bom jogo de tabuleiro?

Podemos verificar a correlação entre a nota do jogo, descrita por stats.average com os outros parâmetros, por exemplo, o nível de dificuldade stats.averageweight, a idade mínima details.minage e a quantidade máxima e mínima de jogadores, respectivamente stats.maxplayers e stats.minplayers.

Para essa análise, iremos utilizar apenas os jogos que possuem mais de 100 avaliações, dessa forma, podemos remover jogos que tiveram poucos jogadores, ou seja, que não são tão relevantes para a comunidade em si ou são muito novos e ainda não estabilizaram seu lugar dentro do ranking.

Matriz de correlação

Avaliando a matriz de correlação acima, identificamos alguns padrões já esperados, por exemplo, a alta correlação entre o tempo de jogo dos usuários, representado por details.playingtime, e os tempos mínimos e máximos esperados, respectivamente details.minplaytime e details.maxplaytime. É interessante notar também a alta correlação entre a nota do jogo (stats.average) e sua dificuldade (stats.averageweight). Isso indica que, de acordo com a comunidade, jogos mais difíceis tendem ter notas mais altas.

Podemos ver que existe uma certa correlação entre a duração de uma partida e sua dificuldade. De fato, por experiência própria, posso dizer que jogos mais difíceis e complexos, ou seja, com valor de stats.averageweight alto, tendem a ter partidas bem mais longas que jogos mais simples, os chamados party games ou fillers. Também podemos identificar um grau de correlação entre a dificuldade do jogo e a idade mínima, o que já é esperado, visto que crianças muito novas teriam dificuldades com jogos complexos, como Twilight Imperium e Mage Knight.

A dificuldade é tão importante assim?

De acordo com a matriz de correlação acima, jogos mais difíceis são os favoritos dos usuários do BGG, mas, como podemos ver abaixo, eles não são a maioria! Na verdade, a maior parte dos jogos está no nível de dificuldade considerado "Simples", entre 2 e 3.

4. Qual a influência da dificuldade na nota?

Vamos verificar a relação entre dificuldade e nota em cada jogo, assim poderemos descobrir se há mesmo uma tendência dos jogos mais difíceis serem melhor avaliados.