INSPIRE-SE: Todos os dados do Cartola FC desde 2014 até 2019 atualizadas

INSPIRE-SE: Todos os dados do Cartola FC desde 2014 até 2019 atualizadas

23 de agosto de 2018 0 Por Ramos de Souza Janones
Powered by Rock Convert
Do Zero ao Profissional com PHP. Mais de 2.300 alunos recomenda.Powered by Rock Convert

Já pensou em criar um aplicativo do Cartola FC que faz as previsões? Segundo o Google Trends futebol é a palavra mais pesquisada no Brasil. E o Cartola FC é um grande sucesso.

Atualizado em 13/05/2019.

Que tal pegar a onda e fazer um aplicativo sobre o tema? O Github do Henrique tem todos os dados e, inclusive, um programa de previsão em Python e R. 

Sugestão: Faça o seu App.

Upload filesFind fileHistory

 README.md

Essa pasta contém os dados de todo o histórico do Cartola organizados por ano. Cada pasta contém os dados sobre jogadores, partidas, times, scouts e uma descrição dos dados em cada arquivo. Na raiz dessa pasta, você vai encontrar os seguintes arquivos:

Leia também: Release do livro: Desenvolvedor Kotlin Android – Bibliotecas para o dia a dia

Essa pasta contém os dados de todo o histórico do Cartola organizados por ano. Cada pasta contém os dados sobre jogadores, partidas, times, scouts e uma descrição dos dados em cada arquivo. Na raiz dessa pasta, você vai encontrar os seguintes arquivos:

⭐️ 2018_dados_agregados.xlsx ⭐️

Estes são os dados agregados em Excel para os cartoleiros que estão familiarizados com Excel (Segredo: todos nós temos alma de planilheiros em alguma medida).

2017_dados_agregados.csv

Esse é o principal arquivo desse repositório. Ele tem todos os dados, de todos os anos, de todas as rodadas, e de todos os jogadores (ufa!). Cada linha representa os scouts de um jogador para uma rodada de um certo ano. Esses dados estão em formato bruto, ou seja, precisam ser limpos antes de serem utilizados. Há erros de inconsistência, presença de NANs, entre outras coisas, que já vêm da API do Cartola FC.

Porém, não se preocupe! Já fizemos o trabalho sujo para você! 💪 Temos um arquivo com os dados bem limpinhos só esperando suas análises. Lê aqui embaixo 👇 e não esquece de ler as observações desse README também.

dados_agregados_limpos.csv

Contém os dados agregados de forma limpa, isto é, dados prontos para você utilizar em suas análises. Nesse arquivo, nós garantimos que NÃO há erros de inconsistência nem dados sujosA menos que você encontre. Nesse caso, avise a gente, tá?😉

LEIA TAMBÉM:  Amazon Fire TV Stick: a melhor alternativa ao Chromecast

Quer saber como essa limpeza foi feita? Dá uma olhada aqui.

dados_agregados_amostras.csv

Contém as amostras utilizadas para o treinamento do modelo preditor de scores. Essas amostras já estão prontas para serem utilizadas para o treinamento de qualquer modelo de Machine Learning sem nenhum esforço adicional.

times_ids.csv

Contém os nomes e os ids de todos os times que já jogaram o brasileirão desde 2014. Você pode obter os dados do time que participaram do brasileirão em um determinado ano na sua pasta correspondente no arquivo [ANO]_times. Repare que em 2017, os ids de alguns times foram alterados. Mas não se preocupe, esse arquivo diz tudo para você.

Observações:

  • Todos os arquivos [ANO]_scouts_raw.csv dentro de cada pasta são arquivos brutos, que vêm diretamente da API do Cartola FC.
  • Os scouts de 2015 são cumulativos, ou seja, os scouts dos jogadores vão sendo somados a cada rodada. Entretanto, a pontuação não é. Isso também causa o repetimento de dados. O arquivo dados_agregados_limpos.csv nessa pasta já corrige esse problema para você.

Créditos:

Descrição dos arquivos dessa pasta

dados_agregados.csv & dados_agregados_limpos.csv

coluna descrição observações
Rodada número da rodada do Brasileirão
ClubeID clube do jogador ver arquivo times_ids.csv
AtletaID id do jogador
Participou indica se o jogador participou daquela rodada FALSE:Não, TRUE:Sim
Posicao posição do jogador gol:goleiro, zag:zagueiro, lat:lateral, mei:meia, ata:atacante, tec:técnico
Jogos qtde. de jogos que o jogador participou até aquela rodada
Pontos pontuação do jogador
PontosMedia média da pontuação do jogador
Preco preço do jogador
PrecoVariacao variação de preço
FS faltas sofridas
PE passes errados
A assistências
FT finalizações na trave
FD finalizações defendidas
FF finalizações para fora
G gols
I impedimentos
PP pênaltis perdidos
RB roubadas de bola
FC faltas cometidas
GC gols contra
CA cartões amarelo
CV cartões vermelho
SG jogos sem sofrer gols
DD defesas difíceis
DP defesas de pênalti
GS gols sofridos
ano ano dos dados
Apelido nome/apelido do jogador
Status status do jogador Provável, Dúvida, Suspenso, Nulo, …
avg.Points média de pontos do jogador
avg.last05 média de pontos do jogador nas últimas 5 rodadas
avg.FS média de faltas sofridas
avg.FS.l05 média de faltas sofridas nas últimas 5 rodadas
avg.PE média de passes errados
avg.PE.l05 média de passes errados nas últimas 5 rodadas
avg.A média de assistências
avg.A.l05 média de assistências nas últimas 5 rodadas
avg.FT média de finalizações na trave
avg.FT.l05 média de finalizações na trave nas últimas 5 rodadas
avg.FD média de finalizações defendidas
avg.FD.l05 média de finalizações defendidas nas últimas 5 rodadas
avg.FF média de finalizações para fora
avg.FF.l05 média de finalizações para fora nas últimas 5 rodadas
avg.G média de gols
avg.G.l05 média de gols nas últimas 5 rodadas
avg.I média de impedimentos
avg.I.l05 média de impedimentos nas últimas 5 rodadas
avg.PP média de pênaltis perdidos
avg.PP.l05 média de pênaltis perdidos nas últimas 5 rodadas
avg.RB média de roubadas de bola
avg.RB.l05 média de roubadas de bola nas últimas 5 rodadas
avg.FC média de faltas cometidas
avg.FC.l05 média de faltas cometidas nas últimas 5 rodadas
avg.GC média de gols contra
avg.GC.l05 média de gols contra nas últimas 5 rodadas
avg.CA média de cartões amarelos
avg.CV média de cartões vermelhos nas últimas 5 rodadas
avg.SG média de jogos sem sofrer gols
avg.SG.l05 média de jogos sem sofrer gols nas últimas 5 rodadas
avg.DD média de defesas difíceis
avg.DD.l05 média de defesas difíceis nas últimas 5 rodadas
avg.DP média de defesas de pênalti
avg.DP.l05 média de defesas de pênalti nas últimas 5 rodadas
avg.GS média de gols sofridos
avg.GS.l05 média de gols sofridos nas últimas 5 rodadas
risk_points desvio-padrão da pontuação do jogador
mes mês que a partida ocorreu
dia dia que a partida ocorreu
away.score.x placar to time visitante
home.score.x placar do time da casa
home.attack estimativa de força de ataque do time do jogador estimada a partir de uma regressão de Poisson com base no histórico de confrontos entre os times
home.defend estimativa de força de defesa do time do jogador estimada a partir de uma regressão de Poisson com base no histórico de confrontos entre os times
pred.home.score estimativa de gols para o time da casa estimada a partir de 10000 simulações de confronto entre os times usando distribuições de Poisson
pred.away.score estimativa de gols para o time visitante estimada a partir de 10000 simulações,de confronto entre os times usando distribuições de Poisson
variable indica se o jogador é do time da casa ou visitante home.team: casa, away.team: visitante
LEIA TAMBÉM:  Blue Ocean: o que é a estratégia do oceano azul?

dados_agregados_amostras.csv

Contém as mesmas colunas que os arquivos dados_agregados.csv e dados_agregados_limpos.csv, exceto Apelido, Status, Participou, dia e mes – uma vez que esses dados não são necessários para o treinamento do modelo.

times_ids.csv

coluna descrição observações
nome.cbf nome do time no site da CBF camel-case, com espaços, com acentos e com abreviações
nome.cartola nome do time no Cartola FC camel-case, sem espaços, com acentos e com abreviações
nome.completo nome do time completo camel-case, com espaços, sem acentos e sem abreviações
cod.older código do time no Cartola FC até 2017
cod.2017 código do time no Cartola FC a partir de 2017 ler esse README
id id do time id = cod.2017

Banco de dados

Artigos e dicas sobre banco de dados que você vai gostar:

MongoDB

– Principais diferenças entre MongoDB e MySQL ou outro RDBMS

– Southbank Software apresenta dbKoda: uma ferramenta de desenvolvimento Open Source para MongoDB

MySQL e Instruções SQL em geral

– SQL e Regex – Entenda quando e como usar em instruções SQL

– MySQL – Manter o formato Date e DateTime em formato dd/mm/Year e dd/mm/Year:HH:mm:ss

– SQL – O que são VIEWS SQL, vantagens e desvantagens

– Instrução Insert MySQL e JSON com todos os bancos brasileiros

– PHP e MySQL – Entendendo as codificações iso-8859-1 e UTF-8 e outras

– Como redefinir a senha de root do MySQL ou do MariaDB

– Para que serve uma MySQL Transaction?

– Banco de Dados – Índices desnecessários no banco são um problema?

– Entenda a diferença entre LIKE, IN e BETWEEN no MySQL

– LinkedIn desenvolve a ferramenta MySQL Query Analyzer

– Como otimizar consultas MySQL

– Quando é interessante desnormalizar o banco de dados?

– Entenda Views em SQL, vantagens e desvantagens

– O que é normalização de banco de dados

– Por que não devemos usar funções do tipo mysql_*

SQL – Entenda as diferenças entre aspas simples e duplas

– SQL – Not IN ou Not EXISTS quando usar?

– SQL – Entendendo JOINS

– PHP Do Zero Ao Profissional – Análise do Curso

Powered by Rock Convert
Powered by Rock Convert

Ramos de Souza Janones

Janones, é um empreendedor brasileiro apaixonado por empreendedorismo e tecnologia. Ao longo dos anos trabalhando com o desenvolvimento de softwares desktop desde a linguagem Clipper, passando pelo Delphi e atualmente com Java.

Optou pela formação de Publicidade e Marketing por sua segunda empresa de tecnologia ter participado do "boom" da internet nos anos 90 e na procura de melhorar seus conhecimentos em negócios.

Em razão da principal formação e profundos conhecimentos em programação e banco de dados, é capaz de realizar o desenvolvimento de aplicativos web, desktop e mobile com maior criatividade e inovação que profissionais de desenvolvimento com uma formação única e mais especifica, dedicada somente ao desenvolvimento de softwares.

Com toda sua experiência com empresas de software, sua formação e paixão por negócios escreveu o livro "Marketing para Empresas e Profissionais de Software", publicado pela editora carioca Ciência Moderna em 2012. Além de outros livros sobre programação.

Últimos posts por Ramos de Souza Janones (exibir todos)

Sumário
INSPIRE-SE: Todos os dados do Cartola FC desde 2014 até 2018 atualizadas
Nome do artigo
INSPIRE-SE: Todos os dados do Cartola FC desde 2014 até 2018 atualizadas
Descrição
Já pensou em criar um aplicativo do Cartola FC que faz as previsões? Segundo o Google Trends futebol é a palavra mais pesquisada no Brasil. E o Cartola FC é um grande sucesso.
Autor
Nome
Ramos da Informática
Logo