Dados do Cartola FC desde 2014 até 2021 atualizadas

Dados do Cartola FC desde 2014 até 2021 atualizadas

23 de agosto de 2018 0 Por Ramos de Souza Janones

Já pensou em criar um aplicativo do Cartola FC que faz as previsões? Segundo o Google Trends futebol é a palavra mais pesquisada no Brasil. E o Cartola FC é um grande sucesso.

Atualizado em 15/02/2021. Que tal pegar a onda e fazer um aplicativo sobre o tema? O Github do Henrique tem todos os dados e, inclusive, um programa de previsão em Python e R. 

Sugestão: Faça o seu App.

🎩 caRtola 🎩

Este repositório tem como objetivo disponibilizar todos os dados do Cartola FC desde sua criação em 2014 até 2019. Estaremos na área em 2020!

Dados 📝

Para ter acesso a todo o histórico de dados do Cartola FC é só acessar a pasta data. Lá você encontra os dados organizados por ano e ainda um arquivo com os dados agregados de todos os anos. Está tudo disponível em arquivos separados por vírgulas. Até o Excel abre. 😉

Tutoriais

Estes são alguns tutoriais que escrevemos. Contribuições são sempre bem vindas!

CURSOS QUE ESTAMOS RECOMENDANDO:

  1. Plano de Assinatura Danki.Code: Diversos cursos completos e atualizados para se tornar um Dev FullStack.
  2. Mercado em Alta de Desenvolvedor Node.JS e React, recomendamos este treinamento.
Bons estudos.

LIVROS QUE INDICAMOS

- Livros para análistas e cientistas de dados que recomendamos

 



R

Análise de agrupamentos

Regressão

Python

Previsões 🎯

Tem um modelo preditivo? Ajude-nos a montar um. Você pode conferir o resultado das previsões do nosso modelo preditivo em 2017 nessa planilha. Nela, você vai encontrar os jogadores que o nosso modelo previu que iam fazer boas predições e a pontuação real do jogador naquela rodada. Você acha que o modelo mandou bem? Foi ruim? Vem resenhar com a gente, parça! 💬

Ah, o nosso modelo preditivo é de domínio público também! Quer saber como ele foi treinado e como você pode utilizá-lo? Confira aqui.

Provavelmente irá gostar:

Jogo Cartola – Super PFC

<img src=”https://henriquepgomide.github.io/cartola-supertrunfo/img/pfc-logo.7412844e.png” alt=”drawing” width=”150″

Criamos um jogo de cartas com base nos dados (em VueJS). Detalhe: também é de código-aberto! Link para repositório: https://henriquepgomide.github.io/cartola-supertrunfo/

 README.md

Essa pasta contém os dados de todo o histórico do Cartola organizados por ano. Cada pasta contém os dados sobre jogadores, partidas, times, scouts e uma descrição dos dados em cada arquivo. Na raiz dessa pasta, você vai encontrar os seguintes arquivos:

Treinamento em Machine Learning, Big Data e Analytics com PYTHON, HADOOP, SPARK e APACHE KAFKA! PRESENCIAL e ONLINE!

Essa pasta contém os dados de todo o histórico do Cartola organizados por ano. Cada pasta contém os dados sobre jogadores, partidas, times, scouts e uma descrição dos dados em cada arquivo. Na raiz dessa pasta, você vai encontrar os seguintes arquivos:

LEIA TAMBÉM:  7 livros de TI mais vendidos em 2021, até agora...

⭐️ 2018_dados_agregados.xlsx ⭐️

Estes são os dados agregados em Excel para os cartoleiros que estão familiarizados com Excel (Segredo: todos nós temos alma de planilheiros em alguma medida).

2017_dados_agregados.csv

Esse é o principal arquivo desse repositório. Ele tem todos os dados, de todos os anos, de todas as rodadas, e de todos os jogadores (ufa!). Cada linha representa os scouts de um jogador para uma rodada de um certo ano. Esses dados estão em formato bruto, ou seja, precisam ser limpos antes de serem utilizados. Há erros de inconsistência, presença de NANs, entre outras coisas, que já vêm da API do Cartola FC. Porém, não se preocupe! Já fizemos o trabalho sujo para você! 💪 Temos um arquivo com os dados bem limpinhos só esperando suas análises. Lê aqui embaixo 👇 e não esquece de ler as observações desse README também.

dados_agregados_limpos.csv

Contém os dados agregados de forma limpa, isto é, dados prontos para você utilizar em suas análises. Nesse arquivo, nós garantimos que NÃO há erros de inconsistência nem dados sujosA menos que você encontre. Nesse caso, avise a gente, tá?😉 Quer saber como essa limpeza foi feita? Dá uma olhada aqui.

dados_agregados_amostras.csv

Contém as amostras utilizadas para o treinamento do modelo preditor de scores. Essas amostras já estão prontas para serem utilizadas para o treinamento de qualquer modelo de Machine Learning sem nenhum esforço adicional.

times_ids.csv

Contém os nomes e os ids de todos os times que já jogaram o brasileirão desde 2014. Você pode obter os dados do time que participaram do brasileirão em um determinado ano na sua pasta correspondente no arquivo [ANO]_times. Repare que em 2017, os ids de alguns times foram alterados. Mas não se preocupe, esse arquivo diz tudo para você.

Observações:

  • Todos os arquivos [ANO]_scouts_raw.csv dentro de cada pasta são arquivos brutos, que vêm diretamente da API do Cartola FC.
  • Os scouts de 2015 são cumulativos, ou seja, os scouts dos jogadores vão sendo somados a cada rodada. Entretanto, a pontuação não é. Isso também causa o repetimento de dados. O arquivo dados_agregados_limpos.csv nessa pasta já corrige esse problema para você.
LEIA TAMBÉM:  VTEX oferece 10 mil bolsas para formar desenvolvedores

Créditos:

  • Os dados de 2014 e 2015 foram obtidos do repositório CartolaFCDados
  • Os dados de 2016 foram disponibilizados por Arnaldo Gualberto.
  • Os dados dos times são extraídos do site da CBF.

Descrição dos arquivos dessa pasta

dados_agregados.csv & dados_agregados_limpos.csv

colunadescriçãoobservações
Rodadanúmero da rodada do Brasileirão
ClubeIDclube do jogadorver arquivo times_ids.csv
AtletaIDid do jogador
Participouindica se o jogador participou daquela rodadaFALSE:Não, TRUE:Sim
Posicaoposição do jogadorgol:goleiro, zag:zagueiro, lat:lateral, mei:meia, ata:atacante, tec:técnico
Jogosqtde. de jogos que o jogador participou até aquela rodada
Pontospontuação do jogador
PontosMediamédia da pontuação do jogador
Precopreço do jogador
PrecoVariacaovariação de preço
FSfaltas sofridas
PEpasses errados
Aassistências
FTfinalizações na trave
FDfinalizações defendidas
FFfinalizações para fora
Ggols
Iimpedimentos
PPpênaltis perdidos
RBroubadas de bola
FCfaltas cometidas
GCgols contra
CAcartões amarelo
CVcartões vermelho
SGjogos sem sofrer gols
DDdefesas difíceis
DPdefesas de pênalti
GSgols sofridos
anoano dos dados
Apelidonome/apelido do jogador
Statusstatus do jogadorProvável, Dúvida, Suspenso, Nulo, …
avg.Pointsmédia de pontos do jogador
avg.last05média de pontos do jogador nas últimas 5 rodadas
avg.FSmédia de faltas sofridas
avg.FS.l05média de faltas sofridas nas últimas 5 rodadas
avg.PEmédia de passes errados
avg.PE.l05média de passes errados nas últimas 5 rodadas
avg.Amédia de assistências
avg.A.l05média de assistências nas últimas 5 rodadas
avg.FTmédia de finalizações na trave
avg.FT.l05média de finalizações na trave nas últimas 5 rodadas
avg.FDmédia de finalizações defendidas
avg.FD.l05média de finalizações defendidas nas últimas 5 rodadas
avg.FFmédia de finalizações para fora
avg.FF.l05média de finalizações para fora nas últimas 5 rodadas
avg.Gmédia de gols
avg.G.l05média de gols nas últimas 5 rodadas
avg.Imédia de impedimentos
avg.I.l05média de impedimentos nas últimas 5 rodadas
avg.PPmédia de pênaltis perdidos
avg.PP.l05média de pênaltis perdidos nas últimas 5 rodadas
avg.RBmédia de roubadas de bola
avg.RB.l05média de roubadas de bola nas últimas 5 rodadas
avg.FCmédia de faltas cometidas
avg.FC.l05média de faltas cometidas nas últimas 5 rodadas
avg.GCmédia de gols contra
avg.GC.l05média de gols contra nas últimas 5 rodadas
avg.CAmédia de cartões amarelos
avg.CVmédia de cartões vermelhos nas últimas 5 rodadas
avg.SGmédia de jogos sem sofrer gols
avg.SG.l05média de jogos sem sofrer gols nas últimas 5 rodadas
avg.DDmédia de defesas difíceis
avg.DD.l05média de defesas difíceis nas últimas 5 rodadas
avg.DPmédia de defesas de pênalti
avg.DP.l05média de defesas de pênalti nas últimas 5 rodadas
avg.GSmédia de gols sofridos
avg.GS.l05média de gols sofridos nas últimas 5 rodadas
risk_pointsdesvio-padrão da pontuação do jogador
mesmês que a partida ocorreu
diadia que a partida ocorreu
away.score.xplacar to time visitante
home.score.xplacar do time da casa
home.attackestimativa de força de ataque do time do jogadorestimada a partir de uma regressão de Poisson com base no histórico de confrontos entre os times
home.defendestimativa de força de defesa do time do jogadorestimada a partir de uma regressão de Poisson com base no histórico de confrontos entre os times
pred.home.scoreestimativa de gols para o time da casaestimada a partir de 10000 simulações de confronto entre os times usando distribuições de Poisson
pred.away.scoreestimativa de gols para o time visitanteestimada a partir de 10000 simulações,de confronto entre os times usando distribuições de Poisson
variableindica se o jogador é do time da casa ou visitantehome.team: casa, away.team: visitante
LEIA TAMBÉM:  Unreal Engine com suporte a C# e Xamarin

dados_agregados_amostras.csv

Contém as mesmas colunas que os arquivos dados_agregados.csv e dados_agregados_limpos.csv, exceto Apelido, Status, Participou, dia e mes – uma vez que esses dados não são necessários para o treinamento do modelo.

times_ids.csv

colunadescriçãoobservações
nome.cbfnome do time no site da CBFcamel-case, com espaços, com acentos e com abreviações
nome.cartolanome do time no Cartola FCcamel-case, sem espaços, com acentos e com abreviações
nome.completonome do time completocamel-case, com espaços, sem acentos e sem abreviações
cod.oldercódigo do time no Cartola FC até 2017
cod.2017código do time no Cartola FC a partir de 2017ler esse README
idid do timeid = cod.2017

Banco de dados

Artigos e dicas sobre banco de dados que você vai gostar:

MongoDB

– Principais diferenças entre MongoDB e MySQL ou outro RDBMS

– Southbank Software apresenta dbKoda: uma ferramenta de desenvolvimento Open Source para MongoDB

MySQL e Instruções SQL em geral

– SQL e Regex – Entenda quando e como usar em instruções SQL

– MySQL – Manter o formato Date e DateTime em formato dd/mm/Year e dd/mm/Year:HH:mm:ss

– SQL – O que são VIEWS SQL, vantagens e desvantagens

– Instrução Insert MySQL e JSON com todos os bancos brasileiros

– PHP e MySQL – Entendendo as codificações iso-8859-1 e UTF-8 e outras

– Como redefinir a senha de root do MySQL ou do MariaDB

– Para que serve uma MySQL Transaction?

– Banco de Dados – Índices desnecessários no banco são um problema?

– Entenda a diferença entre LIKE, IN e BETWEEN no MySQL

– LinkedIn desenvolve a ferramenta MySQL Query Analyzer

– Como otimizar consultas MySQL

– Quando é interessante desnormalizar o banco de dados?

– Entenda Views em SQL, vantagens e desvantagens

– O que é normalização de banco de dados

– Por que não devemos usar funções do tipo mysql_*

SQL – Entenda as diferenças entre aspas simples e duplas

– SQL – Not IN ou Not EXISTS quando usar?

– SQL – Entendendo JOINS

– PHP Do Zero Ao Profissional – Análise do Curso

votes
Article Rating

Sumário
INSPIRE-SE: Todos os dados do Cartola FC desde 2014 até 2018 atualizadas
Nome do artigo
INSPIRE-SE: Todos os dados do Cartola FC desde 2014 até 2018 atualizadas
Descrição
Já pensou em criar um aplicativo do Cartola FC que faz as previsões? Segundo o Google Trends futebol é a palavra mais pesquisada no Brasil. E o Cartola FC é um grande sucesso.
Autor
Nome
Ramos da Informática
Logo