Dados do Cartola FC desde 2014 até 2020 atualizadas

Dados do Cartola FC desde 2014 até 2020 atualizadas

23 de agosto de 2018 0 Por Ramos de Souza Janones
Powered by Rock Convert

Já pensou em criar um aplicativo do Cartola FC que faz as previsões? Segundo o Google Trends futebol é a palavra mais pesquisada no Brasil. E o Cartola FC é um grande sucesso.

Atualizado em 15/02/2020. Que tal pegar a onda e fazer um aplicativo sobre o tema? O Github do Henrique tem todos os dados e, inclusive, um programa de previsão em Python e R. 

Sugestão: Faça o seu App.

🎩 caRtola 🎩

Este repositório tem como objetivo disponibilizar todos os dados do Cartola FC desde sua criação em 2014 até 2019. Estaremos na área em 2020!

Dados 📝

Para ter acesso a todo o histórico de dados do Cartola FC é só acessar a pasta data. Lá você encontra os dados organizados por ano e ainda um arquivo com os dados agregados de todos os anos. Está tudo disponível em arquivos separados por vírgulas. Até o Excel abre. 😉

Tutoriais

Estes são alguns tutoriais que escrevemos. Contribuições são sempre bem vindas!

R

Análise de agrupamentos

Regressão

Python

Previsões 🎯

Tem um modelo preditivo? Ajude-nos a montar um. Você pode conferir o resultado das previsões do nosso modelo preditivo em 2017 nessa planilha. Nela, você vai encontrar os jogadores que o nosso modelo previu que iam fazer boas predições e a pontuação real do jogador naquela rodada. Você acha que o modelo mandou bem? Foi ruim? Vem resenhar com a gente, parça! 💬

Leia também:  

Ah, o nosso modelo preditivo é de domínio público também! Quer saber como ele foi treinado e como você pode utilizá-lo? Confira aqui.

Jogo Cartola – Super PFC

<img src=”https://henriquepgomide.github.io/cartola-supertrunfo/img/pfc-logo.7412844e.png” alt=”drawing” width=”150″

Criamos um jogo de cartas com base nos dados (em VueJS). Detalhe: também é de código-aberto! Link para repositório: https://henriquepgomide.github.io/cartola-supertrunfo/

Como vender Software - Seja desktop, web ou MobilePowered by Rock Convert

 README.md

Essa pasta contém os dados de todo o histórico do Cartola organizados por ano. Cada pasta contém os dados sobre jogadores, partidas, times, scouts e uma descrição dos dados em cada arquivo. Na raiz dessa pasta, você vai encontrar os seguintes arquivos:

Treinamento em Machine Learning, Big Data e Analytics com PYTHON, HADOOP, SPARK e APACHE KAFKA! PRESENCIAL e ONLINE!

Essa pasta contém os dados de todo o histórico do Cartola organizados por ano. Cada pasta contém os dados sobre jogadores, partidas, times, scouts e uma descrição dos dados em cada arquivo. Na raiz dessa pasta, você vai encontrar os seguintes arquivos:

LEIA TAMBÉM:  MySQLi vs PDO - qual o mais recomendado para usar?

⭐️ 2018_dados_agregados.xlsx ⭐️

Estes são os dados agregados em Excel para os cartoleiros que estão familiarizados com Excel (Segredo: todos nós temos alma de planilheiros em alguma medida).

2017_dados_agregados.csv

Esse é o principal arquivo desse repositório. Ele tem todos os dados, de todos os anos, de todas as rodadas, e de todos os jogadores (ufa!). Cada linha representa os scouts de um jogador para uma rodada de um certo ano. Esses dados estão em formato bruto, ou seja, precisam ser limpos antes de serem utilizados. Há erros de inconsistência, presença de NANs, entre outras coisas, que já vêm da API do Cartola FC. Porém, não se preocupe! Já fizemos o trabalho sujo para você! 💪 Temos um arquivo com os dados bem limpinhos só esperando suas análises. Lê aqui embaixo 👇 e não esquece de ler as observações desse README também.

dados_agregados_limpos.csv

Contém os dados agregados de forma limpa, isto é, dados prontos para você utilizar em suas análises. Nesse arquivo, nós garantimos que NÃO há erros de inconsistência nem dados sujosA menos que você encontre. Nesse caso, avise a gente, tá?😉 Quer saber como essa limpeza foi feita? Dá uma olhada aqui.

dados_agregados_amostras.csv

Contém as amostras utilizadas para o treinamento do modelo preditor de scores. Essas amostras já estão prontas para serem utilizadas para o treinamento de qualquer modelo de Machine Learning sem nenhum esforço adicional.

times_ids.csv

Contém os nomes e os ids de todos os times que já jogaram o brasileirão desde 2014. Você pode obter os dados do time que participaram do brasileirão em um determinado ano na sua pasta correspondente no arquivo [ANO]_times. Repare que em 2017, os ids de alguns times foram alterados. Mas não se preocupe, esse arquivo diz tudo para você.

Observações:

  • Todos os arquivos [ANO]_scouts_raw.csv dentro de cada pasta são arquivos brutos, que vêm diretamente da API do Cartola FC.
  • Os scouts de 2015 são cumulativos, ou seja, os scouts dos jogadores vão sendo somados a cada rodada. Entretanto, a pontuação não é. Isso também causa o repetimento de dados. O arquivo dados_agregados_limpos.csv nessa pasta já corrige esse problema para você.

Créditos:

Descrição dos arquivos dessa pasta

dados_agregados.csv & dados_agregados_limpos.csv

coluna descrição observações
Rodada número da rodada do Brasileirão
ClubeID clube do jogador ver arquivo times_ids.csv
AtletaID id do jogador
Participou indica se o jogador participou daquela rodada FALSE:Não, TRUE:Sim
Posicao posição do jogador gol:goleiro, zag:zagueiro, lat:lateral, mei:meia, ata:atacante, tec:técnico
Jogos qtde. de jogos que o jogador participou até aquela rodada
Pontos pontuação do jogador
PontosMedia média da pontuação do jogador
Preco preço do jogador
PrecoVariacao variação de preço
FS faltas sofridas
PE passes errados
A assistências
FT finalizações na trave
FD finalizações defendidas
FF finalizações para fora
G gols
I impedimentos
PP pênaltis perdidos
RB roubadas de bola
FC faltas cometidas
GC gols contra
CA cartões amarelo
CV cartões vermelho
SG jogos sem sofrer gols
DD defesas difíceis
DP defesas de pênalti
GS gols sofridos
ano ano dos dados
Apelido nome/apelido do jogador
Status status do jogador Provável, Dúvida, Suspenso, Nulo, …
avg.Points média de pontos do jogador
avg.last05 média de pontos do jogador nas últimas 5 rodadas
avg.FS média de faltas sofridas
avg.FS.l05 média de faltas sofridas nas últimas 5 rodadas
avg.PE média de passes errados
avg.PE.l05 média de passes errados nas últimas 5 rodadas
avg.A média de assistências
avg.A.l05 média de assistências nas últimas 5 rodadas
avg.FT média de finalizações na trave
avg.FT.l05 média de finalizações na trave nas últimas 5 rodadas
avg.FD média de finalizações defendidas
avg.FD.l05 média de finalizações defendidas nas últimas 5 rodadas
avg.FF média de finalizações para fora
avg.FF.l05 média de finalizações para fora nas últimas 5 rodadas
avg.G média de gols
avg.G.l05 média de gols nas últimas 5 rodadas
avg.I média de impedimentos
avg.I.l05 média de impedimentos nas últimas 5 rodadas
avg.PP média de pênaltis perdidos
avg.PP.l05 média de pênaltis perdidos nas últimas 5 rodadas
avg.RB média de roubadas de bola
avg.RB.l05 média de roubadas de bola nas últimas 5 rodadas
avg.FC média de faltas cometidas
avg.FC.l05 média de faltas cometidas nas últimas 5 rodadas
avg.GC média de gols contra
avg.GC.l05 média de gols contra nas últimas 5 rodadas
avg.CA média de cartões amarelos
avg.CV média de cartões vermelhos nas últimas 5 rodadas
avg.SG média de jogos sem sofrer gols
avg.SG.l05 média de jogos sem sofrer gols nas últimas 5 rodadas
avg.DD média de defesas difíceis
avg.DD.l05 média de defesas difíceis nas últimas 5 rodadas
avg.DP média de defesas de pênalti
avg.DP.l05 média de defesas de pênalti nas últimas 5 rodadas
avg.GS média de gols sofridos
avg.GS.l05 média de gols sofridos nas últimas 5 rodadas
risk_points desvio-padrão da pontuação do jogador
mes mês que a partida ocorreu
dia dia que a partida ocorreu
away.score.x placar to time visitante
home.score.x placar do time da casa
home.attack estimativa de força de ataque do time do jogador estimada a partir de uma regressão de Poisson com base no histórico de confrontos entre os times
home.defend estimativa de força de defesa do time do jogador estimada a partir de uma regressão de Poisson com base no histórico de confrontos entre os times
pred.home.score estimativa de gols para o time da casa estimada a partir de 10000 simulações de confronto entre os times usando distribuições de Poisson
pred.away.score estimativa de gols para o time visitante estimada a partir de 10000 simulações,de confronto entre os times usando distribuições de Poisson
variable indica se o jogador é do time da casa ou visitante home.team: casa, away.team: visitante
LEIA TAMBÉM:  Crie sites Wordpress com Elementor e ganhe produtividade

dados_agregados_amostras.csv

Contém as mesmas colunas que os arquivos dados_agregados.csv e dados_agregados_limpos.csv, exceto Apelido, Status, Participou, dia e mes – uma vez que esses dados não são necessários para o treinamento do modelo.

times_ids.csv

coluna descrição observações
nome.cbf nome do time no site da CBF camel-case, com espaços, com acentos e com abreviações
nome.cartola nome do time no Cartola FC camel-case, sem espaços, com acentos e com abreviações
nome.completo nome do time completo camel-case, com espaços, sem acentos e sem abreviações
cod.older código do time no Cartola FC até 2017
cod.2017 código do time no Cartola FC a partir de 2017 ler esse README
id id do time id = cod.2017
LEIA TAMBÉM:  10 livros de TI mais vendidos no primeiro trimestre de 2019

Banco de dados

Artigos e dicas sobre banco de dados que você vai gostar:

MongoDB

– Principais diferenças entre MongoDB e MySQL ou outro RDBMS

– Southbank Software apresenta dbKoda: uma ferramenta de desenvolvimento Open Source para MongoDB

MySQL e Instruções SQL em geral

– SQL e Regex – Entenda quando e como usar em instruções SQL

– MySQL – Manter o formato Date e DateTime em formato dd/mm/Year e dd/mm/Year:HH:mm:ss

– SQL – O que são VIEWS SQL, vantagens e desvantagens

– Instrução Insert MySQL e JSON com todos os bancos brasileiros

– PHP e MySQL – Entendendo as codificações iso-8859-1 e UTF-8 e outras

– Como redefinir a senha de root do MySQL ou do MariaDB

– Para que serve uma MySQL Transaction?

– Banco de Dados – Índices desnecessários no banco são um problema?

– Entenda a diferença entre LIKE, IN e BETWEEN no MySQL

– LinkedIn desenvolve a ferramenta MySQL Query Analyzer

– Como otimizar consultas MySQL

– Quando é interessante desnormalizar o banco de dados?

– Entenda Views em SQL, vantagens e desvantagens

– O que é normalização de banco de dados

– Por que não devemos usar funções do tipo mysql_*

SQL – Entenda as diferenças entre aspas simples e duplas

– SQL – Not IN ou Not EXISTS quando usar?

– SQL – Entendendo JOINS

– PHP Do Zero Ao Profissional – Análise do Curso

Siga os bons!

Sumário
INSPIRE-SE: Todos os dados do Cartola FC desde 2014 até 2018 atualizadas
Nome do artigo
INSPIRE-SE: Todos os dados do Cartola FC desde 2014 até 2018 atualizadas
Descrição
Já pensou em criar um aplicativo do Cartola FC que faz as previsões? Segundo o Google Trends futebol é a palavra mais pesquisada no Brasil. E o Cartola FC é um grande sucesso.
Autor
Nome
Ramos da Informática
Logo



Frontend Do Zero Ao Profissional