Conhecendo melhor sua base de clientes: qual o salário dos seus consumidores?
help
{{apiData.me.position}}˚ no Ranking
profile pic account_circle
Login Comece agora
Iniciar Desafio Iniciar Desafio Fórum
{{apiData.participant_count}} Participantes
Estatística
Análise de dados
Regressão
Regressão Linear
Regressão Logística

Conhecendo melhor nossa base de consumidores: qual o salário do cliente?

Objetivo

Queremos descobrir qual o salário de todos os nossos clientes já que utilizamos essa informação para ações de marketing e para ofertar novos produtos para cada cliente. Atualmente possuímos o valor do salário apenas de aproximadamente dois terços dos nossos clientes. Gostariamos de utilizar os dados que possuímos para fazer uma regressão de descobrir o salário do resto dos clientes.

Tópicos

Neste desafio você aprenderá:

  • Regressão Linear e Logística;
  • Correlação;
  • Métricas para avaliar regressões;

Requisitos

Você precisará de python 3.6 (ou superior) e do gerenciador de pacotes pip.

O recomendado é você utilizar um ambiente virtual. Para isto, execute os comandos como no exemplo abaixo:

Linux/macos

pip3 install virtualenv
virtualenv ../venv -p python3
source ../venv/bin/activate 
pip install -r requirements.txt

Windows

pip3 install virtualenv
virtualenv ..\venv -p python3
..\venv\Scripts\activate
pip install -r requirements.txt

Ao terminar o desafio, você pode sair do ambiente criado com o comando deactivate

Detalhes

A resposta deve conter o id do cliente e o salário predito na regressão dos clientes disponível no arquivo desafio2_test.csv. O arquivo para submissão deve estar em formato csv, conforme o arquivo exemplo “desafio2_submission.csv”. A métrica utilizada será o r2(coeficiente de determinação).

OBSERVAÇÃO: É recomendado utilizar Python, pandas e sklearn para esse desafio, mas também é possível utilizar outras ferramentas e linguagens de programação.

Descrição dos dados: ‘id’: Identificador do cliente ‘sobrenome’: Sobrenome do cliente ‘pontuacao_credito’: Pontuação de crédito do cliente (quanto maior, melhor o cliente geralmente) ‘estado_residencia’: Estado de residência do cliente ‘genero’: Gênero do cliente ‘nivel_estabilidade’: Nível de estabilidade do cliente ‘saldo_conta’: Saldo disponível na conta do cliente ‘numero_produtos’: Número de produtos que o cliente consome ‘possui_cartao_de_credito’: Possui um cartão de crédito cadastrado ‘membro_ativo’: Membro acessa e consome frequentemente ‘salario’: Salário do cliente

Obs: Os dados são fictícios, mas tentam representar a realidade de uma base de clientes de um produto SaaS.

codenation code review

Para receber Code review, compartilhe o link abaixo com colegas ou em nosso fórum de discussões:

codenation code review

Para receber Code review, você precisa primeiramente finalizar o desafio.

{{apiData.participant_count}} Participantes

Para definir seu posicionamento no ranking do desafio, utilizaremos a nota mais alta que tiver conquistado nele. Caso outra pessoa participante obtenha a mesma nota que a sua, o critério de desempate será data e hora de envio da mais recente.

empty ranking Ainda não temos participantes suficientes para o ranking!
Aproveite e seja um dos primeiros a participar desse desafio.
CODE:NOME NOTA
{{candidate.position}}. {{candidate.name}} {{candidate.score.toFixed(2)}}%
Estatística Basica

Apresentação de estatística básica com explicações sobre média, mediana, moda e desvio padrão.

Estatística Basica

Livro completo de estatística básica.

Regressão Linear Simples

Apresentação sobre regressão linear.

Regressão Linear e Correlação

Capítulo de livro sobre correção e regressão linear.

Coeficiente de Determinação

Artigo apresentando o conceito de coeficiente de determinação.