Skip to content

leassis91/allmart

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

41 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🤝🏽🥇 ALLMART - FIDELIZAÇÃO DE CLIENTES 🥇🤝🏽

project_cover_image

📖 Contexto do Negócio

Disclaimer: O contexto a seguir é completamente fictício. A empresa, o contexto, o CEO, as perguntas de negócio foram idealizadas para simular um problema real de negócio.


A empresa All Mart é uma empresa Outlet Multimarcas, ou seja, ela comercializa produtos de segunda linha de várias marcas a um preço menor, através de um e-commerce.

Em pouco mais de 1 ano de operação, o time de marketing percebeu que alguns clientes da sua base compram produtos mais caro, com alta frequência e acabam contribuindo com uma parcela significativa do faturamento da empresa.

Baseado nessa percepção, o time de marketing vai lançar um programa de fidelidade para os melhores clientes da base, chamado insiders. Mas o time não tem um conhecimento avançado em análise de dados para eleger os participantes do programa.

Por esse motivo, o time de marketing requisitou aao time de dados uma seleção de clientes elegíveis ao programa, usando técnicas avançadas de manipulação de dados.


📌 Desafio do Negócio

Você faz parte do time de cientistas de dados da empresa All Mart, que precisa determinar quem são os clientes elegíveis para participar do programa insiders. Em posse dessta lista, o time de marketing fará uma sequência de ações personalizadas e exclusivas ao grupo, de modo a aumentar o faturamento e a frequência de compra.

Como resultado para esse projeto, é esperado que você entregue uma lista de pesaos elegíveis a participar do programa insiders, junto com um relatório respondendo às seguintes perguntas:

  1. Quem são as pessoas elegíveis para participar do programa insiders?
  2. Quantos clientes farõa parte do grupo?
  3. Quais as principais características desses clientes?
  4. Qual a porcentagem de contribuição do faturamento, vinda do programa?
  5. Qual a expectativa de faturamento (LTV) desse grupo para os próximos meses?
  6. Quais as condições para uma pessoa ser elegível aos insiders?
  7. Quais as condiçlões para um apessoa ser removida dos insiders?

💾 Dados

O conjunto de dados está disponível na plataforma Kaggle, através do link: https://www.kaggle.com/vik2012kvs/high-value-customers-identification

Cada linha representa uma transição de venda, que ocorreu entre o período de novembro de 2016 e dezembro de 2017.

O conjunto de dados inclui as seguintes informações:

  • Invoice Number: identificador único de cada transação.
  • Stock Code Product: código do item.
  • Description Product: nome do item.
  • Quantity: quantidade de cada item comprado por transação.
  • Invoice Date: dia em que ocorreu a transação.
  • Unit Price: preço do produto por unidade.
  • Customer ID: identificador único do cliente.
  • Country: país em que o cliente reside.

🔬 Proposta de Solução

Como parte da solução do projeto, propusemos o uso da metodologia cíclica conhecida por CRISP-DS (Cross-Industry Standard Process for Data Science). Este processo baseia-se em uma separação lógica e clara dos passos para desenvolvimento da solução e em sua estrutura cíclica, de forma que um ciclo consiste em percorrer todas as fases do desenvolvimento e a entrega ágil de uma solução (Minimum Viable Product). Sua natureza cíclica permite não só o refatoramento do código como também a formulação de outras hipóteses, criação de novas features, melhora dos modelos, fine tuning, etc.

crispds

Também desenhamos uma estratégia baseada na metodologia IOT (Input, Output & Tasks) como parte da solução, funcionando basicamente como um Sprint Backlog do projeto, linkando diretamente as perguntas realizadas na elaboração do problema do negócio.

iot


📉 Modelo RFM - RFM Análise

rfm-model

  1. Champions

    a. Compras recentes, frequentes com alto valor gasto.

    b. Prêmios para esses clientes.

  2. Potential Loyalists

    a. Compras recentes, boa frequência e bom valor gasto.

    b. Programa de Fidelização e Upssell

  3. New Customers

    a. Compra recente, baixa frequência

    b. Construção de Relacionamento e ofertas especiais.

  4. At Risk Customer

    a. "Faz tempo que não compra"

    b. Campnhas de reativação, ofertas, produtos

  5. Can't Lose Them

TBD


🔮 Clusterização e suas Propriedades

Existem 2 principais propriedades para avaliar a performance de um agrupamento (clusterização):

  • Distância do centróide em relação aos pontos de seu cluster: O objetivo aqui é minimizar essa distância entre todos os pontos de um mesmo cluster.

  • Distância entre clusters diferentes: Aqui desejamos que a distância seja a maior possível, para evitar o fenômeno de overlapping de dados.

distancias

De uma maneira mais formal:

  1. Compactness (Compacidade) ou Cohesion

    • WSS (Within-Cluster Sum of Squares): Os clusters devem ser compactos. Desvantagem: Não considera as distâncias entre clusters (possível overlapping)

  2. Separation (Separação)

    • SS (Silhouette Score) - Clusters devem ser distantes entre si.

📉 Resultados

TBD


👣 Próximos Passos

TBD


🔗 Referências

  1. Cohort Analysis with Python

✍ Autor

linkedin gmail kaggle


💪 Como contribuir

  1. Dê um fork no projeto.
  2. Crie uma nova branch com suas mudanças: git checkout -b my-feature
  3. Salve-as e então crie um commit com uma mensagem com o que você alterou: git commit -m" feature: My new feature "
  4. Confirme suas alterações: git push origin my-feature

About

All Mart project using Kedro Framework

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published