Skip to content

JIgor08/Cust_Seg_Project

Repository files navigation

Segmentação de Clientes com RFV

Neste projeto, abordei a tarefa de segmentação de clientes por meio da aplicação do algoritmo KMeans, uma técnica de aprendizado de máquina não supervisionado amplamente reconhecida por sua eficácia na descoberta de padrões ocultos em conjuntos de dados. Ao aplicar o KMeans às métricas RFV, buscamos identificar grupos de clientes com comportamentos semelhantes, permitindo que a empresa adapte suas estratégias de marketing e atendimento de acordo com as necessidades específicas de cada segmento.

O principal objetivo deste projeto é oferecer uma visão abrangente de como a segmentação de clientes com base na análise RFV e a aplicação do algoritmo KMeans podem ser utilizadas de forma sinérgica para criar uma abordagem mais personalizada e direcionada ao gerenciamento de clientes. Ao identificar segmentos distintos, a empresa pode otimizar seus recursos, concentrando-se nas áreas de maior potencial e adaptando suas abordagens para melhor atender às expectativas e preferências dos clientes.

O dataset utilizado nesse projeto pode ser baixado neste link: https://www.kaggle.com/datasets/hellbuoy/online-retail-customer-clustering

Após a segmentação, apliquei meus conhecimentos em Power BI para a criação de um dashboard contendo as informações rotuladas(dizendo a qual cluster eles pertencem) dos clientes.

Pré-requisitos

A versão Python utilizada neste projeto é a 3.10.7

  • Pip (Windows)
    py get-pip.py
  • Virtual Env (Opcional)
    pip install virtualenv

Instalação

  1. Clone o repositório
    git clone https://github.com/JIgor08/Cust_Seg_Project.git
  2. Crie e ative um ambiente virtual (Opcional)
  3. Instale os pacotes
    pip install -r requirements.txt

Tecnologias utilizadas:

  • Python
  • PBI
  • VSCode

Dataset:

O Dataset utilizado contém informações de vendas online ocorridas no Reino Unido durante um período de pouco mais de um ano e possui as seguintes colunas:

  • InvoiceNo: Valor único para cada compra

  • StockCode: Código do estoque

  • Description: Descrição do produto

  • Quantity: Quantidade de produtos comprados

  • InvoiceDate: Data da compra

  • UnitPrice: Preço por unidade de produto

  • CustomerID: Identificador do cliente

  • Country: País do comprador

Desenvolvimento:

Foram aplicadas diversas técnicas durante o projeto:

  • Feature Selection
  • Feature Engineering
  • Métodos para a escolha do número adequado de Clusters (Elbow Method e Silhuette Method)
  • Técnicas de remoção de Outliers
  • Algoritmo KMeans para clusterização
  • Técnicas de visualização para análise dos Clusters
  • Análise dos produtos vendidos
  • Criação de um Dashboard contendo as informações dos clientes segmentados

Dashboard:

!Link para o Dashboard

Estrutura do diretório

├── LICENSE
├── README.md          <- Readme contendo a descrição do projeto.
├── data
│   ├── external       <- Dados coletados de terceiros.
│   ├── interim        <- Dados com transformações.
│   ├── processed      <- Dados finais, após a modelagem.
│   └── raw            <- Dados originais, imutáveis.
│
├── models             <- Modelos treinados, predições do modelo, ou sumário do modelo.
│
├── notebooks          <- Jupyter notebooks.
│
├── reports            <- Análises geradas em HTML, PDF, LaTeX, etc.
│   └── figures        <- Gráficos gerados e figuras usadas no relatório.
│
└── requirements.txt   <- Arquivo com as bibliotecas necessárias para a reprodução do projeto.
                          Gerado com `pip freeze > requirements.txt`

Project based on the cookiecutter data science project template. #cookiecutterdatascience

Esse projeto foi executado sob a licença MIT, para mais informações acesse o arquivo LICENSE.tx