This project analyzes Olist's e-commerce sales data, covering customer behavior, order trends, product performance, payment preferences, and customer segmentation.
The analysis is based on the public Olist dataset and was originally developed as part of my Beginner Data Analyst Certification at GROWIA.
- Identify key sales trends and seasonal patterns.
- Highlight top-performing product categories.
- Analyze customer satisfaction using review scores.
- Segment customers using RFM and cohort retention analysis.
- Provide actionable business recommendations.
Sales increase toward the end of the year, especially in November, likely influenced by seasonal events such as Black Friday or year-end promotions.
Most reviews have a score of 5. Low ratings (1–2) are relatively rare but should be addressed to maintain customer satisfaction.
Pareto chart shows that the majority of revenue comes from a small number of product categories — focusing on these top categories can improve sales efficiency.
Top categories: bed_bath_table, health_beauty, sports_leisure — recommended to focus marketing on these.
Majority of customers use credit card. Payments via boleto and voucher are minimal.
Monday and Tuesday have higher transaction volumes — potential for targeted campaigns.
Customers segmented into 4 clusters:
- Green: Loyal & high-value customers
- Orange: New customers with growth potential
- Red: Passive customers needing reactivation
- Blue: Customers close to churn
Customer retention drops sharply after the first month — suggests implementing post-purchase engagement or loyalty programs.
Optimal number of clusters: 4 — beyond this point, inertia reduction is insignificant.
- Source: Olist Public Dataset
- Period: 2016–2018
- Size: ~100k orders
- Python (Pandas, NumPy, Matplotlib, Seaborn)
- Jupyter Notebook
- GitHub for version control
📧 Email: hfzmustafa07@gmail.com
Proyek ini menganalisis data penjualan e-commerce Olist, meliputi perilaku pelanggan, tren pesanan, performa produk, preferensi metode pembayaran, dan segmentasi pelanggan.
Analisis ini menggunakan dataset publik Olist dan awalnya dibuat untuk Sertifikasi Data Analyst Beginner di GROWIA.
- Mengidentifikasi tren penjualan dan pola musiman.
- Menemukan kategori produk dengan kinerja terbaik.
- Menganalisis kepuasan pelanggan melalui skor ulasan.
- Melakukan segmentasi pelanggan dengan RFM dan cohort retention analysis.
- Memberikan rekomendasi bisnis yang dapat diimplementasikan.
Penjualan meningkat menjelang akhir tahun, terutama di November, kemungkinan dipengaruhi event musiman seperti Black Friday atau promo akhir tahun.
Mayoritas ulasan memiliki skor 5. Rating rendah (1–2) relatif jarang tetapi perlu ditindaklanjuti untuk menjaga kepuasan pelanggan.
Pareto chart menunjukkan sebagian besar pendapatan berasal dari sedikit kategori produk — fokus pada kategori utama dapat meningkatkan efisiensi penjualan.
Kategori teratas: bed_bath_table, health_beauty, sports_leisure — disarankan fokus pemasaran ke kategori ini.
Mayoritas pelanggan menggunakan kartu kredit. Pembayaran via boleto dan voucher relatif kecil.
Senin dan Selasa memiliki volume transaksi lebih tinggi — berpotensi untuk kampanye promosi terarah.
Pelanggan dibagi menjadi 4 cluster:
- Hijau: Pelanggan loyal & bernilai tinggi
- Oranye: Pelanggan baru dengan potensi tumbuh
- Merah: Pelanggan pasif yang perlu diaktivasi kembali
- Biru: Pelanggan hampir churn
Retensi pelanggan menurun tajam setelah bulan pertama — disarankan adanya edukasi pasca-pembelian atau program loyalitas.
Jumlah cluster optimal: 4 — penurunan inertia setelah ini tidak signifikan.
- Sumber: Olist Public Dataset
- Periode: 2016–2018
- Ukuran: ~100 ribu pesanan
- Python (Pandas, NumPy, Matplotlib, Seaborn)
- Jupyter Notebook
- GitHub untuk version control
📧 Email: hfzmustafa07@gmail.com