Komparasi K-Means Clustering dengan Euclidean dan Cosine Similarity untuk Segmentasi dan Rekomendasi Produk pada Data E-Commerce

Authors

  • Annisa Khoirala Ermy Pily student
  • Susanti Universitas Sains dan Teknologi Indonesia
  • Unang Rio Universitas Sains dan Teknologi Indonesia
  • Tashid

DOI:

https://doi.org/10.33022/ijcs.v14i2.4713

Abstract

Segmentasi pelanggan dan sistem rekomendasi berperan penting dalam meningkatkan pengalaman pengguna dan efektivitas analisis perilaku pelanggan. Penelitian ini membandingkan K-Means Clustering dengan Euclidean Distance dan Cosine Similarity untuk segmentasi pelanggan. Hasil evaluasi menunjukkan K-Means dengan Cosine Similarity lebih unggul, dengan Silhouette Score 0.6918, Calinski-Harabasz Score 3016.781, dan Davies-Bouldin Score 0.951, dibandingkan dengan 0.2363, 1257.178, dan 1.368 pada Euclidean. Clustering diterapkan pada sistem rekomendasi hybrid yang menggabungkan CBF, CF, dan CBPR. Hasil eksperimen menunjukkan bahwa hybrid recommendation dengan bobot CF 0.3, CBF 0.5, dan CBPR 0.2 menghasilkan Precision 0.8266, Recall 0.6198, NDCG 0.9964, dan Hit Ratio 0.9964. Penelitian ini menyimpulkan bahwa K-Means dengan Cosine Similarity lebih efektif dalam membentuk klaster pelanggan, sementara hybrid recommendation dengan bobot CF 0.3, CBF 0.5, dan CBPR 0.2 meningkatkan kualitas rekomendasi secara lebih relevan dan terstruktur.

Downloads

Published

15-04-2025