Mining Patterns With Durations from E-commerce Dataset - Laboratoire d’Excellence Intelligences des Mondes Urbains
Communication Dans Un Congrès Transactions on Large-Scale Data- and Knowledge-Centered Systems Année : 2018

Mining Patterns With Durations from E-commerce Dataset

Extraction de motifs avec durées à partir des données e-commerce

Mohamad Kanaan
  • Fonction : Auteur
  • PersonId : 171753
  • IdHAL : mkanaan

Résumé

Given a dataset of clickstream extracted from e-commerce logs, can we find a clear usage of the website? Are there hidden relationships between the purchased products? Are there any discriminatory behaviors leading to the purchase? To answer these questions, we propose in this paper a new Sequential Event Pattern Mining algorithm (SEPM). The endeavor is to mine clickstream data in order to extract and analyze useful sequential patterns of clicks. Also, in order to make these patterns clearer, the time spent on each page is taken into account. SEPM maintains the items durations during the mining process and extracts patterns with the average durations of these items without multiple scans of the dataset. Our experimental results on both real and synthetic datasets indicate that SEPM is efficient and scalable.
Disposant d'un ensemble de flux de clics extrait des traces d'utilisation d'un site marchand en ligne, peut-on trouver une utilisation claire du site ? Existe-t-il des relations implicites entre les produits achetés ? Existe-t-il des comportements utilisateurs discriminatoires menant à l'achat ? Pour répondre à ces questions, nous proposons dans cet article un nouvel algorithme d'Extraction de Motifs d'Événements Séquentiels. L'algorithme exploite les données de flux de clics pour extraire et analyser des motifs séquentiels importants. De plus, pour rendre ces motifs plus clairs, le temps passé par les utilisateurs sur chaque page est pris en compte. Notre algorithme conserve les durées des éléments pendant son déroulement et extrait les motifs avec les durées moyennes de leurs éléments sans parcourir l'ensemble de données plusieurs fois. Les résultats de nos expériences sur des jeux de données réelles indiquent que notre algorithme est efficace et évolutif.
Fichier principal
Vignette du fichier
Mining_Patterns_With_Durations_from_E_commerce_Dataset.pdf (275.34 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01960321 , version 1 (19-12-2018)

Identifiants

Citer

Mohamad Kanaan, Hamamache Kheddouci. Mining Patterns With Durations from E-commerce Dataset. Complex Network, Dec 2018, Cambridge, United Kingdom. ⟨10.1007/978-3-030-05411-3_49⟩. ⟨hal-01960321⟩
238 Consultations
614 Téléchargements

Altmetric

Partager

More