Algorithmes basés sur les données pour le comportement individuel et collectif des utilisateurs - SLIDE - ScaLable Information Discovery and Exploitation
Thèse Année : 2023

data-driven algorithms for individual and collective user behavior

Algorithmes basés sur les données pour le comportement individuel et collectif des utilisateurs

Résumé

User data is becoming increasingly available in multiple domains ranging from e-commerce platforms to social media networks. It includes demographics (e.g., age, gender, location, etc.) and user activities (e.g., browsing habits, purchase history, rating records, etc.). The analysis of this data is appealing as it helps companies to enhance their business, understand users’ behavior, reduce their churn, and attract new customers. With the advancement of technology, many data-driven and data-informed tools were developed to understand the preferences of users and extract valuable insights from the collected data.In this thesis, we propose a framework that aims to study distinctly both the individual and collective behavior of users. We first aim to examine users individually as each one is unique, and their actions and interactions may vary significantly from one to another. We leverage recommender systems that analyze the behavior of users at a low level of granularity which allows for personalized experiences that can better meet users’ expectations. More precisely, we leverage dynamic recommenders to infer the states where the users might be and capture their constant evolution over time. Following this, we first extend the standard recommenders by incorporating users’ states and profiles within a static environment based on a meta-learning methodology. Then, we explore more realistic contexts where the environment is dynamic. We explore three real-world applications: Educational test recommendation, SQL query recommendation, and diverse session recommendation. Within each application, we define the behavior of users with many dimensions to avoid overspecialization and filter-bubble and propose several solutions based on Multi-armed bandits, and Reinforcement Learning.In addition to their unique behavior, users with the same characteristics (e.g., demographics) may exhibit the same global trends. Hence, our second part of the framework aims to extract these insights, seek to analyze users’ collective behavior, and discover the relationships between the different user groups and the subset of items. For the purpose of reducing false discoveries, we rely on hypothesis testing to produce significant and statistically sound insights. We also optimize for coverage to explore all users’ groups and avoid analyzing a small subset of them. We design novel solutions based on standard multiples hypothesis testing corrections as well as α-investing.In this thesis, we evaluate our solutions using an extensive set of experiments both for quality and performance. We also conduct a comparative analysis with existing approaches or state-of-the-art approaches to demonstrate the effectiveness of our solutions.
Les données des utilisateurs deviennent de plus en plus disponibles dans plusieurs domaines, allant des plateformes de commerce électronique aux réseaux sociaux. Elles incluent des informations démographiques (par exemple, l'âge, le sexe, la localisation, etc.) et des activités des utilisateurs (par exemple, les habitudes de navigation, l'historique des achats et des notations, etc.). L'analyse de ces données est attrayante car elle aide les entreprises à améliorer leurs activités, comprendre le comportement des utilisateurs, réduire le taux de désabonnement et attirer de nouveaux clients. Avec l'avancement de la technologie, de nombreux outils axés sur les données ont été développés pour comprendre les préférences des utilisateurs et extraire des informations précieuses à partir des données collectées.Dans cette thèse, nous proposons un framework qui vise à étudier distinctement le comportement individuel et collectif des utilisateurs. Nous examinons d'abord individuellement les utilisateurs. La raison est que chaque utilisateur est unique, et leurs actions et interactions peuvent varier considérablement d'un individu à un autre. Nous nous appuyons sur des systèmes de recommandation qui analysent le comportement des utilisateurs à un niveau de granularité fin. Ceci permet des expériences personnalisées répondant au mieux aux attentes des utilisateurs. Plus précisément, nous utilisons des systèmes de recommandation dynamiques pour induire les états dans lesquels les utilisateurs pourraient se trouver et capturer leur évolution constante dans le temps. Ainsi, nous étendons les systèmes de recommandation classiques en incorporant les états et profils des utilisateurs dans un environnement statique basé sur une méthodologie de méta-apprentissage. Ensuite, nous explorons des contextes plus réalistes où les environnements sont dynamiquse. Nous explorons trois applications réelles et concrètes : la recommandation de tests éducatifs, la recommandation de requêtes SQL et la recommandation de sessions diversifiées. Pour chaque application, les utilisateurs sont définis selon plusieurs dimensions afin d'éviter la spécialisation excessive et la formation de filtres de bulles. Nous proposons plusieurs solutions basées sur les bandits manchots et l'apprentissage par renforcement.En plus de leur comportement unique, les utilisateurs ayant des caractéristiques similaires (par exemple, démographiques) peuvent avoir le même comportement global. Ainsi, notre deuxième partie vise à analyser le comportement collectif des utilisateurs et à découvrir les relations entre les différents groupes d'utilisateurs et les ensembles d'éléments (par exemple, les produits). Dans le but de réduire les fausses découvertes, nous nous appuyons sur des tests d'hypothèses pour produire des informations significatives et statistiquement fiables. Nous optimisons également la couverture pour explorer tous les groupes d'utilisateurs et éviter d'analyser qu'un petit sous-ensemble. Nous concevons des solutions novatrices basées sur des méthodes classique de tests d'hypothèses multiples ainsi que sur le α-investing.Dans cette thèse, nous évaluons nos solutions à l'aide d'un ensemble étendu d'expériences, tant en termes de qualité que de performances. Nous effectuons également une analyse comparative avec des approches existantes pour démontrer l'efficacité de nos solutions.
Fichier principal
Vignette du fichier
BOUAROUR_2023_archivage.pdf (5.43 Mo) Télécharger le fichier
Origine Version validée par le jury (STAR)

Dates et versions

tel-04653074 , version 1 (18-07-2024)

Identifiants

  • HAL Id : tel-04653074 , version 1

Citer

Nassim Bouarour. Algorithmes basés sur les données pour le comportement individuel et collectif des utilisateurs. Apprentissage [cs.LG]. Université Grenoble Alpes [2020-..], 2023. Français. ⟨NNT : 2023GRALM081⟩. ⟨tel-04653074⟩
78 Consultations
38 Téléchargements

Partager

More