Exposé d'Antoine Chambaz au Séminaire Parisien de Statistique, lundi 13 avril, 15h, à l'IHP.

Antoine Chambaz présentera un exposé intitulé
Intervalles de confiance pour les bandits contextuels
au Séminaire Parisien de Statistique, lundi 13 avril, 15h, à l'IHP.

Voici le résumé de son intervention:

Un opérateur a le choix entre deux actions. Chaque action induit un gain aléatoire, dont la loi dépend du contexte dans lequel l'action est entreprise. L'objectif est d'apprendre, en répétant l'expérience avec parcimonie, (i) la loi conditionnelle de l'action optimale sachant le contexte et (ii) la moyenne du gain sous cette loi dégénérée. Dans ce cadre de bandit contextuel, nous abordons les questions (i) et (ii) sous l'angle de l'inférence plutôt que sous celui de la minimisation du regret.

(Travail en collaboration avec Wenjing Zheng et Mark van der Laan, avec le soutien de l'ANR SPADRO)

Venez nombreux!