Keyword: Reinforcement Learning https://www.math.univ-toulouse.fr/~agarivie/?q=taxonomy/term/8/all en Maximin Action Identification: A New Bandit Framework for Games https://www.math.univ-toulouse.fr/~agarivie/?q=node/159 Wed, 17 Feb 2016 15:05:16 +0000 garivier 159 at https://www.math.univ-toulouse.fr/~agarivie Optimism in Reinforcement Learning and Kullback-Leibler Divergence https://www.math.univ-toulouse.fr/~agarivie/?q=node/146 Mon, 01 Jun 2015 11:36:33 +0000 garivier 146 at https://www.math.univ-toulouse.fr/~agarivie Allocation dynamique de ressources et modèles de bandits https://www.math.univ-toulouse.fr/~agarivie/?q=node/135 Thu, 16 Oct 2014 08:12:00 +0000 garivier 135 at https://www.math.univ-toulouse.fr/~agarivie Allocation dynamique de ressources et modèles de bandits https://www.math.univ-toulouse.fr/~agarivie/?q=node/134 Thu, 16 Oct 2014 08:11:47 +0000 garivier 134 at https://www.math.univ-toulouse.fr/~agarivie Apprentissage par renforcement et déviations auto-normalisées https://www.math.univ-toulouse.fr/~agarivie/?q=node/105 Thu, 08 Aug 2013 09:16:15 +0000 garivier 105 at https://www.math.univ-toulouse.fr/~agarivie Analyses d'algorithmes pour l'estimation et l'optimisation stochastiques https://www.math.univ-toulouse.fr/~agarivie/?q=node/104 Thu, 08 Aug 2013 08:59:49 +0000 garivier 104 at https://www.math.univ-toulouse.fr/~agarivie Analyse d'algorithmes pour l'estimation et l'optimisation stochastiques https://www.math.univ-toulouse.fr/~agarivie/?q=node/82 Wed, 07 Aug 2013 20:42:20 +0000 garivier 82 at https://www.math.univ-toulouse.fr/~agarivie Optimally Sensing a Single Channel Without Prior Information: The Tiling Algorithm and Regret Bounds https://www.math.univ-toulouse.fr/~agarivie/?q=node/47 Wed, 07 Aug 2013 11:54:01 +0000 garivier 47 at https://www.math.univ-toulouse.fr/~agarivie Optimism in Reinforcement Learning and Kullback-Leibler Divergence https://www.math.univ-toulouse.fr/~agarivie/?q=node/53 Wed, 07 Aug 2013 12:23:41 +0000 garivier 53 at https://www.math.univ-toulouse.fr/~agarivie Optimism in Reinforcement Learning and Kullback-Leibler Divergence https://www.math.univ-toulouse.fr/~agarivie/?q=node/96 Thu, 08 Aug 2013 08:14:18 +0000 garivier 96 at https://www.math.univ-toulouse.fr/~agarivie Présentation de l'équipe et de l'apprentissage par renforcement https://www.math.univ-toulouse.fr/~agarivie/?q=node/95 Thu, 08 Aug 2013 08:13:14 +0000 garivier 95 at https://www.math.univ-toulouse.fr/~agarivie