Keyword: UCB https://www.math.univ-toulouse.fr/~agarivie/?q=taxonomy/term/12/all en X-Armed Bandits: Optimizing Quantiles and Other Risks https://www.math.univ-toulouse.fr/~agarivie/?q=node/228 Tue, 23 Apr 2019 07:57:34 +0000 garivier 228 at https://www.math.univ-toulouse.fr/~agarivie Sequential Test for the Lowest Mean: From Thompson to Murphy Sampling https://www.math.univ-toulouse.fr/~agarivie/?q=node/211 Fri, 18 May 2018 20:17:00 +0000 garivier 211 at https://www.math.univ-toulouse.fr/~agarivie Profitable Bandits https://www.math.univ-toulouse.fr/~agarivie/?q=node/209 Wed, 09 May 2018 20:49:16 +0000 garivier 209 at https://www.math.univ-toulouse.fr/~agarivie Introduction à certains problèmes de décisions séquentielles https://www.math.univ-toulouse.fr/~agarivie/?q=node/221 Fri, 12 Oct 2018 12:18:52 +0000 garivier 221 at https://www.math.univ-toulouse.fr/~agarivie Optimization of a SSP's Header Bidding Strategy using Thompson Sampling https://www.math.univ-toulouse.fr/~agarivie/?q=node/206 Mon, 07 May 2018 08:48:54 +0000 garivier 206 at https://www.math.univ-toulouse.fr/~agarivie Missing Mass, and Optimal Discovery https://www.math.univ-toulouse.fr/~agarivie/?q=node/210 Mon, 14 May 2018 13:11:46 +0000 garivier 210 at https://www.math.univ-toulouse.fr/~agarivie KL-UCB-switch: optimal regret bounds for stochastic bandits from both a distribution-dependent and a distribution-free viewpoints https://www.math.univ-toulouse.fr/~agarivie/?q=node/208 Mon, 07 May 2018 09:28:59 +0000 garivier 208 at https://www.math.univ-toulouse.fr/~agarivie Learning the distribution with largest mean: two bandit frameworks https://www.math.univ-toulouse.fr/~agarivie/?q=node/181 Fri, 27 Jan 2017 08:55:16 +0000 garivier 181 at https://www.math.univ-toulouse.fr/~agarivie A minimax and asymptotically optimal algorithm for stochastic bandits https://www.math.univ-toulouse.fr/~agarivie/?q=node/183 Thu, 23 Feb 2017 14:37:12 +0000 garivier 183 at https://www.math.univ-toulouse.fr/~agarivie Algorithme de bandit et obsolescence : un modèle pour la recommandation https://www.math.univ-toulouse.fr/~agarivie/?q=node/213 Sun, 27 May 2018 20:06:58 +0000 garivier 213 at https://www.math.univ-toulouse.fr/~agarivie Optimal Discovery with Probabilistic Expert Advice https://www.math.univ-toulouse.fr/~agarivie/?q=node/156 Sat, 12 Dec 2015 15:14:20 +0000 garivier 156 at https://www.math.univ-toulouse.fr/~agarivie Systèmes de recommandation et algorithmes de bandits: notebook ipython pour l'enseignement https://www.math.univ-toulouse.fr/~agarivie/?q=node/148 Wed, 17 Jun 2015 08:51:25 +0000 garivier 148 at https://www.math.univ-toulouse.fr/~agarivie Systèmes de recommandations : algorithmes de bandits et évaluation expérimentale https://www.math.univ-toulouse.fr/~agarivie/?q=node/145 Wed, 29 Apr 2015 15:57:42 +0000 garivier 145 at https://www.math.univ-toulouse.fr/~agarivie A Multiple-play Bandit Algorithm Applies to Recommender Systems https://www.math.univ-toulouse.fr/~agarivie/?q=node/153 Fri, 10 Jul 2015 16:06:02 +0000 garivier 153 at https://www.math.univ-toulouse.fr/~agarivie Algorithmes de bandit pour les systèmes de recommandation : le cas de multiples recommandations simultanées https://www.math.univ-toulouse.fr/~agarivie/?q=node/150 Fri, 10 Jul 2015 15:19:33 +0000 garivier 150 at https://www.math.univ-toulouse.fr/~agarivie