Russo, Daniel J., Van Roy, Benjamin, Kazerouni, Abbas, Osband, Ian
Omschrijving
Covers the Thompson sampling algorithm and its application, illustrating concepts through a range of examples, including Bernoulli bandit problems, shortest path problems, product recommendation, assortment, active learning with neural networks, and reinforcement learning in Markov decision processes.
Ik heb een vraag over het boek: ‘A Tutorial on Thompson Sampling - Russo, Daniel J., Van Roy, Benjamin, Kazerouni, Abbas, Osband, Ian’.
Vul het onderstaande formulier in.
We zullen zo spoedig mogelijk antwoorden.