First-Order Regret in Reinforcement Learning with Linear Function Approximation: A Robust Estimation Approach - Max Simchowitz

First-Order Regret in Reinforcement Learning with Linear Function Approximation: A Robust Estimation Approach

Share on

Twitter Facebook LinkedIn