..

archive

09-04-2025 maximum [causal] entropy inverse reinforcement learning
09-04-2025 lagrange multipliers & lagrangian duality
08-02-2025 monte carlo planning in large partially observable mdps
13-01-2025 generative frameworks for robot imitation learning
10-01-2025 policy gradient theorem
07-12-2023 energy-based models & score matching
28-10-2023 cross entropy method