Страницы

Wednesday, May 06, 2026

Учебник по RL

Reinforcement Learning: From Bandits to LLM Alignment. Есть русский перевод

No comments:

Post a Comment