AbavaNet technical corner: Павшие на измену

Saturday, December 09, 2023

Павшие на измену

Отравленные отклики в Reinforcement Learning для обучения LLM. Магическим образом они изменяют поведение LLM :)

См. также другие публикации, посвященные LLM

No comments:

Subscribe to: Post Comments (Atom)