PaLM 架构之上实现 RLHF（人类反馈的强化学习）的 ChatGPT https://github.com/lucidrains/PaLM-rlhf-pytorch

天问 ba283502a9 Initial commit		3 years ago
README.md	ba283502a9 Initial commit	3 years ago

PaLM-rlhf-pytorch

PaLM 架构之上实现 RLHF（人类反馈的强化学习）的 ChatGPT