README.md 94 B

PaLM-rlhf-pytorch

PaLM 架构之上实现 RLHF(人类反馈的强化学习) 的 ChatGPT