# PaLM-rlhf-pytorch PaLM 架构之上实现 RLHF(人类反馈的强化学习) 的 ChatGPT