# PaLM-rlhf-pytorch PaLM 架构之上实现 RLHF（人类反馈的强化学习）的 ChatGPT