OpenAI - ChatGPT中国应用社区

OpenAI 在今年 7 月成立的 Superalignment 研究团队，目标是研发能控制和规范未来超级 AI 系统的方式，OpenAI 也在今（15）日以论文分享目前实验成果。研究员让较低阶的 AI 模型，在不影响更高智慧 AI 模型的表现之下引导其行为。

研究团队使用的是「supervision」，也就是用来微调 GPT-4 以降低模型风险的方式，目前此方法须人类提供回馈给 AI 系统，但研究员不断在探索自动化此流程的办法。

在实验中 Superalignment 团队训练 GPT-2 处理各式任务，像是解西洋棋谜题和 22 项常见 NLP 测试题，再用 GPT-2 回应来训练 GPT-4。团队调整了 GPT-4 演算法，确保 GPT-4 照着 GPT-2 引导，同时也不会让 GPT-4 表现跟着变差。