标签: OpenAI

OpenAI 安全研究团队 Superalignment 交出成绩!成员强调:需要方法控制超级 AI

Published / by 九良良岛上单 / Leave a Comment

OpenAI 在今年 7 月成立的 Superalignment 研究团队,目标是研发能控制和规范未来超级 AI 系统的方式,OpenAI 也在今(15)日以论文分享目前实验成果。研究员让较低阶的 AI 模型,在不影响更高智慧 AI 模型的表现之下引导其行为。

研究团队使用的是「supervision」,也就是用来微调 GPT-4 以降低模型风险的方式,目前此方法须人类提供回馈给 AI 系统,但研究员不断在探索自动化此流程的办法。   

在实验中 Superalignment 团队训练 GPT-2 处理各式任务,像是解西洋棋谜题和 22 项常见 NLP 测试题,再用 GPT-2 回应来训练 GPT-4。团队调整了 GPT-4 演算法,确保 GPT-4 照着 GPT-2 引导,同时也不会让 GPT-4 表现跟着变差。

团队中的研究人员 Collin …