有钱可以多任性?OpenAI提出人肉模型训练,文本摘要全面超越人类表现!

有钱可以多任性?OpenAI提出人肉模型训练,文本摘要全面超越人类表现! 6

知行编程网 人工智能前沿 2年前 (2022-01-24) 63 0

背景 三个多月前,OpenAI的GPT-3在NLP界掀起轩然大波。就在上周,视金钱如粪土的OpenAI团队又在文本摘要方面推出了最新力作,全方位超越人类表现。其亮点在于:以人类偏好替代自动化评测方法(如ROUGE、BLUE)为训练目标,用人类反馈作为奖励进行强化学习,性能表现十分惊艳。 对于较为复杂的NLP任务,如何进行评测、如何构造精准的损失函数已困扰了NLP researchers多年。以文本...

扫一扫二维码分享