谷歌公布模型训练框架ASPIRE,可让AI自我判断输出内容正确性下载
来源ikuho软导
2024-11-22 04:18:16
↓↓下载地址在最下面↓↓
1 月 23 日音讯,google日前公布旧事稿,引见了一款专为年夜言语模子计划的 ASPIRE 锻炼框架,该框架号称能够加强 AI 模子的挑选性猜测才能。google提到,当下年夜言语模子正在天然言语了解以及天生内容方面开展疾速,已经被用于构建各类立异使用,但要使用于高危害决议计划类场所仍然不当。这是因为模子猜测具备没有断定性及“幻觉”能够,因而google开辟了一款 ASPIRE 锻炼框架,为系列模子引入了“可托度”机制,即 —— 模子会输入一系列谜底,每一个谜底城市具备精确几率评分。正在技能层面,网友留意到该锻炼框架次要分为三阶段,辨别为“特定义务调剂”、“谜底采样”以及“自我评价进修”。此中“特定义务调剂”阶段是对于已经承受过根底锻炼的年夜型言语模子停止深化锻炼,专一于强化模子的猜测才能。研讨职员次要为模子引入一系列可调参数,正在特定义务的锻炼数据集上微调预锻炼言语模子,从而晋升模子猜测功能,让模子可以更好地处理特定成绩。第二阶段为“谜底采样”,颠末特定微调后,模子能够应用先前进修到的可调参数,为每一个锻炼成绩天生差别的谜底,并创立用于自我评价进修的数据集,天生一系列可托度较高的谜底。研讨职员同时运用 “集束搜刮(Beam Search)”办法及 Rouge-L 算法来评价谜底的品质,并将天生的谜底及评分从头输出给模子开启第三阶段。而正在第三阶段“自我评价进修”中,研讨职员为模子增加一组可调参数,特地用于晋升模子自我评价才能。该阶段的目的是让模子学会“本人判别输入的谜底精确性”,从而让年夜言语模子正在天生谜底时,还会附上谜底的精确几率评分。google研讨职员运用 CoQA、TriviaQA 以及 SQuAD 三个问答数据集来考证 ASPIRE 锻炼框架的效果,据称“颠末 ASPIRE 调剂的 OPT-2.7B 小模子,施展阐发远超更年夜的 OPT-30B 模子”。而这项尝试后果也同时标明,只需颠末得当的调剂,即便是小言语模子,正在局部场景下也能够逾越年夜言语模子。研讨职员总结称,ASPIRE 框架锻炼可以明显晋升年夜言语模子输入精确率,即便是较小的模子,也能够正在颠末微调落后行“精确且有自傲”的猜测。