当前位置：首页 > 谷歌公布模型训练框架ASPIRE，可让AI自我判断输出内容正确性下载 >

谷歌公布模型训练框架ASPIRE，可让AI自我判断输出内容正确性下载

来源ikuho软导

2024-11-22 04:18:16

↓↓下载地址在最下面↓↓

1 月 23 日音讯，google日前公布旧事稿，引见了一款专为年夜言语模子计划的 ASPIRE 锻炼框架，该框架号称能够加强 AI 模子的挑选性猜测才能。google提到，当下年夜言语模子正在天然言语了解以及天生内容方面开展疾速，已经被用于构建各类立异使用，但要使用于高危害决议计划类场所仍然不当。这是因为模子猜测具备没有断定性及“幻觉”能够，因而google开辟了一款 ASPIRE 锻炼框架，为系列模子引入了“可托度”机制，即 —— 模子会输入一系列谜底，每一个谜底城市具备精确几率评分。正在技能层面，网友留意到该锻炼框架次要分为三阶段，辨别为“特定义务调剂”、“谜底采样”以及“自我评价进修”。此中“特定义务调剂”阶段是对于已经承受过根底锻炼的年夜型言语模子停止深化锻炼，专一于强化模子的猜测才能。研讨职员次要为模子引入一系列可调参数，正在特定义务的锻炼数据集上微调预锻炼言语模子，从而晋升模子猜测功能，让模子可以更好地处理特定成绩。第二阶段为“谜底采样”，颠末特定微调后，模子能够应用先前进修到的可调参数，为每一个锻炼成绩天生差别的谜底，并创立用于自我评价进修的数据集，天生一系列可托度较高的谜底。研讨职员同时运用 “集束搜刮（Beam Search）”办法及 Rouge-L 算法来评价谜底的品质，并将天生的谜底及评分从头输出给模子开启第三阶段。而正在第三阶段“自我评价进修”中，研讨职员为模子增加一组可调参数，特地用于晋升模子自我评价才能。该阶段的目的是让模子学会“本人判别输入的谜底精确性”，从而让年夜言语模子正在天生谜底时，还会附上谜底的精确几率评分。google研讨职员运用 CoQA、TriviaQA 以及 SQuAD 三个问答数据集来考证 ASPIRE 锻炼框架的效果，据称“颠末 ASPIRE 调剂的 OPT-2.7B 小模子，施展阐发远超更年夜的 OPT-30B 模子”。而这项尝试后果也同时标明，只需颠末得当的调剂，即便是小言语模子，正在局部场景下也能够逾越年夜言语模子。研讨职员总结称，ASPIRE 框架锻炼可以明显晋升年夜言语模子输入精确率，即便是较小的模子，也能够正在颠末微调落后行“精确且有自傲”的猜测。

上一篇：MikuTools

下一篇：闲鱼回应1元就能买盗版《黑神话：悟空》：部分用户用网盘引流已处理下载