纵览新闻2024年10月13日发布:大模型“自学”后能力反下降,LlamaMitral都没逃过年内第四次减持!阿里巴巴对网易云音乐持股缩减至491%

⭐发布日期:2024年10月13日 | 来源:纵览新闻

⭐作者:Akinözü 责任编辑:Admin

⭐阅读量:705 评论:3人

【澳门二四六天天资料大全2024】

【新澳门开码结果】

【澳门王中王100%的资料老澳门】 【澳门精准免费资料大全】 【今晚澳门码特开什么号码】 【香港正版图库资料大全用户评价】 【今晚澳门开什么特马】 【澳彩网站准确资料查询大全】 【2024年澳门今晚结果图】 【澳门马会7777788888】
【澳门天天最准最快资料】 【2024澳门正版资料大全网站】 【2024新澳门正版免费资木车】 【澳门精准四肖期期准免费公式功能】 【澳门全年免费资料大全集】 【男生估分600只考了397】 【新澳门六开彩结果近15期】 【管家婆九龙心水资料】

PengFei Liu 投稿

量子位 | 公众号 QbitAI

AI经过多轮“自我提升”,能力不增反降?

上海交通大学GAIR团队最新研究表明,在常识理解、数学推理和代码生成等复杂任务中,AI经过多轮“自我提升”后,可能会出现一种称为“自我提升逆转”(self-improvement reversal)的现象。

LLaMA-2-7B、Mistral-7B、LLaMA-8B都没逃过。

这就像一个学生刷题刷到”走火入魔”——虽然考试成绩提高了,但实际解决问题的能力反而可能下降!

更值得警惕的是,这种训练还可能导致AI的回答变得千篇一律,失去了原有的创造力和适应新情况的能力。好比一个学生只会应付考试,遇到真实世界的问题就束手无策。

要知道,OpenAI最近被曝光的项目“草莓”,据说还在使用post-training阶段的自我提升来提升模型复杂推理能力……

目前该研究《Progress or Regress?Self-Improvement Reversal in Post-training》已获得了 ICML 2024 (AI for Math Workshop) 的Honorable Mention Award。

刷分更高但是能力下降

具体说来,该工作将”迭代后训练”(Iterative post-training)分成三个主要步骤:

  • 答案采样:让AI回答一系列问题,每个问题回答多次。
  • 训练集构建:从AI的回答中挑选出好的答案。
  • 模型后训练:用这些好答案来”教”AI,让它学会更好的回答方式。

研究人员尝试了不同的”教学”方法:

  • 迭代SFT:直接告诉AI哪些答案是对的。
  • 迭代DPO:让AI学会比较不同答案的好坏。
  • 迭代SFT-DPO:将上面两种方法结合起来。

他们还研究了影响AI学习效果的几个关键因素(如图1所示):

  • 训练次数:一般来说,多训练几次,AI的表现会更好。但训练4-5次后,进步就不明显了。
  • AI的基础能力:有趣的是,最聪明的AI并不一定学得最快,但最后表现通常最好。
  • 问题类型:有些类型的问题(如常识问答和简单数学)AI学得比较快,而复杂的数学问题和编程任务就比较困难。
  • 训练方法:不同的问题可能需要不同的训练方法。研究者发现,如果AI一开始就表现不错,用DPO或SFT-DPO方法效果更好。

图1:三种迭代后训练范式在多个任务求解上的Pass@1性能(从常识知识、数学推理、代码生成方向选择了四个聚焦复杂问题求解能力的数据集:CSQA,GSM8k,MATH,MBPP以及三种不同的基座模型LLaMA-2-7B,Mistral-7B,LLaMA-8B。所有实验的迭代次数$$$$设置为5。评估时使用贪婪解码,并且选择Pass@1作为性能评价指标。)

起初,结果看起来很令人兴奋。AI在测试中的分数确实提高了!但研究团队深入观察后,发现了一些“出人意料”的现象:

1、能力幻觉

研究者发现,AI并没有真正学会解决更难的问题。相反,它只是变得更擅长在已知的答案中挑选正确的那个。他们用”正确答案覆盖率”这个指标来衡量这一现象。结果显示,即使是未经过多轮训练的AI,只要给它足够多的尝试机会,也能在那些看似”学会”的问题上得到正确答案。这就像一个学生通过背答案提高了考试分数,但实际解决问题的能力并没有提升。

2、多样性丧失

随着训练次数增加,AI的回答变得越来越“千篇一律”。研究者从三个方面测量了这种变化:

  • 语法多样性:使用”Distinct N-gram”指标。
  • 语义多样性:使用句子嵌入的余弦相似度。
  • 逻辑多样性:在数学问题中计算不同方程的数量。结果显示,无论哪种训练方法,AI的回答都变得越来越相似,失去了原有的创意和多样性。

3、泛化能力下降

研究者还测试了AI面对全新类型问题时的表现。他们先让AI在一个简单的数学问题集(GSM8K)上训练,然后用一个更难的数学问题集(MATH)来测试它。结果发现,经过多轮”自学”的AI在面对这些新问题时,表现反而更差。而且,AI在简单问题和困难问题上的表现差距越来越大,这说明它可能只是在”死记硬背”,而不是真正理解和学习。

毫无疑问,post-training阶段的”自我提升“仍然是一个充满潜力的研究方向,”让AI自我提升”也是一个很酷的想法。但GAIR团队的发现表明,AI的进化之路可能比想象中更加复杂和充满挑战。在追求AI性能提升的同时,也需要更全面地考虑:

  • AI真正的问题解决能力是否提升了?
  • AI是否保持了创造力和多样性?
  • AI能否灵活应对新的、未知的情况?

人工智能的未来令人期待,但同时也需要以更加审慎和全面的视角来看待其发展。只有这样,才能真正实现AI的潜力,创造出既智能又可靠的系统,为人类社会带来真正的价值。

实验室介绍:

生成式人工智能研究实验室(GAIR,主页:https://plms.ai/)由上海交通大学刘鹏飞副教授2023年4月回国创建,是国内首个聚焦于生成式人工智能的高校研究组。汇聚了来自于CMU、复旦、交大(ACM班、IEEE试点班等)等顶尖高校的年轻本硕博人才。实验室专注于三大核心领域:大模型基础研究、对齐系统和社会影响,致力于培养顶尖人工智能人才(具有原创、批判精神等)、开发尖端的生成式人工智能技术,赋能人类解决复杂问题,提升人类生活质量。

论文地址:

https://arxiv.org/pdf/2407.05013

项目主页:https://gair-nlp.github.io/self-improvement-reversal/

— 完 —

量子位 QbitAI · 头条号

【澳门2024正版资料管家婆】 【2024年管家婆澳门结果】
【2o24新澳门正版免费资木车】 【澳门资料大全正版y资料查询】
【白小姐天天来料生肖】 【今晚特马开42号】
【新奥彩资料大全最新版】 【2024年四肖八码期期准精选】
【天天彩澳门资料免费大全年】 【新澳门三中三码精准100%】
【2024澳门跑狗图】 【2024新澳免费资料三头67期】 【白小姐三期必开一肖】
上一条新闻 下一条新闻

推荐文章

发表评论

王运庭

1秒前:他们先让AI在一个简单的数学问题集(GSM8K)上训练,然后用一个更难的数学问题集(MATH)来测试它。

IP:10.63.9.*

张晓燕

5秒前:AI是否保持了创造力和多样性?

IP:85.69.4.*

西格妮·韦弗

5秒前:在追求AI性能提升的同时,也需要更全面地考虑:AI真正的问题解决能力是否提升了?

IP:18.78.8.*

纵览新闻APP介绍

APP图标

新澳门免费资料大全6049APP名:纵览新闻

版本:V7.33.561

更新时间:2024-10-12 20:22

金彩网f49cc全年资料这是一个功能强大的2024澳门管家婆资料大全玛丽APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:相反,它只是变得更擅长在已知的答案中挑选正确的那个。

今晚开特马开的什么生肖APP介绍

APP图标

2024澳门免费资料APP名:纵览新闻

版本:V9.33.450

更新时间:2024-10-12 16:13

无论是澳门精准资料大全免费经典版更新快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

4949澳门免费资料大全特色APP介绍

APP图标

新澳门六开彩网站APP名:纵览新闻

版本:V4.16.462

更新时间:2024-10-12 13:24

全网最精准资料应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

4949.cσm查询,澳彩APP介绍

APP图标

494949cc澳门精准一肖APP名:纵览新闻

版本:V6.66.962

更新时间:2024-10-12 24:14

澳门六开彩资料查询2024网站这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

澳门特马凤凰艺术2024抖音APP介绍

APP图标

西渝高铁安康至重庆段最新进展APP名:纵览新闻

版本:V4.72.778

更新时间:2024-10-12 19:18

这是一款功能强大的2024奥门免费精准资料应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:他们用”正确答案覆盖率”这个指标来衡量这一现象。。无论是获取信息还是提升效率,这款APP都是您理想的助手。

7777788888管家婆跑狗APP介绍

APP图标

新奥新澳门六结果资料查询APP名:纵览新闻

版本:V3.87.233

更新时间:2024-10-12 24:16

这是一款功能强大的新澳门图库资料2024年应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:图1:三种迭代后训练范式在多个任务求解上的Pass@1性能(从常识知识、数学推理、代码生成方向选择了四个聚焦复杂问题求解能力的数据集:CSQA,GSM8k,MATH,MBPP以及三种不同的基座模型LLaMA-2-7B,Mistral-7B,LLaMA-8B。,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

2024年澳门正版免费资料APP介绍

APP图标

新澳资料免费APP名:纵览新闻

版本:V2.41.341

更新时间:2024-10-12 23:21

这是一款功能强大的澳门管家婆2024精准一肖一码应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:只有这样,才能真正实现AI的潜力,创造出既智能又可靠的系统,为人类社会带来真正的价值。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

澳门精准资料期期精准APP介绍

APP图标

7777788888新香港中APP名:纵览新闻

版本:V1.34.615

更新时间:2024-10-12 16:24

今天的最新动态包括:3、泛化能力下降:研究者还测试了AI面对全新类型问题时的表现。,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

二四六天下彩5334cc图文APP介绍

APP图标

马会传真-澳门云APP名:纵览新闻

版本:V7.88.298

更新时间:2024-10-12 14:23

这是一款功能强大的香港正版免费大全资料应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:ai/)由上海交通大学刘鹏飞副教授2023年4月回国创建,是国内首个聚焦于生成式人工智能的高校研究组。。

2024年新奥正版资料免费大全APP介绍

APP图标

新澳彩资料免费长期公开APP名:纵览新闻

版本:V8.36.192

更新时间:2024-10-12 20:18

这款功能强大的8228澳门资料大全应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

澳门挂牌免费资料大全APP介绍

APP图标

澳门正版准最快免费资料APP名:纵览新闻

版本:V5.77.776

更新时间:2024-10-12 13:24

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

看香港正版精准特马资料141期APP介绍

APP图标

2024新澳彩免费资料61期APP名:纵览新闻

版本:V2.71.527

更新时间:2024-10-12 14:19

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。