如何监测通用大模型的安全水位?多位专家支招

⭐发布日期:2024年09月25日 | 来源:华律网

⭐作者:张姻脂 责任编辑:Admin

⭐阅读量:190 评论:5人

【新澳门最快开奖结果开奖网站】

【2024澳门资料大全正版资料免费】

【2024年澳门一肖一码】 【王中王免费资料大全料大全一精准】 【新澳门六开彩今晚开奖】 【2024期澳门正版挂牌】 【新澳彩2024全年免费开奖记录】 【新澳彩资料免费资料大全33图库】 【2024澳彩管家婆资料传真】 【今晚澳门一肖一码一必开】
【新澳门开奖挂牌结果】 【澳门一码一肖一待一中四不像】 【新澳资料免费大全】 【新澳门特马今期开奖结果查询2024】 【最新澳门6合开彩开奖结果】 【新奥门天天开将资料大全】 【奥门最准精选免费资料大全,很历害的刘伯温93】 【新澳门开奖2024年开奖结果查询】

界面新闻记者 | 黄景源

界面新闻编辑 | 彭朋

截至2023年底,国内已完成备案的生成式人工智能服务达60余款。人工智能大模型在解放生产力、提高生产效率的同时也带来了一系列问题,例如隐私信息泄漏、版权归属纠纷、内容真实性与合规性等,如何应对随之而来的安全、治理问题?

9月9日,2024年国家网络安全宣传周上海地区活动拉开帷幕,在当日举行的主论坛现场,教育部长江学者、复旦大学计算机科学技术学院院长杨珉围绕“AI大模型安全评测与治理”,介绍了人工智能系统安全治理领域的研究成果。

杨珉指出,ChatGPT等通用大模型正成为大家日常生活中频繁使用的工具,并逐步向具身智能体进化,在可预见的将来会出现AI社会,很多人工智能体会互相影响、协同工作。这种技术演变的趋势背后,大模型生成内容的安全风险会逐渐外溢,进而形成物理世界的风险,如何动态、持续地监测通用大模型的安全水位,是学界、企业界、政府部门必须共同面对的重大挑战。

“当前的安全技术远远滞后于的AI技术发展的整体速度。”杨珉表示,其中一个技术是基于个人的技巧发现安全问题,即诱导问题,它的特点是自动化程度低、成本高昂。杨珉及团队一直深耕于此,希望寻找到一个通用的普适性的测试集,客观地检视当前大模型的安全合规能力。目前部分技术已在百度、阿里、华为落地应用。

此外,杨珉团队还利用语言学中“转换生成语法”的原理,建设了评测自动化、测试覆盖率高和风险发现能力强的测评平台。基于此,杨珉带领团队在今年6月发布第一代测试集,测试的维度包含了歧视性内容、商业违法违规、侵犯他人权益以及内容不准确不科学等31个子类。

杨珉表示, 未来将持续公布这种动态的测评结果,呈现产业之间在能力上的差异性,希望能助力整个行业生态的健康发展。

上海人工智能实验室综合管理部、AI治理负责人王迎春总结指出,大模型的安全问题包括国家安全、行业安全、社会安全以及人工智能可控性等极端风险。应对路径一是治理政策和规则,二是测评等技术路径。

《人工智能安全治理框架》1.0版指出,人工智能系统设计、研发、训练、测试、部署、使用、维护等生命周期各环节都面临安全风险,既面临自身技术缺陷、不足带来的风险,也面临不当使用、滥用甚至恶意利用带来的安全风险。

例如,以深度学习为代表的人工智能算法内部运行逻辑复杂,推理过程属黑灰盒模式,可能导致输出结果难以预测和确切归因,如有异常难以快速修正和溯源追责。

王迎春指出,随着模型能力的提升,执行的任务更加复杂,对其的监督能力已非人力能及,需要开发出更多新的技术,将监督信号设计到模型当中,其中就包括上述自动化红队测试等。

他预言,下一代的大模型发展应该是数字和物理融合的模型,会带来新的安全风险问题,需要提前进行技术储备,甚至在研发模型当中就要做技术的研究。王迎春认为,国内对于大模型安全的应对比较零散,不体系化,政府要构建人工智能安全技术体系图,有助于有关部门包括企业布局相应技术研究,例如模型评测技术、模型内生安全技术等。

事实上,针对模型算法安全、数据安全和系统安全等内生安全风险和网络域、现实域、认知域、伦理域等应用安全风险,刚刚发布的《人工智能安全治理框架》1.0版提出相应技术应对和综合防治措施,以及人工智能安全开发应用指引,为促进人工智能健康发展和规范应用,提供了基础性、框架性技术指南。

针对模型算法、训练数据、算力设施、产品服务、应用场景,上述框架提出通过安全软件开发、数据质量提升、安全建设运维、测评监测加固等技术手段提升人工智能产品及应用的安全性、公平性、可靠性、鲁棒性人工智能安全治理框架的措施。

【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】
【2024全年资料免费大全】 【新澳天天开奖资料大全】
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【港澳宝六盒典全年资料免费看】
上一条新闻 下一条新闻

推荐文章

发表评论

赵千紫

8秒前:针对模型算法、训练数据、算力设施、产品服务、应用场景,上述框架提出通过安全软件开发、数据质量提升、安全建设运维、测评监测加固等技术手段提升人工智能产品及应用的安全性、公平性、可靠性、鲁棒性人工智能安全治理框架的措施。

IP:74.85.6.*

郭佳佳

7秒前:0版指出,人工智能系统设计、研发、训练、测试、部署、使用、维护等生命周期各环节都面临安全风险,既面临自身技术缺陷、不足带来的风险,也面临不当使用、滥用甚至恶意利用带来的安全风险。

IP:72.82.5.*

森次晃嗣

7秒前:”杨珉表示,其中一个技术是基于个人的技巧发现安全问题,即诱导问题,它的特点是自动化程度低、成本高昂。

IP:63.26.8.*

华律网APP介绍

APP图标

2024澳门免费精准资料APP名:华律网

版本:V1.85.257

更新时间:2024-09-24 24:16

香港澳门资料大全香港t开什么号这是一个功能强大的新澳门开奖号码2024年今晚开奖结果APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:例如,以深度学习为代表的人工智能算法内部运行逻辑复杂,推理过程属黑灰盒模式,可能导致输出结果难以预测和确切归因,如有异常难以快速修正和溯源追责。

2024香港港六开奖结果APP介绍

APP图标

新澳门彩历史开奖记录查询表APP名:华律网

版本:V4.28.895

更新时间:2024-09-24 18:22

香港今晚六给彩开奖结果今天这是一个功能强大的2024年澳门六开彩开奖结果直播APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:此外,杨珉团队还利用语言学中“转换生成语法”的原理,建设了评测自动化、测试覆盖率高和风险发现能力强的测评平台。

2024新奥门免费资料APP介绍

APP图标

香港澳门开奖结果+开奖结果记录APP名:华律网

版本:V4.61.544

更新时间:2024-09-24 15:17

2024澳门跑马图免费这是一个功能强大的黄大仙精准一肖一码comAPP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:0版提出相应技术应对和综合防治措施,以及人工智能安全开发应用指引,为促进人工智能健康发展和规范应用,提供了基础性、框架性技术指南。

澳门特马今晚开什么码APP介绍

APP图标

2024今晚澳门开奖号码95期APP名:华律网

版本:V8.24.890

更新时间:2024-09-24 14:24

澳门最新免费准的资料这是一个功能强大的今晚澳门开奖结果2024开奖记录APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:王迎春指出,随着模型能力的提升,执行的任务更加复杂,对其的监督能力已非人力能及,需要开发出更多新的技术,将监督信号设计到模型当中,其中就包括上述自动化红队测试等。

2024年澳门资料大全正版资料APP介绍

APP图标

澳门码开奖最快的网站APP名:华律网

版本:V4.30.727

更新时间:2024-09-24 16:24

2024今晚澳门开什么号码1101663ocm这是一个功能强大的香港开彩期开奖结果记录近50期APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:目前部分技术已在百度、阿里、华为落地应用。

新奥彩开奖记录APP介绍

APP图标

新澳开码记录大全查询APP名:华律网

版本:V4.56.400

更新时间:2024-09-24 21:24

新澳门开什么奖号码这是一个功能强大的澳门精准资料期期精准每天更新APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:人工智能大模型在解放生产力、提高生产效率的同时也带来了一系列问题,例如隐私信息泄漏、版权归属纠纷、内容真实性与合规性等,如何应对随之而来的安全、治理问题?

新澳历史开奖记录查询结果APP介绍

APP图标

2024年澳门免费资料APP名:华律网

版本:V7.76.279

更新时间:2024-09-24 16:18

2024年老澳门天开彩这是一个功能强大的2024澳门特马今晚开奖一APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:杨珉及团队一直深耕于此,希望寻找到一个通用的普适性的测试集,客观地检视当前大模型的安全合规能力。

澳门彩开奖结果今晚开奖APP介绍

APP图标

澳门最快开奖现场直播开奖奖88快开奖现场直播APP名:华律网

版本:V5.50.691

更新时间:2024-09-24 15:21

香港免费六会彩开奖结果这是一个功能强大的澳门今晚开特马+开奖结果走势图793434APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:界面新闻记者 | 黄景源界面新闻编辑 | 彭朋截至2023年底,国内已完成备案的生成式人工智能服务达60余款。