人工智能大模型工业应用准确性测评-v3.5.docx
《人工智能大模型工业应用准确性测评-v3.5.docx》由会员分享,可在线阅读,更多相关《人工智能大模型工业应用准确性测评-v3.5.docx(25页珍藏版)》请在第一文库网上搜索。
1、c Air中国工网研究院china Academy of Industrial Internet1H( HONG KONGUNMFSrrv Ot SCOand vkkkmogv人工智能大模型工业应用准确性测评2024年3月版 一,刖言C All*中国工sh关网研究院irJr 八 china Academy of Industrial Internet ANDTfCMNOtOOY为贯彻落实党中央国务院关于促进人工智能发展的决策部署,中国工业互联网研究院依托通用人工智能与 工业融合创新中心(简称中心),联合香港科技大学、中国经济信息社,深入研究人工智能大模型在工业 领域的应用性能、技术架构、标准体
2、系,并在此基础上,形成本报告。结合工业企业大模型应用情况调研,本报告在原有工业知识问答准确性测评的基础上,新增数据分析、工 程建模、文档生成、代码理解等四大场景,构建测试数据集,对国内外具有代表性的大模型进行测试,发布新 一轮的准确性测评报告,供业界进行参考。本报告测评结果虽经中心专家委论证,但因大模型迭代速度快,技术复杂,囿于工作团队专业知识和能力, 报告难免存在分析结论不足等问题,且测评结果仅适用于测试期间,欢迎大家批评指正。二、测评内容c Air 5 屯 :谚* ” ! M唧碎也2023年初至今,大模型技术发展突飞猛进,已逐步渗透至工业领域诸多环节,涵盖了知识问答、工程建 模、数据分析、
3、文档生成、代码理解等场景,正快速成长为工业转型升级和创新发展的重要动力。W ER工业语料库于仲.电孑科及电子 鼻.XZ子元件HM.5Wi业i工业应用准确性测评,fl. 61.天” Bftt 1f修L 悠.、MX. M China Academy of Industrial Internetvjr AMD TfOIOtOGY国内大模型发展趋势23年中国内平均24年初国内平均 2023年6月底相对GPT3.5成绩1,oz 2024年年初相对GPT3.5成绩 IoU 120%80%40%2024年初 i对比往期测评,2023年下半年国内大模型能力提升明 显(以GPT3.5为基准)。1选取国内外各能力
4、维度性能最佳的大模型进行对比; 国内大模型发展趋势统计规则见附录2。、测评结果能力对比与变化趋势各维度大模型最佳能力对比图卬口国内口国际数据分析工业知识问答代码理解在工业知识问答、文档生成等领域,国内大模型已取 得领先,数据分析、代码理解等领域能力接近;在工程建模领域,国内大模型与国际存在一定差距。五.场景测评一:工业知识问答c Air sr ,ll知识快速获取数字人售后服务员工自助培训大模型可结合自身知识,回答不同工业领域问题,将用于员工培训.故障诊断.客服咨询.市场调研等 交互场景,协助企业员工熟悉生产流程,帮助用户了解产品特性。应用场景研判 研发设计环节:研发工程师可基于大模型 快速、便
5、捷获取高质量知识,提升研发效 率; 生产制造环节:产线工人可实时向大模型 查询生产工艺经验,辅助其进行制造工艺 优化; 售后服务环节:企业可基于大模型,通过 数字人实时向客户提供售后咨询服务; 技能培训环节:新员工可通过大模型了解 企业信息、学习生产技能。五.场景测评一:工业知识问答CAII+ SB u GAMD TfCHNOlOGV测涌果100工业知识问答能力Top20行业能力对比口100 国内 国际80lllhlll建材 石化化工 电力 电子制造 纺织 装备制造 钢铁 采矿题目例问题:你知道哪些常用逻辑电平? TTL与CMOS电平可以直接互连吗?评分标准:(1)常用逻辑电平包括:12V ,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 模型 工业 应用 准确性 测评 v3
