“大模型在各个行业深入推进展现出了非常强劲的势头,大家对它期待也非常高,希望其能够成为行业智能化发展的引擎,成为未来智慧的底座”
(资料图片仅供参考)
《法治周末》记者 王京仔
“我国大模型驱动产业加速,高校和头部企业积极研发大模型技术,国产大模型已超80个。”近日,由中国互联网协会发布的《中国互联网发展报告(2023)》显示。
今年,大模型成为全球人工智能发展的焦点和产业各方热点话题,越来越多的公司和组织开始投入大量的人力、物力和财力来研究和开发大模型。以ChatGPT为代表的通用大模型正成为通用人工智能的桥梁和技术跃升的新途径,驱动着社会各行业生产力、生产效率发生巨大的变化,也带动了各领域的行业大模型如火如荼地发展。
大模型时代,大模型如何赋能各行各业?通用大模型、行业大模型有着怎样的发展路径?未来面临哪些机遇和挑战?在7月20日举行的2023(第二十二届)中国互联网大会“大模型的发展路径”论坛上,行业学者、企业代表等就此展开了讨论。
通用大模型是行业大模型重要的基础
2022年11月,ChatGPT一经推出便掀起大模型发展的热潮。大模型技术与AI产业发展日新月异,AI引领的新一轮科技革命正加速演进,仅在国内,迄今已有80余个大模型公开发布。
在与会的专家们看来,在大模型时代中,通用大模型、行业大模型已经成为大模型的两个方向。在产业各方的共同努力下,我国已形成初步的大模型产业链条,通用大模型与行业大模型将协同发展,共同推进产业渗透。行业大模型将基于更智能的通用大模型的平台底座,更好地为千行百业服务。
“大模型在各个行业深入推进展现出了非常强劲的势头,大家对它期待也非常高,希望其能够成为行业智能化发展的引擎,成为未来智慧的底座。”中国信息通信研究院云计算与大数据研究所副所长魏凯坦言,希望与大家交流、未来展开更多合作,目的就是让大模型能够真正地走向千行百业,扎下根,真正为我们国家数字化转型更好地赋能。
在北京智源人工智能研究院副院长、总工程师林咏华看来,通用大模型是行业大模型重要的基础。首先,通用大模型是知识体系的基础,不能强求通用大模型里面包含所有行业的专业知识,但很多领域的基本知识是希望包括的,如果在通用大模型的预训练中没有见过相关数据,就需要依靠行业大模型做大量微调。其次,通用大模型或者基础模型是下游行业模型很重要的底座和框架。同时,通用模型自身发展需要与行业模型进行相辅相成的配对或者迭代。
中国信息通信研究院云计算与大数据研究所人工智能部主任曹峰补充说明,他认为通用大模型未来可能呈现“聚合”,因为考虑算力能力、数据集的获取等,需要聚合更多的算力资源、更多行业专家的能力,“聚合的目的是为了形成更重要、更好用或能力更强的基础大模型”。行业大模型的发展趋势,则是在找到更多场景基础上更多地形成新的应用模式。
通用大模型应建立开源开放生态
“我们今天所说的大模型,是通用性人工智能到真正的超人智能之间的一个过渡阶段。”北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军指出,“通用人工智能”往往对应GAI(General Artificial Intelligence)和AGI(Artificial General Intelligence)两个概念。GAI是指具有通用性的人工智能,强调的是通用性,即人工智能大模型并不限于专门的问题或领域;AGI严格意义上叫做人工通用智能,强调的是在人类智能所有方面全面超越人类的一种人工智能。
黄铁军表示,像ChatGPT这样一个大语言模型是把人类的所有语言,主要是书面语言,训练成一个千亿、万亿的神经网络,从而具备了融会贯通的能力。不同于传统IT系统的确定性,“从某种意义上讲,这种模型背后有其自己对世界模型空间的认知”。大模型可能两三年就能把人类所有的资料都拿来训练,相较之下,每个人的知识空间与它相比都是微不足道的,这方面它是超人的,而未来大模型发展到具备其他超人能力都是可能的,如发现新的物理定律等。
在黄铁军看来,目前我国大模型发展的问题在于从“大炼模型”变成“大炼大模型”,碎片化严重,造成资源浪费。“大模型这件事要体系化地去做,特别是一定要把大模型竞争从模型本身给拉回到算法竞争、技术竞争上去,不能仅仅停留在谁能做出一个大模型。”他强调,大模型要比的是聪明程度、智力程度,一旦出现了“最强”的智能系统,训练那么多“智力不高”的系统就没有意义了。
华为战略研究院大模型产业发展首席专家王震军表示,真正的预训练通用大模型对数据、算力、先进算法架构等要求都非常高,未来成为一个人工智能或整个信息领域的操作系统,一定是在大厂之间最终胜出两三家。林咏华也认为算力、人力、数据能力奠定了大模型很重要的基础,通用大模型的锤炼不能仅跟着某一个商业利益走偏,而是朝着今天的OpenAI那样走到它的层面,“大家都希望中国能够有一家到三家机构达到那个层面,而且必须要有这样的机构,这需要集合大家的智慧和力量去做”。
针对我国当前通用大模型研发应用现状,黄铁军认为,对中国而言,很多企业机构都能训大模型,关键在于大家要通过开源方式联合迭代创新,推动行业发展往前走。“从技术体系演进来看,英特尔联盟在技术上主导了PC时代,移动互联网时代iOS和Android两个生态主导了迄今为止手机的生态。进入智能时代,这样的生态也一定会出现,且正在出现。”他强调,要建立开源开放的生态。
近日,Meta公布最新大语言模型Llama2并宣布开源,覆盖70亿、130亿及700亿参数版本,可免费用于商业或者研究。7月25日,阿里云在国内推出针对Llama2全系列版本的训练和部署方案,便于开发者进行再训练,搭建专属大模型。
大模型落地行业需解决专业知识、安全等问题
通用人工智能搭建后需要落地行业,现阶段,大模型赋能各行各业还面临哪些挑战呢?
“大模型重塑产业格局,两年落地50%+行业核心场景,华为云在金融、制造、政务、气象、铁路等领域推动了深入的行业创新。”华为云大数据与AI总经理李伟指出,在实践过程中,发现通用大模型落地行业的时候存在三个挑战。
具体而言,一是大模型通用性强,但专业能力是比较弱,落地行业需要具备专业知识,明白行业工作流程,给出专业准确的回答;二是大模型知识虽然多,但技能不足,目前通用大模型大多展现的是大语言模型,而企业场景本身是很复杂的,需要的模型不仅能说还要会看,不仅能想还要会算;三是数据的安全合规问题,数据是企业核心资产之一,大模型可以有效地存储和挖掘知识,但训练和使用大模型需要保障企业数据安全合规。
李伟以华为云盘古大模型为例,介绍了实现行业大模型采用的四大关键举措,包括沉淀行业知识、淬炼行业技能、对话专业工具、保障安全合规等。
“从长期发展来看,应该把数据做大、把数据质量做高、把模型做小,有助于大模型规模化的落地;在使用模型上,应该用最小成本的方式去使用,即优先通过parameter,其次是通过SFT的方式去使用模型;要累积应用场景和数据,有助于使用方下一步真正启用大模型。”阿里达摩院资深技术专家王巍巍强调,大模型落地时,场景非常关键。在推进大模型落地过程中一定要找准场景,弄清楚大模型能解决哪些问题,哪些问题解决不好,能解决好的问题怎么去解决等,随着国内大模型的发展,今后应该可以在多个维度上用一个模型来解决不同场景落地的问题。同时,他指出,我国的行业模型发展还需要走更长一段路。
魏凯则指出,大模型进入千行百业的两个核心是工程化和安全可信。大模型本身有理论上的创新,更有工程的创新,大模型落地到行业里,工程化实施的能力非常重要,这些模型的服务商、模型技术提供商需要把技术栈封装起来,不让用户直面复杂的技术栈。很多公司采取措施强制禁用ChatGPT等大模型,主要原因就是一些非常严重的数据安全风险及模型本身提示工程投毒风险,还有输出结果稳定性、可靠性、透明度等。面对日渐凸显的大模型安全可信风险,一个路径就是需要技术与管理双管齐下,保证模型的安全可信,中国信息通信研究院面向大模型“建、用、管”等产业需求,形成覆盖大模型全生命周期的《大模型技术和应用评估方法》系列标准,面向产业提供评测服务,助推大模型生态可信发展。
从行业大模型层面,哪些行业会率先使得行业大模型落地,王震军认为具有三个方面的共性:一是行业体量比较大,无论是市场空间还是用户数;二是行业信息化程度比较高,包括数据化能力、技术等;三是行业容错率比较低,如文创、娱乐、教育等。
“目前阶段,通用大模型和行业大模型可以适当做一些解耦。通用大模型的世界格局已经比较清楚,但国内格局仍不是特别清楚,同时在行业大模型里,做好行业应用场景、具体某一领域的Know-How能力是促进行业发展都需要做的,可以把这部分工作先做了,到时候具体结合哪个通用大模型来进一步提升,可以有多种路线选择。”王震军补充。