今年上半年,国内多家大厂扎堆发布大模型,百度、360、阿里、京东、网易、腾讯、华为、科大讯飞等国内互联网巨头和科技企业都在AIGC(生成式人工智能)产业展开深入布局,“百模大战”一度成为舆论焦点。在AIGC创业与投资爆发的当下,AI在“百模大战”中迈向通用,未来或将与人类智能越来越相近。但另一方面,大模型仍处于发展初期,也仍存在部署难度高、准确率低等问题,只有人机协作才能充分发挥出其潜能。2023 Inclusion·外滩大会期间,多名人工智能(AI)领域人士表示,今年AIGC创业与投资爆发,大模型已经呈现出显著的通用特性,为各行各业提供了丰富的想象空间。
“当前AIGC创业与投资爆发,今年上半年的投资额已经超过去年全年水平,更强算力支持、模型参数量增长和数据量爆发共同驱动了本轮技术的发展”这是金沙江创投主管合伙人张予彤所表示的。此外张予彤也预测,AIGC在企业的关键职能中将释放巨大价值潜力,集中影响客户运营、营销和销售、软件工程、产品研发这四个职能。从产业转型的角度,中国工程院院士、中国人工智能学会(CAAI)监事/Fellow钱锋指出,AI是新时代经济发展的新引擎,在中国工业企业盈利能力亟待提升的当下,需要数字经济和实体经济一同打造工业元宇宙,助力制造业数字化转型。
对于AI的未来发展,清华大学计算机科学与技术系副教授刘知远认为,GPT系列模型再次验证了“更多数据、更多智能”原则的适用性,大模型已经呈现出显著的通用特性,其在未来将会成为智能时代的基础设施。刘知远表示,大模型的未来之路应与人类智能相似,从语言智能出发,向多模态智能和工具智能进化,实现具身智能,最终形成群体智能。而复旦大学计算机学院副院长彭鑫则认为,以ChatGPT为首的大模型确实对软件开发行业带来了很大冲击,不过,由于缺乏抽象思维和无法理解难以用文字表达的“暗知识”,大模型软件开发能力依然存在不足,需要人机协作,形成一个有机的结构化。
随着大模型的出现,AI开始“理解”世界。各行各业都希望能借助大模型的能力,在这同时也要面对开发它的难度,以及控制它的风险。说到AI大模型时,英伟达的GPU(图形显示芯片)成为最抢手的硬件。而在软件生态方面,英伟达资深解决方案架构师张玮东重点介绍了英伟达于今年上半年推出的开源框架NeMo:开发者可以使用NeMo创建定制的语言文本转文本生成式模型,并通过易于使用的应用编程接口(API),在英伟达GPU中的Tensor Core(张量计算核心)上使用混合精度计算对其进行训练。张玮东认为,大模型不仅是一种技术,更是一种“艺术”,现在大模型刚开始为大家展现可能性,比起简单地将人类能做到的事交给AI去做,研究者更应该放开视野,“利用AI去做那些我们现在做不好、但又想做的事,比如机器人和绿色能源领域等等。”同样是从技术层面出发,清华大学计算机科学与技术系教授、人工智能研究院大数据智能中心主任朱文武则提到,大模型的部署难度目前仍然较大,面临着占用计算资源高、存储空间大和能耗高的三大挑战。因此,朱文武正在带领清华大学的团队进行大模型轻量化研究,在将大模型“变小”的同时也能保留其大计算能力。
对于企业来说,如何利用大模型为用户提供更好的服务、增加公司收益也是一个全新的问题。DCloud的CTO崔红保坦言,目前大模型普遍面临“幻觉”问题,即在回答提问时会出现胡说八道的现象,费用高而准确率低,难以吸引客户付费。支付宝小程序云负责人李铮也补充道,现在一个本质问题是大模型仍然处于发展初期,未来也许会像移动互联网一样经历高速发展的十年,人们对于刚刚诞生一年的大模型的期待却可能已经到了第七、第八年的水平,所以需要企业先把基础的工程学好、做好,再看未来发展。