2023年12月5日,深圳市互联网信息办公室、宝安区人民政府、网易传媒联合主办“2023新一代人工智能(深圳)创业大赛”颁奖典礼在深圳成功举办。

“2023新一代人工智能(深圳)创业大赛”旨在促进人工智能的创新发展,助力人工智能初创企业健康成长。经过海选报名和多轮筛选比拼,大赛获奖项目将由主办方从现金、流量扶持、产业资源供需对接等多维度给予丰厚激励。现场,“网易新一代人工智能产业联盟”正式成立,未来将持续加强产业、资本、媒体、政府资源的链接,为创业者提供服务。

现场,深圳大学大数据技术与应用研究所副所长陈小军以《大模型助力数字化转型
》为主题发表演讲,分享了他对大模型及数字经济的见解。他表示,以端、边、云、网、智为代表的新IT,正在推动数字化转型,实现全产业链、全价值链和全场景数字化。

深圳大学陈小军:新IT正推动全产业链、全价值链和全场景数字化-风君雪科技博客

陈小军教授表示,未来企业数字化转型的架构将是以数据为中心的分层处理架构,传统业务系统未来更多是作为数据提供方,把数据汇总起来形成数据底座;在数据底座之上再建立智能底座,在此之上支持各种各样的智慧应用。

陈小军还阐述了他对未来数据架构的更多思考。在他看来,“首先底层有一个数据平台,将各种各样的数据汇总起来并进行数据治理,随着数据交易的快速发展,可能未来还要考虑这个数据如何和外部进行交易。”同时,他认为需要在数据中台的基础上构造一个认知中台,“这个认知中台主要是利用人工智能方法对数据进行加工,获得数据中的知识。这里面可能会包括一些领域知识库、领域大模型、领域小模型、领域工具集”。接下来,他认为应该在数据中台及认知中台的基础上去构建能力及应用。“基于数据中台及认知中台构建一个能力层,包括语义理解、语义检索、智能分析、智能生成及智能决策。基于这种能力,再支持包括智慧城市、商业智能、智慧海关、社会治理、智慧金融等各种各样的应用。”深圳大学大数据所一直聚焦大数据出炉,也取得了丰硕的成果,其研发的技术将有效地支持这种以数据为中心的分层处理架构。(记者:平章)

以下为陈小军演讲节录:

非常感谢网易的邀请,今天有机会跟大家分享一下关于大模型助力数字化转型方面的思考。

首先介绍一下我自己,我自己是深圳大学大数据所的副所长,同时是中国计算机学会的理事,我自己在深圳已经待了十几年,自己在人工智能、机器学习方面的研究也是研究了十几年,而且有非常丰富的经验。

数字经济是非常重要的热点话题,数字经济主要包含四个方面,包括数字产业化、产业数字化、数字化治理以及数据价值化四个方面,为什么数字经济比较重要呢?可以看一下2020年全球数字经济占GDP比重超过了40%,我们国家2022年占GDP的比重大概是41.5%,所以是非常重要的。同时数字化对企业也是非常重要,一是可以化解供需市场的波动,最近波动性特别强,构造以客户为中心的服务运营体系有效化解一些风险。同时,我们最近新IT,就是以端、边、云、网、智为代表的新IT,也在推动数字化转型,实现全产业链、全价值链和全场景数字化。

现在数字化的基础特别好,经过疫情几年,大家已经习惯了网上办公、学习网购等等,所以有非常好的基础。

这里面重点的是新IT,和传统比不一样的是多了几块,一是混合型工作设备是多种多样的,除了传统的终端,比如说手机、服务器等等,其实我们还有各种各样的IoT设备,以及边缘计算设备。这里面边缘计算、云计算、传统数据中心会并存,推动我们建立一些新的基础设施。同时,人工智能在这里面将会扮演越来越重要的作用,我们把“智”放在最上面,以前传统人工智能没有那么强,没有过分地强调它。现在随着GPT技术的成熟,我们希望人工智能在这里面扮演更重要的角色。

可以看到在传统企业中,传统的架构是一种垂直架构,主要是从功能点出发来将不同的软件系统给集成起来,这种系统在数字化转型之后,它会遇到非常大的问题,特别是数据是不畅的,在各个系统中是不畅的,很难有效地汇总起来进行分析处理。未来将会过渡到新的架构是数字脱分层架构,传统业务系统未来更多的是作为一种数据的提供方,我们把这些数据汇总起来可以形成一个数据底座,在数据底座之上再建立智慧大脑,提供智慧服务。中间可能是一些通用大模型、任务大模型以及行业大模型,在此之上支持各种各样的智慧应用。

我们的思考未来可能是这样一种数据架构,首先底层有一个数据中台,将各种各样的数据处理起来,你要做的事是数据汇总和数据治理,随着数据交易的快速发展,可能未来还要考虑这个数据如何和外部进行交易。在数据中台的基础上构造一个认知层,这个认知层主要是对数据的一个应用,这里面可能会包括一些领域知识库、领域大模型、领域小模型、领域工具集,形成数字中台。之后再构建一个能力层,是语义理解、语义检索等等,之后才是应用层。

数据层面上要考虑到底需要什么样的数据,如果数据不够可以通过数据交易的方式引入第二是数据从哪里来,怎么采集,未来的采集场景会越来越多、越来越丰富。第三是如何确保数据可用、能用额是非常重要的。对于大模型而言,我们也有很重要的事,现在通用大模型到应用上也要考虑很多的转变,比如说任务怎么定义,不同模态、不同场景、不同用户之间怎么对齐。怎么样降本,现在大模型的成本非常高,很多中小企业是很难用得起的,这也是非常重要的一件事。

模型也需要评测,能力怎么评测?怎么分级,二是数据指标怎么定义,现在评测非常多,这些评测和企业应用是否相关也可以看一下,很多不一定是特别相关的。输出如何可信?如果不可信人工智能在应用中使用是非常受阻的。

在实施部署中要考虑几件事,一是可靠非常重要,现在在大模型公司内部训练时,大模型经常要出问题的,虽然我们外面用没有这种感觉。二是经济性,成本非常重要,现在大模型卖得非常贵,直接卖大模型非常贵,但是没API的价格相对合适,企业要考虑如何选型。三时效性非常重要,怎么样去更新,而且更新的频率都非常关键,特别是对于企业内部的数据,我们希望能够用到最新的数据,怎么去做也是一个问题。四是数据安全是非常重要的。

剩下的时间主要跟大家分享一下我们之前做的一些事。第一是和政务行业的数字化转型,这是我们和海关合作多年的项目,深圳海关毗邻香港,反腐败形势长期严峻复杂,同时深圳海关监管模式复杂,包含陆运、海运、空运、特殊监管区、跨境电商、快件等不同监管方式,监管过程的申报、布控、审单等业务环节中,极易出现权利寻租的廉政风险,迫切需要数据手段提升监督效能,改善营商环境。比如说最近国家高度重视的一个问题是外贸的产业链供应链韧性问题。通过对进出口数据开展一系列风险量化分析,为优化产业结构,助企兴业提供精准数据支持。

我们在围绕智慧海关创新应用做了一些有益的探索,首先把海关的核心业务系统数据进行深度治理,形成完整的进出口业务数据链条,搭建数据中台,在此基础上构建面向分析的智慧大脑计算引擎。该引擎支撑了包括智慧纪检、智慧稽查、智慧关税、智慧加贸、智慧统计等多种智慧海关应用。

第二是零售行业的数字化拴性,零售行业是非常底层的行业,这个行业也受到数字化、人工智能的技术冲击是非常大的,如果不做转型肯定很多就会倒闭,或者说已经倒闭了很多,我们接触这家的眼光还是比较长远,很早就开始做一些事了。

这家公司的数字化第一阶段是2003年以前是一个传统的事,2003年之前就是系统化,确保这个东西有系统支撑,不可能和小摊贩是一样的,我们看到典型的是有一套POS和ERP的系统就不错了,门店的进销存管理就不错了。
随着零售系统的进一步演变和发展,第二阶段是2014年左右,这时候就形成了线上线下一体化,回去看到正好这些年在2014年之前,2010年左右线上这块确实也是飞速地发展起来,像淘宝的发展,很多公司也要进行转变。所以2014年时就是线上线下一体化的体系,2014年成立全资科技公司,还有500人做研发,100人做运营,就不是传统的零售,绝大部分都是搞卖东西或者是库存管理,有点向科技公司转变了。包括构建了会员、库存、到店交易体系,因为它是一个全国的连锁店比较多,这套系统也非常喷大。随着这几年的发展之后进入到另外一个阶段,这几年越来越多的交易来自于线上了,所积累的线上数据也越来越多了,加上竞争是越来越激烈,所以第三阶段要做的事是公私域的精准经销,传统的架构里,数据在公司的内部系统中流转,但现在需要和包括抖音、微信等外部营销系统有效对接起来。这是2019年左右做的事。当前,随着人工智能技术的飞速发展,如何利用人工智能技术提供更好的服务,是近期大家都在思考和尝试的事。相信过几年后零售业将进入到下一阶段,人工智能将在里面发挥更大的作用。

我今天就汇报到这儿,谢谢。