大模型重塑赋能 数字人迎来爆点
结束了一场热情洋溢的演讲后,南京硅基智能科技有限公司(下称“硅基智能”)的创始人司马华鹏回到座位上,打开微信上的二维码,放在桌面上。在下一个嘉宾上台前的间隙,几十名投资人和创业者涌上前来,扫码、添加好友,提示音响个不停。
这一幕,发生在不久前的一场人工智能投融资峰会上。司马华鹏在演讲中说,公司要实现2025年为全球提供1亿硅基劳动力的目标——硅基劳动力,指的是存在于虚拟世界里的数字人。这家2017年成立的公司,开展数字人业务已有好几年,但直至大模型的火热才让司马华鹏感觉到,数字人迎来了爆点。
经过大模型重塑与赋能的数字人,一定程度上摆脱了价格昂贵、互动性差等问题,越来越广泛地出现在短视频、直播间中。随着效果越来越逼真,且成本逐渐降低,数字人已经不满足于做主播和带货,开始朝着更多“身份”进军。银行理财师、律师、老师、已逝的名人……数字人正在成为任何想成为的人,也为这条日渐拥挤的赛道带来了一些新的机遇。
大模型助力
数字人降本增效
2019年,司马华鹏以自己为原型制作了一个数字人。在他展示的视频片段中,人物的动作显得生硬,口型也对不上。“那时候,中国还只有寥寥几家数字人公司,几年过去,数字人进化了很多。”司马华鹏说。
这一变化,主要归功于以大模型为代表的AI(人工智能)技术的进步。赛智产业研究院院长赵刚在接受证券时报记者采访时表示,大模型让数字人进化出了更聪明的“大脑”,使得数字人更加智能化和人性化,从而能够为用户提供更高效、低成本、标准化的服务。
一名人工智能研发人员向记者介绍,大模型对数字人的重塑与赋能主要体现为降本增效。从技术角度来说,搭建一个数字人主要分为建模、驱动、渲染几个环节。传统的数字人主要依托计算机图形学技术+真人动作捕捉,需要采集大量的真人数据,深度建模,耗时长,效率低,成本高。如今在大模型的加持下,通过AI算法,基于深度学习模型、动作模拟、情感模拟等技术,只需要几分钟的真人视频,用大模型训练若干个小时,就可以生成逼真的数字人,制作成本大大降低。
以腾讯云发布的智能小样本数智人生产平台为例,腾讯云智能数智人产品总经理陈磊表示,只需要3分钟的视频就可以完成建模,整个制作过程耗时控制在24小时以内,生产成本从百万级别降低至了数千元。
成本降低的同时,效能也大大提升。在大模型出现以前,数字人在外形上差异度较小,而且只能根据输入的统一脚本,“照本宣科”地回答问题。在大模型的赋能下,数字人拥有了“灵魂”,不仅外貌特征可以自定义设计,智能化、交互性也有了很大提升。比如在一些直播带货场景中,数字人已经可以与受众进行基础互动。
过去,数万元甚至几十万元的数字人让买家望而却步,如今价格便宜了,效果却更好了,订单自然纷至沓来。一名知名科技公司的营销人员告诉记者,公司目前定制一个数字人分身的价格仅为8000元,制作数字人短视频按照时长收费,价格低廉至每分钟16元。司马华鹏向记者表示,公司已卖出5万多个虚拟数字人直播间,这个数字仍在增长之中。
企业加速布局
新应用场景
克劳锐指数研究院近日发布的《2023年中国数字人行业发展专题报告》显示,短视频平台是用户了解数字人的主要渠道,视频和直播带货是用户接触数字人的主要途径。
为什么是短视频和电商直播?因为这两个领域足够火,而且仍然蒸蒸日上。“如果你处于泰坦尼克号上,不管技术做得再好,都是要跟着下沉的。”司马华鹏表示,中国的短视频市场广阔,电商领域全球领先,而且有可以与数字人结合的场景,自然就成为了创业公司争相布局的赛道。
东方证券研报指出,随着技术的不断完善,更多低成本、智能化的解决方案和产品出现,预计数字人在电商行业的用户群体会大幅增加。研报还指出,跨境电商是值得关注的细分赛道,跨境电商将在多语言方面显著受益于AI技术,降低海外多语言经营环境的传统障碍。
上海元集之智能科技有限公司CEO陆文斌表示,对于跨境电商企业来说,主播的语言能力是一个重要的困扰,采用真人主播的成本很高。因此,会说多门外语的数字人主播成为了“香饽饽”。司马华鹏也向记者表示,公司的产品已能够支持阿拉伯语视频翻译,“最近来了大量的中东订单”。
除了做短视频主播和直播带货,数字人还开始进入各个垂直行业。记者观察发现,近期多家上市公司在业务中引入了数字人。比如在教育行业,中公教育10月10日表示,已于近日发布了首款人工智能课程,并首次推出虚拟数字讲师“小鹿”;网易有道10月12日宣布,搭载其自主研发的“子曰”教育大模型的全球首个虚拟人口语私教“Hi Echo”正式推出独立APP和微信小程序,能够为用户提供一对一的口语练习。
如果说AI教师对于很多人来说都已不陌生,那么“数字永生”则仍然显得有些超前。数字永生是指利用人工智能技术,将人类的思想、情感、记忆等信息转化为数字形式,保存在云端或者其他载体中,实现人类意识或者个性的延续。
前不久,司马华鹏在朋友圈转发了一则视频。视频中,一名4岁的女孩不知道自己的父亲已经生病去世,妈妈只能告诉女孩,爸爸只是去了很远的地方。司马华鹏写道,“我们可以通过照片复活这个爸爸,通过视频电话和这个宝宝通话。”
事实上,硅基智能在今年6月就已成功“复活”过已逝的人。在上海电影节期间,已故导演谢晋通过数字人的形式和现场观众见面,引发全场惊叹。这名谢晋数字人,正是由硅基智能利用大模型技术,根据其生前的素材,通过训练复合而成的。
不过,数字永生在国内还处于早期的阶段。司马华鹏告诉记者,公司主要在海外布局这方面的业务。据他了解,同行公司在国内获得的订单主要来自政府部门,例如为革命烈士、抗战英雄等特殊的人士制作数字人。“目前国内比较难推,主要因为市场接受度不高。与国外相比,国内在死亡教育方面比较薄弱。”司马华鹏说。据介绍,目前公司首先将数字永生推往日本、新加坡等国家,这些国家不仅在文化风俗上的接受度高一些,而且注重孝道。“数字永生是个非常大的市场,光日本市场,我们就做到200万个产品分发,1亿美元的收入。”司马华鹏表示。
赵刚认为,随着人口老龄化等问题日益突出,满足人类情感需求的“数字永生人”的市场需求也会提升。然而,数字人面临技术成熟度的问题,在感性理解、情感模拟等方面还存在较大缺陷。另外,司马华鹏还表示,从商业化的角度说,数字永生业务的成本还比较高,没有达到普通老百姓能接受的水平。“数字永生需要一些时机。可能在某个事件后,大家对这个技术的接受度就会提高很多。我们一直在等待一个爆点。”司马华鹏说。
赛道趋于内卷
警惕劣币驱逐良币
大模型的出现让数字人“脱胎换骨”,成为了今年最火的创业赛道之一。记者梳理发现,目前市场上主要的数字人厂商主要有两类:一类是以百度、腾讯、华为等为代表的科技巨头,基于自身大模型方面的优势研发推出数字人产品;另一类是以硅基智能、出门问问、相芯科技等为代表的中小厂商。
多名人工智能领域投资人表示,目前AIGC(生成式人工智能)还处于早期阶段,能落地产生利润的不多,数字人是其中比较少有的商业化路径,且已经能够盈利的项目。但随着大量的创业者涌入,行业竞争趋于激烈和同质化,赛道逐渐变得拥挤和内卷。
内卷的一个表现是价格越降越低。记者询问多家数字人企业发现,目前2D数字人的价格大多数已经降到千元级别,有的甚至只需要几百元。就在几天以前,硅基智能宣布数字人产品由8000元降至4000元。对于越来越便宜的趋势,司马华鹏并不觉得困扰:“我们要做数字人行业的特斯拉,引领行业走向物美价廉。”真正令他感到担忧的是,随着越来越多的玩家涌入,一些创业者技术能力有限,生产的数字人产品质量良莠不齐,容易导致劣币驱逐良币。
“数字人产业有一个悖论。好的数字人直播观众是看不出来的,会以为那是真人直播。但是不好的数字人直播你却能一眼看出来,于是就永远认为数字人直播都是不好的。”司马华鹏说。一名媒体行业的内容负责人向记者表示,她所在的公司曾想采购一名数字人用于新闻播报,然而在观看若干个数字人新闻主播视频,从一成不变的服装、单调的手势动作、僵硬的面部表情中察觉出“数字人痕迹”以后,最终决定放弃采购。
数字人正处于风口,吸引了大量想分一杯羹的创业者涌入。但不可否认的是,作为一项年轻的技术,数字人还处于早期阶段,市场尚在培育之中,十分脆弱。对于同处一片红海中的数字人公司来说,要思考的或许不是如何“卷低价”,而是通过技术的不断进步,让数字人“更像人”,提高行业的整体水位,让数字人“活下去”,创造更多的价值。