CONN基于九个真人(也被称为“催化师”)的面孔开发而成,研究人员通过东映Zukun实验室的新版LightStage3对这些人进行扫描,之后使用计算机图形创建出一个逼真的人类(数字人)。
为了让CONN具有行为和声音等个性,研究人员利用催化师的动作捕捉数据和语音数据来训练由NTT人类信息学实验室开发的人工智能引擎,该引擎再现了CONN中的真人行为和声音特征。
在最后一步,NTT Com开发的专有软件将捕获到的面部与个性数据特征点转换为3DCG。4然后,该软件会根据学习程序生成数字动作和声音。
游客进入开放中心园区之后,CONN会以自然的方式与之交流,展示各种面部表情、行为和语音语调,如同它真的正在思考,同时还会引导游客参观虚拟公园的各个区域。
接待区:CONN将通过七个LED显示器上显示的信息来介绍OPEN HUB Park的概念,游客可以戴上AR眼镜观看内容。
演示区:CONN将出现在真人大小的LED显示屏上,讲解屏幕上的视频内容,并与游客进行简短的互动问答。
图书馆区5:象征智能世界(Smart World)计划的动物将出现在游客的AR眼镜中,引导游客参观图书馆区。
3DCG CONN数字催化师将针对多种设备进行优化,以便能够在AR眼镜、七个LED显示器和真人大小的显示器之间无缝移动。
为了进行本次演示,每家公司都负责完成各自的任务:
三家公司将利用从演示中获得的经验,探索将数字人用于自己公司内部以及为各种行业和部门客户提供的解决方案中,例如活动/展厅服务员、企业接待员和服装店店员。
随着日本劳动力短缺的加剧和对提高生产力的需求的增长,企业纷纷开始尝试创建融合扩展现实(XR)、元宇宙和机器人等先进技术的解决方案。例如,聊天机器人和虚拟人物已被广泛部署在联络中心和商店。但很多人还是更喜欢和真人,或者至少是可以像真人一样移动和交流的虚拟人物打交道。
在这一背景下,三家公司创造了CONN——一个行为像自然人一样的数字人。CONN融合了东映Zukun实验室的数字人生成技术和NTT人类信息学实验室的身体动作生成人工智能技术6与语音合成人工智能技术7。CONN将作为数字催化师8,在智能世界9的开放中心中提供客户服务在此基础上,研究人员将探索使用迄今为止主要用于娱乐的数字人作为企业服务新联络点的可能性。
1 数字人技术使用高清扫描和动作捕捉,并结合3DCG,创造出逼真的人物形象。
2 开放中心园区是NTT Com于2022年2月启用的一个工作场所,配备了尖端技术。
3 LightStage是一种人脸扫描系统,通过控制设置在天球上的大量灯光拍摄照片,该系统不仅可以再现形状,还能够以高清晰度再现纹理。
4 三维计算机图形学是一种在三维空间平面上将物体表现为3G物体的方法。
5 图书馆区将在演示的后期实施。
6 NTT人类信息学实验室正在开发身体动作生成人工智能技术。该技术使用通过特定人的语音和动作数据建立的模型,自动生成此人特有的动作。
7 由NTT人类信息学实验室开发的语音合成人工智能技术,利用深度神经网络技术和多个演讲者的声音数据库,在某人的少量语音数据中合成清晰自然的语音,以再现其独特的特征。
8 在开放中心中,与企业客户共同创造项目的内部和外部专家被称为“催化师”。截至2023年2月,约有400名催化师。
9 NTT Com于2021年10月与客户和合作伙伴启动了开放中心计划,旨在共同设定并最终实施新的商业概念。
原文版本可在businesswire.com上查阅:https://www.businesswire.com/news/home/20230317005166/en/
免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。
联系方式:
垂询详情
NTT Communications
商业解决方案事业部商业规划部
openhub-pr@ntt.com
东映株式会社
东映Zukun实验室
zukun@toei.co.jp
NTT QONOQ, INC
扩展现实商务代表
info-xr-commerce@ml.nttqonoq.com