本文聚焦吉林省吉林祥云信息技术有限公司,介绍了其在2024年11月申请的一项名为“基于SadTalker的实时虚拟数字人播报方法”的专利,详细阐述了该专利的内容和优势,还对公司的基本情况进行了介绍。
金融界于2025年3月22日发布消息,国家知识产权局的相关信息表明,吉林省吉林祥云信息技术有限公司提交了一项引人注目的专利申请。该专利名为“基于SadTalker的实时虚拟数字人播报方法”,其公开号为CN 119653171 A,申请日期定格在2024年11月。
从专利摘要中我们可以了解到,这项基于SadTalker的实时虚拟数字人播报方法,属于计算机视觉和人工智能技术领域中的视频生成范畴。为了显著提高虚拟数字人的实时性以及自然逼真度,该发明精心设计了一系列步骤。
首先是步骤1,通过原始图片生成无语音视频帧。接着进入步骤2,依据人脸检测算法的结果,将视频帧图片进行裁剪,从而得到人脸图片,并把这些人脸图片保存起来,作为SadTalker模型的输入。然后是步骤3,需要持续读取语音流并且对其进行预处理。在步骤4中,将人脸图片和实时语音流经过数据调度后传入SadTalker模型,同时增加实时短帧推理适配性修改,严格限制模型使用短语音进行推理。之后进入步骤5,进行人脸位置的还原,进而形成完整的视频帧。最后是步骤6,将视频帧和语音流的时间戳进行匹配。值得一提的是,通过加入REF视频,能够让虚拟数字人呈现出更加自然逼真的效果;采用短帧推理技术,则可以让虚拟数字人的视频生成过程变得更加高效,从而大幅度提高了实时性。
根据天眼查提供的资料,吉林省吉林祥云信息技术有限公司成立于2018年,其坐落于长春市,是一家主要从事软件和信息技术服务业的企业。该企业的注册资本高达80000万人民币,实缴资本为15600万人民币。通过天眼查的大数据分析可知,吉林省吉林祥云信息技术有限公司积极对外投资,一共投资了4家企业;在招投标领域也十分活跃,参与招投标项目多达914次。在财产线索方面,该企业拥有商标信息12条,专利信息30条,此外还拥有行政许可5个。
本文介绍了吉林省吉林祥云信息技术有限公司申请的“基于SadTalker的实时虚拟数字人播报方法”专利,说明了该专利在提高虚拟数字人实时性和自然逼真度方面的具体步骤和优势,同时还介绍了公司的基本情况和相关业务活动,展现了该公司在软件和信息技术服务领域的实力和创新能力。
原创文章,作者:Dermot,如若转载,请注明出处:https://www.qihaozhang.com/archives/3457.html