智东西AI前瞻(公众号:zhidxcomAI)
作者 | ZeR0
编辑 | 漠影
智东西9月19日报道,北京多模态大模型创企生数科技今日宣布完成新一轮数亿元A轮融资。
该轮融资由博华资本领投,卓源亚洲、百度战投、北京市人工智能产业投资基金、启明创投、达泰资本、BV百度风投等老股东持续跟投,建发新兴投资等产业合作方加码跟投。
新一轮融资将用于模型研发和技术创新,探索多模态大模型的智能上限和应用广度,同时将持续加强产品拓展、用户服务、产业合作和全球商业布局。
瑞莱智慧、百度、蚂蚁集团、华为哈勃、智谱均曾投资生数科技。
生数科技成立于2023年3月,核心团队由来自清华大学、北京大学、帝国理工学院、卡耐基梅隆大学等全球顶尖高校的技术人才和来自产业界的产品研发、产业服务人才组成,具备深厚的产业实践经验与出色的全球化技术落地能力。
该公司专注于多模态大模型及应用的自主研发。其核心产品Vidu具备AI图像生成、视频生成、音频生成等能力,广泛应用于互联网、广告、电商、动漫、文旅、广电、教育、游戏及影视等行业领域。
2024年7月,Vidu在全球上线,全球首创「参考生」图片/视频概念。其在AI视频生成和AI生图领域已覆盖全球200多个国家和地区的超3000万用户和6000家开发者及企业。
通过Vidu累计生成视频数量超过4亿,其核心功能参考生视频和参考生图的数量已超过1亿,其中商业内容素材生成量占比超过50%。
今年9月9日,生数科技正式将其视频大模型Vidu的Q1参考生图功能向大众用户开放。其参考生图功能同时支持7张参考图输入,可在多人、多场景、多次生成下保持人物/主体的面貌与特征不跑偏,并支持“一张图 + 一句提示词”自由换装、换背景、合成。
例如,上传人物、道具、服饰、配饰等多张参考图,让小李子坐在霍格沃茨学院的教室里练习魔法。Vidu Q1参考生图能把它们自然得拼到一张图里。
由Vidu Q1参考生图功能生成的图像,能够保持人物发型、五官、书本插图等与原图一致,每个物品位置摆放正确,且比例合理。
该功能可以被用来快速制作时尚杂志封面。
也可以用它来设计中秋礼品营销样稿。
让林黛玉代言川贝枇杷膏,看起来同样有模有样。
Vidu Q1参考生图还能实现“合影自由”,上传场景照片、多个单人照,即可生成合影。
换背景更是不在话下。
动漫人物分分钟就能加上特效。
把照片中的特定素材替换成其他东西,也变得高效。
还可以让图中的南瓜变大1倍、1.5倍。
AI虚拟换装、换场景都更加便利。
比如把裙子换上时髦的碎花花纹。
再比如上传人物照、裙子照、场景照,让AI生成霉霉的结婚现场图。
或者让模特在银白色现代化的室内房间中,分别换上西服、晚礼服、紧身装、休闲运动装。
Vidu Q1参考生图还可以用于一些有趣的P图玩法。
比如把真人变手办。
或是把线稿转3D。
给指定建筑换成木头材质,然后上色:
把平面照片变成冰箱贴。
生数科技CEO骆怡航博士认为,多模态生成技术在数字内容产业中的商业化进程正在加速,但目前仍处于早期阶段。
他预计在未来三年内,多模态生成将重塑全球数字内容的生产方式,全面渗透到各行各业的内容生产与消费环节,展现出巨大的市场空间与全球性增长潜力。
















