4月20日,出门问问宣布内测探索大模型“序列猴子”,并同步开启了面向创作者的CoPilot产品矩阵,面向C端的升级版语音助手魔法小问,以及面向B端的企业专属大模型的内测。

其中面向创作者的CoPilot产品矩阵包含了四款AIGC产品,分别为AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频与直播平台“奇妙元”。

目前,“序列猴子”大模型已经具备了一定的自然语言理解、知识、逻辑以及推理等能力,对于“湖南和湖北哪一个省会的人口更多?”这类比较复杂的问题能够快速给出准确结果。

出门问问自研大模型的构建原理与“无限猴子”类似,海量文本序列通过出门问问自主算法的不断训练,经由大规模算力消化理解,便练成了“序列猴子”。

出门问问创始人兼CEO李志飞表示,大模型不只是参数量大,当今的大模型是互联网文本的深度建模,而互联网文本是世界知识的映射,因此大模型是一个认知模型,是对语言的建模。而语言是思维的边界,所以大模型拥有无限想象空间。“序列猴子”在训练过程中已经展现出了“涌现”能力,目前正处于“顿悟”阶段,未来提升的速度会越来越快。

他还认为,做人类的CoPilot会是大模型最好的“工作”,未来CoPilot将无处不在。

基于“序列猴子”大模型,出门问问内测探索了多款面向创作者的AIGC产品及应用,为创作者构建一站式CoPilot产品矩阵,打通内容创作全流程。

其中,“奇妙文”的AI写作能力覆盖了职场办公、市场营销、新媒体和创意写作四大内容创作场景,能够在用户撰写年终总结、客服话术、剧本、广告文案等内容时,提供灵感和创意方向。

面对设计师、插画师等在文字外对设计有强烈需求的创作者,出门问问内测探索了“言之画”AI绘画平台。“言之画”支持二次元、蒸汽朋克、插画等8种创作风格。用户只需输入文字,“言之画”就能一次性生成8张光影逼真、细节丰富的2K高分辨率图像。

除了以文生图,“言之画”还拥有以图生图、动图生成、个性头像生成等AI绘图能力,极大丰富了用户的创作手段。对于企业用户,“言之画”还支持专属模型定制,让企业用户能够根据自身需要自定义模型风格,并且支持多人协作生产,更好地满足企业的绘图需要。

面向AI配音场景,出门问问推出了新一代AI配音产品“魔音工坊”,搭载了大模型AI写作功能,覆盖了AI写作、AI配音和剪辑等多个场景。用户可以在它的辅助下轻松完成影视解说、有声书、在线教育、新闻播报等集文案与配音于一体的内容创作。

目前,“魔音工坊”已向用户开放了超1000种音色、超2000种声音风格以及超20种方言和外语。

在文字、图像、声音等生成能力基础上,为了让视频内容创作者更快更好地创作形式新颖、生动有趣的作品,出门问问内测探索了AI数字形象创作及直播平台“奇妙元”。

其形象克隆功能,仅需一段5分钟的真人视频素材,就可以1:1复刻用户的形象神态,为用户打造声音一致、动作自然的数字人分身。

公开资料显示,出门问问对AI语音的研究可以追溯至十年前,2014年出门问问发布了首款语音助手“小问助手”,2015年迭代了“小问秘书”,2017年推出了全场景VPA,并在2019年对VPA进行了升级。

本次发布会上出门问问内测探索的CoPilot-魔法小问,可以理解为Siri与ChatGPT的综合体。作为面向个人用户开发一款智能语音助手,“魔法小问”可以帮助用户查百科信息、查天气、查餐厅、查酒店,还能与用户自由对话,让用户更方便、快捷地获取信息。

据介绍,“CoPilot”源自超级助理的概念,它将拥有基于大模型的高智商大脑,能够分析海量数据即时准确地与人类交流;还会拥有动听的声音、靓丽的形象,可以搭载任意硬件平台,如手机、手表、车机等;还能够适配千行百业,化身高质量教学的老师、知识渊博的律师、专业的医生、金融理财客服等,在需要的时候,随时随地展示专业知识,为人分担压力。

基于“序列猴子”大模型的底层能力,对于B端用户和垂直领域,“出门问问Copilot”不仅提供通用能力支持服务和数字人形象定制服务,还将开放自身角色能力,持续迭代数据接口。有需求的企业用户可以登陆web端调用API服务,并且能通过上传文档的方式,对行业专有内容进行训练,从而实现定制化语音交互。

目前,出门问问已经与首批十大行业的内测探索伙伴达成了合作,包括汽车、教育、律所、金融、医疗、旅游等,未来出门问问“CoPilot”将逐步赋能更多行业,助力更多企业拥有自己的专属大模型,打造自己的专属“CoPilot”。