目前为止,与AIGC相关的创作类型主要有三种:
1.内容平台的一种自动化作业方式,比如CCTV的AIGC平台,就包括智能采编,模板生成,画质优化等等,部分语音类app,通过语音合成(TTS)技术,提供文本自动转语音的能力,流媒体平台,通过算法对画面画质进行优化,提高清晰度等等。
2.AI科研机构的多模态应用,实现内容生成,比如中科院自动化所的跨模态通用人工智能平“紫东太初”,就能够做到“以图生音”“以音生图”,百度文心大模型的“AI画家”,则在前不久的元宵节,生成与地点相匹配的专属画作。
3.科技企业及创业公司的数字人,虚拟人制作,通过自主开发,平台开发等形式,合成全新的人物形象,与用户开展互动,比如AI手语主播,通过AI算法将文本转化为手语信息,为听障朋友提供服务,品牌代言人,火星车数字人祝融号跟广大用户进行互动,虚拟偶像,通过生动的表情,动作,语言等展示才艺,与粉丝对话,以及智能客服,游戏陪玩等等。
AI以崭新的应用形式又一次刺激人类对科技的想象,但这些让人兴奋应用的体验感依然没有想象中丝滑,例如AI绘画会画出与主题完全不相干的图片,ChatGPT也时常一本正经地胡说八道。
技术更新诞生新的应用,而新应用出现的问题往往又倒逼技术的升级更新,AIGC势必也会在AI芯片领域掀起新的浪潮,直到有大模型,可控性,多模态等技术为AIGC赋能,AIGC才愈发走向成熟,终于有了更加出色的应用表现。
需要强调的是,对于AI而言,如何理解用户输入语言的含义是运作的关键,而AI对人类语言的理解主要基于被喂入的数据——被喂入的数据越多,理解能力越强,即模型越大,理解能力越强,这一点在ChatGPT上也得到了证明,其友好对话能力也是基于较新的GPT-3.5这一大规模的通用语言模型,通过对来自四面八方的大量文本进行训练,从而产生类似人类的反应。