未来AIGC可能有两种世界:一种世界是多个大模型基础公司,为上游应用提供API和模型服务,上游应用公司只需要专注于开发产品逻辑和上层算法,而另一种世界则如同今天的AI公司一样,每家公司都根据自身需求研发底层大模型,为自身应用提供技术支持。
你对任何一种世界的相信都将构成你当下投资和创业的选择,当然,这两种世界也可能存在互相交织的过渡形态,但需要你来对过渡形态的持续时间进行判断,你会选择相信哪一种世界。
1,如果GPT-4,或者3年,5年后较好的模型比GPT-3大100倍甚至1000倍,作为创业公司是否还要自研。
2,在某个领域的底层基础模型尚未成熟的时候,选择在该领域进行创业是很好的timing吗。
其实AIGC并不是一个新颖的概念,AIGC即用AI算法生成文本或者图像等内容,各种NLG(自然语言生成)模型和GAN(生成对抗网络)及其变种模型都是此前的生成式AI模型。
AIGC对创作者的解放体现在:“只要会说话,你就能创作”,无需懂得原理,不用学习代码,或者Photoshop等专业工具,创作者以自然语言向AI描述脑海中的要素甚至想法(术语是给出“prompt”)后,AI就能生成对应的结果,这也是人机互动从打孔纸带,到编程语言,图形界面后的又一次飞跃。
自然语言是不同数字内容类型间转化的根信息和纽带,比如“猫”这个词语就是加菲猫的图片,音乐剧《猫》和无数内容的索引,这些不同的内容类型可以称为“多模态”。
AIGC此轮浪潮,较大底层进化就在AI对自然语言“理解”和“运用”能力的飞跃,有了这一强大的特征提取器,后续的GPT,BERT等语言模型突飞猛进,不仅质量高,效率高,还能以大数据预训练+小数据微调的方式,摆脱了对大量人工调参的依赖,在手写,语音和图像识别,语言理解方面的表现大幅突破,所生成的内容也越来越准确和自然。