Loading...

中国绘画+书法AICG赋能传统艺术创作;

AIGC行业资讯1年前 (2023)更新 admin
3,630 0

AIGCAI Generated Content)即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT,以及 Dall·E 2、Stable Diffusion 等文生图模型,都属于 AIGC 的典型案例,它们通过借鉴现有的、人类创造的内容来快速完成内容创作。

在“新晋流量” ChatGPT 的背后,AIGC 是“昙花一现”?还是将引领人工智能进入新的时代?「AIGC 周报」将从技术前瞻、企业动态、政策法规、专家观点四个板块带你走进 AIGC 世界。

01 技术前瞻

中国绘画+书法,AICG赋能传统艺术创作

AIGC 受到广泛欢迎,得益于其生产的高效率和一致性,以及定制化和多样化的能力。受汉字象形图子集的启发,Zuhao Yang、Huajun Bai 等人提出了 PaCaNet,这是一种基于 CycleGAN 的综合解决方案,用于制作融合传统中国绘画和书法的新颖艺术作品。

为了产生稳定和多样化的输出,该研究主要采用了三个主要的技术创新:使用单次学习来增强预训练模型的创造力,并使融合图像的内容多样化;通过冻结预训练模型中的随机采样参数来控制对生成的中国书法的偏好;使用正则化方法来鼓励模型产生类似于中国画的图像。

此外,研究团队还对 PaCaNet 在中国书画多样化方面的表现进行了系统研究,并取得了令人满意的结果。通过融合绘画中的视觉信息和中国书法中的笔画特征,该研究为艺术创作提供了一个新的方向,创造了根植于中国象形文字起源的独特审美体验。

中国绘画+书法AICG赋能传统艺术创作;

论文链接:

https://doi.org/10.48550/arXiv.2301.13082

跨模态交互新进展:文字提问,图片回答

大多数的大型语言模型(LLM)都是基于从互联网上抓取的纯文本数据进行训练的,不具备丰富的视觉线索(visual cues),因而无法学习现实世界中的概念,在涉及视觉推理和接地(grounding)的任务上表现得较差,而且也不能产生图像。

Jing Yu Koh 等人提出了一种将预训练的纯文本语言模型应用于视觉域的有效方法,使它们能够处理和生成任意交错的图像和文本数据。该方法利用了预训练后语言模型的上下文学习和自由文本生成能力,并通过微调输入和输出线性层等来实现跨模态交互。研究团队在上下文图像检索和多模式对话等基础任务上实现了强大的零样本性能,并展示了引人注目的交互能力。

中国绘画+书法AICG赋能传统艺术创作;

该方法为纯文本模型加入了令人兴奋的视觉和语言功能,比如多模态对话、生成图像以及从对话中的上下文图像检索,为能够适应和生成长、连贯、多模态序列的模型铺平了道路,并为预训练的纯文本 LLM 在视觉基础任务上的能力提供了进一步的见解。

论文链接:

https://doi.org/10.48550/arXiv.2301.13823

研究表明:Midjourney不具备伪造科学图像的能力

当大型注释图像数据集用于训练 AI 时,可能会产生意想不到的联系、模型和基于图像的组学。通过识别人们无法发现的关系和模式,AI 可能会生成新的知识、假设甚至范式,从而有可能彻底改变科学。

在此次研究中,为探讨“由 AI 创建的图像是否会对科学出版物中数据的完整性构成威胁”的问题,Michael Cammer 使用领先的人工智能图像生成引擎 Midjourney 来创建生物科学中通常描述的图像的逼真复制品。

由于免疫印迹(immunoblots)是生物科学的基础和相对简单的图形,在已发表的论文中,其是存在科学欺诈的主要对象。于是,Cammer 利用 Midjourney 生成免疫印迹带(western blots),并与真实的免疫印迹带进行对比。结果发现,Midjourney 生成的图像更像是 20 世纪中期的艺术作品,而非科学图像。这可能是因为 Midjourney 的训练数据不包括免疫印迹相关的专业语料。

中国绘画+书法AICG赋能传统艺术创作;

因此,Cammer 认为,当今流行的 AI 尚无法伪造科学图像,从而用于科学欺诈。然而,如果 AI 通过丰富的科学特定图像进行训练,未来可能会具备伪造数据的能力。

参考链接:

https://www.biorxiv.org/content/10.1101/2023.01.28.526052v1

02 企业动态

OpenAI推出付费版ChatGPT,每月20美元

ChatGPT 的成本极其昂贵。据 OpenAI 联合创始人兼首席执行官 Sam Altman 称,ChatGPT 的运营费用高得吓人。在微软投资数十亿美元后,OpenAI 面临着在 ChatGPT 等产品上实现盈利的压力。

2 月 1 日,OpenAI 宣布推出 ChatGPT 试点订阅计划,即以每月 20 美元的价格提供 ChatGPT Plus 服务。与免费版 ChatGPT 相比,它提供了更多特权,包括在高峰时段也能流畅地访问,且响应时间更快,以及优先体验新功能和性能改进等。ChatGPT Plus 目前只对美国用户开放,免费版 ChatGPT 将继续面向公众开放。

参考链接:

https://openai.com/blog/chatgpt-plus/

OpenAI推出ChatGPT“官方检测器”

1 月 31 日,OpenAI 宣布推出一款可以区分人类编写的和 AI 生成的文本的分类器。具体来说,该工具能够在一定程度上防止 AI 文本生成工具的滥用,比如自动虚假信息宣传、学术造假以及将 AI 聊天机器人定位为人类等。Open AI 表示,分类器并不完全可靠,仅能正确地将 26% 的 AI 生成文本识别为“可能是 AI 生成的”,并错误地将 9% 的人类编写的文本标记为 AI 生成的。据介绍,分类器的可靠性通常会随着输入文本长度的增加而提高。

参考链接:

https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/

硅谷大厂“带货”,ChatGPT成AI圈新秀

1 月 23 日,OpenAI 宣布和微软扩张合作关系。微软在向 OpenAI 投资数十亿美元后,计划加深与 OpenAI 的合作,将 ChatGPT 整合到 Bing 搜索引擎、Office 全家桶、Azure 云服务器、Teams 聊天程序等系列产品中。

据新浪科技消息,内部 Slack 消息显示,ChatGPT 已被亚马逊用于多种工作职能中,包括回答面试问题、编写软件代码和创建培训文档等。一名员工在 Slack 上表示,亚马逊 Amazon Web Services(AWS)云部门已成立了一个小型工作组,以更好地了解人工智能对其业务的影响。该团队发现,ChatGPT 在回答 AWS 客户支持问题方面“做得非常好”,在创建培训文档方面“非常出色”,在企业战略问题方面也“非常强大”。

参考链接:

https://new.qq.com/rain/a/20230128A02AA200

03 政策法规

arXiv:生成式 AI 语言工具不应被列为作者

ChatGPT 在研究界引发严重质疑:ChatGPT 可以被指定为研究论文的作者吗?计算机程序不能对论文的内容负责,也不能同意 arXiv 的条款和条件。因此,arXiv 领导者和顾问坚决反对,并于 1 月 31 日正式提出一项关于使用 AI 生成文本工具的新政策:

(1) 继续要求作者在他们的工作中报告任何复杂工具的使用情况,如仪器和软件;特别将文本到文本的生成式 AI 包含在应报告的符合方法论主题标准的工具中。

(2) 提醒所有同事,只要在论文上署名,每个人都要对论文的所有内容承担全部责任, 不论这些内容是如何产生的。如果生成式 AI 语言工具生成不恰当的语言、抄袭的内容、错误的内容、不正确的参考文献或误导性的内容,并且该输出被纳入科学成果中,这就是作者的责任。

(3) 生成式 AI 语言工具不应该被列为作者。

参考链接:

https://blog.arxiv.org/2023/01/31/arxiv-announces-new-policy-on-chatgpt-and-similar-tools/

“你有律师职业证吗?”原定2月首次出庭的AI律师被撤

成立于 2015 年的纽约初创公司 DoNotPay 旨在使用机器学习和自动化技术让用户跳过耗时但简单的流程,例如取消订阅,自动起草从离婚协议到诽谤信等所有内容。在背后,该系统依赖于包括 ChatGPT 和 DaVinci(基于 GPT 3.0)等 AI 文本生成程序。

Browder 1 月初在采访中表示,公司的“ AI 律师”将于” 2 月 22 日在美国首次出庭,为被告提供建议。但受到律师公会的威胁后, Browder 表示不值得冒着坐牢 6 个月的风险把第一个“机器人律师”带进法庭。但他还是指出:“大多数人请不起律师。我本可以改变现状,让人们可以在法庭上使用 ChatGPT 等工具,这或许可以帮助他们打赢官司。”

参考链接:

https://www.fastcompany.com/90840073

04 专家观点

比尔·盖茨:ChatGPT的历史意义不亚于PC或互联网的诞生

近日,比尔·盖茨提出,在对社会产生的影响来看,ChatGPT 等人工智能技术的出现不亚于个人电脑或互联网。虽然他对 ChatGPT 与人工智能技术不吝啬溢美之词,但在最初微软决定投资 OpenAI 时却提出质疑。当时,他担心人工智能是否能够理解人类高度基于“上下文”的语言交流内容。但现在,ChatGPT 已经初步证实其应用能力。他表示,在 2023 年,人工智能将成为最受人们关注的热点板块。

参考链接:

https://finance.sina.com.cn/stock/usstock/c/2023-02-03/doc-imyeknkx3560906.shtml

史松坡:基于人类反馈的强化学习,ChatGPT是高效的信息整合助手

近日,洛克资本副总裁史松坡表示,ChatGPT 受到广泛认可的重要原因是引入新技术 RLHF(Reinforcement Learning with Human Feedback),即基于人类反馈的强化学习。“RLHF 的重点是如何让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致;同时人类不断的使用和效果反馈,也能迭代优化 AIGC 的效果。”

他表示:“目前 ChatGPT 在海外英文环境中已经能胜任图画创作、音乐创作、文字整理、信息搜集综合、基础编程和金融分析,但还不能胜任高频度的人类主观决策,比如大型投资决策、政治战略决策等。本质上,ChatGPT 是一个高效的信息整合助手,可以取代大量人类中初级助理的角色。”

参考链接:

https://www.chinatimes.net.cn/article/124546.html

AIGC爆火之余,冷静的警醒与反思也同样存在

Gmail 创始人 Paul Buchheit 在 2 月 2 日称:“谷歌距离被彻底颠覆可能只需一两年的时间。AI 将消灭搜索引擎结果页面,这可是谷歌赚钱最多的地方。即使他们在 AI 领域追赶上来,他们也无法在不破坏其业务最有价值的部分的情况下完全部署 AI。”

参考链接:

https://twitter.com/paultoo

深度科技研究院院长张孝荣认为:“现在的技术创新获得了一定突破,但并非革命性突破。国内企业没有能力构建类似水平的技术和研究项目。国内有一些机构借助于国外来源技术和模型,通过技术接口,跟风推出一些同类应用,类似于将自己的大厦建筑在别人的土地上,向国外项目输出了大量原始数据,存在严重卡脖子风险,也存在一定的信息安全问题。”

参考链接:

https://www.thepaper.cn/newsDetail_forward_21742876

创新工场王咏刚表示:“AI 创作在知识教育领域极度危险,今天的 AI 生成理论,还没办法保证生成内容的逻辑正确与合理。AI/CS 等专业人士要保持冷静,今天的 AI 仍然没有摆脱大黑盒的问题,跟风要有道德底线。”

参考链接:

https://finance.sina.com.cn/tech/internet/2023-02-01/doc-imyecyew6757670.shtml

清华大学计算机科学与技术系长聘副教授、聆心智能创始人黄民烈则指出:“由于后端的模型和算法设置决定,ChatGPT 并没有动态记忆功能。而且目前只是对过往知识的学习和应用,如果没有足够的主题可用信息,很容易用不正确的数据回复。国内企业要想发展还需要资本、数据等支撑,最主要的问题是需要找到和应用的结合点,思考如何降成本并解决安全和伦理问题。”

    © 版权声明

    相关文章

    暂无评论

    暂无评论...