OpenAI推出DALL·E 3识别器、媒体管理器

添加书签

AIGC开放社区
2024-05-08

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

5月8日，OpenAI在官网宣布，将推出面向其文生图模型DALL·E 3 的内容识别器，以及一个媒体管理器。

随着ChatGPT、DALL·E 3等生成式AI产品被大量应用在实际业务中，人们越来越难分辨AI和人类创建内容的区别，这个识别器可以帮助开发人员快速识别内容的真假。

目前，OpenAI已经开放了DALL·E 3识别器的API，开发人员从今天开始至7月31日可申请试用。OpenAI会在8月31日之前公布获取使用权限的名单。

这个媒体管理器主要是面向媒体行业、内容创作者的产品，帮助控制自己的知识产权内容是否会被OpenAI搜集用于训练AI模型。

DALL·E 3内容识别器申请地址：https://openai.smapply.org/prog/dalle_detection_classifier_access_program/

AI生成的内容真假难辨

由于DALL·E 3等大模型生成的图片能达到以假乱真的效果，例如，AI合成的斯威夫特色情照片被疯传。

早在今年2月7日，OpenAI宣布在DALL·E 3生成的图片中嵌入了 C2PA的元数据，以防止图片被非法乱用。即将发布的文生视频模型Sora，也会集成C2PA元数据。

C2PA是一种开放数据标准，允许出版商、企业、开发者等，通过元数据来跟踪和验证数字内容，例如，图片、视频、文档等，最初来源、真实性和完整性等。

但这些还远远不够，因为可以通过技术手段去除这些元数据，使得人们在视觉上还是无法分辨。所以，OpenAI开发了这款内容识别器帮助开发人员、用户来识别内容真假。

OpenAI表示，即便对AI生成的图片进行压缩、裁剪、更改饱和度/颜色、去除水印、改变形状等各种常规操作，识别器的准确率仍高达98%。

此外，AI生成语音的造假能力比文本、图片、视频高出好几倍，并且已经有人被AI语音诈骗过钱财。

OpenAI还开发了一种音频水印，将其集成在自定义语音模型 Voice Engine中，目前处于产品预览阶段。

媒体管理器，保护知识产权

前不久，《纽约日报》、《芝加哥论坛报》、《奥兰多前哨报》、《水星报》等8家知名媒体联名状告OpenAI，在没有获取授权的情况下使用其文章训练AI模型。而谷歌也因为非法搜集数据，同样被起诉过。

目前，OpenAI用于训练AI模型的数据主要有两个渠道：第一个，付费知识产权渠道，例如，OpenAI与《金融时报》、《世界报》、Prisa Media、Axel Springer等媒体签订的数据合作协议，每年支付他们上千万欧元以获取使用数据的权利。

第二个，公开渠道，这包括大量的开源数据集和通过爬虫获取到的数据。爬虫在抓取的过程中可能会非法搜集一些知名网站的数据，就会出现那8家媒体状告OpenAI的情况。

因此，OpenAI正在开发一款“媒体管理器”，可以轻松管理知识产权内容，哪些可以被AI搜集，哪些不可以。预计该产品将在2025年之前发布。

OpenAI最近还对ChatGPT生成的内容加上了原始网站链接，例如，达拉斯最适合午夜约会的5家餐厅。ChatGPT会在回答的每一条内容上加上餐厅的官网地址。

一方面，可以保护知识产权增加内容的可信度；另一方面，正在为其推出的搜索引擎做铺垫，可以像谷歌搜索那样列出所有答案的原始链接。

本文素材来源OpenAI官网，如有侵权请联系删除

END

本篇文章来源于微信公众号: AIGC开放社区

即将举行的活动