谷歌因窃取用户数据，训练Bard等AI模型被起诉

添加书签

AIGC开放社区
2023-07-15

专注AIGC领域的专业社区，关注OpenAI、百度文心一言等大语言模型（LLM）的发展和应用落地，关注LLM的基准评测和市场研究，欢迎关注！

7月14日，Masthead消息，美国加利福尼亚州克拉克森律师事务所，对科技巨头谷歌提起了法律诉讼。

在这份长达90页的诉讼书中，指控谷歌从网络秘密窃取大量数据来训练其AI产品。指控其疏忽、侵犯隐私、盗窃、侵犯版权以及从非法获取的个人数据中获利。

该诉状于7月11日在加利福尼亚州北区提起，声称谷歌已经获取了个人用户的信息、创意作品、照片，甚至电子邮件等数据，基本涵盖用户的所有网络操作。

据称，这些数据用来训练类ChatGPT产品Bard等商业AI产品。该诉讼认为，这种做法是对用户隐私的大规模侵犯，因为谷歌在没有补偿或同意的情况下收集数据，其唯一目的是训练AI模型。

克拉克森律师事务所认为，谷歌在全球拥有数十亿用户，正在将用户置于“毫无隐私”的境地。

用户面临着艰难的抉择：要么将所有个人和版权数据交给谷歌，用于训练AI模型；要么完全避开互联网。该诉讼旨在挑战这一困境，并为那些受谷歌非法抓取数据的人寻求正义。

诉讼称，谷歌盗用了Common Crawl等数据集。Common Crawl 是一家为研究和教育目的提供免费数据的非营利组织。此外，谷歌还被指控使用来自Medium、Kickstarter、Gmail 和 Google Search 等平台的数据，来为其AI模型提供训练数据。

还指控谷歌使用了受版权保护的作品，包括数字图书馆的电子书和盗版网站的内容，而没有向艺术家和作者提供补偿。

针对这些指控，谷歌总法律顾问Halimah DeLaine Prado驳回了这些指控，称其毫无根据。Prado表示，谷歌负责任地使用来自公共来源的数据集，并符合其人工智能原则。据谷歌称，用于训练谷歌翻译、Bard等AI模型的数据，是从发布到开放网络和公共数据集的信息中获得的。

前不久，谷歌更新了其隐私策略将会抓取用户公开或来自其他公共来源的数据，用于训练Bard、谷歌翻译和云AI。

根据谷歌之前的隐私策略显示，是限制搜集用户的公开数据。现在，用户上传的任何数据、任何操作，都有可能被谷歌搜集，用于训练其AI模型。

该隐私策略的更改很可能就是为了避免遭到法律方面的纠纷。但是，用户的数据隐私将彻底暴露在谷歌面前人任其随意搜集、使用，并不会得到任何补偿。

克拉克森律师事务所此前也因为用户数据隐私问题，起诉了ChatGPT母公司OpenAI，向加州北部地区巡回法院提交了一份长达157页的起诉书。

在起诉书中，指控OpenAI在开发、营销和运营其AI产品时，对数以亿计的互联网用户的个人信息，包括儿童信息进行了非法收集、使用和分享。原告认为，被告的上述活动违反了多项法律。因此，原告要求法院对被告发布禁令，并对被告的损失进行赔偿。

本文素材来源Masthead官网，如有侵权请联系删除

END

即将举行的活动