看世界(2024年第10期)_看世界杂志社_AZW3_MOBI_EPUB_PDF_电子书(无页码)_看世界杂志社
内容节选
HUMANITY & INSPIRATION 人文·启迪OpenAI,到底Open了什么? 文∣菲力 从版权劫掠到技术合作,再到创意启发,以OpenAI为代表的人工智能新势力,就像一个调皮的孩子,不停地拆着盲盒。 人形机器人拿着画笔站在画架前进行创作,图像由AI生成 生成式AI及背后的科技巨头,正张着血盆大口,对古老的出版行业虎视眈眈。 今年4月,美媒爆出Facebook母公司Meta一份内部会议记录,原来,早在一年前,Meta内部几乎每天都开会讨论如何获取更多数据,来训练人工智能模型。在这份文件中,公众得以窥见科技巨头如何看待书籍、知识和数据,以及其中隐含的微妙态度。根据会议记录,Meta的生成式人工智能负责人Ahmad Al-Dahle告诉高管们,公司已经使用了互联网上几乎所有的英文书籍、诗歌和散文来训练模型,因此正在寻找新的训练材料来源。 他们清楚一点,AI在未经授权的情况下,已经穷尽了素材,如果要引用更多,必然意味着潜在的诉讼风险。律师指出了其中的道德问题,高管们却沉默了。 其中一则录音显示,与会者讨论收购全球五大出版商之一的美国西蒙与舒斯特公司(Simon&Schuster),或者以每本书10美元的价格,取得新书的全部授权。但方案未能落实,原因很简单,相关的知识产权还是一片空白,AI还可以厚着脸皮肆无忌惮地挪用。 去年11月,加利福尼亚州联邦法官文斯·查布里亚(Vince Chhabria)驳回众多作家对Meta未经许可就用其书籍训练AI的指控。这向他们传递了一个信息,在知识产权混乱的当下,还有灰色操作的余地。 但无可否认,当下,各大AI巨头,正在为高质量文本的追逐蓄势待发。拥有优质内容的传统出版行业,正是其瞄准的目标。我们来到了一个关键的历史节点,围绕书籍这种人类引以为傲的智慧结晶,更多的撕扯、博弈将会展开。尽管科幻电影对AI的想象无穷无尽,但现实的发展还是超出了人们的预期。就像纽扣和纽扣洞、罐头和开瓶器不是同时出现的,世界的格局不是一蹴而就的,在问题找到答案之前,难免经历混乱与遐想、博弈与突围。 美国西蒙与舒斯特公司 / Epoch(人工智能研究机构)预测,到2026年,所有高质量可用数据都可能被耗尽。 / Meta公司 巨人要求付费 “Word,你是个成熟的软件了,该学会自己码字了。”这话刚出口没多久,键盘侠们还在为自己的幽默感沾沾自喜。OpenAI、ChatGPT和Sora、Midjourney的先后诞生,就一口气取代了人们对Word、Excel和PPT的全部期待:自己码字、自己统计数据,自己生成影像,甚至自己讨好甲方。 一个人工智能领域的基本常识:AI不是生来就这么聪明的,不论ChatGPT还是OpenAI,模型只是模型。要使其具备可持续进化的智能,“数据堆肥”是关键的一步。在这一点上,人工智能和人的婴儿时期是相似的,都要依靠外界的输入,建立起自身最初的认知基础。2022年11月,ChatGPT横空出世,人工智能领域的数据饥渴被彻底引爆。快速成长中的人工智能对数据调用的需求,已经远超科学家们的投喂速度——孩子嗷嗷待哺。 一年之后,《纽约时报》状告OpenAI和微软侵犯其版权,宣称其出版的数百万篇文章被用于训练OpenAI旗下的聊天机器人。这些机器人作为人类社会新的信息来源,与新闻机构展开了直接竞争。《纽约时报》表示,如果新闻机构无法制作和保护独立的新闻报道,将会造成AI无法填补的真空。此话不假。但更切实的理由是,人工智能站在巨人的肩膀上,却没向巨人付费。 第一个为“巨人”付费的公司是谷歌。2024年初,法国竞争管理局表示,谷歌在未经允许的情况下,使用了法国出版商和新闻机构的内容训练大模型Gemini,对此处以2.5亿欧元的罚款,由此结束了互联网漫长时间以来免费的午餐。 Meta全球合作伙伴和内容副总裁Nick Grudin表示:“唯一阻碍我们达到ChatGPT水平的因素就是数据量。”流出的Meta内部会议记录显示,高层早就开始商议收购出版巨头西蒙与舒斯特公司,以廉价获取更多书籍、诗歌和文章来训练旗下的人工智能产品。流出的资料还显示,当时参会的成员中,有人曾表示在未经许可的情况下使用更多文本,哪怕有被起诉的风险,也是值得的。 约翰内斯·古腾堡正在检查用活字印刷的样张 这场毫无武德可言的现代战争正在进入白热化。 即便如此,Epoch(人工智能研究机构)预测,到2026年,所有高质量可用数据都可能被耗尽。但届时,人工智能可能已经在巨人肩膀上完成了自身从0到1的起步。这之后,就像人成年之后,一切经验的取得得靠自己,而不是他人喂养。比如,由人工智能模仿人类生成文本,再用这些文本训练人工智能的“合成数据”,似乎是一个可行的选择。但也有研究人员表示,这些近亲繁殖而来的数据,或许最终导致“哈布斯堡诅咒”,让最终的输出缺乏多......
- 信息
- 本期文章
- 风靡海外的纸片人老公
- 周冠宇:偏执者游戏
- 美国大学抗议,改变了什么
- 特朗普,法庭大作战
- 500年后,日本人都姓“佐藤”?
- 马尔克斯想毁掉的遗作,终于出版
- OpenAI,到底Open了什么?
- 巴黎圣母院,五年再复兴
- TikTok上,商家们“富贵险中求”
- 国产乙女,俘获欧美
- 全球最大比特币洗钱案告破
- 校园的“硝烟”
- 英国弹性工作制,我的工作我做主?
- 欧洲人的地摊文化
- “量子”诈骗,盯上农民
- 跨越时空的“法医”,揭秘传奇帝王之死
- 沙漠之城遇洪灾,预示了什么?
- 当环保女孩抵制图书节赞助商
- 肯尼亚的证人
- 在流泪与不流泪之间