看世界(2024年第10期)_看世界杂志社_AZW3_MOBI_EPUB_PDF_电子书(无页码)_看世界杂志社

内容节选

HUMANITY & INSPIRATION 人文·启迪OpenAI,到底Open了什么? 文∣菲力 从版权劫掠到技术合作,再到创意启发,以OpenAI为代表的人工智能新势力,就像一个调皮的孩子,不停地拆着盲盒。 人形机器人拿着画笔站在画架前进行创作,图像由AI生成 生成式AI及背后的科技巨头,正张着血盆大口,对古老的出版行业虎视眈眈。 今年4月,美媒爆出Facebook母公司Meta一份内部会议记录,原来,早在一年前,Meta内部几乎每天都开会讨论如何获取更多数据,来训练人工智能模型。在这份文件中,公众得以窥见科技巨头如何看待书籍、知识和数据,以及其中隐含的微妙态度。根据会议记录,Meta的生成式人工智能负责人Ahmad Al-Dahle告诉高管们,公司已经使用了互联网上几乎所有的英文书籍、诗歌和散文来训练模型,因此正在寻找新的训练材料来源。 他们清楚一点,AI在未经授权的情况下,已经穷尽了素材,如果要引用更多,必然意味着潜在的诉讼风险。律师指出了其中的道德问题,高管们却沉默了。 其中一则录音显示,与会者讨论收购全球五大出版商之一的美国西蒙与舒斯特公司(Simon&Schuster),或者以每本书10美元的价格,取得新书的全部授权。但方案未能落实,原因很简单,相关的知识产权还是一片空白,AI还可以厚着脸皮肆无忌惮地挪用。 去年11月,加利福尼亚州联邦法官文斯·查布里亚(Vince Chhabria)驳回众多作家对Meta未经许可就用其书籍训练AI的指控。这向他们传递了一个信息,在知识产权混乱的当下,还有灰色操作的余地。 但无可否认,当下,各大AI巨头,正在为高质量文本的追逐蓄势待发。拥有优质内容的传统出版行业,正是其瞄准的目标。我们来到了一个关键的历史节点,围绕书籍这种人类引以为傲的智慧结晶,更多的撕扯、博弈将会展开。尽管科幻电影对AI的想象无穷无尽,但现实的发展还是超出了人们的预期。就像纽扣和纽扣洞、罐头和开瓶器不是同时出现的,世界的格局不是一蹴而就的,在问题找到答案之前,难免经历混乱与遐想、博弈与突围。 美国西蒙与舒斯特公司 / Epoch(人工智能研究机构)预测,到2026年,所有高质量可用数据都可能被耗尽。 / Meta公司 巨人要求付费 “Word,你是个成熟的软件了,该学会自己码字了。”这话刚出口没多久,键盘侠们还在为自己的幽默感沾沾自喜。OpenAI、ChatGPT和Sora、Midjourney的先后诞生,就一口气取代了人们对Word、Excel和PPT的全部期待:自己码字、自己统计数据,自己生成影像,甚至自己讨好甲方。 一个人工智能领域的基本常识:AI不是生来就这么聪明的,不论ChatGPT还是OpenAI,模型只是模型。要使其具备可持续进化的智能,“数据堆肥”是关键的一步。在这一点上,人工智能和人的婴儿时期是相似的,都要依靠外界的输入,建立起自身最初的认知基础。2022年11月,ChatGPT横空出世,人工智能领域的数据饥渴被彻底引爆。快速成长中的人工智能对数据调用的需求,已经远超科学家们的投喂速度——孩子嗷嗷待哺。 一年之后,《纽约时报》状告OpenAI和微软侵犯其版权,宣称其出版的数百万篇文章被用于训练OpenAI旗下的聊天机器人。这些机器人作为人类社会新的信息来源,与新闻机构展开了直接竞争。《纽约时报》表示,如果新闻机构无法制作和保护独立的新闻报道,将会造成AI无法填补的真空。此话不假。但更切实的理由是,人工智能站在巨人的肩膀上,却没向巨人付费。 第一个为“巨人”付费的公司是谷歌。2024年初,法国竞争管理局表示,谷歌在未经允许的情况下,使用了法国出版商和新闻机构的内容训练大模型Gemini,对此处以2.5亿欧元的罚款,由此结束了互联网漫长时间以来免费的午餐。 Meta全球合作伙伴和内容副总裁Nick Grudin表示:“唯一阻碍我们达到ChatGPT水平的因素就是数据量。”流出的Meta内部会议记录显示,高层早就开始商议收购出版巨头西蒙与舒斯特公司,以廉价获取更多书籍、诗歌和文章来训练旗下的人工智能产品。流出的资料还显示,当时参会的成员中,有人曾表示在未经许可的情况下使用更多文本,哪怕有被起诉的风险,也是值得的。 约翰内斯·古腾堡正在检查用活字印刷的样张 这场毫无武德可言的现代战争正在进入白热化。 即便如此,Epoch(人工智能研究机构)预测,到2026年,所有高质量可用数据都可能被耗尽。但届时,人工智能可能已经在巨人肩膀上完成了自身从0到1的起步。这之后,就像人成年之后,一切经验的取得得靠自己,而不是他人喂养。比如,由人工智能模仿人类生成文本,再用这些文本训练人工智能的“合成数据”,似乎是一个可行的选择。但也有研究人员表示,这些近亲繁殖而来的数据,或许最终导致“哈布斯堡诅咒”,让最终的输出缺乏多......

  1. 信息
  2. 本期文章
  3. 风靡海外的纸片人老公
  4. 周冠宇:偏执者游戏
  5. 美国大学抗议,改变了什么
  6. 特朗普,法庭大作战
  7. 500年后,日本人都姓“佐藤”?
  8. 马尔克斯想毁掉的遗作,终于出版
  9. OpenAI,到底Open了什么?
  10. 巴黎圣母院,五年再复兴
  11. TikTok上,商家们“富贵险中求”
  12. 国产乙女,俘获欧美
  13. 全球最大比特币洗钱案告破
  14. 校园的“硝烟”
  15. 英国弹性工作制,我的工作我做主?
  16. 欧洲人的地摊文化
  17. “量子”诈骗,盯上农民
  18. 跨越时空的“法医”,揭秘传奇帝王之死
  19. 沙漠之城遇洪灾,预示了什么?
  20. 当环保女孩抵制图书节赞助商
  21. 肯尼亚的证人
  22. 在流泪与不流泪之间