我把ChatGPT训练成了小红书读书博主|全球热讯
事情是这样的,你想必已经听说了全网刷屏的AI聊天机器人ChatGPT,我想让它帮我找一本关于中国古人养猫的专著,测试一下它的搜书能力。没想到它却一本正经地杜撰出了一本《中国古代养猫史》,连内容简介都挺像那么回事儿,如果不是豆瓣、当当、孔夫子遍寻不着,我还真被这个小机灵鬼儿给唬住了。
(资料图片)
为了惩罚拒不认错、百般狡辩的ChatGPT,我先是让它用小红书的风格写一篇《中国古代养猫史》的推广文案,虽然浮夸度可以打满分,却更像是车轱辘话来回倒腾(看来小红书读书博主暂时不用担心失业了)。接着,我又“勒令”它自己把这本“虚构之书”写出来。
它刚开始的表现令我惊喜,五秒之内就列出了《中国古代养猫史》的各个章节,看起来滴水不漏,无可挑剔。然而,当我让它细化第一章的内容时,ChatGPT的马脚就再也藏不住了——原来,它只是在套用大数据习得的学术著作通用框架,并没有具体问题具体分析的能力。
当然,指导ChatGPT写书之所以第二步就受挫,一方面是因为它训练时的中文语料十分有限。毕竟,它用英文已经可以写出一篇莎士比亚风格的文章,却很难模拟出鲁迅、老舍的文字风味。另一方面,也是因为我的调教不得其法,微博博主祝佳音经过连续多天的辛苦调教,已经成功训练出了一口京片子的老北京AI(可以和满口“册那”的上海话AI组一对cp),给出情景就能唱山歌的刘三姐AI,以及可以通过图灵测试的仁波切AI。在精通古诗音韵、对仗、修辞、用典的高手的调教之下,教会ChatGPT写一首有老杜神韵的律诗并非是一件不可能之事。
虽然我的试验失败了,但YouTube上已经有不少教你用ChatGPT写书的教程。既然它能编写代码,撰写券商分析报告甚至专业论文,写出一本煞有其事的书应该不在话下。毕竟,有大量的商业、成功学著作,都像是把一篇文章就能讲清楚的观点“注水”成了一本书。
在YouTube评论区,已经有人尝试给ChatGPT提供角色名称和人物介绍,让它自己写出一本童书,也有人试着用ChatGPT把剧本转写成小说。不过,更多人则在质疑这是在批量生产垃圾电子书(“除非对主题了如指掌,否则你无法判断它是否在信口开河”),版权归属也存在很大问题。多家知名学术期刊已经更新编辑规则,禁止将ChatGPT列为合著者,不允许在论文中使用ChatGPT所生产的文本,相信很多出版机构也将快速跟进。
虽然ChatGPT作为写作者存在诸多争议,却必将很快成为作者们须臾难离的写作助手,极大地提高收集、整理、归纳、分析信息的效率,还可以提供思路、润色文字。ChatGPT不仅正在快速抢走废话连篇的专家的饭碗,也将会降低读者对于“水文”“水书”的容忍度,将剪刀+浆糊的资料整合型作者逼上绝路。
相比于训练ChatGPT写一本书,我更关心它怎样更好地帮我提高阅读效率,毕竟“生也有涯而书海无涯”是我一直以来最大的苦恼。在国外,已经出现了多款基于大语言模型的阅读辅助应用。
输入你的问题、描述,BookAbout就能从50万本书中找到你想要的那一本。只要向Humata.ai上传一本书,它就能解答关于这本书的几乎任何问题,更可以快速帮你梳理书籍结构,概括故事情节,做各个章节的内容摘要,甚至可以找出“《哈利波特》中出现次数最多的100个角色”。随着类似服务的不断精进,我们可能就不需要真人来为我们拆书了,人人都可以实现5分钟翻完一本书。
当然,对于淹没在浩如烟海的专业文献中的研究者来说,这样的AI助手可谓是天降福音。如豆瓣用户王紫的畅想,它可以帮助学者速读各语种的文献,提炼出有价值的观点,从而超越语言、视野的局限,皓首穷经这样的苦活以后完全可以训练AI来完成。
目前国内尚未出现类似的服务,我们期待微信读书等电子书平台能早日训练出自己的ChatGPT,从而为读者提供更为精准、智能的阅读辅助服务,未来能做的远比Kindle的X-Ray功能更多。
当然,对于类似ChatGPT这样的大型语言模型,如果在训练过程中纳入更多图书语料,必将会极大地提高其对于人类各种语言,各领域知识的理解、运用能力。虽然Google已经发布了对标ChatGPT的聊天机器人Bard,但它所基于的大型语言模型,在训练过程中却无权利用Google Books的2500万本图书。
Google曾用10年时间花费4亿美元扫描了美国各家大学图书馆及公共图书馆的2500万本书,2010年时更扬言要全部扫描世界上现存的129864880册图书。然而,随后它开始面临作家和出版商的轮番起诉,也遭到微软、亚马逊等巨头的阻击,由于反垄断部门介入调查,它最终未能与出版业达成协议,后续的扫描计划也不了了之。如《纽约客》作者James Somers所言,“一想到Google公司某处有一个包含有2500万本书但是却没有人有权利阅读的数据库,这个事实就让人觉得无法理解。”
随着科技巨头之间围绕大型语言模型的军备竞赛正式打响,或许这一沉睡已久的知识宝藏有望被重新激活。当AI在一夜之间读完了人类数千年写下的上亿本图书,会进化成何种我们无法想象的模样?