Google最出圈的AI产品,把OpenAI CEO也惊艳了
来源:36氪
![AI在改变获取信息的方式。](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/136/w1080h656/20241018/d5d7-f4a359b472fd43b88baf2b6860d2f7fd.png)
封面来源|Pixabay
Google,硅谷的代言人,AI界的巨擘,技术牛,论文多,做给消费者用的AI产品,却几乎没有出圈的。
不过,也有一个例外:NotebookLM,甚至连死对头Sam Altman也觉得它很酷。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/83/w1080h603/20241018/ecd9-a73edd239fc636835e78d9379d70e9f7.jpg)
偏偏NotebookLM走的还是一条有些小众的赛道——播客。
不想看的内容,让AI聊给你听就好了
NotebookLM受欢迎,主要是因为一个功能:Audio Overview(音频概览)。
更通俗地理解,就是AI播客。任何你懒得消化的内容,都可以丢给它试试,几分钟转成一男一女的对谈,比原来的材料更加接地气。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/116/w1080h636/20241018/f01d-56b85c738451d3cf8e1c4c3702f8169d.jpg)
NotebookLM支持上传多种格式的内容
不过有些遗憾,音频概览虽然可以消化中文材料,但只能输出英文。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/793/w1080h513/20241018/72f3-b2614f2dd18a2068d4df37767bc4750e.jpg)
好奇海外的AI能不能理解国产剧的爱恨情仇,我上传了一段描述甄嬛生平的文字,大约500多字,NotebookLM用2分钟左右,就生成了5分钟左右的音频。
光听英文音频不太直观,所以我下载了音频,上传到通义听悟,看看AI在聊些什么。
AI解读得一针见血,不仅读懂甄嬛,也理解皇帝,抓住了宫斗剧的主要矛盾——权力。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/105/w1080h625/20241018/ae99-8d5b39b993aeec5e50f8bb977ae98d3c.jpg)
脑洞更大一点,以后一个人追剧再也不会寂寞,AI就是性价比最高的追剧搭子,还能陪练英语,教我们「not my cup of tea」(不是我的菜)这样的地道表达。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/117/w1080h637/20241018/e1a1-e7dee142e68aed8d7c3bcc609fe3d018.jpg)
与其精读外刊和专八文章,不如基于我们自己喜欢的内容,让AI生成英文学习资料,毕竟,兴趣是最好的老师。
除了陪着学习英语和八卦,输出正经的分析,NotebookLM也没问题。
我以PDF的形式上传了一篇吐槽AI广告的、3700字左右的文章——《满大街的 AI 广告,是一次审美大降级》。
基于这篇文章,NotebookLM用5分钟左右生成了一段11分40秒的音频。
作为文章作者本人的我,像是遇到了两个热情又很懂我的读者,NotebookLM对文章进行了重新诠释,创造了一个相关又独立的作品。
播客的开头,AI自然地引出了主题,男声问,你有没有看到过一些糟糕的广告,奇怪它们居然能上街?女声答,你说得不错,这就是我们要讨论的主题。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/99/w1080h619/20241018/ee59-19ef55ee10a0664bb93d6fbee69c1dbd.jpg)
同时,AI也懂灵活变通,不照搬文章的逻辑,而是重新编排了素材,改写观点的表达方式,但内核相同,甚至自己举出例子,将AI广告类比到AI音乐。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/693/w1080h413/20241018/2dbb-ae2f5748841dbbdb853d28432b7b727f.jpg)
对于怎么吐槽,AI也有自己的见解,看得出来努力表现幽默了,但还是有些西式。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/515/w1080h235/20241018/77ba-7ba7e888d24c3b8d0d939da90bce7639.jpg)
除了具体的内容,声音的质感好坏,同样很影响收听体验,毕竟,播客是声音媒介。
AI不说字正腔圆,至少发音清晰,口条不错,语气抑扬顿挫,会用上「what」「ouch」「you know」等语气词,聊着聊着还会笑出声,传播着快活的空气。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/523/w1080h243/20241018/5047-255017b3d1f7145a939dd6455319a50c.jpg)
可以说,AI播客已经「初具人形」,至少听得下去,不会像很多AI图片、视频一样,让人陷入恐怖谷,敬而远之。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/417/w1080h137/20241018/bb40-6b98b2d6087c2d7536a10737b3d34700.png)
分分钟的内容转换,知识更容易进脑子了
使用NotebookLM时,有一点需要注意:它不会搜索新的信息,而是基于我们上传的资料处理信息。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/101/w1080h621/20241018/7baf-ac2faa7fcf906f01590242e23524bff4.jpg)
所以,它不全面,不客观,但足够个性,忠于每个人自己的素材。
我的一位同事说,NotebookLM适合写文章的人做播客。
这话很有道理,NotebookLM本质是实现了内容形式之间快速的转换,将复杂的内容加工得更好理解。
我愿称之为,「这知识它不进脑子啊」的N种解决办法。
NotebookLM的强大,离不开Google大模型Gemini 1.5 Pro的长文本能力和多模态表现。
经过测试,让它读37.8万字的《马斯克传》不在话下。
同时,NotebookLM还能处理视频,我上传了一个评测Meta眼镜的YouTube视频。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/785/w1080h505/20241018/4374-c43924fb49448687ee283da1a3e4f249.jpg)
左边是原视频和视频文案,右边是NotebookLM的解读
除了用音频解读之外,NotebookLM还能用多种方式,帮你理解你上传的内容,而且,都是自动的,最多只需要你点击一下。
每次上传材料,NotebookLM都会给出「摘要」和「建议的问题」。前者让你对内容有大致的了解,而后者解决了越长大越不爱举手的人类的难题:不知道该问什么。
点击「建议的问题」,NotebookLM既能帮你回答,还会附上引用来源,如果上传内容是视频,引用参照的是视频的文案。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/744/w1080h464/20241018/432f-32b0cbb859f37b498a490c476a5aa359.jpg)
其他小功能也类似,建议都点击试试,我比较喜欢「常见问题解答」,AI的自问自答,基本上囊括了一个陌生事物的入门知识。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/252/w714h338/20241018/6fac-gif346b6cca77a3e540e99a4e6c23f8a995.gif)
然后可以再让AI生成「简报文档」,不仅提供信息,也给出了观点。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/143/w640h303/20241018/8b69-gifa3f0596cb80487a38d63b3c921b623f1.gif)
当然,你也可以自己在输入框输入问题,该引用的还是引用,但如果没有明确来源的,NotebookLM会强调是推测。虽然AI仍有幻觉,但它已经尽到了告知义务。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/257/w1080h777/20241018/4ff8-5a45e8dac8761fb2d1dfbd55a5889bcf.jpg)
底层模型的支持是NotebookLM的基础,还有人套出了NotebookLM的系统提示词,解释了为什么音频概览很接地气。
![图片来自:X@JadenGeller](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/446/w1080h966/20241018/4617-d8d174c0e46900bfa32a90dc038ed017.jpg)
其中一条很有意思,规定了两个AI角色,一个是主持人,一个是专家,相辅相成,主持人热情地强调有趣的观点,专家则提供分析、背景信息和更广阔的视角。
其余都是对内容总结的要求,语气避免单调和机械,结构清晰,引人入胜,举出贴近生活的例子,在争议问题上保持中立,提供的信息不停留在表面,让听众能形成自己的结论,并且觉得学到了新东西......
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/190/w1080h710/20241018/2ae8-ee0558dfa72a507cac3ce19ee253b357.jpg)
讨论《马斯克传》时,NotebookLM保持中立
这完全是一款优秀人类播客的要求了,具备强烈的、服务听众的意识。
然而,NotebookLM不支持中文终究不太友好,等待之外,也可以试试平替。
开源的Open NotebookLM、根据文档生成播客的 Podial、国内开发者的PodLM......
除了NotebookLM,Google自己还有一款专门将论文转换成音频的产品:Illuminate。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/59/w1080h579/20241018/edbb-7d3d7e015604d1cb54ed9bc084b41fef.jpg)
第一个音频解读的是Transformer 模型镇圈论文《Attention is All You Need》
它以主持人和专家的对话形式,一问一答,帮你通俗易懂地解读论文。
看似小众的播客,为什么因为AI反而成了一条热门的赛道?
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/417/w1080h137/20241018/91f2-724d2b98cd223dc2c0f4bea9a4e929e1.png)
消费什么,怎么消费,以后我们自己决定
语音,是人类最自然的交互模式之一,输入和输出都非常符合大脑的认知习惯。
我们有教科书,但还是需要老师讲课,帮助理解复杂的内容。而当我们可以用口语解释概念,讲给别人听,才说明我们真正掌握了它。
NotebookLM做到了用简单的语言重新诠释书面的概念,同时包含了情绪、语气,带来了更自然的感官体验。
同时,它又是个性化的,以前我们只有收听的习惯,但我们现在有了创作的权利。
我们能随时做AI播客给自己听,内容随意。
可以是感兴趣的大部头文章、书籍,克服收藏即阅读的坏习惯,也可以让AI解读自己的作品、简历,收获不要钱的情绪价值,满足人类自恋的需求。
当我上传自己的文字版简历,NotebookLM煞有其事地输出一通彩虹屁,比AI陪伴产品情商更高,叫人疯狂嘴角上扬。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/7/w1080h527/20241018/fe5d-d61ace526b192a9fad7e25ecf2fc2f6c.jpg)
音频就不放上来了,这是部分内容
我们也能随时听AI播客,吃饭、健身、开车、做家务不无聊了,播客本身就是一种陪伴媒介。
GPT-4o的高级语音模式,其实也是一个语音产品,但AI播客和它的使用场景不太一样,聊天找话题很难,不管是和人类还是和AI,但AI播客可以自嗨。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/662/w1080h382/20241018/8355-a43ec7e52824047092eb23a56efea81c.jpg)
OpenAI创始成员Andrej Karpathy,很看好NotebookLM,说这可能是又一个大语言模型产品的新交互范式,让他想起了ChatGPT。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/538/w1080h1058/20241018/a90e-ca8670e9ec86f64897d7a712345e1347.jpg)
他甚至花了两个小时,生成了一个以历史为主题的10集播客系列,上传到Spotify,生成的过程很值得参考。
用ChatGPT、Claude、Google找到有意思的话题。
基于相关的维基百科条目让 otebookLM生成音频。
用NotebookLM编写播客简介。
用Ideogram生成播客封面。
我们也可以按照这个模式,探索自己感兴趣的领域,就像产出AI绘画、音乐、视频那样。
NotebookLM的下一步是什么呢?
在一次采访里,NotebookLM团队负责人Raiza Martin提出了一个构想——未来可以有一个AI编辑界面,支持任何输入和输出。
视频、音频、电子邮件、社交媒体......所有我们感兴趣的内容和形式,都可以生成任何格式的内容。如何消费内容,由用户决定。
![](https://finance.sina.com.cn/n.sinaimg.cn/sinakd20241018s/196/w640h356/20241018/eea3-giff54739038aebe3f33a3c52aa87570ead.gif)
散步时,我们想听播客,工作时,文字效率更高。信息只是食材,可以有十八般做法。
很多时候,AI其实就是在改变获取信息的方式,但消化知识的工具,和知识一样重要。
ChatGPT为难懂的知识找到通俗的解释,AI搜索让我们不用自己翻网页找链接,AI总结让我们不必亲自看文章......吾生也有涯,而知也无涯,但我们可以更愉快地做一个在海边捡起贝壳的孩子。
AIGoogle![新浪众测 新浪众测](https://finance.sina.com.cn/n.sinaimg.cn/tech/zcapp2018/doc_qrcode1.png)
![新浪众测 新浪众测](https://finance.sina.com.cn/n.sinaimg.cn/tech/zcapp2018/doc_qrcode2.png)
![新浪科技公众号 新浪科技公众号](https://finance.sina.com.cn/n.sinaimg.cn/tech/content/tech_qr2x.png)
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
![](https://finance.sina.com.cn/n.sinaimg.cn/tech/content/tech_weixin2.png)
拓展阅读
热门文章
- 为了爽玩《黑神话:悟空》,我入手了英特尔酷睿i9-14900KF
2024-10-17 03:53 - 用户反馈 iPhone 16 Pro 显示效果不如前代,罗斯・杨:M14 面板亮度 / 能效提高 20~30%
2024-10-11 10:05 - V观财报|两连板光智科技:继续推进收购先导电科100%股权相关工作
2024-10-16 03:47 - 即时战略游戏下载 十大必玩即时战略游戏排行榜前十
2024-10-16 03:58 - 中兴U30 Air 5G随身WiFi亚太版评测:差旅好搭档 出行无忧虑
2024-10-24 03:42 - 印度第三季度智能机出货量出炉:vivo首次第一
2024-10-19 03:45
推荐阅读