谷歌的NotebookLM毫无疑问是我最喜欢的AI工具。我在很多方面都依赖它,从理解我杂乱无章的笔记到从难以消化的信息中提取精华要点。
无论你是想快速总结材料,还是深入使用NotebookLM从多个来源提取特定见解,它都能以令人难以置信的灵活性配合你的工作方式。对于学生来说,它是完美的学习伙伴,对于工作而言,它是简化流程和组织信息的好助手。
谷歌定期为NotebookLM推出新功能,让它变得更加强大,同时不会损害让它如此易于使用的整体简洁性。如果你是新用户或想了解最近新增功能的长期用户,我将详细介绍NotebookLM的亮点、功能以及它如何成为我日常工作不可或缺的工具的过程。
**什么是NotebookLM?**
NotebookLM是一个由Gemini驱动的笔记和研究助手工具,可以多种方式使用。一切都从你提供的资源开始,无论是网页URL、YouTube视频还是音频片段,它都能让你将多个来源整合成一个有机整体,为你分散的想法或笔记带来组织性。
NotebookLM最明显的用例是用于学校或工作。想象一下——你跟上了无数课程,为每门课都记录了笔记,甚至可能录制了一些讲座。单独筛选所有内容最终可以让你获得某种程度的理解,但如果能让它们协同工作会怎样?
上传资源后,Gemini会开始创建材料的整体摘要。然后你可以开始就资源中的特定主题向Gemini提问,来自资源的信息将以易于理解的格式显示。仅这一点可能就足够一些只想充分利用笔记的人使用,但这真的只是触及了表面。
**桌面端和移动端都可使用**
NotebookLM在桌面端已经可用一段时间,采用三面板布局,包含资源面板、聊天面板和工作室面板。资源面板和工作室面板都可以折叠,如果你喜欢,可以获得全屏聊天体验。
虽然资源面板和聊天面板功能相当明显,但工作室面板是奇迹发生的地方(尽管一些功能也可以直接从聊天面板创建)。这是你充分利用NotebookLM体验的地方。
熟悉桌面体验的用户会对iOS和Android移动应用感到宾至如归。精简的应用允许你通过底部菜单在资源、聊天和工作室面板之间切换。当你进入显示所有笔记本的视图时,你会看到最近、共享、标题和已下载的标签页。
**音频概览**
如果你在NotebookLM首次发布时没有听说过它,那么在音频概览功能发布时你很可能听说了。一旦你上传了至少一个资源,就可以选择生成音频概览,它会对资源材料提供"深度解读"。这些概览完全由Gemini创建,不仅仅是你材料的音频格式快速摘要——而是一个完整的播客,由两个"主持人"将复杂主题分解为易于理解的信息片段。它们也非常有效,经常互相提问来分析某些主题。
音频概览的默认长度会根据要讨论的材料数量和主题复杂性而变化。在我的测试中,一段很短的文本创建了五分钟的音频片段,而我上传的两个更长更密集的Google Docs文档创建了18分钟的概览。
如果你想对音频概览的长度有更多控制,你很幸运。在本月早些时候的谷歌I/O活动博客文章中宣布,用户现在有三个选项可选择:更短、默认和更长。如果你想要短而密集的播客式体验,或想通过更长的音频概览深入了解某个主题的细节,这个功能非常完美。
**你可以与AI播客主持人互动**
更棒的是,去年12月,NotebookLM获得了新设计和与音频概览互动的新方式。自定义按钮允许你指导对话,确保涵盖关键点。输入你的指令,然后生成音频概览。
现在,如果你想让这个功能更具互动性,可以选择仍在测试阶段的互动模式来加入对话。片段会播放,如果你对所说内容有特定问题,可以点击加入按钮。一旦你这样做,说话者会暂停并确认你的存在,询问你的想法或问题,然后你会得到回复。
**视频概览**
视频概览功能从7月下旬开始向用户推出,目前仍在推广中。我使用NotebookLM的三个谷歌账户中,只有一个提供视频概览功能。
新功能为你的音频概览创建动画视觉辅助。目前,谷歌表示视频概览将作为幻灯片开始,这表明未来会有更多类型的概览可用。
**思维导图**
我听说过NotebookLM思维导图功能的有趣事情,我取了大约1500字的荷马《奥德赛》文本作为唯一资源。然后点击思维导图按钮,几秒钟内就显示了一个交互式分类文本分析,供我探索。
许多细分部分都有用于深入探索的子部分,其中一些专门用于单行分析。点击地图的类别或端点会打开聊天并预填提示。
**公共和特色笔记本**
最初,笔记本只绑定到你的账户,但谷歌添加了与他人分享笔记本或通过链接完全公开分享的选项。虽然这是一个简单的添加,但如果你与其他人合作处理笔记本,它为协作打开了大门,因为你可以提供编辑或仅查看访问权限。
公共和可分享笔记本的引入为谷歌7月推出的另一个功能铺平了道路:特色笔记本。对任何人公开可用,特色笔记本来自涵盖各种主题的出版物、作者和研究人员。目前列表仅限于八个笔记本,但随着时间推移会有更多。
**学习指南和更多功能**
如果音频概览和思维导图的所有组合听起来像学生可能需要的完美学习伙伴的一切,NotebookLM还有一些其他功能将巩固其地位。
上传资源后,你可以基于材料创建快速学习指南,它会自动提供包含测验、潜在论文问题、关键术语词汇表和底部测验答案的文档。如果需要,你甚至可以将学习指南转换为笔记本的资源。
无论你是在学校使用还是想为网站创建FAQ页面,NotebookLM按钮都会根据你的资源生成一系列潜在的常见问题。
如果你正在寻找逐步时间线,它已经内置。为《奥德赛》摘录创建时间线会将主要事件分解为项目符号列表,并根据材料中提到的时间放置它们。
简报文档就像听起来的那样,为你提供关键主题和重要事件的快速快照,让某人快速了解情况。这将包括来自资源的具体引用及其位置。
**NotebookLM如何成为我不可或缺的工具**
在产品简报会期间,我进行了典型的笔记记录:打开Google文档,开始输入关于要点的零碎想法,希望在需要参考时能理解我的意思。我知道我也会收到官方新闻稿,所以我并不(太)担心,但我想在真实世界情况下测试NotebookLM。
我决定创建一个新笔记本,将我粗糙的笔记(乍一看像一系列糟糕的俳句)作为唯一资源,看看另一端会产生什么。NotebookLM不仅填补了空白,整体摘要读起来几乎和我第二天收到的新闻稿一样好。我印象深刻。感觉像炼金术——NotebookLM将一些相当难以理解的语言不仅转化为可接受的东西,而是相当令人印象深刻的描述。
有趣的是,我后来成为了更彻底的笔记记录者,但知道在需要时有东西可以拯救我,让我感到安心。
**如果你需要更多功能,考虑升级**
大多数人可能永远不需要为NotebookLM付费,因为免费版本已经足够强大。但如果你需要更多,可以升级获得额外功能。升级NotebookLM将提供免费版本的所有内容,以及:
5倍更多的音频概览、视频概览、笔记本、查询和每个笔记本的资源。
访问高级功能,如聊天自定义、高级分享和笔记本分析。
Q&A
Q1:NotebookLM是什么?它能做什么?
A:NotebookLM是谷歌推出的一个由Gemini驱动的AI笔记和研究助手工具。它可以处理网页URL、YouTube视频、音频片段等多种资源,将多个来源整合成有机整体,帮助用户整理分散的想法和笔记,生成摘要、回答问题,并提供音频概览等功能。
Q2:NotebookLM的音频概览功能有什么特别之处?
A:音频概览功能可以将上传的资料生成完整的播客形式内容,由两个AI"主持人"进行对话,将复杂主题分解为易懂的信息。用户还可以选择音频长度(更短、默认、更长),甚至通过互动模式加入对话,与AI主持人实时交流。
Q3:NotebookLM适合哪些人群使用?
A:NotebookLM适合13岁及以上的用户使用,特别适合学生和职场人士。学生可以用它整理课程笔记、生成学习指南和思维导图;职场人士可以用它简化工作流程、整理会议记录、生成简报文档等,是理想的学习伙伴和工作助手。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。