新型AI模型的深度研究功能及其应用探索

文章介绍了AI大语言模型中最新的深度研究功能,这是目前最令人印象深刻的新功能之一。作者详细解析了ChatGPT、Claude和Gemini等主流模型的使用方法,并重点展示了深度研究功能的实际应用。通过实际测试,作者用ChatGPT 4.5的深度研究功能生成了一份关于1990-2025年最令人厌烦歌曲的详细报告,展示了AI如何通过思维链进行深度研究和分析。文章还提到了语音交互模式将进一步改变用户与AI的交互体验。

你是否厌倦了那些烦人的歌曲?让我们看看新的深度研究AI工具能做什么。

虽然我们可以告诉人们使用ChatGPT、Claude或Gemini等工具亲自体验AI模型,但有些人想要更详细的了解。他们想知道如何以更精细的方式使用最好的新工具。

深度研究是当今大语言模型最新且最令人印象深刻的功能之一。但大多数人还没有听说过它,更不用说使用它了。

伊桑·莫利克是我认为代表AI研究前沿的人物。凭借前MIT的背景,莫利克代表了这一领域的领先声音。所以我阅读了他关于不同模型以及如何使用它们的最新博客文章。

莫利克将Claude、ChatGPT和Google的最有用模型分为以下几类:"聊天"、"工作"和"难题"。

他指出,Claude通常在隐私方面更好,而在ChatGPT中你需要选择这一点,在Google中可能会影响某些功能。

然后莫利克开始描述内置在一些最新模型中的深度研究功能,但这些功能尚未免费提供。这是如此新的功能,以至于仍然需要付费且对付费用户有限制。

深度研究功能的前景

深度研究功能可从OpenAI、Google和Anthropic获得。

当你查看研究功能的发布时,你会看到很多关于2月份的报告。

那么如何访问这种结果呢?

我在6月份的"OpenAI cookbook"中找到了一篇关于此的最新帖子,其中发帖者谈到了下载Python SDK和API工作。

不过,事实证明,如果你是付费Plus或Pro用户,你可以在ChatGPT 4.5的提示部分选择"深度研究",并通过这种方式获得深度研究报告。

向ChatGPT 4.5请求深度研究

我想亲自尝试这个功能,所以基于我当时的体验,我专注于编制一份从1990年到2025年最烦人歌曲的报告。

我的查询:"请创建一份关于1990年至2025年最烦人音乐的报告,按年度分段。"

很简单,对吧?

首先,ChatGPT让我澄清几个基本问题:

"为了创建一份关于1990年至2025年'最烦人音乐'的详细报告,你能否澄清几件事:

你说的'烦人'是什么意思?你是指被广泛批评、过度播放、有争议的歌曲,还是基于听众投票或网络热议的?

列表应该是全球性的还是专注于特定地区(例如美国、英国等)?

你想要每年一首歌,还是如果适用的话每年多首?

你希望报告包含每个选择的解释或文化背景吗?"

我回答:

"1. 以上所有 2. 基于美国 3. 每年多首歌曲 4. 是的。"

"谢谢!"GPT回应。"我将编制一份以美国为重点的报告,涵盖1990年至2025年最广泛批评、过度播放或文化上被嘲笑的歌曲。这将包括每年多首歌曲,以及解释为什么它们被认为烦人的背景——从音乐评论家、听众投票、网络热议、电台过度播放投诉和公众意见中获取。"

然后报告开始了。确实,编制花了超过10分钟,显示了思维链过程,如"搜索'Rico Suave':最差歌曲"和"寻找Macarena"。

查看GPT的思维链

实际上,以下是系统在研究数十个网站时提供的一些有趣的思维链注释(它花了很多时间阅读《卫报》!)

我正在梳理最近的标题和思考文章,比如来自Global News和《卫报》的那些,都注意到"Baby Shark"是最烦人的歌曲。嗯,这很有趣。

我正在准备1993-1995年最烦人歌曲的列表,考虑"What's Up"、"Cotton Eye Joe"、"Macarena"和"Wonderwall"。不过,我在考虑其他值得注意的曲目,比如早期年份的"Rico Suave"。

(又是那首'Rico Suave'歌曲。)

我正在梳理2001-2006年的热门和失败作品,2005年的病毒式传播如"Crazy Frog"和Nickelback的"Photograph"成为焦点。嗯,这很有趣——这些曲目似乎引起了强烈反应。

(注意模型实际上在研究时'做笔记',给我们一些个性化的小片段以及报告的实际内容。)

这里有一个有趣的比较:

我正在比较Nickelback在2006年的"Rockstar"与Soulja Boy在2007年的"Crank That"的影响。前者被广泛批评,而后者被许多人喜爱,这引发了关于音乐品味随时间变化的问题。

一个基于研究的注释:

我正在按类型和年份挖掘歌曲,考虑广泛的意见和具体例子来选择最频繁被标记为烦人的曲目。

我正在评估像Meghan Trainor的"All About That Bass"(2014)和Tyga的"Stimulated"(2015)这样的热门歌曲的普遍性和被标记为烦人的频率。逐步推进过去五年。

然后有这个:

"注意到时间限制的挑战,我正在想办法平衡包含关键例子与简洁性的需要。"

所以模型实际上在尝试对其工作进行优先级排序。这是下一级别的东西。

最后,GPT似乎结束了,正在完善细节:

"我正在检查'Achy Breaky'歌曲是否包含任何对拟人化鲨鱼的引用。"

最终,我得到了完整的报告。它有数十页,提供了超过四分之一世纪的糟糕、可怕音乐的精彩覆盖。一些突出的作品,带年份:

1990年

"Ice Ice Baby" – Vanilla Ice (1990):

这首嘻哈跨界热门歌曲因其俗气的歌词和无处不在的播放而成为流行文化的笑柄。虽然它最初是一首榜首成功歌曲,但评论家后来抨击了它;Spinner杂志将其列为历史上第二差的歌曲,Blender将其列为第五。《休斯顿新闻》的一位评论家甚至称其为德州艺术家最差的歌曲,声称它"让白人在嘻哈中的事业倒退了十年"。它的过度曝光将这首曾经流行的赞美诗变成了许多听众的烦恼。

"Rico Suave" – Gerardo (1990):

一首双语新奇说唱曲目,在1991年达到顶峰,"Rico Suave"是一首经常被引用在"最差歌曲"列表上的一击即中。其愚蠢、夸张的拉丁情人形象和重复的副歌很快就让人厌烦。

《Blender》杂志臭名昭著的"史上50首最差歌曲"列表将"Rico Suave"列入其中(排在30多位),回顾性流行文化论坛经常将其作为90年代初流行文化尴尬的例子。这首歌的口号式副歌(以及其无上装音乐视频)让它令人难忘,但在随后的几年里也被广泛嘲笑。

1994年

"Cotton Eye Joe" – Rednex (1994):

这首老民谣的电子乡村舞曲混音版成为体育比赛和派对的主打歌——让许多人非常厌烦。凭借其疯狂的小提琴循环和刺耳的"If it hadn't been for Cotton Eye Joe"副歌,这首曲目很快就让人厌倦。

CBS新闻将其列为"Jock Jams最差歌曲"列表的第一位,称其为"乡村风小提琴俗气和无情的hi-NRG鼓声的邪恶混合体"。《多伦多星报》的一位评论家称其为90年代最差的歌曲,形容它是"纯粹的胡言乱语"。甚至摔跤手转摇滚歌手Chris Jericho说这是他最不喜欢的歌曲之一——在他个人最差列表中将其与"Mambo No. 5"并列。尽管在派对上很普遍,但很少有人真正想要像这样的"EDM-乡村"混搭。

1997年

"Barbie Girl" – Aqua (1997):

这首新奇舞曲流行歌曲同时是全球排行榜冠军和批评家的出气筒。其弹跳的、塑料般的声音和夸张的人声("Come on Barbie, let's go party!")使其成为90年代后期电台和儿童派对的主打歌,但也让许多人烦恼。

《滚石》读者投票选其为90年代最差歌曲,《NME》也将其列为最差单曲榜首。虽然Aqua将其作为讽刺,但这首歌被广泛嘲笑;它甚至引发了Mattel因玷污芭比品牌而提起的诉讼。几十年后,它仍然是一首有罪恶感的快感洗脑歌,经常登上"最烦人"歌曲列表的榜首。

快进一点:

2013年

"The Fox (What Does the Fox Say?)" – Ylvis (2013):

这首由挪威喜剧二人组演唱的荒诞新奇歌曲,在2013年后期意外成为全球病毒式热门歌曲。其类似EDM的节拍和一连串动物声音(ring-ding-ding, wa-pa-pa-pow!)使其成为YouTube时代的"Macarena"——起初很有趣,然后重复播放就变得痛苦。孩子们喜欢这种愚蠢,而家长和许多其他人很快就厌倦了。这首歌本质上是一个关于动物声音的长笑话,一旦笑话过时了,剩下的就是一个疯狂重复的无意义副歌。《滚石》读者后来投票选其为2010年代最烦人的歌曲之一,《今日美国》称其为"年度最令人恼火的网络热门歌曲"。像其他网络热门歌曲一样,它在学校活动中播放,甚至在电台作为好奇心播放,这放大了那些不想再听"Hatee-hatee-hatee-ho!"的人的烦恼。Ylvis将其作为EDM流行音乐的模仿——讽刺地实现了他们所嘲讽的那种无处不在的洗脑歌效果,让数百万人烦恼。

"Baby Shark"(全球病毒式热门——2018/2019年登上排行榜):

{见上文2016年。}在2018年,"Baby Shark"终于冲进国际音乐排行榜(到2019年初进入美国前40)。这一年这首歌真正变得流行,从儿童YouTube跨入主流意识。到2018年秋天,文章直接称其为"年度最烦人歌曲"。各地的家长都恳求免受doo-doo-doos的折磨。《卫报》挖苦地指出,即使是没有听过它的人也通过文化渗透知道它——通常是通过幼儿无休止地重复播放它、让他们的家人发狂的故事。一旦它上了电台并出现了舞曲混音版,就无处可逃。2018年的"Baby Shark"展示了一首简单的儿童歌曲如何能让数百万人团结在共同的、头痛的沫挫中。(有趣的事实:那年一个病毒式社交媒体帖子开玩笑说《日内瓦公约》应该将重复播放"Baby Shark"归类为一种折磨形式——这是许多疲惫的保姆会支持的观点。)

2023年

"Peaches" – Jack Black (Bowser) (2023):

这首出现在《超级马里奥兄弟大电影》中的夸张钢琴民谣由Jack Black(饰演Bowser)演唱,成为TikTok热门歌曲,甚至进入了Billboard Hot 100。它故意搞笑——Bowser用戏剧性的"Peaches, Peaches, Peaches"副歌向桃花公主示爱。孩子们和游戏玩家觉得它搞笑且朗朗上口;其他人很快发现它刺耳(特别是如果他们没有看过电影背景的话)。副歌本质上是一个单词(peaches)用歌剧般的夸张无休止地重复。几周内,人们因为朋友或孩子无休止地唱"Peaches"而烦恼的片段在网上出现。虽然很短,但这首歌的洗脑力量很强。《AV Club》的一篇文章开玩笑说,这是那种"注定要烦恼到处的家长,而他们的后代重复播放1000次"的新奇歌曲。这是一个关于歌曲如何能够病毒式传播并魅力四射地进入你的大脑的新鲜例子——然后,由于纯粹的过度使用,让你再也不想听到"peach"这个词(抱歉,乔治亚州)。

关于语音模式的一些想法

让我们回到博客文章:在深入研究上述内容后,莫利克还涵盖了真正改变界面的新系统的语音功能。正如他指出的,你可以在开车时、散步时或任何有空间和时间的地方与这些模型交谈。

我认为语音沟通最终会让大语言模型的响应对我们变得"真实"。这就是我现在要说的全部——暂时如此。

我认为所有这些对想要实际使用大语言模型的人来说是非常有启发性的。特别是深度研究功能,随着时间的推移,人们会了解到这一点。在有什么新东西出现并使其过时之前,我们中有多少人会弄清楚它?

无论如何,这是一个关于如何在当今环境中充分利用AI的优秀指南。

来源:Forbes

0赞

好文章,需要你的鼓励

2025

07/09

12:27

分享

点赞

邮件订阅