在人工智能大热之前,聊天机器人只是那些奇怪的信息工具,常驻在各个网站上,很少真正解决你的问题,反而可能因为阻挡你与真人沟通而增加更多困扰。但如今,像 ChatGPT 这样的 AI 聊天机器人已经开创了一种全新模式 —— 它既是搜索,又是对话。
谷歌的搜索算法提供的是最优化的链接,而生成式 AI 则能够解读信息并进行总结。此外,你还可以不断追问、获得更多背景信息以及在最初的提问基础上拓展讨论。正是对话这一特性使其区别于传统搜索引擎,提示词就像聊天机器人的关键词。
你可以将它作为思想伙伴、研究助手,或者作为你想了解任何信息时的谷歌替代工具。但需要注意的是,生成式 AI 有时会产生虚假信息 —— 即它可能传递错误或杜撰的内容,这一点在谷歌早期 AI 概览出现在搜索结果中的阶段尤为明显。
既然 ChatGPT 是最知名的聊天机器人,我们就从它开始,并与另一个热门聊天机器人 Claude 进行对比。二者都是免费的,但均提供每月 20 美元的高级版本。
其他流行的聊天机器人还包括谷歌的 Gemini、Microsoft 的 Copilot 和 Perplexity。可以从你最熟悉的聊天机器人开始使用。
AI 聊天机器人最适合用来做什么?
你可以用聊天机器人完成的最佳用途包括:
- 通常会通过谷歌查询的问题,并且可以边问边追问后续问题。 - 针对个人决策,提供更多背景信息。 - 与工作相关的任务,比如总结文件和编辑电子邮件。
AI 聊天在个人决策中的应用
提示词越精准,得到的回答也越准确。为避免得到泛泛的回复,应尽可能向聊天机器人提供更多背景信息。例如,假设你正在搬到纽约市。对于搜索来说,“纽约市最佳社区”这一关键词就足够了,但 AI 却需要在提示词中获得更具个性化的信息。
相反,你可以这样提问:“请提供关于纽约最佳社区的信息,适合一位 36 岁、已婚且计划建立家庭的女性。我希望居住在年轻专业人士、艺术气息浓厚、有公园和户外空间的区域。我不需要住在曼哈顿,倾向于降低租金成本并获得更大的居住空间。我希望公寓离地铁站步行 10 分钟以内。”
看看你起初对 AI 聊天的具体描述有多详细?利用 ChatGPT 的新网页搜索功能,我得到了以下回复 —— 一份列出了五个可能适合我需求的纽约社区:Astoria, Queens;Park Slope, Brooklyn;Long Island City, Queens;Williamsburg, Brooklyn;以及 Forest Hills, Queens。
聊天机器人的一个优点是,你可以对它不认同的观点提出异议,或要求提供更多信息。我随后又要求该聊天机器人对 Park Slope 和 Astoria 提供更多建议。
我很喜欢其实时比较功能。
然后,我请求它提供每个社区的人口统计数据。我发现 Park Slope 的家庭中位数收入是 Astoria 的两倍,于是我问这对当地居民意味着什么。
ChatGPT 回答说,更高的收入可能会导致当地餐饮、娱乐和商店的价格上涨。然而,家庭收入的增加同样可能为当地设施(如公园和社区项目)带来更多资金支持。
这些信息都十分有价值。
AI 聊天在工作事务中的应用
那么,使用聊天机器人处理工作相关任务呢?这正是 Anthropic 致力于引导 Claude 发挥作用的领域。Claude 作为一款 AI 助手,在朝九晚五的工作中可能会派上大用场。
例如,假如你在一家快速发展的科技初创企业任职,并希望获得关于绩效反馈的建议。你可以这样提问:“我在一家正在成长的科技初创企业工作,该公司没有正式的绩效评估机制。我已经在公司工作一年了。我们是一个小团队,每个人都承担多重角色。请提供一些非正式的建议,让我可以跟经理交流并请求反馈。”
刚开始得到的建议就非常有用。Claude 综合了建议和可采取的行动,建议例如可以设立定期的一对一会议,将反馈过程转变为持续性的,而不是一次性的。
非常赞。
接着,我让 Claude 撰写一封邮件,建议设立每周 15 分钟的例行检查电话,将其定位为一个对齐问题与想法的机会。
邮件内容已经接近“可直接发送”的程度。
我又请求 Claude 使邮件看起来更具对话性,结果变得更加出色。
和所有 AI 工具一样,使用时还是需要持保留态度 —— 就像对待搜索结果一样。
尽管 AI 聊天暂时还无法替代“直接谷歌搜索”得来的首个回答,但它确实是你工具箱中极具价值的一项技能。
好文章,需要你的鼓励
从浙江安吉的桌椅,到广东佛山的沙发床垫、河南洛阳的钢制家具,再到福建福州的竹藤制品,中国各大高度专业化的家具产业带,都在不约而同地探索各自的数字化出海路径。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
研究人员正探索AI能否预测昏迷患者的医疗意愿,帮助医生做出生死决策。华盛顿大学研究员Ahmad正推进首个AI代理人试点项目,通过分析患者医疗数据预测其偏好。虽然准确率可达三分之二,但专家担心AI无法捕捉患者价值观的复杂性和动态变化。医生强调AI只能作为辅助工具,不应替代人类代理人,因为生死决策依赖具体情境且充满伦理挑战。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。