每当新版Siri正式上线,它将成为目前隐私保护最完善的AI聊天助手之一,而近日又有报道披露了一项新的隐私功能。
此前我们已知晓,苹果与谷歌的合作协议规定,Siri的对话数据不得用于训练Gemini模型。据彭博社最新报道,新版Siri还将提供一项可自动删除对话记录的选项。
虽然新版Siri将由谷歌的Gemini驱动,但它并不会运行在谷歌的服务器上。苹果表示,AI功能将尽可能在设备本地运行,若有需要,Gemini模型也将在苹果自有的私有云计算服务器上运行。即将卸任的CEO蒂姆·库克曾表示:"我们相信,通过这次合作,可以解锁许多全新体验并实现关键创新。我们将继续在设备端及私有云计算中运行,并在此过程中维持我们行业领先的隐私标准。"
新版Siri应用的另一项隐私亮点是对话历史自动删除功能。类似"信息"应用可将对话历史设定为30天或一年后自动删除,或选择永久保留,新版Siri应用也将提供相同选项。
这听起来不错,我也认为提供这一选项本身是件好事——但我个人不打算开启它。原因在于,AI聊天助手会从我们所有的历史对话中学习,而这些上下文在未来的交互中往往极为有用。
我目前最常用的AI工具是Claude,我通过显式指令和隐性反馈对其进行了定制训练。我给它设置了一系列常规指令,例如:回答简洁明了、尽量使用项目符号、避免华丽冗余的语言、不要一味奉承,以及引用事实信息时必须附上来源链接。此外,当它以我喜欢的方式回答问题时,我也会给予反馈,它确实从这一过程中不断学习改进。
还有一些情况下,Claude会利用它对我的了解来定制化回应。这些并非我明确告知它的信息,而是它从我之前的提问以及针对我查询所做的网络搜索中自行推断出的。Claude在这方面表现相当出色,已有多次基于此类上下文给出精准回答的例子。
基于以上原因,我不会开启Siri对话记录的自动删除功能。当然,如果你对某次会话中Siri保留了敏感信息有所顾虑,随时可以手动删除特定对话。我自己也有过这样的操作——当我帮朋友处理某些事务时,会在会话结束后手动删除,以免AI将那些上下文误归为与我个人相关的信息。
顺带一提,在使用AI聊天助手时,我很快摸索出一个经验:每个新话题都应开启一个新的对话窗口。若不这样做,每次追加内容时,AI都需要处理当前会话的全部内容,这会消耗大量Token。同时,将不同话题分别保存为独立对话,也便于日后查找和继续。Claude通常能为每个会话自动生成一个合适的名称,这一点做得相当好。
以上就是我的使用方式——你又是怎么做的?欢迎在评论区分享你的想法。
Q&A
Q1:新版Siri的对话数据会用于训练谷歌Gemini模型吗?
A:不会。苹果与谷歌的合作协议明确规定,Siri的对话数据不得用于训练Gemini模型。此外,苹果表示AI功能将尽可能在设备本地运行,必要时在苹果自有的私有云计算服务器上运行,而非谷歌的服务器,以此维护用户隐私。
Q2:新版Siri的自动删除对话功能是如何工作的?
A:新版Siri应用将提供与"信息"应用类似的自动删除选项,用户可以选择在30天后、一年后自动删除对话历史,或选择永久保留。此外,用户也可以随时手动删除特定的敏感对话内容,灵活管理自己的隐私数据。
Q3:为什么使用AI聊天助手时建议每个话题开启新对话窗口?
A:每次在同一对话中追加新内容时,AI需要处理该会话的全部历史内容,这会消耗大量Token,降低效率且可能增加成本。将不同话题分开为独立对话,不仅节省Token消耗,也便于日后按话题查找和继续之前的讨论。
好文章,需要你的鼓励
Locus Robotics宣布收购加拿大温哥华机器人公司Nexera Robotics,将其专有的NeuraGrasp末端执行器技术整合至Locus Array平台。NeuraGrasp融合AI抓取智能、计算机视觉及专利软膜结构,可动态适应不同形状、材质、重量的商品,显著扩大了可自主拣选的SKU类型范围。此次收购将加速Locus Robotics在移动操控领域的技术路线图,推动仓储全流程自动化履约能力迈上新台阶。
ServiceNow研究团队构建的EVA-Bench框架,通过AI对AI的音频通话测试,量化评估语音客服系统在准确性和对话体验两个维度的真实表现,揭示现有系统普遍存在的可靠性缺口。
人形机器人正从原型验证迈向早期商业部署,汽车制造与物流领域预计成为未来十年核心需求市场。IDTechEx预测,相关市场规模将于2030年代初达到约250亿美元,2036年年出货量接近180万台。硬件成本持续下降,均价有望从2024年的约11.47万美元降至2030年的约3.7万美元。高利用率场景下运营成本有望低于5美元/小时,投资回收期可缩短至约6个月。但大规模商业化的关键,仍在于软件能力、任务泛化与系统集成的持续突破。
AWS AI Labs研究团队发布EvalAgent,这是一套通过"评估技能"自动生成AI智能体评测方案的系统,将首次运行成功率从17.5%提升至65%,并在人类专家评测中获得79.5%的偏好选择。