5月3日,前Mila研究员、麻省理工讲师Lior S爆料,根据OpenAI最新的SSL证书日志显示,已经创建了search.chatgpt.com子域名(目前无法访问),将会进军搜索引擎全面挑战该领域的全球霸主谷歌。
比较巧的是,OpenAI已经更新了网站主页,第一个轮番页是一个搜索框上面写着“向ChatGPT问任何事情”。再结合theinformation在今年2月14日的新闻,OpenAI正在秘密研发一款ChatGPT支持的web搜索引擎,这个事情还是挺靠谱的。
目前,多方位消息证实,OpenAI将会在5月9日上午10点公布该消息,大约是北京时间周五的凌晨2点。
OpenAI抢在5月9日发布这个消息也挺有意思,因为5月14日谷歌将举行一年一度的“Google I/O”大会,OpenAI不希望谷歌的技术大会抢了该产品的风头。
早在今年2月14日,著名科技媒体theinformation独家消息显示,OpenAI会联手微软的Bing研发一款网络搜索引擎来挑战谷歌。
目前,全球前五搜索引擎分别是谷歌、Bing、雅虎、百度和Yandex,而谷歌的市场份额占到了90%左右,几乎垄断了整个市场,出道即巅峰至今几十年从未遇到过对手。
但OpenAI进军搜索引擎的消息放出后,不少人认为,谷歌这次是碰到硬茬了。
这是因为谷歌搜索引擎虽然经过几十年的技术积累和迭代,在市场影响力、用户积累方面处于领导地位,但在技术层面和用户使用体验方面仍然有很多问题。
广告太多,这个问题已经被用户抱怨了十几年。用户通过谷歌搜索一些内容,10个链接里大概有5个广告非常影响用户体验,并且很多是虚假广告。
死链、过时链接和数据更新太慢,谷歌搜索结果中存在大量死链和过时的链接,致使用户访问无效的网页浪费时间。
关键字匹配有局限性,无法深度理解上下文搜索,传统搜索引擎主要依赖于关键词匹配来返回搜索结果。
这种方法可能会忽略文本的语义和上下文,导致搜索结果不够精准。例如,当用户搜索"苹果"时,搜索结果可能会包含苹果公司、苹果产品、苹果水果等内容,而用户可能只对其中某一类方面感兴趣。
OpenAI最新首页
个性化搜索,谷歌的个性化搜索可以为用户提供量身定制的搜索服务(有点类似抖音的推荐机制),例如,兴趣、常看的内容等,但也会出现“过滤泡沫”的情况。
就是用户只能看到与自己观点一致的信息,限制了信息的多样性和视野的广阔性,长此以往会形成“信息茧房”,把用户困在自己的世界里。
数据隐私,上面提到的个性化搜索,就是谷歌根据用户的搜索历史和行为数据来完成的,所以,用户的很多私密数据会被搜集或用于商业广告精准投放。
微软的Copilot搜索
那么大模型厂商来搞搜索引擎到底靠不靠谱呢?微软的Bing(现在改名为Copilot)一直是搜索引擎领域的千年老二,但存在感不强。
去年,Bing在OpenAI的GPT-4模型加持下其搜索能力、市场用户、营收等迎来一波井喷式增长。尤其是全球用户突破1亿大关,这充分说明用户对大模型加持的搜索引擎认可。
此外,前不久获得6270万美元,估值10.4亿美元的纯大模型搜索引擎Perplexity AI也证实了很有搞头,并且获得了资本市场的认可。
Perplexity AI提供了一个搜索框,可以像谷歌搜索引擎那样输入我们想搜索的东西。
例如,人感冒的时候如何才能快速恢复?Perplexity 会列出6个文本内容,并附带真实的网站地址。这一点很重要,是在告诉用户它说的内容是真实、可靠的。但如果源地址是错误的,也会影响大模型结果的输出。
此外,Perplexity还能提供图片、视频搜索以及图片的生成,这些功能与微软的Bing几乎差不多。在OpenAI正式加入搜索引擎赛道后,谷歌要如何回应呢?让我们拭目以待吧。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。