东方神秘力量上线,DeepSeek APP低调却不奢华?

目前有“深度思考”和“联网搜索”两个模式,相较于网页端,APP能够支持拍照识文字、图片识文字及文件三个功能,支持用户完成对话、语言翻译、创意写作、编程、解题、文献解读、旅行规划等场景。
东方神秘力量上线,DeepSeek APP低调却不奢华?
图源:大模型之家

被外国网友评为“来自东方的神秘力量”,DeepSeek低调的上线了APP,甚至在其官网和公众号中都没有发布这一消息。

大模型之家注意到,在1月11日这款名为“DeepSeek”AI智能对话助手的APP就上线了安卓端和iOS端。

目前有“深度思考”和“联网搜索”两个模式,相较于网页端,APP能够支持拍照识文字、图片识文字及文件三个功能,支持用户完成对话、语言翻译、创意写作、编程、解题、文献解读、旅行规划等场景。

01

 

来自何方的DeepSeek

接下来,大模型之家输入Prompt“写一篇关于DeepSeek APP的推广文案,突出它的功能特点,风格要有趣诙谐”。

让DeepSeek来介绍一下自己吧:

东方神秘力量上线,DeepSeek APP低调却不奢华?

解锁关键词:DeepSeekAPP,一款集全网资源搜索精准定位一键下载于一体的神器。

自诩“神器”的DeepSeek,有那么玄乎吗?大模型之家持怀疑态度,接下来开始围绕DeepSeek的联网搜索、深度思考、和图文识别,以及回答中提到的一键下载等功能进行实测。

02

 

联网搜索,DeepSeek才变聪明

大模型之家很是好奇“一键下载”的功能,于是输入“DeepSeek如何下载文件”(未打开联网搜索状态)。

东方神秘力量上线,DeepSeek APP低调却不奢华?

此时得到的回答是,无法直接提供下载链接,接下来,大模型之家打开“联网搜索”功能后进行重复提问“DeepSeek如何下载文件”。

联网搜索被打开后,大模型之家得到了4个下载链接,点开后确实能够进行下载操作。

东方神秘力量上线,DeepSeek APP低调却不奢华?

这也揭开了DeepSeek的“一键下载”功能,其实并非是下载的能力,只不过是联网搜索功能,即能够整合网络信息,并根据提问进行数据整理,可访问外部网络链接,这也是目前AI产品中普遍存在的搜索功能。

既然已经打开了联网搜索功能,大模型之家根据近一周内的社会热点对DeepSeek进行提问“2025年1月,中国演员星星在哪个国家失联?”

东方神秘力量上线,DeepSeek APP低调却不奢华?

紧接着,大模型之家继续提问“演员星星现在回到中国了没”。

东方神秘力量上线,DeepSeek APP低调却不奢华?

这两个问题在同一轮对话中进行提问,DeepSeek回答正确且能够衔接上下对话

大模型之家注意到,2万吨智利车厘子运抵中国的新闻被冲上热搜,于是打算考一下DeepSeek“2025年1月11日,有多少吨智利车厘子运到中国广东广州南沙港”。

东方神秘力量上线,DeepSeek APP低调却不奢华?

DeepSeek回答正确,并且给出了“补充信息”的回答,实现了抢答。

大模型之家实测看来,DeepSeek联网搜索后能够根据网页信息进行整合归纳,提取问题要点进行回复,并且能够根据时效性的新闻进行提炼整合,这一搜索能力可以媲美国内AI搜索前列的文心一言。

03

 

深度思考N秒,连草稿纸都呈上了

既然联网搜索功能能让DeepSeek变得聪明,那接下来就试一下其深度思考能力吧。大模型之家输入了数学里最火的鸡兔同笼问题“鸡兔同笼,一共有35个头、94只脚,问笼子里分别有多少只兔子?多少只鸡?”

东方神秘力量上线,DeepSeek APP低调却不奢华?

DeepSeek在回答的第一行就写出了“已深度思考(用时14秒)”的字样,给出了整个思考过程中的两种解法,并且在正式的解题中使用了方程组的解法。

东方神秘力量上线,DeepSeek APP低调却不奢华?

不过,接下来大模型之家以构建拉格朗日函数的经典高等数学题进行提问“已知实数x,y 满足x?+y?-4x-2y--4=0,求x-y的最大值”。

刚开始DeepSeek给出了一种几何方法来进行解答,尽管结果是正确的,但DeepSeek接下来的思考过程中仍构建了拉格朗日乘数法进行解答,耗时41秒结果正确。

东方神秘力量上线,DeepSeek APP低调却不奢华?

但是,DeepSeek似乎是代入到了成功解答的喜悦中,在最后的“综上所述中,x-y的最大值 ”居然没写完!

东方神秘力量上线,DeepSeek APP低调却不奢华?

从DeepSeek公开披露的信息来看,目前DeepSeek搭载的是DeepSeek-V3,在知识类任务(MMLU、MMLU-Pro、 GPQA、SimpleQA)上,V3接近当前表现最好的Claude-3.5-Sonnet-1022。

大模型之家看来,能够在深度思考中对自己计时,并且能够面对复杂的高数问题给出多种解法已经超越了很多AI产品,不完美的地方是总结回答的时候竟然“掉链子”,可能是由于设置的深度思考计时器在输出正确解答之后就“戛然而止”,以此来争分夺秒,还要另外一种可能是一种是篇幅限制,如字数超限。

但深度思考和非深度思考有哪些区别呢?

大模型之家关闭深度思考之后,重新对DeepSeek进行提问“已知实数x,y 满足x?+y?-4x-2y--4=0,求x-y的最大值”。

东方神秘力量上线,DeepSeek APP低调却不奢华?

显然,关闭深度思考之后,计时消失,也没有出现思考的过程显示,而是直接进行题目回顾-初步分析-完成平方-确定图形-目标函数-几何解释-使用拉格朗日乘数法-确定最大值-最终答案,结果依旧正确。

由此看来,深度思考与非深度思考的能力并无太大差别。

04

 

拍照和发图分设两个功能区,有点烦了

使用习惯淘宝、百度等APP的时候,大模型之家习惯偏好能够在拍照的功能区同时上传或拍摄图片进行识别,在遇到DeepSeek的“拍照识别文字”和“图片识别文字”的时候还有些恍惚,是同一个功能吧?

大模型之家把下载DeepSeek的图片发送给DeepSeek,得到了解析答案。

东方神秘力量上线,DeepSeek APP低调却不奢华?

解析结果很全面,包含下载区的图片示例的文字也进行了识别,其中“西安家庭旅游计划”的“时间、预算、行程安排”也进行了分析。

接下来,同样的照片,大模型之家使用“拍照识文字”功能进行识别。

东方神秘力量上线,DeepSeek APP低调却不奢华?

大模型之家注意到,同样的图片,使用“拍照识别文字”的功能得到的信息点比图片识别更密集,但具体的识别还与拍照的清晰度有关,其中“西安家庭旅游计划”识别错误为“我家泰鑫源计划”。

05

 

提取文档内容要点

点击“文件”,大模型之家将《2025人工智能行业趋势报告》PDF版本上传至DeepSeek进行识别。

东方神秘力量上线,DeepSeek APP低调却不奢华?

DeepSeek快速进行了内容识别,并根据提示词“提取出这份报告中的趋势预测10点内容”,给出了《2025人工智能行业趋势报告》中的十大预测并分点罗列正确。

紧接着,大模型之家提问“报告中提到几次OpenAI的案例”,DeepSeek回答正确并且分点罗列出了所引用的案例。

东方神秘力量上线,DeepSeek APP低调却不奢华?

综上,大模型之家的实测中的整体感受是DeepSeek的页面设计整体和其公司一样简约低调,在刚过去的12月26日,DeepSeek才宣布DeepSeek-V3 首个版本上线并同步开源,在刚才的测试中我们也看到了DeepSeek-V3的准确率和速度都表现不凡。

据官方披露,DeepSeek-V3是其自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练,多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型。

DeepSeek-V3模型是在2000块英伟达H800 GPU(针对中国市场的低配版 GPU)上训练完成的,而硅谷大厂模型训练普遍跑在几十万块更高性能的英伟达H100 GPU上。这也让DeepSeek的训练成本得以被极大压缩,使得DeepSeek低调的出现在了国产大模型赛道前列。

大模型之家认为,DeepSeek AI智能助手的上线是国产大模型的首次面向大众的科技型“秀肌肉”,让高高挂起的论文走入到大众视野,从而能够根据其表现判断出DeepSeek大模型的走向,或许第一次的见面并不完美,但DeepSeek已经成为大模型之家重点关注的国产大模型序列,下一步大模型之家还将不断探寻国产大模型的发展走向,期待中国科技的更好表现!

 

来源:大模型之家

0赞

好文章,需要你的鼓励

2025

01/15

13:04

分享

点赞