快手Kwai Agents系统、模型、数据全部开源

7B的模型也能玩转AI Agents了？近期，快手开源了Kwai Agents，亲测发现，问它周末滑雪问题，它不但能帮你找到场地，连当天的天气都帮你考虑周到了。

大语言模型（LLM）通过对语言的建模而掌握了大量知识，并具备一定认知和推理能力。但由于无法跟世界保持实时的交互，在单独使用的情况下，常会出现一本正经地胡说八道的现象。而AI Agents就是解决这个问题的道路之一，它通过激发大模型任务规划、反思、调用工具等能力，使大模型能够借助现实世界工具提升生成内容的准确性，甚至有能力解决复杂问题。

据了解，KwaiAgents是一个先进的AI智能体系统，由快手联合哈尔滨工业大学研发，通过使用大型语言模型来模仿人类认知技能，可应用于自然语言处理、语音识别等领域。Kwai Agents可以使7B/13B的“小”大模型也能达到超越GPT-3.5的效果，目前该项目已将系统、模型、数据、评测全部开源，使得更多的研究人员可以参与其中。
技术报告：https://arxiv.org/abs/2312.04889
项目主页：https://github.com/KwaiKEG/KwaiAgents

从「KwaiAgents」的Github主页中可以看到，本次开源内容包含：
1.系统（KAgentSys-Lite）：轻量级AI Agents系统，并配备事实、时效性工具集；
2.模型（KAgentLMs）：Meta-Agent Tuning后，具有Agents通用能力的系列大模型及其训练数据；
3.评测（KAgentBench）：开箱即用的Agent能力自动化评测Benchmark与人工评测结果。

KAgentBench通过人工精细化标注的上千条数据，做到了开箱即用，让大家能够用一行命令评测一个大模型在不同模板下，各方面的Agents能力。下表显示了经过快手团队调优后，7B-13B模型各项能力的提升，且超越了GPT-3.5的效果：

同时，作者们还请人类标注者在200个事实性和时效性的问题（如“刘德华今年几岁了”），对不同的大模型和Agent系统进行了交叉评估，可以看到KAgentSys系统和MAT之后模型提升显著（百分号前为正确率，括号内为5分制均分）。

通常仅依赖网页搜索对一些长尾问题和热门问题返回结果不佳。比如问到“安东内拉比梅西大多少天？”这类长尾问题，往往搜索结果返回的都是一些两者的八卦新闻，而返回不了一些关键信息。而KAgentSys 通过调用百科搜索工具获取精准的出生日期，再调用time_delta时间差工具算出年龄差，就能精准回答这个问题了。

快手技术人员表示，AI Agents是一条非常有潜力的道路，未来一方面会在这个方向持之以恒地沉淀核心技术，并为整个社区不断地注入新的活力；另一方面，也会积极探索Agents技术与快手业务的结合，尝试更多有趣、有价值的创新应用落地。

来源：业界供稿

快手

0赞

好文章，需要你的鼓励

快手Kwai Agents系统、模型、数据全部开源

来源：业界供稿

2024

01/04

17:03

分享

点赞

Decart发布Oasis 3世界模型，为机器人训练注入真实感

AI既令人兴奋又让人焦虑，企业究竟该如何面对？

芬兰与瑞典联手推进6G韧性联合研究计划

微软公布智能体AI系统七大新型安全漏洞

GitHub Copilot推出桌面应用与画布功能，同步启用按量计费模式

谷歌DeepMind分拆公司如何追踪隐藏的药物靶点

Snowflake峰会观察：智能体浪潮下平台的核心竞争力之争

亚马逊"故事回顾"功能正式向美国Kindle设备及iPhone应用推出

Anthropic推出聚焦生命科学的全新大语言模型

Motive AI Coach智能驾驶辅导系统正式进军英国市场

联想世界杯嘉年华盛大启幕！AI+体育引领中国足球产业升级

Google Cloud深度解析AI智能体治理难题

快手Kwai Agents系统、模型、数据全部开源

快手持续落地AIGC新应用场景 开启内测“AI小快”

快手联合阿里云构建容器混合云架构，轻松应对百万级秒杀

360度呈现超燃瞬间 快手“子弹时间”首次应用于国际级击剑赛事

快手发布文生图大模型“可图”，探索AI新玩法

有意见 | 大模型再次上新 “可图”文生图大模型亮相

快手公布自研大模型最新进展：“快手AI对话”已开放内测

快手展示全模态、大模型AIGC解决方案和AIGC数字人产品

落实“东数西算”国家战略 快手智能云乌兰察布数据中心正式投运

快手内测短视频直播行业首个搜索智能问答产品

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

快手持续落地AIGC新应用场景开启内测“AI小快”

360度呈现超燃瞬间快手“子弹时间”首次应用于国际级击剑赛事

落实“东数西算”国家战略快手智能云乌兰察布数据中心正式投运