智能头戴设备AiSee为视障人士提供全新"视觉"体验

新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备，利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态，配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型，设备从简单物体识别升级为对话助手，用户可进行追问。设备运行代理AI框架，使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行，支持离线处理敏感文档，保护用户隐私。

新加坡国立大学(NUS)的研究人员开发了一款名为AiSee的可穿戴辅助设备，该设备利用Meta的Llama大语言模型帮助视障人士"看见"周围的世界。

这款头戴式设备外形类似耳机，配备了摄像头，作为人工智能伙伴帮助用户处理视觉信息，融入他们的日常生活，甚至帮助他们重返职场。

AiSee最初在2018年被设计为戴在手指上的智能戒指，后来演变为开放式耳机形态。领导研究团队的新加坡国立大学信息系统与分析学系教授Suranga Nanayakkara表示，选择这种设计而非眼镜等其他方案，是为了避免潜在的社会歧视，更重要的是保持用户耳朵畅通，通过声音保留他们天然的空间感知能力。

基于用户反馈，该设计得到进一步改进，解决了头发遮挡摄像头和电池续航不足等问题。最新版本还具备标准耳机功能，可播放音乐和接听电话，AI功能可按需使用。

Nanayakkara表示，这种双重功能设计增强了AiSee的实用性和用户吸引力。"开发一个每天只用一次或每周用几次的产品没有意义，我们更多地将其打造为智能耳机。"

AiSee的重大突破是集成了大语言模型，将设备从简单的物体识别器转变为对话式助手。这使用户不仅能识别物体，还能就此提出后续问题。

该设备运行智能体AI框架，计算机视觉和推理模型与Llama模型协同工作，理解用户意图并执行任务。为了在基于Android的设备上高效运行Llama，团队使用量化技术将模型规模缩减至10亿到30亿参数。

AiSee首席技术官Hussel Suriyaarachchi表示，智能体框架具有足够灵活性，可以整合更新的Llama版本。"如果它能与Llama 3.2兼容，我们可以轻松地用更新版本替换模型，因为Llama的底层架构是相似的。"

选择使用Llama的决定源于公司视障员工的反馈，特别是离线处理敏感文档的需求。Nanayakkara解释道："如果你是盲人，收到新的劳动合同，你希望理解合同内容并提出问题，但你不希望将其扫描并上传到云端。这就是我们选择使用Llama，特别是可以在设备上运行的小型模型的原因。"

AiSee获得了新加坡国立大学研究生研究创新计划的支持，并获得了影响力投资者的资金。该公司赢得了2024年Meta Llama影响创新奖，目前正与博物馆和机场运营商等组织洽谈，使其空间更具包容性，并计划很快推出消费者版本。公司还与东南亚超级应用Grab合作，创建基于语音的叫车系统。

目前，AiSee尚未开发超出Llama可用范围的本地语言支持，不过最近收到了阿联酋一家基金会关于本地化选项的请求。

Nanayakkara展望AiSee的未来将超越辅助技术，成为每个人都能使用的视觉智能工具。"我们预见这不仅仅是盲人设备，"他引用了"路缘坡道效应"，即为残障人士设计的功能往往在消除限制后会惠及普通大众。"AiSee的商业成功不会局限于辅助技术，而是作为一种无需手动操作和屏幕的轻松计算方式。"

Q&A

Q1：AiSee是什么？它有什么功能？

A：AiSee是新加坡国立大学开发的智能头戴设备，外形类似耳机，配备摄像头和AI功能。它利用Meta的Llama大语言模型帮助视障人士"看见"周围世界，不仅能识别物体，还能进行对话式交流，同时具备播放音乐和接听电话等标准耳机功能。

Q2：AiSee为什么选择头戴式设计而不是眼镜？

A：研究团队选择开放式耳机形态而非眼镜等方案，主要是为了避免潜在的社会歧视，更重要的是保持用户耳朵畅通，通过声音保留他们天然的空间感知能力，这对视障人士来说至关重要。

Q3：AiSee使用哪种AI技术？有什么特殊优势？

A：AiSee使用Meta的Llama大语言模型，采用智能体AI框架，计算机视觉和推理模型协同工作。其特殊优势是支持离线处理，用户可以在设备上直接处理敏感文档而无需上传云端，保护隐私安全。

来源：Computer Weekly

0赞

好文章，需要你的鼓励

智能头戴设备AiSee为视障人士提供全新"视觉"体验

来源：Computer Weekly

2025

09/16

11:21

分享

点赞

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

《2025 中国企业级 AI 实践调研分析年度报告》：深度剖析与价值洞察

Gartner：在中国构建AI软件工程技能的三大举措

阿联酋MBZUAI发布PAN世界模型，AI仿真技术迎来突破

Nvidia和Google支持的AI代码编辑器Cursor获23亿美元融资

Anthropic披露首例Claude模型参与的AI网络间谍活动

Cadence首款系统芯粒架构成功流片，助力物理AI发展加速

百度发布定制AI加速器响应国产芯片需求

VasEdge试用火热招募，降本增效机遇来袭

Infinidat InfiniBox G4系列升级重塑高端企业存储格局

Avalonia为微软MAUI跨平台应用方案带来Linux和浏览器支持

谷歌DeepMind发布SIMA 2智能体：游戏世界中学习迈向AGI之路

OpenAI发布GPT-5-Codex模型，可自动处理耗时编程任务

英伟达与CoreWeave达成63亿美元GPU算力担保协议

Luminary Cloud完成7200万美元融资，推进AI驱动物理产品设计

Google发布首个隐私保护大语言模型VaultGemma

OpenAI发布GPT-5-Codex升级版本提升编程智能体性能

HPE时隔7年再破90亿美元季度营收创新高

爱立信推出首个企业级5G智能体AI解决方案

甲骨文云服务或在本十年内媲美AWS

AirPods Pro 3内置心率传感器，无需Apple Watch也能监测健康数据

Google推出VaultGemma模型，引领隐私保护AI新标准

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: