计算机视觉 关键字列表
Nomadic获8400万美元融资,专攻自动驾驶数据管理

Nomadic获8400万美元融资,专攻自动驾驶数据管理

Nomadic ML是一家专注于自动驾驶和机器人视频数据处理的初创公司,刚刚完成840万美元种子轮融资。该公司开发的平台能够将海量视频数据转化为结构化、可搜索的数据集,解决自动驾驶汽车和机器人公司95%数据闲置在档案库中的问题。通过视觉语言模型,平台可以识别边缘案例,为强化学习创建独特数据集,提升车队监控效率。

计算机视觉技术助力公民科学鱼类监测项目

计算机视觉技术助力公民科学鱼类监测项目

麻省理工学院等机构研究团队开发出基于水下视频和计算机视觉的鱼类监测新方法,用于补充传统的公民科学监测项目。研究人员构建了端到端的自动化管道,从水下摄像头视频采集到模型训练,实现了AI驱动的鱼类自动计数。通过标注1435个视频片段和59850帧图像训练深度学习模型,系统在2024年河鲱鱼迁徙监测中准确计数42510条鱼,并揭示了鱼类迁徙的昼夜模式规律。

8个实用家居AI功能让聊天机器人相形见绌

8个实用家居AI功能让聊天机器人相形见绌

生成式AI和大型语言模型在家庭环境中展现出独特应用价值。包括包裹识别、声音异常检测、智能恒温器习惯学习、宠物行为识别、对话式智能助手、漏水检测、视频事件摘要和野火预警协调等功能。这些AI技术通过视觉识别、声音分析和行为模式学习,为用户提供安全监控、节能建议和便捷操作,在实用性和安全性方面远超普通聊天机器人。

Google在更多市场测试Search Live功能

Google在更多市场测试Search Live功能

谷歌正在更多市场测试Search Live功能,该功能允许用户通过手机摄像头对准物体或场景并提出相关问题。公司原计划宣布全球推广,但目前仅在美国和印度正式推出,其他市场仍在测试阶段。功能已升级至Gemini 3.1 Flash模型,提供更自然的对话体验和多语言支持,用户可通过安卓和iOS的谷歌应用或谷歌镜头访问。

英伟达超低功耗芯片:毫秒级人脸检测技术突破

英伟达超低功耗芯片:毫秒级人脸检测技术突破

英伟达研究人员开发的常开计算机视觉系统可在不到1毫秒内检测人脸,功耗仅5毫瓦。该芯片通过本地存储2MB数据和"竞速休眠"机制大幅降低功耗,检测准确率达99%。系统可应用于笔记本电脑智能息屏、自动驾驶汽车、机器人等领域,为设备提供无缝的节能体验。

AI视觉监控初创公司City Detect获得1300万美元A轮融资

AI视觉监控初创公司City Detect获得1300万美元A轮融资

City Detect是一家利用视觉AI技术帮助地方政府监控建筑和社区健康状况的公司,刚刚完成1300万美元A轮融资。该公司在垃圾车等公共车辆上安装摄像头,拍摄周边建筑物照片,然后使用计算机视觉技术分析图像,识别涂鸦、违法倾倒、建筑损坏等城市问题。相比人工每周检查50栋建筑,该系统能检查数千栋。目前已在17个城市部署,包括达拉斯和迈阿密。

三星Galaxy S26成摄影领域的噩梦

三星Galaxy S26成摄影领域的噩梦

三星Galaxy S26虽然在硬件上进行了常规升级,S26 Ultra的隐私显示功能表现出色,但其AI相机功能却令人担忧。这些新功能似乎要彻底改变拍照的概念,甚至让人质疑拍摄的还算不算"照片"。同时,微软Xbox团队发生重大人事变动,Phil Spencer和Sarah Bond离职,Asha Sharma接任。此外还讨论了OpenAI基础设施投资和Claude AI意识等话题。

Ring智能门铃寻狗功能引发公众隐私担忧

Ring智能门铃寻狗功能引发公众隐私担忧

Ring公司推出的"搜索派对"功能允许丢失宠物的主人向附近门铃用户发送照片和描述,摄像头识别匹配狗只后会通知用户。该功能现已扩展至非Ring用户。由于公司此前推出面部识别功能,公众担心该技术可能被用于监控人类,特别是针对移民和被认为"可疑"的人群。参议员等政界人士和媒体均表达担忧,认为这一功能具有反乌托邦色彩。

Razer推出桌面AI动漫全息投影智能助手

Razer推出桌面AI动漫全息投影智能助手

Razer的Project Ava项目推出桌面全息投影版本,采用5.5英寸动漫角色形象,能通过内置摄像头监控屏幕内容和用户行为。该AI助手可回答问题、提供游戏建议、协助解决问题,甚至给出穿搭建议。用户可通过自定义按键与助手对话,目前使用Grok大语言模型驱动。Razer计划今年底推出该产品并接受预订。

纳瓦尔Flow 2扫地机器人问世:配备AI识别技术能找到丢失物品

纳瓦尔Flow 2扫地机器人问世:配备AI识别技术能找到丢失物品

Narwal在CES 2026上发布了最新的Flow 2扫地机器人,具备30,000Pa吸力和AI无限物体识别功能。该设备能够自动适应不同家庭环境,包括婴儿和宠物模式。通过双1080p摄像头和AI视觉模型,可识别地面贵重物品并发送通知提醒。还配备轨道拖把系统,支持140度热水清洁。同时发布V50系列无绳吸尘器和U50系列床垫吸尘器。

CES 2026最令人期待的AI可穿戴设备

CES 2026最令人期待的AI可穿戴设备

Memories.ai在CES 2026发布Project LUCI研究原型,为开发者提供AI可穿戴设备开发平台。该系统以大型视觉记忆模型为核心,具备持久记忆层,能像人类一样理解和记忆用户生活。LUCI包含轻量化硬件、移动应用和实时世界模型,支持连续录制2-3小时。公司与高通合作实现本地化处理,确保用户隐私安全。

Meta计划2026年发布新一代图像视频AI模型

Meta计划2026年发布新一代图像视频AI模型

Meta正在其超级智能实验室开发代号为"Mango"的图像视频模型和代号为"Avocado"的文本模型,计划于2026年上半年发布。实验室负责人王亚历山大表示,新文本模型将增强编码能力,并探索能理解视觉信息、推理和规划的世界模型。Meta在AI竞赛中落后于OpenAI等竞争对手,其AI部门经历重组和人员流失,首席AI科学家杨立昆也已离职创业。

Spoor鸟类监测AI软件需求飞速增长

Spoor鸟类监测AI软件需求飞速增长

挪威初创公司Spoor开发了基于计算机视觉的鸟类监测软件,可在2.5公里范围内追踪识别鸟类。该技术帮助风电场运营商更好规划选址并应对鸟类迁徙模式,在迁徙高峰期可减速或停止风机运转。公司鸟类识别准确率达96%,已与全球20多家大型能源公司合作,业务遍及三大洲。近期完成800万欧元A轮融资,随着监管趋严,此类技术需求将持续增长。

Meta发布第三代SAM视觉AI模型,助力野生动物保护研究

Meta发布第三代SAM视觉AI模型,助力野生动物保护研究

Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。

谷歌地图为极星4车型新增实时车道导航功能

谷歌地图为极星4车型新增实时车道导航功能

谷歌正在为搭载其内置信息娱乐系统的汽车推出谷歌地图实时车道引导功能,首先从极星4开始。该系统利用车辆前置摄像头和AI技术,分析车道标线和路标,为驾驶者提供更精确的车道指引和视听提示。该功能将在未来几个月内在美国和瑞典的极星4车型上推出,目前仅支持高速公路使用。

Skyline Nav AI推出无GPS导航技术,将亮相TechCrunch Disrupt 2025

Skyline Nav AI推出无GPS导航技术,将亮相TechCrunch Disrupt 2025

天际线导航AI公司开发出基于视觉的导航系统Pathfinder,可在没有GPS信号的情况下提供实时导航。该软件通过AI识别建筑物、道路等场景,快速匹配数据库生成导航信息。技术主要应用于GPS信号被阻挡的城市峡谷或山区,以及对抗GPS干扰攻击。公司已与美国国防部、NASA等机构合作,并推出边缘计算版本Pathfinder Edge。

Apple 收购计算机视觉初创公司 Prompt AI

Apple 收购计算机视觉初创公司 Prompt AI

据报道,苹果收购Prompt AI的交易基本确定,该初创公司领导层已召开全体会议讨论协议细节。Prompt的核心产品Seemour将AI技术应用于安防摄像头,可识别特定人员、宠物和物体,发送异常活动警报并提供文字描述。这种收购人才和技术而非整个公司的策略已成为科技巨头在AI领域的常见做法,部分为了避免监管审查。

亚马逊Lens Live AI可识别并购买任何可见物品

亚马逊Lens Live AI可识别并购买任何可见物品

亚马逊发布Lens Live AI功能,用户可通过手机摄像头扫描任何物品进行实时购物。该技术利用人工智能识别用户拍摄的物品,并在亚马逊平台上匹配相关商品,提供即时购买选项。这一创新功能将大幅简化购物流程,用户只需"看到即可购买",为在线购物体验带来革命性改变。

Runway为何瞄准机器人行业寻求新增长点

Runway为何瞄准机器人行业寻求新增长点

纽约AI公司Runway过去七年专注为创意产业构建视觉生成工具,现在发现其技术在机器人领域的新机遇。该公司的世界模型技术吸引了机器人和自动驾驶汽车公司的关注,用于训练仿真。联合创始人表示,相比现实世界训练,使用AI模型进行仿真更具成本效益和可扩展性。公司不会为机器人客户开发全新产品线,而是优化现有模型并组建专门团队。Runway已获得超过5亿美元融资,估值30亿美元。

GPT-4o开启太空舱门:AI Space Cortex让航天器具备自主运行能力

GPT-4o开启太空舱门:AI Space Cortex让航天器具备自主运行能力

加州理工学院、NASA喷气推进实验室等机构合作开发AI太空皮层系统,利用GPT-4o和计算机视觉技术实现太空任务自主操作。该系统能够进行实时场景分析、故障自诊断和重新校准,在机械臂受损情况下仍可恢复90%以上精度。项目已在NASA海洋世界着陆器自主测试平台完成验证,为未来木星卫星探索任务提供技术支持。