澳大利亚海洋科学研究所联合昆士兰大学,通过叠加数百张卫星图像构建合成影像的方法,成功绘制出澳大利亚北部海岸超过3600处珊瑚礁和2900处岩礁地图,填补了长期以来的测绘空白。此前,该区域浑浊的水体使传统勘测手段难以识别礁体。相关数据集已通过eAtlas等公共平台开放共享,将为海洋生态系统的保护与沿海开发规划提供重要依据。
随着AI识别技术的快速发展,自动车牌识别摄像头和无人机监控对个人隐私构成日益严峻的威胁。本文梳理了美国各州在隐私保护领域的立法实践,涵盖限制AI检测功能、规范警方摄像头权限、要求数据定期删除、禁止跨州数据共享及无人机使用须持令状等多类法规。伊利诺伊、新罕布什尔、弗吉尼亚等州的立法经验值得关注,公民也可通过参与倡导活动和联系议员推动隐私保护立法。
麻省理工学院研究人员开发了名为VisiPrint的AI驱动预览工具,能够准确预测3D打印物体的外观效果。用户只需上传设计截图和材料图像,系统就能自动生成包含颜色、纹理、光泽度等细节的渲染效果图。该工具采用双AI模型协作,考虑熔融沉积建模过程对材料外观的影响,预览过程仅需约一分钟。这项技术有助于减少因外观不符预期而产生的重复打印,降低材料浪费,特别适用于牙科和建筑设计等对外观要求较高的领域。
Nomadic ML是一家专注于自动驾驶和机器人视频数据处理的初创公司,刚刚完成840万美元种子轮融资。该公司开发的平台能够将海量视频数据转化为结构化、可搜索的数据集,解决自动驾驶汽车和机器人公司95%数据闲置在档案库中的问题。通过视觉语言模型,平台可以识别边缘案例,为强化学习创建独特数据集,提升车队监控效率。
麻省理工学院等机构研究团队开发出基于水下视频和计算机视觉的鱼类监测新方法,用于补充传统的公民科学监测项目。研究人员构建了端到端的自动化管道,从水下摄像头视频采集到模型训练,实现了AI驱动的鱼类自动计数。通过标注1435个视频片段和59850帧图像训练深度学习模型,系统在2024年河鲱鱼迁徙监测中准确计数42510条鱼,并揭示了鱼类迁徙的昼夜模式规律。
生成式AI和大型语言模型在家庭环境中展现出独特应用价值。包括包裹识别、声音异常检测、智能恒温器习惯学习、宠物行为识别、对话式智能助手、漏水检测、视频事件摘要和野火预警协调等功能。这些AI技术通过视觉识别、声音分析和行为模式学习,为用户提供安全监控、节能建议和便捷操作,在实用性和安全性方面远超普通聊天机器人。
谷歌正在更多市场测试Search Live功能,该功能允许用户通过手机摄像头对准物体或场景并提出相关问题。公司原计划宣布全球推广,但目前仅在美国和印度正式推出,其他市场仍在测试阶段。功能已升级至Gemini 3.1 Flash模型,提供更自然的对话体验和多语言支持,用户可通过安卓和iOS的谷歌应用或谷歌镜头访问。
英伟达研究人员开发的常开计算机视觉系统可在不到1毫秒内检测人脸,功耗仅5毫瓦。该芯片通过本地存储2MB数据和"竞速休眠"机制大幅降低功耗,检测准确率达99%。系统可应用于笔记本电脑智能息屏、自动驾驶汽车、机器人等领域,为设备提供无缝的节能体验。
City Detect是一家利用视觉AI技术帮助地方政府监控建筑和社区健康状况的公司,刚刚完成1300万美元A轮融资。该公司在垃圾车等公共车辆上安装摄像头,拍摄周边建筑物照片,然后使用计算机视觉技术分析图像,识别涂鸦、违法倾倒、建筑损坏等城市问题。相比人工每周检查50栋建筑,该系统能检查数千栋。目前已在17个城市部署,包括达拉斯和迈阿密。
三星Galaxy S26虽然在硬件上进行了常规升级,S26 Ultra的隐私显示功能表现出色,但其AI相机功能却令人担忧。这些新功能似乎要彻底改变拍照的概念,甚至让人质疑拍摄的还算不算"照片"。同时,微软Xbox团队发生重大人事变动,Phil Spencer和Sarah Bond离职,Asha Sharma接任。此外还讨论了OpenAI基础设施投资和Claude AI意识等话题。
Ring公司推出的"搜索派对"功能允许丢失宠物的主人向附近门铃用户发送照片和描述,摄像头识别匹配狗只后会通知用户。该功能现已扩展至非Ring用户。由于公司此前推出面部识别功能,公众担心该技术可能被用于监控人类,特别是针对移民和被认为"可疑"的人群。参议员等政界人士和媒体均表达担忧,认为这一功能具有反乌托邦色彩。
Razer的Project Ava项目推出桌面全息投影版本,采用5.5英寸动漫角色形象,能通过内置摄像头监控屏幕内容和用户行为。该AI助手可回答问题、提供游戏建议、协助解决问题,甚至给出穿搭建议。用户可通过自定义按键与助手对话,目前使用Grok大语言模型驱动。Razer计划今年底推出该产品并接受预订。
Narwal在CES 2026上发布了最新的Flow 2扫地机器人,具备30,000Pa吸力和AI无限物体识别功能。该设备能够自动适应不同家庭环境,包括婴儿和宠物模式。通过双1080p摄像头和AI视觉模型,可识别地面贵重物品并发送通知提醒。还配备轨道拖把系统,支持140度热水清洁。同时发布V50系列无绳吸尘器和U50系列床垫吸尘器。
Memories.ai在CES 2026发布Project LUCI研究原型,为开发者提供AI可穿戴设备开发平台。该系统以大型视觉记忆模型为核心,具备持久记忆层,能像人类一样理解和记忆用户生活。LUCI包含轻量化硬件、移动应用和实时世界模型,支持连续录制2-3小时。公司与高通合作实现本地化处理,确保用户隐私安全。
Meta正在其超级智能实验室开发代号为"Mango"的图像视频模型和代号为"Avocado"的文本模型,计划于2026年上半年发布。实验室负责人王亚历山大表示,新文本模型将增强编码能力,并探索能理解视觉信息、推理和规划的世界模型。Meta在AI竞赛中落后于OpenAI等竞争对手,其AI部门经历重组和人员流失,首席AI科学家杨立昆也已离职创业。
挪威初创公司Spoor开发了基于计算机视觉的鸟类监测软件,可在2.5公里范围内追踪识别鸟类。该技术帮助风电场运营商更好规划选址并应对鸟类迁徙模式,在迁徙高峰期可减速或停止风机运转。公司鸟类识别准确率达96%,已与全球20多家大型能源公司合作,业务遍及三大洲。近期完成800万欧元A轮融资,随着监管趋严,此类技术需求将持续增长。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
谷歌正在为搭载其内置信息娱乐系统的汽车推出谷歌地图实时车道引导功能,首先从极星4开始。该系统利用车辆前置摄像头和AI技术,分析车道标线和路标,为驾驶者提供更精确的车道指引和视听提示。该功能将在未来几个月内在美国和瑞典的极星4车型上推出,目前仅支持高速公路使用。
天际线导航AI公司开发出基于视觉的导航系统Pathfinder,可在没有GPS信号的情况下提供实时导航。该软件通过AI识别建筑物、道路等场景,快速匹配数据库生成导航信息。技术主要应用于GPS信号被阻挡的城市峡谷或山区,以及对抗GPS干扰攻击。公司已与美国国防部、NASA等机构合作,并推出边缘计算版本Pathfinder Edge。
据报道,苹果收购Prompt AI的交易基本确定,该初创公司领导层已召开全体会议讨论协议细节。Prompt的核心产品Seemour将AI技术应用于安防摄像头,可识别特定人员、宠物和物体,发送异常活动警报并提供文字描述。这种收购人才和技术而非整个公司的策略已成为科技巨头在AI领域的常见做法,部分为了避免监管审查。