据彭博社报道,ChatGPT开发商OpenAI预计将在印度建设一个功耗超过1千兆瓦的数据中心。
OpenAI正在寻找可以合作的印度本地公司来推进这一项目。该公司需要电力公用事业和建筑公司的支持来启动数据中心建设。此外,OpenAI还可能寻求市场推广合作伙伴关系,以扩大ChatGPT的采用范围。
1千兆瓦的电力足以为数十万户家庭供电。英伟达公司的DGX GB200设备包含72个Blackwell B200图形处理单元,功耗约为120千瓦。这意味着OpenAI在印度的数据中心至少能够容纳59,000个B200芯片。
OpenAI也可能选择英伟达最新的Blackwell Ultra芯片,该芯片最近开始向客户发货。Blackwell Ultra比B200更快,因此可能消耗更多电力。
GPU只占AI数据中心芯片的一小部分。除了B200加速器外,每台DGX GB200设备还包括36个中央处理器和9个由定制硅芯片驱动的交换机。基于Blackwell Ultra的升级版DGX GB300具有类似的配置。
目前尚不清楚OpenAI在印度建设的设施是否属于其"OpenAI for Countries"计划的一部分。该计划于今年早些时候启动,将在全球建设数据中心以支持国际用户。OpenAI迄今已签署协议在阿联酋和挪威建设基础设施。
"OpenAI for Countries"计划的范围不仅限于数据中心。值得注意的是,这家大语言模型提供商正在帮助参与国政府推出ChatGPT的本地化版本,并培育本地AI初创企业。OpenAI表示可能会投资其中一些初创公司。
今年2月,OpenAI首席执行官山姆·奥特曼据报与印度官员会面,讨论发展"低成本AI生态系统"。最近,该公司推出了仅在印度提供的新ChatGPT计划。这项名为ChatGPT Go的订阅服务月费约4.5美元,用户可以发送的提示数量是免费版本的10倍。
据路透社报道,奥特曼将于下个月访问印度。OpenAI最近宣布计划在年底前在新德里开设办事处。此外,该公司还打算向当地教育工作者和学生分发约50万个ChatGPT许可证。
在印度建立数据中心将使OpenAI能够为本地用户提供更低的延迟。此外,该设施可能使其在争夺企业客户方面处于更有利的地位。一些组织必须在本地存储数据以遵守网络安全和隐私法规。
关于OpenAI在印度基础设施建设的报道发布几周前,该公司刚与甲骨文公司合作,计划在美国建设4.5千兆瓦的数据中心容量。在未来四年内,这家ChatGPT开发商计划在美国再增加至少5.5千兆瓦的容量。该计划预计耗资5000亿美元。
Q&A
Q1:OpenAI在印度建设的数据中心规模有多大?
A:OpenAI计划在印度建设一个功耗超过1千兆瓦的数据中心。这个规模足以为数十万户家庭供电,能够容纳至少59,000个英伟达B200芯片,是一个超大规模的AI数据中心项目。
Q2:OpenAI为什么要在印度建设数据中心?
A:主要有三个原因:为印度本地用户提供更低的网络延迟;更好地竞争企业客户,因为一些组织需要在本地存储数据以符合网络安全和隐私法规;支持OpenAI在印度市场的扩张,包括推广ChatGPT和培育本地AI生态系统。
Q3:这个印度数据中心项目何时能够完成?
A:文章没有提及具体的完成时间。目前OpenAI还在寻找印度本地合作伙伴,包括电力公用事业公司和建筑公司。该公司CEO奥特曼计划下个月访问印度,并将在年底前在新德里开设办事处。
好文章,需要你的鼓励
Meta宣布为Facebook Dating推出AI聊天机器人助手,帮助用户找到更匹配的对象。该AI可根据用户需求推荐特定类型的匹配者,并协助优化个人资料。同时推出Meet Cute功能,每周提供算法选择的"惊喜匹配"。尽管18-29岁用户匹配数同比增长10%,但相比Tinder的5000万日活用户仍有差距。AI功能已成为约会应用标配,Match Group等竞争对手也在大力投资AI技术。
字节跳动团队提出RewardDance框架,首次系统性解决视觉生成中的奖励模型扩展问题。该框架通过将奖励预测转为生成式任务,并将模型规模扩展至260亿参数,同时集成任务指令、参考样例和推理能力,有效解决了"奖励作弊"问题。实验显示,在文本生成图像任务中质量提升10.7分,视频生成性能改善49%,达到行业领先水平,为AI视觉创作提供了更强大可靠的技术基础。
Neo4j认为已找到让生成式AI访问图数据库记录的方法。图数据库专注于数据点之间的关系建模和查询,在欺诈检测、推荐引擎等场景中表现出色。2024年4月,ISO批准了图查询语言GQL标准,Neo4j的Cypher查询语言完全符合该标准。现代工具提供拖拽式工作流程,GenAI可作为自然语言接口,将用户请求转换为Cypher查询。
ByteDance团队开发的Mini-o3系统通过深度多轮推理突破了传统AI视觉理解的局限。该系统能像人类侦探般进行几十轮的视觉探索,在困难的视觉搜索任务上准确率达48%,相比现有模型提升显著。核心创新包括挑战性的Visual Probe数据集、多样化推理策略训练和突破性的过轮掩码技术,实现了测试时思考轮数的自然扩展。