欧盟在如何增强其在科技世界影响力方面似乎达成了一致。
目前,美国的科技巨头主导着欧洲的企业领域,大多数大型企业高度依赖微软、亚马逊和谷歌等公司。
在这篇文章中,我们分析了欧盟为创建数字单一市场所做的努力,这是打败美国大型科技公司、管理全球数据流动和振兴其失败的云计算产业计划的一部分。
这是即将上任的欧盟管理机构议程上的紧急事项,因为他们承认必须改变游戏规则,既然无法竞争。
在中东,另一个投入大量时间和资金以成为科技领导者的地区,沙特阿拉伯正在建设一座名为Neom的智慧城市。这个项目将极大地推动这个石油富国的高科技产业,任何新公司和倡议都将以强大的技术为重点。在这篇年度回顾中可以了解更多相关信息。
同时,在邻近的海湾国家阿联酋,石油巨头阿布扎比国家石油公司 (ADNOC) 与微软达成了一项协议,这被视为美国防止中国在海湾地区进行军事技术抢占的战略工具。
了解为什么荷兰面临潜在危机,因为对复杂的 Cobol 系统的专业知识正在减少,而这些系统对主要金融机构至关重要,导致退休专业人士重返工作岗位。
我们还介绍了一个案例研究,讲述了举办一场大型体育赛事需要多少技术服务才能顺利运行并增加观众。阅读法国 IT 巨头 Atos 在德国欧洲杯足球锦标赛中的工作。《计算机周刊》深入了解了杜塞尔多夫临时 IT 支持中心的幕后工作。
以下是《计算机周刊》2024年欧洲、中东和非洲地区十大新闻:
1. 欧盟推广计划以超越美国大型科技公司,打造数字市场
欧洲即将将其长期努力创建数字单一市场作为打败美国大型科技公司、管理全球数据流动和振兴其失败的云计算产业的宏伟计划的一部分。
2. 丹麦的 AI 驱动福利系统引发大规模监控
根据国际特赦组织的分析,丹麦福利机构使用的人工智能工具侵犯了个人隐私,存在歧视风险,并违反了欧盟 AI 法案关于社会评分系统的规定。
3. 从虚拟病房到数字反馈:北欧后疫情医疗保健方法
新冠疫情改变了全球医疗保健格局,世界各地的机构意识到需要更先进的数字干预,以实现远程护理。
4. Neom:沙特沙漠中的科技冰山一角
即使沙特阿拉伯的 Neom 智慧城市项目只实现了计划的一小部分,也可能极大地推动该国的高科技生态系统。
5. 尽管领导层信心高涨,荷兰关键基础设施仍面临风险
虽然荷兰商业领袖对其 IT 基础设施充满信心,但最近的事件和统计数据描绘了该国关键基础设施脆弱性的更令人担忧的画面。
6. Afas 在荷兰引领四天工作周
在荷兰传统的议会年度开幕前夕,劳工联盟 CNV 和 FNV 大力宣传他们缩短荷兰工作周的计划。
7. 微软与阿联酋的能源协议成为美国 AI 霸权计划的核心
在一年的外交努力后,微软与阿联酋石油巨头阿布扎比国家石油公司 (ADNOC) 达成了人工智能能源协议,这被视为美国防止中国在海湾地区进行军事技术抢占的战略工具。
8. DACH 地区教育"已为 AI 做好准备",家长呼吁创新进入下一阶段
DACH 地区对教育领域数字化干预的呼声可能为未来几年大陆向更具动态性和直观性的学习方式转变定下基调。
9. Atos 为 2024 年欧洲杯"跳上行驶的列车"
今年夏天在德国举行的欧洲男子足球锦标赛展示了数字技术如何改变体育赛事的消费方式,但支持后勤工作的幕后团队是无名英雄。
10. Cobol 知识危机威胁荷兰金融系统
Cobol 仍然是许多关键金融和行政系统的支柱,由于荷兰早期熟练地实现了经济自动化,Cobol 在该国的使用率很高。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。