一家名为Kiefer的公司正在着手一项重大挑战:为希腊这个拥有约1050万人口的国家专门创建大语言模型应用。尽管以美国标准来看,希腊算是一个传统的老派国家,但整个世界都在快速迈向未来。据最近与我们交流的技术专家Christos介绍,希腊需要拥有自己的模型。
他提到了激励团队的目标:通过语言和文化定向优势,在特定市场需求中建立主导地位。
"希腊模型在应用性能方面表现卓越,对希腊语、文化背景和本地企业有深入理解,"他说,"因为我们所有的数据都基于希腊。"
不可否认,这是一项艰巨的工作。
"由于数据量庞大,我们面临很多问题,"他说。"主要是需要扫描的书籍以及互联网上的所有内容。这些都是需要整理的PDF文件来提取数据,之后才能训练模型。"
采用方面也存在阻力:Christos提到接受度大约为9%,在政府和公共部门的数字更低。
深入了解:Kiefer使用什么技术
在回答关于架构的问题时,Christos表示该项目使用三种不同的模型,包括一个来自DeepSeek的模型,他说选择它部分是因为准确性,部分是因为该模型是开源的。
至于其他模型,他提到了Nemotron和Google的一个演示版本,同时对Minimax也表现出兴趣。
目前,该服务是免费的。但Christos表示未来有订阅定价计划。
"在我们实现一些功能(如视频等模态)后,我们将开始收取月订阅费,价格会比大公司更低,"他说。
他补充说,部分原因是为了覆盖成本,比如使用英伟达硬件的费用。
关于基本任务,他谈到要跟上AI发展中出现的快速变化趋势。
"总是有新东西出现,"他说。"我们总是试图跟上AI的新发展。但是...如果你有基础结构,例如,如果你创建自己的数据,你可以遵循最佳实践,使每个国家、每个人、每个公司都能创建特定的模型。关键在于数据。"
他还提到了迭代研究在微调中的价值。
"因为我们已经找到了具体的操作程序,实施和训练下一个模型变得更容易,"他说。"我们从错误中学习,最终获得成功。"
希腊与希腊AI
还有一个关于主权AI的深入讨论,围绕这样一个原则:如果追求这种国家模型的人利用国际研究的力量,他们能否构建更强大、更有能力的服务?
Kiefer团队似乎致力于在希腊内部构建AI系统,而不是利用外部研究援助——在一定程度上。虽然Christos对分享开源数据持开放态度,但他建议整体努力应该保持在国内,原因包括语言和文化特定目标、所有权问题等。
还有对未来技术的展望:
"也许我想创造一个人形机器人来帮助我将来收集橄榄,"他说。"这就是为什么我说每个国家拥有AI非常重要的原因。"
数据所有权和知识产权问题
Christos还表示,团队正在关注知识产权和数据案例的结果,比如涉及Anthropic的案例,美国法官正在裁决作者是否可以起诉该公司使用书籍数据训练模型。
硬件和人形机器人
对话中更有趣的内容之一是Kiefer与Unitree在人形机器人方面的合作,使用英伟达全宇宙平台。Christos没有提供太多细节,但表示Kiefer希望使用自己的CPU和GPU,并很快开始建设AI数据中心。他说,基础设施将使用液体冷却。
他还指出对英伟达作为供应商的依赖。
"不仅仅是GPU,"他说。"还有软件和库。"
他说,最终目标是开发先进的希腊语模型,与希腊大学和其他参与者整合,使用绿色Token技术和可持续基础设施。
这是一个引人入胜的例子,展示了当前各国如何主动出击,面临如此多的选择。
您可以在www.sophea.ai上试用该系统。
好文章,需要你的鼓励
随着数字化时代的到来,网络安全威胁呈指数级增长。勒索软件、AI驱动的网络攻击和物联网设备漏洞成为主要威胁。企业需要建立全面的风险管理策略,包括风险评估、安全措施实施和持续监控。新兴技术如人工智能、区块链和量子计算为网络安全带来新机遇。组织应重视员工培训、供应链安全、数据治理和事件响应能力建设。
滑铁卢大学研究团队开发出ScholarCopilot,一个革命性的AI学术写作助手。该系统突破传统"先检索后生成"模式,实现写作过程中的动态文献检索和精确引用。基于50万篇arXiv论文训练,引用准确率达40.1%,大幅超越现有方法。在人类专家评估中,引用质量获100%好评,整体表现优于ChatGPT。这项创新为AI辅助学术写作开辟新道路。
AWS Amazon Bedrock负责人Atul Deo正致力于让人工智能软件变得更便宜和更智能。他在12月re:Invent大会前只有六个月时间来证明这一目标的可行性。Deo表示AI领域发展速度前所未有,模型每几周就会改进,但客户只有在经济效益合理时才会部署。为此,AWS推出了提示缓存、智能路由、批处理模式等功能来降低推理成本,同时开发能执行多步骤任务的自主代理软件,将AI应用从聊天机器人转向实际业务流程自动化。
哥伦比亚大学研究团队发布NodeRAG技术,通过异构图结构革新智能问答系统。该方法将文档信息分解为7种节点类型,采用双重搜索机制,在多个权威测试中准确率达89.5%,检索效率提升50%以上,为智能信息检索技术带来重大突破。