一家名为Kiefer的公司正在着手一项重大挑战:为希腊这个拥有约1050万人口的国家专门创建大语言模型应用。尽管以美国标准来看,希腊算是一个传统的老派国家,但整个世界都在快速迈向未来。据最近与我们交流的技术专家Christos介绍,希腊需要拥有自己的模型。
他提到了激励团队的目标:通过语言和文化定向优势,在特定市场需求中建立主导地位。
"希腊模型在应用性能方面表现卓越,对希腊语、文化背景和本地企业有深入理解,"他说,"因为我们所有的数据都基于希腊。"
不可否认,这是一项艰巨的工作。
"由于数据量庞大,我们面临很多问题,"他说。"主要是需要扫描的书籍以及互联网上的所有内容。这些都是需要整理的PDF文件来提取数据,之后才能训练模型。"
采用方面也存在阻力:Christos提到接受度大约为9%,在政府和公共部门的数字更低。
深入了解:Kiefer使用什么技术
在回答关于架构的问题时,Christos表示该项目使用三种不同的模型,包括一个来自DeepSeek的模型,他说选择它部分是因为准确性,部分是因为该模型是开源的。
至于其他模型,他提到了Nemotron和Google的一个演示版本,同时对Minimax也表现出兴趣。
目前,该服务是免费的。但Christos表示未来有订阅定价计划。
"在我们实现一些功能(如视频等模态)后,我们将开始收取月订阅费,价格会比大公司更低,"他说。
他补充说,部分原因是为了覆盖成本,比如使用英伟达硬件的费用。
关于基本任务,他谈到要跟上AI发展中出现的快速变化趋势。
"总是有新东西出现,"他说。"我们总是试图跟上AI的新发展。但是...如果你有基础结构,例如,如果你创建自己的数据,你可以遵循最佳实践,使每个国家、每个人、每个公司都能创建特定的模型。关键在于数据。"
他还提到了迭代研究在微调中的价值。
"因为我们已经找到了具体的操作程序,实施和训练下一个模型变得更容易,"他说。"我们从错误中学习,最终获得成功。"
希腊与希腊AI
还有一个关于主权AI的深入讨论,围绕这样一个原则:如果追求这种国家模型的人利用国际研究的力量,他们能否构建更强大、更有能力的服务?
Kiefer团队似乎致力于在希腊内部构建AI系统,而不是利用外部研究援助——在一定程度上。虽然Christos对分享开源数据持开放态度,但他建议整体努力应该保持在国内,原因包括语言和文化特定目标、所有权问题等。
还有对未来技术的展望:
"也许我想创造一个人形机器人来帮助我将来收集橄榄,"他说。"这就是为什么我说每个国家拥有AI非常重要的原因。"
数据所有权和知识产权问题
Christos还表示,团队正在关注知识产权和数据案例的结果,比如涉及Anthropic的案例,美国法官正在裁决作者是否可以起诉该公司使用书籍数据训练模型。
硬件和人形机器人
对话中更有趣的内容之一是Kiefer与Unitree在人形机器人方面的合作,使用英伟达全宇宙平台。Christos没有提供太多细节,但表示Kiefer希望使用自己的CPU和GPU,并很快开始建设AI数据中心。他说,基础设施将使用液体冷却。
他还指出对英伟达作为供应商的依赖。
"不仅仅是GPU,"他说。"还有软件和库。"
他说,最终目标是开发先进的希腊语模型,与希腊大学和其他参与者整合,使用绿色Token技术和可持续基础设施。
这是一个引人入胜的例子,展示了当前各国如何主动出击,面临如此多的选择。
您可以在www.sophea.ai上试用该系统。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。