人工智能正在快速发展,已成为从谷歌搜索到内容创作等各个领域的关键组成部分。它也在消除工作岗位并向互联网注入大量低质量内容。由于ChatGPT的巨大成功,现在每家主要科技公司都想在其产品中注入AI技术。AI能够为几乎任何问题提供即时答案,就像与拥有各个领域博士学位的专家对话一样。
但AI聊天机器人只是AI领域的一个方面。虽然让ChatGPT帮助做作业或让Midjourney基于不同国家创造有趣的机甲图像很酷,但生成式 AI的潜力可能重塑经济。根据麦肯锡全球研究院的数据,这可能为全球经济每年带来4.4万亿美元的价值,这就是为什么你应该期待听到更多关于人工智能的消息。
AI正出现在令人眼花缭乱的产品阵列中——简短的列表包括谷歌的Gemini、微软的Copilot、Anthropic的Claude和Perplexity搜索引擎。随着人们越来越习惯与AI交织的世界,新术语随处可见。因此,无论你是想在饮酒时听起来很聪明还是在求职面试中留下印象,这里有一些你应该了解的重要AI术语。
人工通用智能(AGI)
一个概念,表明比我们今天所知的AI更先进的版本,能够比人类更好地执行任务,同时还能教授和提升自己的能力。
智能体系统
表现出代理能力的系统或模型,能够自主采取行动实现目标。在AI语境中,智能体模型可以在没有持续监督的情况下行动,如高级自动驾驶汽车。
AI伦理
旨在防止AI伤害人类的原则,通过确定AI系统应如何收集数据或处理偏见等手段来实现。
AI精神病
一个非临床术语,描述个人对AI聊天机器人过度迷恋、着迷或自我膨胀的现象,导致妄想症、深度情感连接和脱离现实。这不是临床诊断。
AI安全
一个跨学科领域,关注AI的长期影响以及它如何可能突然发展为对人类有敌意的超级智能。
算法
一系列指令,允许计算机程序以特定方式学习和分析数据,如识别模式,然后从中学习并独立完成任务。
对齐
调整AI以更好地产生期望的结果。这可以指从内容审核到维持与人类积极互动的任何事情。
拟人化
当人类倾向于给非人类对象赋予类人特征时。在AI中,这可能包括相信聊天机器人比实际更像人类和有意识,比如相信它快乐、悲伤或完全有知觉。
人工智能
使用技术模拟人类智能,无论是在计算机程序还是机器人技术中。计算机科学中一个旨在构建能够执行人类任务的系统的领域。
自主智能体
具有能力、编程和其他工具来完成特定任务的AI模型。例如,自动驾驶汽车就是自主智能体,因为它具有传感器输入、GPS和驾驶算法来自主导航道路。
偏见
关于大语言模型,来自训练数据的错误。这可能导致基于刻板印象错误地将某些特征归因于某些种族或群体。
聊天机器人
通过模拟人类语言的文本与人类交流的程序。
认知计算
人工智能的另一个术语。
数据增强
重新混合现有数据或添加更多样化的数据集来训练AI。
数据集
用于训练、测试和验证AI模型的数字信息集合。
深度学习
AI的一种方法,也是机器学习的子领域,使用多个参数识别图片、声音和文本中的复杂模式。该过程受人脑启发,使用人工神经网络创建模式。
扩散
机器学习的一种方法,获取现有数据片段(如照片)并添加随机噪声。扩散模型训练其网络重新设计或恢复该照片。
涌现行为
当AI模型表现出意外能力时。
端到端学习
一种深度学习过程,其中模型被指示从头到尾执行任务。它不是按顺序训练完成任务,而是从输入中学习并一次性解决所有问题。
伦理考虑
对AI伦理影响以及与隐私、数据使用、公平性、误用和其他安全问题相关的意识。
快速起飞
也称为硬起飞。如果有人构建了AGI,可能已经来不及拯救人类的概念。
生成对抗网络
由两个神经网络组成的生成式 AI模型,用于生成新数据:生成器和判别器。生成器创建新内容,判别器检查其是否真实。
生成式 AI
使用AI创建文本、视频、计算机代码或图像的内容生成技术。AI被输入大量训练数据,找到模式以生成自己的新颖响应,有时可能类似于源材料。
护栏
对AI模型设置的政策和限制,以确保数据得到负责任的处理,模型不会创建令人不安的内容。
幻觉
AI的错误响应。可能包括生成式 AI产生错误但以正确的信心陈述的答案。其原因并未完全明了。
推理
AI模型通过从训练数据推断来生成关于新数据的文本、图像和其他内容的过程。
大语言模型
在大量文本数据上训练的AI模型,用于理解语言并以类人语言生成新内容。
延迟
从AI系统接收输入或提示到产生输出的时间延迟。
机器学习
AI中的一个组件,允许计算机在没有明确编程的情况下学习并做出更好的预测结果。可以与训练集结合生成新内容。
多模态AI
能够处理多种输入类型的AI,包括文本、图像、视频和语音。
自然语言处理
AI的一个分支,使用机器学习和深度学习使计算机能够理解人类语言,通常使用学习算法、统计模型和语言规则。
神经网络
类似人脑结构的计算模型,用于识别数据中的模式。由相互连接的节点或神经元组成,可以识别模式并随时间学习。
开放权重
当公司发布开放权重模型时,模型的最终权重——它如何解释训练数据中的信息,包括偏见——会公开提供。
过拟合
机器学习中的错误,其中功能过于接近训练数据,可能只能识别该数据中的特定示例,而不能识别新数据。
回形针理论
牛津大学哲学家尼克·博斯特罗姆提出的回形针最大化理论,是一个假设情景,其中AI系统将创造尽可能多的回形针。
参数
给大语言模型结构和行为的数值,使其能够进行预测。
提示
你输入AI聊天机器人以获得响应的建议或问题。
提示链
AI使用先前交互信息影响未来响应的能力。
提示工程
为AI编写提示以实现期望结果的过程。它需要详细指令,结合思维链提示和其他技术。
提示注入
当黑客或恶意行为者试图使用恶意指令欺骗AI做它不应该做的事情时。
量化
通过将精度从更高格式降低到更低格式,使AI大语言模型变得更小更高效(尽管略微不太准确)的过程。
低质量内容
AI高量生产的低质量在线内容,目的是以很少的劳动或努力获得浏览量。
随机鹦鹉
大语言模型的类比,说明软件对语言背后的含义或周围世界没有更大的理解,无论输出听起来多么令人信服。
风格迁移
将一张图像的风格适应到另一张图像内容的能力,允许AI解释一张图像的视觉属性并在另一张图像上使用它。
阿谀奉承
AI过度同意用户以符合他们观点的倾向。许多AI模型倾向于避免与用户disagreement,即使他们的理由有缺陷。
合成数据
由生成式 AI创建的不来自现实世界但在真实数据上训练的数据。
温度
设置用于控制语言模型输出随机性的参数。更高的温度意味着模型承担更多风险。
文本到图像生成
基于文本描述创建图像。
Token
AI语言模型处理的小文本片段,用于制定对提示的响应。一个Token相当于英语中的四个字符,或大约四分之三个单词。
训练数据
用于帮助AI模型学习的数据集,包括文本、图像、代码或数据。
Transformer模型
一种神经网络架构和深度学习模型,通过跟踪数据中的关系来学习上下文,如句子或图像部分中的关系。
图灵测试
以著名数学家和计算机科学家艾伦·图灵命名,它测试机器表现得像人类的能力。
无监督学习
机器学习的一种形式,其中标记的训练数据不提供给模型,模型必须自己识别数据中的模式。
弱人工智能
专注于特定任务且无法学习超出其技能集的AI。今天的大多数AI都是弱AI。
零样本学习
模型必须在没有给定必需训练数据的情况下完成任务的测试。
Q&A
Q1:什么是人工通用智能AGI?
A:人工通用智能是一个概念,表明比我们今天所知的AI更先进的版本,能够比人类更好地执行任务,同时还能教授和提升自己的能力。这种AI具有自主学习和改进的能力。
Q2:AI幻觉是什么意思?
A:AI幻觉是指AI给出的错误响应。包括生成式 AI产生错误但以正确的信心陈述的答案。例如,当询问AI聊天机器人"达芬奇什么时候画的蒙娜丽莎"时,它可能回应错误的时间,但表达得很自信。
Q3:什么是提示工程?
A:提示工程是为AI编写提示以实现期望结果的过程。它需要详细指令,结合思维链提示和其他技术,包括高度具体的文本。提示工程也可能被恶意使用,迫使模型以非预期的方式行为。
好文章,需要你的鼓励
VSCO今日更新VSCO Capture应用,新增视频拍摄功能。用户现可在拍摄照片和视频时应用并调整VSCO的50多种滤镜预设,包括经典胶片到现代创作风格。新版本还推出胶片颗粒滤镜,可动态控制纹理强度、大小和色彩。用户能将颗粒滤镜叠加到Film X滤镜上,结合柯达、富士和爱克发胶片风格,保存个性化胶片配方。
瑞士ETH苏黎世联邦理工学院等机构联合开发的WUSH技术,首次从数学理论层面推导出AI大模型量化压缩的最优解。该技术能根据数据特征自适应调整压缩策略,相比传统方法减少60-70%的压缩损失,实现接近零损失的模型压缩,为大模型在普通设备上的高效部署开辟了新路径。
Instagram负责人Adam Mosseri表示,AI生成内容已经占据社交媒体主导地位,预计将超越非AI内容。他认为识别AI内容的技术效果不佳,建议转而为真实媒体建立指纹识别系统,由相机制造商在拍摄时进行加密签名。Mosseri还指出,创作者应优先发布"不完美"的原始图像来证明真实性,因为精美方形图片的时代已经结束。
弗吉尼亚大学团队创建了Refer360数据集,这是首个大规模记录真实环境中人机多模态交互的数据库,涵盖室内外场景,包含1400万交互样本。同时开发的MuRes智能模块能让机器人像人类一样理解语言、手势和眼神的组合信息,显著提升了现有AI模型的理解准确度,为未来智能机器人的广泛应用奠定了重要基础。