Cointime

扫码下载App
iOS & Android

人工智能入门必读|A16z 整理的 AI 词汇表

作者:a16z  编译:Cointime Lu Tian

  • 加速器(Accelerator)

一类微处理器,设计用于加速AI应用。

  • 代理(Agents)

能够独立地、主动地执行某些任务而无需人类干预的软件,通常使用一套工具,如计算器或网页浏览。

  • 人工通用智能(AGI,Artificial General Intelligence)

尽管没有广泛达成共识,但微软研究人员将AGI定义为在任何智力任务上与人类具备一样能力的人工智能。

  • 对齐(Alignment)

确保AI系统的目标与人类价值观一致的任务。

  • 人工超智能(ASI,Artificial Super Intelligence)

尽管存在争议,但ASI通常被定义为超越人类思维能力的人工智能。

  • 注意力(Attention)

在神经网络背景下,注意力机制帮助模型在生成输出时关注输入的相关部分。

  • 反向传播(Back Propagation)

一种经常用于训练神经网络的算法,指计算损失函数关于网络权重的梯度的方法。

  • 偏差(Bias)

AI模型对数据所做的假设。 “偏差方差权衡”是模型对数据所做假设与模型预测在不同训练数据下变化的平衡。归纳偏差是机器学习算法对数据底层分布所做的一组假设。

  • 思维链(Chain of Thought)

在AI中,这个术语通常用来描述AI模型用来得出决策的一系列推理步骤。

  • 聊天机器人(Chatbot)

一种计算机程序,通过文本或语音交互模拟人类对话。聊天机器人通常利用自然语言处理技术来理解用户输入并提供相关回应。

  • ChatGPT

由OpenAI开发的大规模AI语言模型,生成类似于人类的文本。

  • CLIP(对比性语言-图像预训练,Contrastive Language–Image Pretraining)

由OpenAI开发的AI模型,连接图像和文本,使其能够理解和生成图像描述。

  • 计算(Compute)

用于训练或运行AI模型的计算资源(如CPU或GPU时间)。

  • 卷积神经网络(CNN,Convolutional Neural Network)

一种深度学习模型,通过应用一系列滤波器处理具有网格状拓扑的数据(例如图像)。这类模型通常用于图像识别任务。

  • 数据增强(Data Augmentation):

通过添加现有数据的略微修改的副本,增加用于训练模型的数据量和多样性的过程。

  • 深度学习(Deep Learning)

机器学习的一个子领域,专注于训练具有多层的神经网络,使其能够学习复杂的模式。

  • 扩散(Diffusion)

在AI和机器学习中,一种通过从真实数据开始并添加随机噪声来生成新数据的技术。扩散模型是一种生成模型,其中神经网络被训练来预测在数据上添加随机噪声时的反向过程。扩散模型用于生成与训练数据相似的新数据样本。

  • 双下降(Double Descent)

机器学习中的一种现象,其中模型性能随着复杂度的增加而提高,然后恶化,然后再次提高。

  • 嵌入(Embedding)

数据以新形式(通常是向量空间)表示。相似的数据点具有更相似的嵌入。

  • 涌现/涌现行为(Emergence/Emergent Behavior)

在AI中,涌现指由简单规则或交互产生的复杂行为。“急转弯”和“智能爆炸”是AI发展突然发生巨大变化的推测性场景,通常与AGI的到来相关。

  • 端到端学习(End-to-End Learning)

一种不需要手工设计特征的机器学习模型。该模型只需输入原始数据,并从这些输入中学习。

  • 专家系统(Expert Systems)

应用人工智能技术为特定领域内的复杂问题提供解决方案。

  • 可解释AI(XAI,Explainable AI)

关注创建透明模型并提供其决策清晰可理解解释的AI子领域。

  • 微调(Fine-tuning)

将一个已经在大型数据集上经过预训练的机器学习模型进行调整以适应稍微不同的任务或特定领域的过程。在微调过程中,使用较小的、任务特定的数据集进一步调整模型的参数,使其能够学习任务特定的模式,并在新任务上提高性能。

  • 前向传播(Forward Propagation)

在神经网络中,前向传播是将输入数据输入网络并通过每一层(从输入层到隐藏层,最后到输出层)传递以产生输出的过程。网络对输入应用权重和偏差,并使用激活函数生成最终输出。

  • 基础模型(Foundation Model)

在广泛数据上训练的大型AI模型,旨在用于特定任务的适应。

  • 生成对抗网络(GAN,General Adversarial Network)

一种用于生成与现有数据相似的新数据的机器学习模型。它将两个神经网络相互对抗:一个“生成器”创建新数据,一个“判别器”尝试将这些数据与真实数据区分开来。

  • 生成式AI(Generative AI)

一个关注创建可以基于现有数据的模式和示例生成新的和原创内容(如图像、音乐或文本)的模型的AI分支。

  • GPT(生成预训练Transformer,Generative Pretrained Transformer)

由OpenAI开发的大规模AI语言模型,生成类似于人类的文本。

  • GPU(图形处理单元,Graphics Processing Unit)

一种专门的微处理器类型,主要设计用于快速渲染图像以输出到显示器。GPU还非常擅长执行训练和运行神经网络所需的计算。

  • 梯度下降(Gradient Descent)

在机器学习中,梯度下降是一种优化方法,它根据损失函数的最大改进方向逐步调整模型的参数。例如,在线性回归中,梯度下降通过反复优化线的斜率和截距来最小化预测误差,从而找到最佳匹配线。

  • 幻觉/幻觉现象(Hallucinate/Hallucination)

在AI的背景下,幻觉指的是模型生成的内容不基于实际数据或与现实相差很大的现象。

  • 隐藏层(Hidden Layer)

神经网络中不直接连接输入或输出的人工神经元层。

  • 超参数调优(Hyperparameter Tuning)

选择机器学习模型的超参数(从数据中未学习到的参数)的适当值的过程。

  • 推理(Inference)

利用训练好的机器学习模型进行预测的过程。

  • 指令调优(Instruction Tuning)

一种机器学习技术,根据数据集中给出的特定指令对模型进行微调。

  • 大型语言模型(LLM, Large Language Model)

一种能生成类似人类文本的AI模型,训练于广泛的数据集。

  • 潜在空间(Latent Space)

在机器学习中,这个术语指的是模型(如神经网络)创建的数据的压缩表示。相似的数据点在潜在空间中更接近。

  • 损失函数(或代价函数,Loss Function or Cost Function)

机器学习模型在训练过程中试图最小化的函数。它量化了模型预测与真实值之间的差距。

  • 机器学习(Machine Learning)

一种人工智能类型,使系统能够在无需明确编程的情况下自动学习和从经验中改进。

  • 专家混合(Mixture of Experts)

一种机器学习技巧,其中训练了几个专门的子模型(“专家”),并以依赖于输入的方式组合它们的预测。

  • 多模态(Multimodal)

在AI中,这是指可以理解和生成跨多种数据类型(如文本和图像)的信息的模型。

  • 自然语言处理(NLP, Natural Language Processing)

AI的一个子领域,专注于计算机和人类通过自然语言进行交互。NLP的最终目标是以有价值的方式阅读、解密、理解并理解人类语言。

  • NeRF(神经辐射场,Neural Radiance Fields)

一种使用神经网络从2D图像创建3D场景的方法。它可用于照片级渲染、视图合成等。

  • 神经网络(Neural Network)

一种受人类大脑启发的AI模型。它由连接在一起的单元或节点组成,称为神经元,这些神经元按层组织。神经元接收输入,对它们进行一些计算,并产生输出。

  • 目标函数(Objective Function)

机器学习模型在训练过程中试图最大化或最小化的函数。

  • 过拟合(Overfitting)

一种建模错误,当函数与有限数据点过于紧密匹配时发生,导致在应用于未见数据时预测性能不佳。

  • 参数(Parameters)

在机器学习中,参数是模型用来进行预测的内部变量。它们是在训练过程中从训练数据中学习的。例如,在神经网络中,权重和偏差是参数。

  • 预训练(Pre-training)

训练机器学习模型的初始阶段,模型在此阶段从数据中学习通用特征、模式和表示,而无需具体了解将来要应用到的任务。这种无监督或半监督学习过程使模型能够建立对底层数据分布的基本理解,并提取有意义的特征,这些特征可以用于后续针对特定任务的微调。

  • 提示(Prompt)

为模型设置任务或查询的初始上下文或指令。

  • 正则化(Regularization)

在机器学习中,正则化是一种防止过拟合的技术,通过在模型的损失函数中添加惩罚项来实现。这种惩罚阻止模型过分依赖训练数据中的复杂模式,从而促进更具泛化能力和不容易过拟合的模型。

  • 强化学习(Reinforcement Learning)

一种机器学习类型,其中智能体通过在环境中采取行动来最大化某种奖励,从而学会做出决策。

  • RLHF(来自人类反馈的强化学习,Reinforcement Learning from Human Feedback)

一种通过从人类对模型输出给出的反馈中学习来训练AI模型的方法。

  • 奇点(Singularity)

在AI背景下,奇点(也称为技术奇点)指的是一个假设的未来时间点,当时技术增长变得无法控制和不可逆转,导致人类文明发生无法预料的变化。

  • 监督学习(Supervised Learning)

一种机器学习类型,其中模型提供带有标签的训练数据。

  • 符号人工智能(Symbolic Artificial Intelligence)

一种利用符号推理解决问题和表示知识的AI类型。

  • TensorFlow

由谷歌开发的开源机器学习平台,用于构建和训练机器学习模型。

  • TPU(Tensor Processing Unit)

谷歌专门为加速机器学习工作负载开发的一种微处理器类型。

  • 训练数据(Training Data)

用于训练机器学习模型的数据集。

  • 迁移学习(Transfer Learning)

机器学习中的一种方法,将预训练模型应用于新问题。

  • Transformer

一种主要用于处理顺序数据(如自然语言)的特定类型神经网络结构。Transformer以其处理数据中长距离依赖性的能力而闻名,这要归功于一种名为“注意力”的机制,它允许模型在产生输出时权衡不同输入的重要性。

  • 欠拟合(Underfitting)

统计学和机器学习中的建模错误,当统计模型或机器学习算法无法充分捕捉数据的底层结构时发生。

  • 无监督学习(Unsupervised Learning)

一种机器学习类型,其中模型没有提供带有标签的训练数据,而是必须自行识别数据中的模式。

  • 验证数据(Validation Data)

用于机器学习的数据集的子集,与训练和测试数据集分开。它用于调整模型的超参数(即结构,而不是权重)。

  • XAI(可解释AI,Explainable AI)

AI的一个子领域,专注于创建透明的模型,为其决策提供清晰、易于理解的解释。

  • 零样本学习(Zero-shot Learning)

一种机器学习类型,其中模型在训练期间未见过的条件下进行预测,无需进行任何微调。

评论

所有评论

推荐阅读

  • 美国现货以太坊ETF昨日净流出493万美元

    6月13日,据Trader T监测,美国现货以太坊ETF昨日净流出493万美元。

  • 美国现货比特币ETF昨日净流入8582万美元

    6月13日,据Trader T监测,美国现货比特币ETF昨日净流入8582万美元。

  • 美国禁止外国主体访问Fable 5和Mythos 5,Anthropic发长文驳斥

    6月13日,Anthropic发布声明称,美国政府以国家安全权力为由,发布了一项出口管制指令,要求暂停任何外国主体对人工智能模型Fable 5 和Mythos 5的所有访问权限,无论该人员是否在美国境内,包括属于外国公民的Anthropic员工。该命令的实际效果是,我们必须立即为所有客户禁用Fable 5和Mythos 5,以确保合规。所有其他Anthropic模型的访问将不受影响。我们于今天下午5点21分(美国东部时间)收到了政府的指令。该信函未说明其国家安全关切的具体细节。我们的理解是,政府认为其已获悉一种绕过或“越狱”Fable 5的方法。迄今为止,政府仅向我们提供了口头证据,证明存在一种潜在的狭窄、非通用越狱,本质上是通过要求模型读取特定的代码库并修复任何软件缺陷。我们正在遵守政府的合法指令,并正在移除所有用户对 Fable 5 和 Mythos 5 的访问权限。但是,我们不同意“某个狭窄的潜在越狱漏洞就应成为召回已部署给数亿用户的商业模型的原因”这一结论。(金十)

  • 伊朗外长:伊美谅解备忘录可能在几天内签署

    6月13日,据伊朗媒体12日报道,伊朗外长阿拉格齐表示,一旦伊美完成最后阶段的谈判,谅解备忘录将立即签署并公布。第一阶段将以远程电子方式签署,“这可能在未来几天内发生”。(新华社)

  • 美国官员:美伊接近达成协议,将在未来几天签署

    6月13日,据路透社报道,一名美国高级官员当地时间周五表示,美国和伊朗尚未真正抵达终点线,但距离达成一项解决双方冲突的协议已经非常接近,华盛顿预计将在未来几天签署协议。“谈判团队让我们处在一个非常有利的位置,但我们还要再看看,我们还没有真正抵达终点线,但已经非常接近了,”这名美国官员表示。该官员称,已达成一致的条款实现了特朗普的核心目标。谅解备忘录的条款包括重新开放霍尔木兹海峡,以及解除美国对伊朗港口的封锁。伊朗的高丰度浓缩铀也将被就地销毁,随后运出该国。“伊朗不会因为签署谅解备忘录或谈判本身而得到任何东西,”该官员说,“他们会因为履行协议规定的义务而获得经济奖励。因此,如果他们按承诺交出核材料,就会得到一些东西。如果他们拆除核计划或核设施,就会得到另外的东西。”

  • 伊朗外交部:伊方正在审议谅解备忘录草案

    6月13日,当地时间12日,伊朗外交部发言人巴加埃表示,目前伊美双方已经在大多数问题上达成谅解,伊朗内部正在对谅解备忘录文本进行最后阶段的汇总。因此,伊朗外长阿拉格齐此前关于“双方已非常接近达成谅解”的表态是准确且值得关注的。相关决策机构的会议正在举行,这是一个持续推进的过程。为达成一个最终且具有决定性的结果,决策机构和相关部门之间必须形成共识。巴加埃还表示,目前有关协议文本内容的各种猜测均未获得证实。虽然外交进程中的具体细节暂不便公开讨论,但这并不意味着公众没有知情权。(央视新闻)

  • SpaceX上市首日开盘报150美元,其IPO发行价为135美元

    6月12日,SpaceX上市首日开盘报150美元,其IPO发行价为135美元。

  • 伊朗外长称伊美“从未如此接近达成”谅解备忘录

    6月12日,伊朗外交部长阿拉格齐12日在社交媒体发文说,伊美“从未如此接近达成”谅解备忘录。在最终敲定之前,媒体应避免对其内容进行猜测。伊方将适时公布所有细节。 (央视新闻)

  • BTC突破64000美元

    行情显示,BTC突破64000美元,现报64107.99美元,24小时涨幅达到2.18%,行情波动较大,请做好风险控制。

  • ARM拉升大涨近10%,美银预计到2030年服务器CPU市场规模料激增4倍

    6月12日,ARM拉升大涨近10%,报376.18美元。消息面上,美国银行全球研究部分析师Vivek Arya最新预测,服务器CPU的总潜在市场规模(TAM)将从2025年的350亿美元激增4倍至2030年的1700亿美元以上。这远超该行此前对2030年服务器CPU市场规模1250亿美元的预测。 Arya在报告中写道:“我们认为,代理式AI的崛起是一个强大的需求加速器,它不仅扩大了CPU的市场机遇,也为英特尔、AMD以及基于Arm架构的挑战者们带来了利好。”