Cointime

扫码下载App
iOS & Android

人工智能时代,谁将引领应用创新?AI工程师的崛起如何改变游戏规则?

作者: SWYX. 编译:Cointime.com QDD

我们正在目睹应用人工智能的一次“右移”现象,这得益于基础模型的新兴能力和开源/API的可用性。

在2013年,完成一系列人工智能任务通常需要5年时间和一个研究团队,而在2023年,只需要API文档和一个闲暇的下午就可以完成。

正如我们在Spaces聊天中讨论的那样,API界线是渗透性的 - AI工程师可以向左调整/托管模型,研究工程师也可以向右构建API。但是,他们的相对优势和“归属基地”是明确的。

然而,魔鬼在细节中 - 成功评估、应用和产品化人工智能存在无数挑战:

  • 模型:从评估最大的GPT-4和Claude模型,到最小的开源Huggingface、LLaMA和其他模型。
  • 工具:从最受欢迎的链式、检索和向量搜索工具,如LangChain、LlamaIndex和Pinecone,到新兴的自主代理领域,如Auto-GPT和BabyAGI(Lilian Weng在这里提供了一个必读的回顾)。
  • 新闻:除此之外,每天发布的论文、模型和技术的数量随着兴趣和资金的增加呈指数级增长,以至于跟上这一切几乎成了一项全职工作。

我对此持认真和字面的态度。我认为这是一项全职工作。我认为软件工程将催生一个新的子学科,专门研究人工智能的应用,并有效地使用新兴的技术堆栈,就像“可靠型站点工程师”、“DevOps工程师”、“数据工程师”和“分析工程师”一样。

这一角色新兴的(并且最不尴尬的)版本似乎是:AI工程师。

我所知道的每个初创公司都有一个名为#discuss-ai的Slack频道。这些频道将从非正式的小组变成正式的团队,就像AmplitudeReplitNotion一样。成千上万的软件工程师正在为公司的API和开源模型进行生产工作,无论是在公司的工作时间还是在晚上和周末,在公司的Slack或独立的Discord中,他们将专业化并汇聚到一个称号下 - AI工程师。这很可能是本十年最需求量最大的工程职位。

AI工程师无处不在,从微软和谷歌这样的大公司,到领先的初创公司,如Figma(通过收购Diagram)、Vercel(例如Hassan El Mghari的RoomGPT)和Notion(例如Ivan Zhao和Simon Last的Notion AI),再到像Simon WillisonPieter LevelsPhoto/InteriorAI)和Riley Goodside(现在在Scale AI工作)这样的独立黑客。他们在Anthropic公司以prompt engineering的方式赚取30万美元/年,在OpenAI建立软件赚取90万美元。他们在AGI House上度过空闲的周末,分享/r/LocalLLaMA上的技巧。他们所有人的共同之处是将人工智能的进步塑造成数以百万计的真实产品,几乎是一夜之间。

一个博士学位都看不到。在推出人工智能产品时,你需要工程师,而不是研究人员。

AI与ML工程师的翻转

我提醒大家注意这一趋势,而不是开启它。Indeed上有10倍于AI工程师职位ML工程师职位,但“AI”增长率更高,因此我预测这个比例将在5年内颠倒。

每月工作趋势(根据HN招聘数据)

所有职位头衔都有缺陷,但有些是有用的。我们对于AI和ML之间的区别进行无休止的语义争论感到警惕和疲倦,我们也很清楚,普通的“软件工程师”角色完全能够构建人工智能软件。然而,最近有一个关于如何进入AI工程领域的问答贴子,说明了市场上仍然存在的基本观念:

2023年6月截图:“如何进入AI工程”的最受赞同的答案

大多数人仍然认为AI工程是机器学习或数据工程的一种形式,因此他们推荐的先决条件是相同的。但我向你保证,我提到的那些高效的AI工程师中没有一个人完成过等同于Andrew Ng的Coursera课程的工作,他们也不懂PyTorch,也不知道数据湖(Data Lake)和数据仓库(Data Warehouse)之间的区别。

在不久的将来,没有人会推荐通过阅读《Attention is All You Need》来开始学习AI工程,就像你不会通过阅读福特T型车的图纸来开始学开车一样。当然,理解基本原理和历史总是有帮助的,并且可以帮助您找到尚未为人所知的想法和效率/能力增益。但有时你只需使用产品并通过实际体验来了解它们的特性。

我不指望这种课程的“翻转”会一夜之间发生。人类天性就是想要填写简历,填写市场地图,并通过引用更权威的深层次话题来突出自己。换句话说,Prompt Engineering和AI Engineering在相当长的一段时间内都会比拥有良好数据科学/机器学习背景的人感到逊色。然而,我认为需求和供应的经济学规律将占上风。

为什么现在出现了AI工程师

  • 基础模型是“少样本学习器”,具有上下文学习甚至零样本迁移的能力,可以推广到模型训练者最初意图之外的领域。换句话说,创建模型的人并不完全了解它们的能力。那些不是LLM研究人员的人可以通过更多地与模型交互,并将其应用于研究未充分重视的领域(例如Jasper的文案写作),从而发现并利用这些能力。
  • 微软、谷歌、Meta和大型基础模型实验室占据了稀缺的研究人才,实际上提供了“AI研究即服务”的API。你不能雇佣他们,但如果你有软件工程师知道如何与他们合作,你可以租用他们。世界上大约有5000名LLM研究人员,但有约5000万名软件工程师。供应约束决定了将会涌现出一类介于两者之间的AI工程师,以满足需求。
  • GPU囤积。当然,OpenAI/微软是第一家,但Stability AI通过强调他们的4000个GPU集群掀起了初创公司GPU竞赛的热潮。
还记得2022年10月吗?

自那时以来,新的初创公司(如Inflection,13亿美元;Mistral,1.13亿美元;Reka,5800万美元;Poolside,2600万美元;Contextual,2000万美元)已经成为拥有自己硬件的巨大种子轮融资的常见现象。甚至丹·格罗斯(Dan Gross)和纳特·弗里德曼(Nat Friedman)宣布了他们的1000万美元、10亿亿次浮点运算GPU集群Andromeda,专门为他们投资的初创公司。全球芯片短缺反过来又创造了更多的短缺。在API线的另一边,AI工程师将有更多的容量来使用模型,而不是训练模型。

  • 先火再瞄准。不再要求数据科学家/机器学习工程师在训练一个特定领域的模型之前进行费力的数据收集工作,然后将其投入生产。现在,产品经理/软件工程师可以提示LLM,构建/验证产品想法,然后获取特定数据进行优化。

假设后者的数量比前者多100到1000倍,而提示LLM原型的“先火再瞄准”工作流使您能够比传统机器学习更快地进行10到100倍的工作。因此,AI工程师能够以更便宜的方式验证AI产品。这就是瀑布与敏捷的区别。AI是敏捷的。

  • 从Python到JavaScript。数据/人工智能传统上非常依赖Python,最初的AI工程工具,如LangChain、LlamaIndex和Guardrails,也出自同一个社区。然而,JavaScript开发者与Python开发者的数量至少相当,因此现在的工具越来越多地面向这个广泛扩展的受众,从LangChain.js和Transformers.js到Vercel的新AI SDK。市场的扩大和机会是巨大的。
  • 生成式AI vs分类器机器学习。术语“生成式AI”已经不再流行,为其他类比诸如“推理引擎”让路,但它仍然有助于简明地阐明现有的MLOps工具和ML从业者与新兴的、截然不同的人物类型之间的差异。新一代机器学习可能更加关注欺诈风险、推荐系统、异常检测和特征存储,而AI工程师正在构建写作应用程序、个性化学习工具、自然语言电子表格和类似Factorio的可视化编程语言。

每当一个子群体出现,他们具有完全不同的背景、说着不同的语言,生产出完全不同的产品,并使用完全不同的工具集,他们最终会分裂成为自己的群体。

1+2=3:从Software 2.0到Software 3.0的演进中代码的作用

6年前,Andrej Karpathy撰写了一篇非常有影响力的文章,描述了Software 2.0,对比了精确建模逻辑的“经典堆栈”手写编程语言与近似逻辑的“机器学习”神经网络堆栈,使软件能够解决比人类模拟更多的问题。今年,他在接下来的文章中指出,最热门的新编程语言是英语,最终填补了他在原始文章中未标注的灰色区域。

更新:Karpathy的回应——意见不合

去年,Prompt Engineering是关于工作将如何改变的流行观点,因为人们开始使用GPT-3和稳定扩散进行工作。人们嘲笑AI初创公司为“OpenAI包装商”,并担心LLM应用程序容易受到提示注入和反向提示工程的影响。没有moat可言?

但是,2023年最重要的主题之一实际上是重新确立人类编写代码的作用,以编排和替代LLM的力量,从超过2亿美元的巨头Langchain,到受Nvidia支持的Voyager展示了代码生成和重用的重要性(最近我参加了与Harrison的Chain 和 Agents的在线研讨会)。Prompt Engineering既被过度炒作又被保留下来,但软件3.0应用中软件1.0范式的再次出现既是机遇和困惑的领域,也为一大批初创公司创造了白色空间。

如果你没有市场地图,那你真的算得上一名风险投资人吗?

当然,这不仅仅是人类编写的代码。我最近使用的smol-developer、更大范围的gpt-engineer以及其他代码生成代理,如Codium AI、Codegen.ai和Morph/Rift,将越来越成为AI工程师工具包的一部分。随着人类工程师学会利用人工智能,人工智能也将越来越多地进行工程工作,直到有一天,我们抬头望去,再也分不清楚区别了。

是时候汇聚在一起了 - AI工程师峰会

建造者们需要一个交流的地方。因此,在组织了几个小型聚会几个月后,我们现在宣布第一个独立举办的面向建造者的AI会议:AI工程师峰会

看看我们漂亮的域名 - ai.engineer!

如果您对本文中的一切感兴趣,我们计划召集所有顶级的AI工程师、创始人和投资者,共同了解最前沿的技术,参加/教授工作坊,并找到从在工作中使用的新工具到下一位新雇员/联合创始人/融资的一切。

这是我们过去一年在本通讯和播客中讨论的一切的终极会议,以及更多内容:

  • AI用户体验
  • AI开发工具
  • AI基础设施
  • AI代理
  • 新的LLM工具,包括Langchain、Vector DB等等
  • 开源模型(训练、微调、推理、评估)

我有相当多的社区管理经验,但从未组织过一个500人的会议,所以我与Reactathon的Ben Dunphy合作,举办旧金山(以及在线)最好的AI工程师会议(他最近举办的一场会议有20,000多人远程参与)。

我们是建造者

敏锐的观察者会注意到,我们逐渐将Latent Space播客和通讯调整以迎合AI工程师的角色。为我最兴奋的是为这个受众提供技术乐观主义和实用主义的结合。Marc Andreesen最近写道,绝大多数公众关于人工智能的讨论都是“歇斯底里的恐惧和偏执狂”。在谱系中的另一端,有很多不认真的加速主义者和令人无法忍受的foomer threadbois整天在推特上谈论遥远的乌托邦未来,但他们正在采取什么行动来实现它还不清楚。

AI工程师将驯服并驾驭Shoggoth。

让我们把它变成现实。

评论

所有评论

推荐阅读

  • Polymarket周一将发布重大公告

    3 月 21 日,Polymarket 团队成员 Mustafa 发文表示,将于周一公布一项「重大公告」,具体内容尚未披露。

  • Polymarket将于下周一公布重大消息,或为发币或融资相关消息

    Cointime 报道,3月21日消息,Polymarket 官方团队成员 Mustafa 于 X 平台发文表示,下周一即将公布重大消息。因推文内容包含硬币符号,社区猜测或为融资或代币发射相关重大消息。 此前消息,预测市场平台 Kalshi 与 Polymarket 据悉正与潜在投资者洽谈新一轮融资,目标估值均约为 200 亿美元。日前,Kalshi 已完成新一轮超 10 亿美元融资,估值达 220 亿美元,较去年 12 月上一轮融资时的 110 亿美元估值翻倍。知情人士透露,本轮融资由 Coatue Management 领投,Kalshi 目前的年化收入为 15 亿美元。

  • 美众议院金融服务委员会将于3月25日举行代币化听证会,聚焦资本市场未来

    3 月 21 日,美国众议院金融服务委员会将于美东时间 3 月 25 日 10:00 举行听证会,主题为「代币化与资本市场的未来」,预计将重点讨论区块链技术在金融体系中的应用与监管方向。

  • 黄金创43年来最大周跌幅:一周暴跌11%,避险属性遭质疑

    3 月 21 日,受中东局势升级及利率预期影响,黄金价格大幅下挫,创下自 1983 年以来最大单周跌幅。现货黄金周五跌至约 4488 美元/盎司,单周累计下跌约 11%,自 2 月底以来累计跌幅已超 15%。市场分析认为,美联储年内或维持利率不变、鲍威尔关于通胀上行的表态削弱了黄金吸引力。同时,在伊朗冲突背景下,比特币表现相对更强,期间反弹超 11%,对黄金形成对比。

  • 分析:加密市场山寨币交易量大幅下滑,市场兴趣持续降温

    3 月 21 日,Cryptoquant 分析师 Darkfost 发文称,加密市场山寨币交易量持续走低,投资者兴趣明显减弱。在熊市背景及地缘政治不确定性影响下,山寨币表现持续跑输比特币,风险偏好显著收缩。当前,Binance 山寨币日交易量约为 77 亿美元,其它主要交易所合计约 188 亿美元,远低于 2025 年 10 月与 2 月高峰期(Binance 曾达 400 亿至 500 亿美元,其它平台达 630 亿至 910 亿美元)。目前 Binance 占据约 40% 的市场份额。分析指出,历史上交易量高峰往往对应市场阶段性顶部与 FOMO 情绪释放,而当前低迷成交环境也意味着潜在机会通常出现在市场关注度最低阶段。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    3 月 21 日,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。

  • 中东冲突与加息预期共振:全球资产大震荡,美股四连跌、债市「血洗」、黄金创43年最大周跌幅

    3 月 21 日,中东局势持续升级叠加 Federal Reserve 加息预期骤然升温,全球市场遭遇系统性冲击。美股连续第四周下跌创一年最长跌势,纳指单日跌超 2%,科技股全线承压;全球债市收益率大幅飙升,美债、英债、德债均创多年新高,资金大规模去杠杆。大宗商品剧烈分化,黄金跌破 4500 美元关口,单周暴跌超 10%,创 1983 年以来最大跌幅,避险属性遭质疑;原油则因中东供应风险暴涨,布油重返 110 美元上方,迪拜原油期货单日飙升超 16%。与此同时,比特币在 7 万美元附近获得支撑,连续三周跑赢黄金。市场分析认为,地缘冲突推升能源价格并加剧通胀预期,迫使货币政策路径重定价,全球金融条件快速收紧,风险资产仍处于下行与再定价过程中。

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)