Cointime

扫码下载App
iOS & Android

人工智能时代,谁将引领应用创新?AI工程师的崛起如何改变游戏规则?

作者: SWYX. 编译:Cointime.com QDD

我们正在目睹应用人工智能的一次“右移”现象,这得益于基础模型的新兴能力和开源/API的可用性。

在2013年,完成一系列人工智能任务通常需要5年时间和一个研究团队,而在2023年,只需要API文档和一个闲暇的下午就可以完成。

正如我们在Spaces聊天中讨论的那样,API界线是渗透性的 - AI工程师可以向左调整/托管模型,研究工程师也可以向右构建API。但是,他们的相对优势和“归属基地”是明确的。

然而,魔鬼在细节中 - 成功评估、应用和产品化人工智能存在无数挑战:

  • 模型:从评估最大的GPT-4和Claude模型,到最小的开源Huggingface、LLaMA和其他模型。
  • 工具:从最受欢迎的链式、检索和向量搜索工具,如LangChain、LlamaIndex和Pinecone,到新兴的自主代理领域,如Auto-GPT和BabyAGI(Lilian Weng在这里提供了一个必读的回顾)。
  • 新闻:除此之外,每天发布的论文、模型和技术的数量随着兴趣和资金的增加呈指数级增长,以至于跟上这一切几乎成了一项全职工作。

我对此持认真和字面的态度。我认为这是一项全职工作。我认为软件工程将催生一个新的子学科,专门研究人工智能的应用,并有效地使用新兴的技术堆栈,就像“可靠型站点工程师”、“DevOps工程师”、“数据工程师”和“分析工程师”一样。

这一角色新兴的(并且最不尴尬的)版本似乎是:AI工程师。

我所知道的每个初创公司都有一个名为#discuss-ai的Slack频道。这些频道将从非正式的小组变成正式的团队,就像AmplitudeReplitNotion一样。成千上万的软件工程师正在为公司的API和开源模型进行生产工作,无论是在公司的工作时间还是在晚上和周末,在公司的Slack或独立的Discord中,他们将专业化并汇聚到一个称号下 - AI工程师。这很可能是本十年最需求量最大的工程职位。

AI工程师无处不在,从微软和谷歌这样的大公司,到领先的初创公司,如Figma(通过收购Diagram)、Vercel(例如Hassan El Mghari的RoomGPT)和Notion(例如Ivan Zhao和Simon Last的Notion AI),再到像Simon WillisonPieter LevelsPhoto/InteriorAI)和Riley Goodside(现在在Scale AI工作)这样的独立黑客。他们在Anthropic公司以prompt engineering的方式赚取30万美元/年,在OpenAI建立软件赚取90万美元。他们在AGI House上度过空闲的周末,分享/r/LocalLLaMA上的技巧。他们所有人的共同之处是将人工智能的进步塑造成数以百万计的真实产品,几乎是一夜之间。

一个博士学位都看不到。在推出人工智能产品时,你需要工程师,而不是研究人员。

AI与ML工程师的翻转

我提醒大家注意这一趋势,而不是开启它。Indeed上有10倍于AI工程师职位ML工程师职位,但“AI”增长率更高,因此我预测这个比例将在5年内颠倒。

每月工作趋势(根据HN招聘数据)

所有职位头衔都有缺陷,但有些是有用的。我们对于AI和ML之间的区别进行无休止的语义争论感到警惕和疲倦,我们也很清楚,普通的“软件工程师”角色完全能够构建人工智能软件。然而,最近有一个关于如何进入AI工程领域的问答贴子,说明了市场上仍然存在的基本观念:

2023年6月截图:“如何进入AI工程”的最受赞同的答案

大多数人仍然认为AI工程是机器学习或数据工程的一种形式,因此他们推荐的先决条件是相同的。但我向你保证,我提到的那些高效的AI工程师中没有一个人完成过等同于Andrew Ng的Coursera课程的工作,他们也不懂PyTorch,也不知道数据湖(Data Lake)和数据仓库(Data Warehouse)之间的区别。

在不久的将来,没有人会推荐通过阅读《Attention is All You Need》来开始学习AI工程,就像你不会通过阅读福特T型车的图纸来开始学开车一样。当然,理解基本原理和历史总是有帮助的,并且可以帮助您找到尚未为人所知的想法和效率/能力增益。但有时你只需使用产品并通过实际体验来了解它们的特性。

我不指望这种课程的“翻转”会一夜之间发生。人类天性就是想要填写简历,填写市场地图,并通过引用更权威的深层次话题来突出自己。换句话说,Prompt Engineering和AI Engineering在相当长的一段时间内都会比拥有良好数据科学/机器学习背景的人感到逊色。然而,我认为需求和供应的经济学规律将占上风。

为什么现在出现了AI工程师

  • 基础模型是“少样本学习器”,具有上下文学习甚至零样本迁移的能力,可以推广到模型训练者最初意图之外的领域。换句话说,创建模型的人并不完全了解它们的能力。那些不是LLM研究人员的人可以通过更多地与模型交互,并将其应用于研究未充分重视的领域(例如Jasper的文案写作),从而发现并利用这些能力。
  • 微软、谷歌、Meta和大型基础模型实验室占据了稀缺的研究人才,实际上提供了“AI研究即服务”的API。你不能雇佣他们,但如果你有软件工程师知道如何与他们合作,你可以租用他们。世界上大约有5000名LLM研究人员,但有约5000万名软件工程师。供应约束决定了将会涌现出一类介于两者之间的AI工程师,以满足需求。
  • GPU囤积。当然,OpenAI/微软是第一家,但Stability AI通过强调他们的4000个GPU集群掀起了初创公司GPU竞赛的热潮。
还记得2022年10月吗?

自那时以来,新的初创公司(如Inflection,13亿美元;Mistral,1.13亿美元;Reka,5800万美元;Poolside,2600万美元;Contextual,2000万美元)已经成为拥有自己硬件的巨大种子轮融资的常见现象。甚至丹·格罗斯(Dan Gross)和纳特·弗里德曼(Nat Friedman)宣布了他们的1000万美元、10亿亿次浮点运算GPU集群Andromeda,专门为他们投资的初创公司。全球芯片短缺反过来又创造了更多的短缺。在API线的另一边,AI工程师将有更多的容量来使用模型,而不是训练模型。

  • 先火再瞄准。不再要求数据科学家/机器学习工程师在训练一个特定领域的模型之前进行费力的数据收集工作,然后将其投入生产。现在,产品经理/软件工程师可以提示LLM,构建/验证产品想法,然后获取特定数据进行优化。

假设后者的数量比前者多100到1000倍,而提示LLM原型的“先火再瞄准”工作流使您能够比传统机器学习更快地进行10到100倍的工作。因此,AI工程师能够以更便宜的方式验证AI产品。这就是瀑布与敏捷的区别。AI是敏捷的。

  • 从Python到JavaScript。数据/人工智能传统上非常依赖Python,最初的AI工程工具,如LangChain、LlamaIndex和Guardrails,也出自同一个社区。然而,JavaScript开发者与Python开发者的数量至少相当,因此现在的工具越来越多地面向这个广泛扩展的受众,从LangChain.js和Transformers.js到Vercel的新AI SDK。市场的扩大和机会是巨大的。
  • 生成式AI vs分类器机器学习。术语“生成式AI”已经不再流行,为其他类比诸如“推理引擎”让路,但它仍然有助于简明地阐明现有的MLOps工具和ML从业者与新兴的、截然不同的人物类型之间的差异。新一代机器学习可能更加关注欺诈风险、推荐系统、异常检测和特征存储,而AI工程师正在构建写作应用程序、个性化学习工具、自然语言电子表格和类似Factorio的可视化编程语言。

每当一个子群体出现,他们具有完全不同的背景、说着不同的语言,生产出完全不同的产品,并使用完全不同的工具集,他们最终会分裂成为自己的群体。

1+2=3:从Software 2.0到Software 3.0的演进中代码的作用

6年前,Andrej Karpathy撰写了一篇非常有影响力的文章,描述了Software 2.0,对比了精确建模逻辑的“经典堆栈”手写编程语言与近似逻辑的“机器学习”神经网络堆栈,使软件能够解决比人类模拟更多的问题。今年,他在接下来的文章中指出,最热门的新编程语言是英语,最终填补了他在原始文章中未标注的灰色区域。

更新:Karpathy的回应——意见不合

去年,Prompt Engineering是关于工作将如何改变的流行观点,因为人们开始使用GPT-3和稳定扩散进行工作。人们嘲笑AI初创公司为“OpenAI包装商”,并担心LLM应用程序容易受到提示注入和反向提示工程的影响。没有moat可言?

但是,2023年最重要的主题之一实际上是重新确立人类编写代码的作用,以编排和替代LLM的力量,从超过2亿美元的巨头Langchain,到受Nvidia支持的Voyager展示了代码生成和重用的重要性(最近我参加了与Harrison的Chain 和 Agents的在线研讨会)。Prompt Engineering既被过度炒作又被保留下来,但软件3.0应用中软件1.0范式的再次出现既是机遇和困惑的领域,也为一大批初创公司创造了白色空间。

如果你没有市场地图,那你真的算得上一名风险投资人吗?

当然,这不仅仅是人类编写的代码。我最近使用的smol-developer、更大范围的gpt-engineer以及其他代码生成代理,如Codium AI、Codegen.ai和Morph/Rift,将越来越成为AI工程师工具包的一部分。随着人类工程师学会利用人工智能,人工智能也将越来越多地进行工程工作,直到有一天,我们抬头望去,再也分不清楚区别了。

是时候汇聚在一起了 - AI工程师峰会

建造者们需要一个交流的地方。因此,在组织了几个小型聚会几个月后,我们现在宣布第一个独立举办的面向建造者的AI会议:AI工程师峰会

看看我们漂亮的域名 - ai.engineer!

如果您对本文中的一切感兴趣,我们计划召集所有顶级的AI工程师、创始人和投资者,共同了解最前沿的技术,参加/教授工作坊,并找到从在工作中使用的新工具到下一位新雇员/联合创始人/融资的一切。

这是我们过去一年在本通讯和播客中讨论的一切的终极会议,以及更多内容:

  • AI用户体验
  • AI开发工具
  • AI基础设施
  • AI代理
  • 新的LLM工具,包括Langchain、Vector DB等等
  • 开源模型(训练、微调、推理、评估)

我有相当多的社区管理经验,但从未组织过一个500人的会议,所以我与Reactathon的Ben Dunphy合作,举办旧金山(以及在线)最好的AI工程师会议(他最近举办的一场会议有20,000多人远程参与)。

我们是建造者

敏锐的观察者会注意到,我们逐渐将Latent Space播客和通讯调整以迎合AI工程师的角色。为我最兴奋的是为这个受众提供技术乐观主义和实用主义的结合。Marc Andreesen最近写道,绝大多数公众关于人工智能的讨论都是“歇斯底里的恐惧和偏执狂”。在谱系中的另一端,有很多不认真的加速主义者和令人无法忍受的foomer threadbois整天在推特上谈论遥远的乌托邦未来,但他们正在采取什么行动来实现它还不清楚。

AI工程师将驯服并驾驭Shoggoth。

让我们把它变成现实。

评论

所有评论

推荐阅读

  • 前FTX高管Ryan Salame请求法庭从宽处理,判处其18个月监禁

    根据周二提交的一份量刑备忘录,前FTX高管Ryan Salame于去年9月承认共谋非法政治献金以及共谋经营无证汇款业务的罪名 ,其律师请求法庭从宽处理,判处其18个月的刑期。RyanSalame在FTX和Alameda任职期间,为FTX客户管理电汇存款和法币兑换,利用Alameda的资金参与政治献金,并在巴哈马领导慈善活动。 在提交的文件中,其律师辩称,Salame在被关闭的公司中扮演的角色与欺诈的核心关系不大,更多的是操作性的。他们还提到了萨拉梅与当局的合作、真正的悔意、为解决药物滥用问题所做的努力,以及交易所倒闭给他造成的重大个人和经济损失。

  • 让 ICO 回归:分布式代币发行 (DTL)

    DTL 的核心焦点是将代币及其技术交到真实用户手中,而不仅仅是投机者。

  • 宏观思考:并非都是厄运和阴霾

    这可能是一次健康的重置。

  • 5月15日早间要闻速递

    1.美国比特币ETF持有价值近600亿美元的BTC

  • 香港警方逮捕100万元USDT诈骗团伙,检获 3000 张冥币

    据星岛日报报道,香港警方于 4 月 12 日接获一名35岁男子报案,称其在尖沙咀一店铺转售约值 100 万元的虚拟货币 USDT 后未能收回现金,怀疑被骗。

  • 前总统特朗普赢得内布拉斯加州共和党党内初选

    据美国《国会山报》统计报道,美国现任总统拜登赢得2024年美国总统选举在内布拉斯加州的民主党党内初选,前总统特朗普赢得该州共和党党内初选。

  • 成都公安公布两起以虚拟货币为媒介向国外转移资产、虚开发票骗取国家退税资金的典型案例

    今天是全国第十五个“5·15”打击和防范经济犯罪宣传日,川渝公安经侦部门联合开展的打击和防范经济犯罪宣传日活动在成都天府国际金融中心举行。 活动现场,成都公安公布了两起经济犯罪典型案例。其中,成都市公安局侦破涉案金额高达138亿元的特大地下钱庄案,犯罪嫌疑人以USDT泰达币为媒介,逃避国家外汇监管,非法提供外汇结算渠道,该案涉及全国26各省(市、自治区),如今公安机关已在全国范围内抓获犯罪嫌疑人193名。

  • 昨日Tether发行1.1亿美元的USDT,赎回2300万美元的USDT

    据ChainArgos监测,Tether于5月14日共发行1.1亿美元的USDT,同时赎回了2300万美元的USDT。

  • 萨尔瓦多为新机场酒店启动基于比特币的融资

    萨尔瓦多启动宣布圣萨尔瓦多国际机场的度假酒店进行比特币融资,目标融资目标为625万美元。资金将用于建造一座占地4,484平方米的五层设施,设有80间客房、商业空间、游泳池和其他设施。 该酒店位于机场内,使其成为该地区唯一的酒店服务提供商。 该投资机会的最低投资额为 1,000 美元,共有 6,250 种代币可供选择,每种代币每半年支付 10% 的年收益率。 该项目由Inversiones Laguardia SA de CV监督并通过Bitfinex证券推动。

  • 美国比特币ETF持有价值近600亿美元的BTC

    据HODL15Capital监测,美国比特币ETF目前持有价值近600亿美元的BTC,本周已累计买入2,667枚比特币,灰度GBTC是唯一净流出流出的ETF。