Cointime

扫码下载App
iOS & Android

Meta的大语言AI模型意外泄露,掀起一系列ChatGPT替代品创新!

使用 Midjourney 创建

LLama效应:一次意外的泄漏如何引发了一系列令人印象深刻的ChatGPT的开源替代品

开源和基于API的分发之间的摩擦是生成式人工智能生态系统中最有趣的战斗之一。在文本到图像领域,Stable Diffusion的发布清楚地表明开源是基础模型可行的分发机制之一。然而,在大语言模型(LLM)领域,最重要的突破来自GPT-4、Claude和Cohere等模型,这些模型仅通过API提供。这些模型的开源替代品在遵循人类指令方面没有展现出同样水平的性能。然而,一个意外的研究突破和泄露版本正在改变这种情况。

几周前,Meta AI宣布了Llama,一个旨在推进该领域研究的LLM。Llama发布了不同的版本,包括7B、13B、33B和65B的参数,尽管比其他模型小,但在许多任务中能够与GPT-3的性能相匹配。Llama最初没有开源,但在其发布一周后,该模型在4chan上被泄露,引发了成千上万的下载。

在过去的几周里,本来可以被看作是一个不幸的事件,却成为LLM领域最有趣的创新来源之一。自从Llama被泄露后,我们看到了建立在它之上的LLM代理的爆炸性创新。仅举几个例子:斯坦福大学发布了Alpaca(https://crfm.stanford.edu/2023/03/13/alpaca.html),一个基于LLama 7B模型的指令跟随模型。

在这个列表中,还有几个项目值得一提,我相信很快会有更多的项目发布。有一件事是肯定的:Llama的意外泄露可能变成了开源LLM领域最大的创新火花之一。

ML研究

OpenAI的安全性

OpenAI发表了一篇详细的博文,概述了用于确保其模型安全的一些原则。该文章强调了隐私、事实准确性和有害内容的预防等方面,这对基础模型的广泛采用至关重要(https://openai.com/blog/our-approach-to-ai-safety)。

BloombergGPT

彭博社发表了一篇论文,介绍了BloombergGPT,一个在金融数据中微调的500亿LLM。该模型以BLOOM为基础,在3630亿个token数据集上进行了微调(https://www.bloomberg.com/company/press/bloomberggpt-50-billion-parameter-llm-tuned-finance/)。

任何细分市场

Meta AI发表了一篇论文,概述了Segment Anything Model(SAM),一个用于图像分割的大规模模型。该模型与Segment Anything 1-Billion mask dataset(SA-1B)一起开源,SA-1B是有史以来发布的最大的计算机视觉分割模型(https://ai.facebook.com/blog/segment-anything-foundation-model-image-segmentation/)。

Koala

伯克利人工智能研究中心(BAIR)发布了一篇论文,详细介绍了Koala,一个为学术研究微调的对话模型。该模型以Meta AI的Llama为基础,与ChatGPT的性能相匹配(https://bair.berkeley.edu/blog/2023/04/03/koala/)。

用于超参数优化的BayesOpt

谷歌研究院发表了一篇论文,将超参数优化建模为Bayesian优化问题。该论文提出了Hyper BayesOpt,一种超参数优化算法,在BayesOpt中不再需要量化高斯过程的模型参数(https://ai.googleblog.com/2023/04/pre-trained-gaussian-processes-for.html)。

很酷的人工智能技术发布

Vicuna

Vicuna是一个基于Meta AI Llama的开源聊天机器人,与ChatGPT的质量相匹配(https://vicuna.lmsys.org/)。

ColossalChat

Colossal-AI项目的团队开源了ColossalChat,这是ChatGPT的一个开源克隆版本,具有RLHF功能(https://medium.com/@yangyou_berkeley/colossalchat-an-open-source-solution-for-cloning-chatgpt-with-a-complete-rlhf-pipeline-5edf08fb538b)。

真实世界的ML

LinkedIn的生成性人工智能

Linkedin讨论了一些构建生成式人工智能应用的经验教训和最佳实践(https://engineering.linkedin.com/blog/2023/our-learnings-from-the-early-days-of-generative-ai)。

Lyft的建议

Lyft讨论了在他们的推荐系统中使用的ML模型和架构(https://eng.lyft.com/the-recommendation-system-at-lyft-67bc9dcc1793)。

其它AI新闻

AI传奇人物Andrew Ng和Yann LeCun录制了一个会议,表达了他们对AI暂停提案的反对意见。

Quantexa为其基于人工智能的金融欺诈预防平台融资1.29亿美元。

Adthos推出了其使用生成性人工智能创建音频广告的平台。

Meta公司讨论了他们使用生成性人工智能来创建广告的举措。

机器人公司Covariant又筹集了7500万美元。

人工智能搜索公司Glean将生成性人工智能功能纳入其搜索平台。

一些泄露的文件显示,OpenAI的竞争对手Anthropic打算在未来两年内筹集约50亿美元。

评论

所有评论

推荐阅读

  • 美伊有望24小时内宣布和平协议最终达成

    5月24日,据《华盛顿时报》援引接近谈判的消息人士报道,在谈判代表批准了一项结束所有战线战斗的协议草案后,美国和伊朗预计将在24小时内宣布和平协议的最终达成。该协议仍有待两国政府最终批准。(金十)

  • 伊朗:谈判重点是结束战争 正努力敲定谅解备忘录

    5月23日,伊朗外交部发言人巴加埃23日接受伊朗伊斯兰共和国广播电视台采访表示,当前谈判重点是推动结束“被强加的战争”,暂不深入讨论核问题,伊美正在努力敲定谅解备忘录。巴加埃说,现阶段谈判不涉及核问题及其相应的解除制裁的具体细节,但伊朗要求解除制裁、尤其是释放被冻结资产等诉求,已明确写入14条谅解备忘录文本。他表示,伊朗之所以暂不深入讨论核问题,是因为认为核问题曾两度成为针对伊朗发动战争的借口。当前伊朗将重点放在推动结束包括黎巴嫩在内“所有战线上的战争”,可能在30天或60天后的下一个阶段再进入核问题的谈判。(新华社)

  • BTC跌破75000美元

    行情显示,BTC跌破75000美元,现报74988美元,24小时跌幅达到3.19%,行情波动较大,请做好风险控制。

  • Michael Saylor:Strategy 或在2026 年前出售部分比特币

    据Strategy董事长Michael Saylor 表示,公司不太可能完全不卖出比特币,或将在2026年底前出售部分BTC,并动态管理美元现金储备,以实现每股比特币数量最大化目标。截至目前,Strategy持有约84.38万枚BTC,总价值约650亿美元,平均买入成本约为7.57万美元。当前比特币价格约为7.6万美元,接近其整体持仓成本线。

  • 知情人士:美筹备对伊朗发动新一轮军事打击 但仍未最终决定

    5月23日讯,据知情人士透露,尽管外交努力仍在持续,特朗普政府当日仍在筹备对伊朗发动新一轮军事打击。截至当日下午,关于是否发动打击尚未有最终决定。特朗普在社交媒体发文称,受“与政府事务相关的特殊情况��影响,他将无法出席本周末儿子小唐纳德·特朗普的婚礼。他此前原计划在“阵亡将士纪念日”周末前往其位于新泽西州的私人高尔夫球场度假,但现已决定返回白宫。据多位消息人士透露,鉴于可能发生军事打击,美国军方和情报界的部分人员已取消了原定的“阵亡将士纪念日”周末休假计划。国防和情报官员已开始更新美国海外军事基地的紧急召回名册。与此同时,驻扎在中东的部分美军部队正分批轮换撤离战区。(央视新闻)

  • 新任美联储主席沃什:将领导一个以改革为导向的美联储

    5月23日,第17任美联储主席沃什于周五在白宫宣誓就职。沃什表示: “美联储的使命是促进物价稳定和充分就业。”他说,“当以智慧和清晰的思路、独立和坚定的决心去追求这些目标时,通胀可以降低,经济增长可以更强劲,实际到手工资可以更高,美国可以更加繁荣,而且同样重要的是,美国在世界上的地位也会更加稳固。”他补充说:“为了完成这项使命,我将领导一个以改革为导向的美联储,从过去的成功和错误中吸取教训,既要摆脱静态的框架和模式,又要坚持明确的诚信和绩效���准。”

  • 美国新版战略比特币储备法案取消“100万枚BTC”购买目标,已持有BTC拟锁定20年

    5月23日,美国众议院提出新版两党法案《American Reserve Modernization Act of 2026》(ARMA),拟将美国政府持有的比特币纳入战略储备,并要求至少锁定 20 年。与此前提出的 BITCOIN Act 不同,新法案不再要求美国政府购买 100 万枚 BTC,而是主要将通过刑事和民事没收等方式已持有或未来获得的比特币纳入储备。 同时,法案还将设立独立的数字资产库存,用于管理联邦政府持有的非比特币加密资产。根据草案,进入战略储备的比特币在 20 年内不得出售、交换、拍卖、抵押或以其他方式处置。锁定期结束后,财政部长可建议在任意两年内出售最多 10% 的储备资产。法案还要求政府按季度公开储备证明,并对比特币持仓进行第三方审计。支持者认为,美国不应出售战略性数字资产,而应将其作为现代化国家储备体系的一部分长期持有。

  • 美SEC推迟开放代币化股票交易

    5月23日,据彭博社,由于面临监管担忧及外界反对,美国 SEC 已推迟允许代币化股票交易的相关计划。报道称,SEC 目前正重新评估相关风险及市场影响。

  • BTC跌破76000美元

    行情显示,BTC跌破76000美元,现报75997.97美元,24小时跌幅达到2.28%,行情波动较大,请做好风险控制。

  • 交易员已完全预期到2026年底美联储将加息25个基点

    5月22日,市场定价显示,交易员已完全预期到2026年底美联储将加息25个基点。消息面上,美联储理事沃勒表示,美联储不应再释放降息信号,短时间内应按兵不动。