Cointime

扫码下载App
iOS & Android

价值“交换”,人工智能初创企业是怎么做的?

个人专家

原文链接:The Give-to-Get Model for AI Startups 

本文作者:David Sacks  编译:CoinTime Candice

大约20年前,一家名为Jigsaw的初创公司开创了一种新的众包模式,即用户向平台贡献数据,以换取对平台服务的使用。Jigsaw在今天基本上被遗忘了,但它所谓的“给予获得”模型可能对需要获得丰富专有数据集来训练模型的人工智能初创公司来说,是非常适合的。这些数据集对于提高人工智能模型的准确性和性能至关重要,可以提供相对于对手的竞争优势,允许针对特定行业的需求进行定制和专业化,并减少对第三方数据源的依赖。本文将讨论Jigsaw模型,它对人工智能的适用性,获得专有训练数据集的挑战,以及它可以应用的行业垂直领域。

Jigsaw和“交换”模型

Jigsaw数据公司由Jim Fowler和Garth Moulton于2004年创立。该公司的主要产品是一个大型、众包、可搜索的数据库,其中包含各行各业数百万的商业联系人。在每个人都有LinkedIn个人资料的时代,这对寻找潜在客户的销售人员来说特别有价值。

Jigsaw的众包模式围绕着积分制展开。用户可以通过贡献自己的业务联系信息,在Jigsaw的平台上创建一个免费帐户。他们还可以将新的联系人添加到数据库中以获得积分,然后用积分查看其他人发布的联系人。不想贡献自己数据的用户可以购买积分。Jigsaw还鼓励用户验证数据库中联系信息的准确性,每做一次更正就奖励他们一些积分。

2010年,Salesforce.com以1.42亿美元收购了Jigsaw,将其更名为“Data.com”,并将其与Salesforce.com生态系统整合。这使得用户可以在他们的CRM系统中直接访问更新的业务联系信息。

人工智能的“交换”模型

用户通过贡献数据来获得积分,并花费积分来获取基于该数据的服务,这种交换模式可能是人工智能初创公司的一种有效方法。在许多行业垂直领域,获得丰富的专有数据集将是产生差异化的人工智能模型的关键挑战。通过激励该行业的专业人士共享必要的数据,人工智能初创公司可以快速培训和改进他们的模型,为这些专业人士服务。

例如,一家“人工智能架构师”初创公司可以为用户贡献建筑计划和CAD图纸提供积分。然后,用户可以通过要求人工智能设计新的计划来消费积分。这种方法可以在各种行业中使用,在这些行业中,用户拥有专有数据,并愿意贡献其中的一部分,以换取利用人工智能能力。

激励用户众包可能是获取大量数据的一种具有成本效益的方式,因为它利用了社区的努力,而不是依赖付费数据收集服务。随着用户贡献更多数据并使用人工智能的服务,模型可以迭代改进,从而获得更好的性能和更有价值的洞察力。

将会有一些重要的问题需要解决。确保所提供数据的质量和准确性至关重要。初创企业可能需要实施验证流程,如同行评审或专家验证,以保持数据质量。处理专有数据还需要解决隐私和知识产权问题。初创企业可能需要确保某些数据仅用于培训目的,并且在如何使用贡献的数据方面是透明的。遵守特定行业的法规也至关重要。

最后,货币化的需求必须与积分制相平衡;否则,用户可能更愿意通过贡献数据而不是为服务付费来永久免费使用该平台。可以对积分进行限制,使用户获得折扣或获得更多的查询,而不是完全免费地享受服务。

不同行业的机会

一种交换、众包的数据收集方法可以应用于目标用户拥有培训数据的许多垂直行业。以下是这种方法可能有用的一些例子:

  1. 医疗和健康数据:人工智能模型可以极大地受益于对不同患者数据的访问,如电子健康记录、医学成像和基因组数据。用户(患者或医疗保健专业人员)可能愿意共享匿名数据以换取积分,然后积分可以用于获得人工智能驱动的健康见解、个性化治疗建议或早期疾病检测。
  2. 法律文件分析:律师事务所和法律专业人员通常可以查阅大量的法律文件,如合同、法院裁决或专利申请。通过共享这些文件,用户可以为训练法律文件分析的人工智能模型做出贡献,而作为回报,可以获得人工智能驱动的法律研究工具或合同审查服务。
  3. 艺术和创意工作:艺术家和设计师可能拥有大量自己的艺术品、草图或设计。共享这些数据可以帮助训练人工智能模型,用于转换艺术风格、生成艺术或设计辅助。然后,用户可以获得人工智能驱动的创意工具或个性化设计建议。
  4. 金融和投资:金融专业人士和投资者可能可以获得专有交易算法、投资组合数据或市场分析报告。通过共享这些数据,他们可以为金融分析和预测的人工智能模型做出贡献。而作为回报,用户可以获得人工智能驱动的投资建议、风险评估或市场预测工具。
  5. 科学研究数据:各个领域的研究人员可能可以获得通过实验或模拟生成的宝贵的数据集。通过共享这些数据,他们可以帮助训练人工智能模型,用于各自领域的数据分析、模式识别或预测性建模。然后,用户可以获得人工智能驱动的研究工具或个性化的研究建议。
  6. 制造和生产数据:参与制造和生产的公司可能拥有有关生产过程、质量控制和设备性能的专有数据。分享这些数据可以改善用于预测性维护、流程优化和质量保证的人工智能模型。然后,用户可以获得人工智能驱动的优化建议或设备监测服务。

结论

对于希望为垂直行业创建人工智能模型的初创公司来说,获得丰富的专有培训数据集将是一项关键性挑战。从这些行业的专业人士那里众包这些数据可能是解决这个问题的绝佳方法。此外,众包其实是创造了一个循环机制:随着用户为模型贡献数据,模型变得更智能、更有能力,从而吸引下一组用户,他们提供下一组数据。而这种数据网络效应应该会在企业周围形成一条强大的护城河。也就是说,初创公司必须积极解决与交换模式相关的潜在风险或不利因素,如数据质量、隐私和知识产权问题,以确保其人工智能模型的长期成功。

*本文由CoinTime整理编译,转载请注明来源。

评论

所有评论

推荐阅读

  • Polymarket周一将发布重大公告

    3 月 21 日,Polymarket 团队成员 Mustafa 发文表示,将于周一公布一项「重大公告」,具体内容尚未披露。

  • Polymarket将于下周一公布重大消息,或为发币或融资相关消息

    Cointime 报道,3月21日消息,Polymarket 官方团队成员 Mustafa 于 X 平台发文表示,下周一即将公布重大消息。因推文内容包含硬币符号,社区猜测或为融资或代币发射相关重大消息。 此前消息,预测市场平台 Kalshi 与 Polymarket 据悉正与潜在投资者洽谈新一轮融资,目标估值均约为 200 亿美元。日前,Kalshi 已完成新一轮超 10 亿美元融资,估值达 220 亿美元,较去年 12 月上一轮融资时的 110 亿美元估值翻倍。知情人士透露,本轮融资由 Coatue Management 领投,Kalshi 目前的年化收入为 15 亿美元。

  • 美众议院金融服务委员会将于3月25日举行代币化听证会,聚焦资本市场未来

    3 月 21 日,美国众议院金融服务委员会将于美东时间 3 月 25 日 10:00 举行听证会,主题为「代币化与资本市场的未来」,预计将重点讨论区块链技术在金融体系中的应用与监管方向。

  • 黄金创43年来最大周跌幅:一周暴跌11%,避险属性遭质疑

    3 月 21 日,受中东局势升级及利率预期影响,黄金价格大幅下挫,创下自 1983 年以来最大单周跌幅。现货黄金周五跌至约 4488 美元/盎司,单周累计下跌约 11%,自 2 月底以来累计跌幅已超 15%。市场分析认为,美联储年内或维持利率不变、鲍威尔关于通胀上行的表态削弱了黄金吸引力。同时,在伊朗冲突背景下,比特币表现相对更强,期间反弹超 11%,对黄金形成对比。

  • 分析:加密市场山寨币交易量大幅下滑,市场兴趣持续降温

    3 月 21 日,Cryptoquant 分析师 Darkfost 发文称,加密市场山寨币交易量持续走低,投资者兴趣明显减弱。在熊市背景及地缘政治不确定性影响下,山寨币表现持续跑输比特币,风险偏好显著收缩。当前,Binance 山寨币日交易量约为 77 亿美元,其它主要交易所合计约 188 亿美元,远低于 2025 年 10 月与 2 月高峰期(Binance 曾达 400 亿至 500 亿美元,其它平台达 630 亿至 910 亿美元)。目前 Binance 占据约 40% 的市场份额。分析指出,历史上交易量高峰往往对应市场阶段性顶部与 FOMO 情绪释放,而当前低迷成交环境也意味着潜在机会通常出现在市场关注度最低阶段。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    3 月 21 日,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。

  • 中东冲突与加息预期共振:全球资产大震荡,美股四连跌、债市「血洗」、黄金创43年最大周跌幅

    3 月 21 日,中东局势持续升级叠加 Federal Reserve 加息预期骤然升温,全球市场遭遇系统性冲击。美股连续第四周下跌创一年最长跌势,纳指单日跌超 2%,科技股全线承压;全球债市收益率大幅飙升,美债、英债、德债均创多年新高,资金大规模去杠杆。大宗商品剧烈分化,黄金跌破 4500 美元关口,单周暴跌超 10%,创 1983 年以来最大跌幅,避险属性遭质疑;原油则因中东供应风险暴涨,布油重返 110 美元上方,迪拜原油期货单日飙升超 16%。与此同时,比特币在 7 万美元附近获得支撑,连续三周跑赢黄金。市场分析认为,地缘冲突推升能源价格并加剧通胀预期,迫使货币政策路径重定价,全球金融条件快速收紧,风险资产仍处于下行与再定价过程中。

  • 美团开源560B参数定理证明模型:72次推理通过率97.1%,刷新开源模型SOTA

    据 1M AI News 监测,美团 LongCat 团队开源 LongCat-Flash-Prover,一个 5600 亿参数的 MoE 模型,专攻形式化定理证明语言 Lean4 的数学推理任务。模型权重以 MIT 协议发布,已上线 GitHub、Hugging Face 和 ModelScope。模型将形式化推理拆解为三项独立能力:自动形式化(将自然语言数学问题转化为 Lean4 形式语句)、草图生成(产出引理风格的证明框架)和完整证明生成。三项能力均通过 Agent 工具集成推理(TIR)与 Lean4 编译器实时交互验证。训练方面,团队提出 Hybrid-Experts Iteration Framework 生成冷启动数据,并在强化学习阶段引入 HisPO 算法稳定 MoE 模型的长程任务训练,同时加入定理一致性和合法性检测机制防止 reward hacking。基准测试显示,LongCat-Flash-Prover 在开源权重模型中刷新了自动形式化和定理证明两项 SOTA。MiniF2F-Test 上仅用 72 次推理即达 97.1% 通过率,ProverBench 和 PutnamBench 分别达到 70.8% 和 41.5%,每题推理次数不超过 220 次。

  • Erik Voorhees再次增持1.44万枚ETH,总持仓量突破11.7万枚

    3 月 21 日,据 AI 姨监测,ShapeShift 创始人、比特币早期支持者 Erik Voorhees 关联地址,过去 11 小时买入 14,424.53 ETH,总持仓突破 11.7 万枚,持仓均价 2,160.24 美元,当前浮亏 114.5 万美元。

  • 消息人士:特朗普政府正制定方案以夺取伊朗核材料储备

    Cointime 报道,3月21日消息,据美国哥伦比亚广播公司(CBS)报道,多位知情人士透露,特朗普政府一直在谋划获取或转移伊朗核材料的方法和选项。此时,由美国和以色列领导的针对伊朗的军事行动正进入一个更加不确定的阶段。 关于特朗普是否会下令实施此类行动,目前时机尚不明确。一位消息人士表示,他尚未做出任何决定。但两位消息人士表示,相关规划的核心是可能部署来自联合特种作战司令部的部队,该部队是精英军事单位,常负责最敏感的防扩散任务。(金十)