这些初创公司正在无需数据中心的情况下构建先进AI模型
研究人员利用遍布全球的 GPU,结合私有和公开数据,训练出了一种新型大语言模型(LLM)。这一举措表明,构建人工智能的主流方式可能会被颠覆。
Flower AI 和 Vana 这两家追求非传统 AI 构建方式的初创公司合作开发了这一新模型,名为 Collective-1。
Flower 开发的技术允许训练过程分布在通过互联网连接的数百台计算机上。该公司的技术已被一些公司用于训练 AI 模型,无需集中计算资源或数据。Vana 则提供了包括 X、Reddit 和 Telegram 上的私人消息等数据来源。
Collective-1 按现代标准来看规模较小,拥有 70 亿个参数——这些参数共同赋予模型能力——相比之下,当今最先进的模型(如驱动 ChatGPT、Claude 和 Gemini 的模型)拥有数千亿参数。
剑桥大学计算机科学家、Flower AI 联合创始人 Nic Lane 表示,这种分布式方法有望扩展到远超 Collective-1 的规模。Lane 补充说,Flower AI 正在使用常规数据训练一个 300 亿参数的模型,并计划在今年晚些时候训练一个 1000 亿参数的模型——接近行业领导者提供的规模。「这可能会彻底改变人们对 AI 的看法,所以我们正在全力以赴,」Lane 说。他还表示,这家初创公司正在将图像和音频纳入训练,以创建多模态模型。
分布式模型构建还可能动摇塑造 AI 行业的权力格局。
目前,AI 公司通过将海量训练数据与集中在数据中心的大量计算资源结合,构建模型。这些数据中心充满先进的 GPU,并通过超高速光纤电缆联网。它们还高度依赖通过抓取公开(尽管有时涉及版权)的材料(如网站和书籍)创建的数据集。
这种方法意味着,只有最富有的公司和拥有大量最强大芯片的国家,才能切实开发出最强大、最有价值的模型。即使是开源模型,如 Meta 的 Llama 和 DeepSeek 的 R1,也由拥有大型数据中心的公司构建。分布式方法可能使小型公司和大学通过聚合同质资源来构建高级 AI。或者,它可能使缺乏传统基础设施的国家通过联网多个数据中心来构建更强大的模型。
Lane 认为,AI 行业将越来越倾向于允许训练突破单个数据中心的新方法。分布式方法「让你能够以比数据中心模型更优雅的方式扩展计算能力,」他说。
新兴技术安全中心 AI 治理专家 Helen Toner 表示,Flower AI 的方法「有趣且可能非常相关」于 AI 竞争和治理。「它可能难以跟上前沿,但可能是一种有趣的快速跟随方法,」Toner 说。
分而治之
分布式 AI 训练涉及重新思考用于构建强大 AI 系统的计算分配方式。创建 LLM 需要将大量文本输入模型,调整其参数以生成对提示的有用响应。在数据中心内,训练过程被分割,以便在不同 GPU 上运行部分任务,然后定期整合成单一的主模型。
新方法允许通常在大型数据中心内完成的工作在可能相距数英里的硬件上执行,并通过相对较慢或不稳定的互联网连接进行连接。
一些大公司也在探索分布式学习。去年,谷歌的研究人员展示了一种名为 DIstributed PAth COmposition(DiPaCo)的新方案,用于分割和整合计算,使分布式学习更高效。
为了构建 Collective-1 和其他 LLM,Lane 与英国和中国的学术合作者开发了一种名为 Photon 的新工具,使分布式训练更高效。Lane 表示,Photon 改进了谷歌的方法,采用了更高效的数据表示方式和共享及整合训练的方案。这一过程比传统训练慢,但更灵活,允许添加新硬件以加速训练,Lane 说。
Photon 由北京邮电大学和浙江大学的研究人员合作开发。该团队上个月以开源许可发布了该工具,允许任何人使用这种方法。
Flower AI 在构建 Collective-1 的努力中的合作伙伴 Vana,正在开发新方法让用户与 AI 构建者共享个人数据。Vana 的软件允许用户将来自 X 和 Reddit 等平台的私人数据贡献给大语言模型的训练,并可能指定允许的最终用途,甚至从他们的贡献中获得经济利益。
Vana 联合创始人 Anna Kazlauskas 表示,这一想法是让未被利用的数据可用于 AI 训练,同时让用户对其信息如何用于 AI 有更多控制权。「这些数据通常无法纳入 AI 模型,因为它们不是公开的,」Kazlauskas 说,「这是用户直接贡献的数据首次被用于训练基础模型,用户对其数据创建的 AI 模型拥有所有权。」
伦敦大学学院计算机科学家 Mirco Musolesi 表示,分布式 AI 训练方法的一个关键好处可能是它解锁了新型数据。「将其扩展到前沿模型将使 AI 行业能够利用分散且隐私敏感的大量数据,例如在医疗保健和金融领域,用于训练,而无需数据集中化的风险,」他说。
本文来自投稿,不代表BlockBeats观点。
猜你喜欢

遭Vitalik质疑后,L2们正集体告别「廉价」时代
WEEX人工智能交易黑客马拉松巴黎研讨会揭晓:零售加密货币交易者如何超越对冲基金
见证WEEX巴黎人工智能交易黑客马拉松如何揭示人工智能相较于人类交易员的优势。探索核心策略、实盘竞赛结果及如何构建专属人工智能交易机器人。

Optimism 价格预测 2026–2032:OP代币能否延续其上升轨迹?
关键要点:乐观主义(OP)代币预计到2026年底,其价格将在最低…之间波动。

最贵的一次拒绝:CZ赢了商战,却在AI门口「踏空」了200亿

BTC腰斩,但比特币钱包依然估值40亿

纽约时报:USD1已成为特朗普家族的加密引擎

IBIT真能引爆全市场清算吗?

a16z:预测市场的「超级碗时刻」

对话Cathie Wood:关于2026 Big Ideas的八个见解
WEEX人工智能交易黑客马拉松2026:顶级人工智能策略如何主导真实市场
WEEX人工智能交易黑客马拉松证明,高效交易——无论由人工智能驱动还是基于人类判断——都依赖于核心原则:理解市场结构、保持信念、注重质量而非数量,以及智能管理风险。
WEEX人工智能交易黑客马拉松 vs.其他人工智能交易竞赛:哪种更适合你?
人工智能交易赛格局为发展提供了不同的路径。WEEX AI 交易黑客马拉松的 独特之处在于它专注于真实市场执行和实际可行性,使其成为有抱负的量化交易员和策略师的关键平台。
人工智能交易正在取代人类吗?WEEX黑客马拉松揭示金融科技未来图景
WEEX人工智能交易黑客马拉松揭示,交易的未来不在于人工智能取代人类,而在于两者的协同合作。人工智能增强了交易能力,但人类的判断力、道德观和战略监督仍不可或缺。

预测市场被低估的优势:逆行情,反波动,随时有得玩
解读策略公司最新财务报告:在124亿美元亏损后,比特币飞轮还能持续运转多久?
当财报成为比特币价格的心电图,Strategy已非单纯的公司——它是一场实验,在检验信念能否战胜重力。

了解如何参与质押
质押是 WEEX 平台推出的数字资产收益产品。通过订阅质押产品,用户可以质押闲置的数字资产并获得相应的质押奖励。
WEEX 开启黄金白银合约 0 费率,提供加密寒冬避风港
深潮 TechFlow 消息,2 月 9 日,WEEX 唯客交易所宣布于 2 月 9 日 20:00 至 3 月 9 日 20:00 (UTC+8) 正式开启黄金白银合约 0 费率活动。活动期间,用户参与黄金代币 PAXG、XAUT 和白银代币 XAG 合约交易,无论 Maker 还是 Taker 均免手续费,交易量达标还可延长 0 费率权益时间,最长可延长 60 天。

WEEX AI Trading黑客松决赛规则说明
这篇文章主要介绍了 WEEX AI Trading 黑客松决赛的整体规则,包括参赛形式、赛程安排、交易与技术要求、AI 使用规范、比赛资金规则以及奖励机制,帮助参赛者全面了解决赛的参赛标准与评审方式。
人工智能代理正在取代加密货币研究?自主人工智能如何重塑加密货币交易
人工智能正从辅助交易者转向自动化整个加密货币市场的研究到执行流程。优势已从人类洞察力转向数据管道、速度和可立即执行的AI系统,AI整合的延迟正成为竞争劣势。
遭Vitalik质疑后,L2们正集体告别「廉价」时代
WEEX人工智能交易黑客马拉松巴黎研讨会揭晓:零售加密货币交易者如何超越对冲基金
见证WEEX巴黎人工智能交易黑客马拉松如何揭示人工智能相较于人类交易员的优势。探索核心策略、实盘竞赛结果及如何构建专属人工智能交易机器人。
Optimism 价格预测 2026–2032:OP代币能否延续其上升轨迹?
关键要点:乐观主义(OP)代币预计到2026年底,其价格将在最低…之间波动。