NVIDIA NeMo 通过 AutoModel 功能增强 Hugging Face 模型集成
By: blockchain news|2025/05/13 15:45:04
0
分享
NVIDIA 推出了 NeMo 框架的重大增强,推出了 AutoModel 功能,旨在简化 Hugging Face 模型的集成和微调。根据 NVIDIA 官方博客 的说法,该开发旨在支持最先进模型的 Day-0 支持,使组织能够高效利用生成式 AI 的最新进展。 AutoModel:模型集成的新纪元 AutoModel 功能作为 NeMo 框架内的高级接口,允许用户轻松微调来自 Hugging Face 的预训练模型。起初涵盖文本生成和视觉语言模型,AutoModel 计划扩展到视频生成和其他分类。该功能简化了模型并行的过程,通过 JIT 编译增强 PyTorch 性能,并确保无缝过渡到由 NVIDIA Megatron-Core 提供支持的最佳训练和后训练方案。 AutoModel 的引入解决了将新模型架构集成到 NeMo 框架中的挑战,提供了利用 Hugging Face 庞大模型库的简单途径。该功能通过完全分片的数据并行 2 (FSDP2) 和分布式数据并行 (DDP) 支持模型并行,未来扩展包括张量并行 (TP) 和上下文并行 (CP)。 高效训练和可扩展性 AutoModel 接口启用开箱即用的模型并行和增强的 PyTorch 性能,允许组织高效扩展它们的 AI 解决方案。集成使导出至 vLLM 进行优化推理变得轻而易举,计划很快引入 NVIDIA TensorRT-LLM 导出。这确保了组织能够维持高吞吐量和可扩展性,这对于竞争激烈的 AI 领域至关重要。 AutoModel 还提供了无缝的“选择加入”高性能 Megatron-core 路径,允许用户通过最小化代码修改切换到优化训练。一致的 API 确保了对 Megatron-Core 支持路径的最大吞吐量过渡是简单的。 扩展 NeMo 的能力 AutoModel 的引入是 NVIDIA 增强 NeMo 框架能力的更广泛战略的一部分。该功能不仅支持文本生成的 AutoModelForCausalLM 类,还允许开发人员通过创建子类来扩展对其他任务的支持,从而拓宽 AI 应用的范围。 随着 NeMo 框架 25.02 的发布,鼓励开发人员通过 NVIDIA 的 GitHub 仓库提供的教程笔记本探索 AutoModel。社区也被邀请提供反馈并为 AutoModel 功能的持续开发做出贡献,以确保其持续演变以满足尖端 AI 研究和开发的需求。 随着 AI 领域的快速发展,NVIDIA 的 NeMo 框架及其 AutoModel 功能,将自身定位为组织寻求最大化生成 AI 模型潜力的关键工具。通过实现无缝集成和优化性能,NeMo 框架使团队能够始终站在 AI 创新的前沿。 nvidia ai 模型 hugging face nemo 框架
猜你喜欢

如何看待Crypto式微后的Neobanks时代?
加密新型银行不只是把银行搬到链上,而是在重构资金存、花、增、借的运行轨道

《经济学人》:在亚洲,稳定币正成为新的金融基础设施
投机性加密货币或许摇摇欲坠,但稳定币正在亚洲站稳脚跟。

为什么大多数加密代币,注定无法复利
复利需要留存、配置和决策,而大多数加密代币只参与分配,不参与经营

从劳埃德咖啡馆到Polymarket:预测市场正在重构保险行业
历史总是在不经意间完成轮回。

a16z合伙人自述:精品VC已死,做大规模才是VC的终局
「VC 行业正处于从『判断力驱动』向『赢得交易能力驱动』的范式转移中。」

无题
很抱歉,我似乎没有收到原文的任何内容供我改写……

量子威胁面前,比特币核心开发者选择了无视
当真正的风险尚未被承认为「当下问题」时,比特币是否具备在必要时快速转向的治理能力

别只盯着交易量,教你看懂永续合约的「真假繁荣」
六个月内的累计永续交易量增长量已经超过此前四年的总和。

华尔街 2.0:Ondo Finance 达成银行和代币化之间的开创性联盟
要点:Ondo Finance、贝莱德和白宫之间的联盟有望通过使用区块链技术将股票代币化来彻底改变金融市场……

联合国教科文组织警告称,到 2028 年,人工智能的颠覆性发展可能会使创作者的收入减少近 25%
关键要点:联合国教科文组织警告称,人工智能生成的内容可能会导致音乐创作者的收入损失高达24%……

全民转向AI,加密并不是为人类设计的?
随着AI代理成为主要接口,加密或许终于迎来了真正适配它的使用者
WEEX AI 交易黑客马拉松:关于人工智能交易和预测市场未来的 3 个关键见解
深入了解 WEEX AI 交易黑客马拉松 AMA 的关键要点。从平台构建者、预测市场专家和获奖交易员那里获得关于人工智能交易未来、如何交易社交情绪以及为什么人机协作是终极优势的 3 个关键见解。
超越战场:PS5大奖、1,000 USDT空投及来自伊斯坦布尔的WEEX人工智能交易核心洞察
获取人工智能交易前沿的关键洞察:对伊斯坦布尔实盘对决的分析揭示了人类直觉胜过人工智能的时刻,以及算法领先指数较高的领域。探索协作交易的未来。

2026春节,巨头为何豪掷45亿疯狂补贴AI支付?
谁能捕捉更多意图,谁能更高效地满足这些意图,谁就能在未来的商业战争中占据绝对的主动。

彭博社:a16z何以成为美国AI政策背后的关键力量?
白宫与国会共和党高层在制定 AI 相关政策时,通常第一个致电咨询的外部机构就是 a16z。
盈利超1.5万美元:WEEX黑客松预赛优胜者领跑加密货币市场的4大AI交易秘诀
WEEX黑客松顶尖AI交易策略如何在加密货币市场盈利超1.5万美元:震荡行情下ETH、BTC交易、市场结构分析及风险管理的4条实用准则。

比特币带头大哥的镰刀,一场纳斯达克抢劫实录
从23倍溢价到归零,散户是如何被合法吃干抹净的?

ARK Invest:稳定币正在构建下一代货币体系
如今稳定币的局面与 1913 年之前的私人发行货币极其相似。