近日,阿里巴巴Qwen团队宣布Qwen3全系模型完成苹果MLX框架的官方适配,涵盖从0.6B(6亿参数)到235B(2350亿参数)的8个尺寸,并支持4bit、6bit、8bit、BF16四种量化精度,总计32个版本模型。
苹果MLX框架自2023年12月推出后,主要适配欧美模型(如Llama)。尽管苹果在2024年2月已确认与阿里合作开发中国版Apple Intelligence,但2025年WWDC大会仍未公布具体进展。
苹果自研的MLX框架是为Apple Silicon芯片(M1/M2/M3系列)深度优化的开源机器学习工具,而Qwen3作为阿里巴巴通义实验室的最新成果,凭借其混合架构(MoE)、多语言支持和高效推理能力,成为首个全面适配MLX的国产大模型。
此次官宣,Qwen3将成为苹果面向中国市场首个全面落地的中文大模型。
官方适配的战略意义
4 月 28 日,在 Qwen3 发布前夕,苹果 MLX Community 成员就在 X 上率先宣布完成了 Qwen3 的适配。 Huggingface 平台上,在所有 MLX 模型中,排名前五有两个都是 Qwen3 模型,这一数据充分彰显了 Qwen3 模型在苹果开发者群体中的受欢迎程度和广泛应用。
社区适配更多的是基于技术爱好者们的热情,是一种自发的 “粉丝行为”。而此次发布者变成了 Qwen 官方团队,给出了一个明确的信号:Qwen 团队将为这一技术路线提供持续、稳定、可靠的官方支持。
阿里通义千问开源负责人林俊旸在X上回应,“这是一个小更新,但由于模型太多,我们甚至需要用 Mac Studio 进行测试,所以花了不少时间。希望这些更新对 MLX 用户有所帮助!”
Qwen3 与苹果 MLX 框架的碰撞
MLX 是苹果专为 Apple Silicon 芯片设计的高效机器学习框架,提供了类 PyTorch 的 API,这对于熟悉 PyTorch 的开发者而言,降低了学习和使用成本,快速上手进行相关开发工作。同时,它兼容 Numpy 语法,Numpy 在数据处理和科学计算领域应用极为广泛。MLX 还支持 C++/Swift 扩展,这使得开发者可以根据具体需求,灵活地对框架进行定制和拓展。
利用统一内存架构是 MLX 的一大亮点。在这种架构下,数据在 CPU/GPU 间能够实现共享,带来的直接好处便是降低了功耗,同时显著提升了处理速度。MLX 具备动态图构建、多模态支持、端侧部署优化等一系列功能。这些功能的协同作用,使得它能够在 iPhone、iPad、Mac 等各种苹果设备上高效运行模型,极大地帮助开发者更轻松地进行机器学习模型训练与部署。
为更好服务开发者,通义团队推出基于 MLX 框架深度优化的全部 Qwen3 系列模型,每款模型都有 4bit、6bit、8bit 和 BF16 等 4 种不同精度的量化版本,即共有 32 款官方的 Qwen3 MLX 模型一次性全开源。这些丰富的选择允许用户根据自身设备的硬件资源情况,精准地选择合适的模型精度。
目前从 Mac Pro、Mac Studio 到 Mac mini、 MacBook ,再到 iPad 、 iPhone等,都可以部署 Qwen3。
下载地址:
Huggingface:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f
ModelScope: https://modelscope.cn/collections/Qwen3-9743180bdc6b48
对于开发者而言,这种细致的划分具有极大的实用价值。例如,低量化(如 4bit)非常适合内存有限的设备,像 iPhone,在这类设备上运行低量化模型可以在有限的硬件条件下实现轻量级 AI 助手功能,满足用户日常一些简单的 AI 需求;而高精度(如 BF16)则适合需要更高推理质量的场景,比如在配备 M2/M3 Ultra 芯片的 Mac Studio 上进行复杂 AI 内容创作时,高精度模型能够提供更优质、更准确的推理结果,助力创作者实现更出色的作品。
在激烈的 AI 竞争环境下,苹果在 AI 领域的发展进程备受关注。Qwen3这种 “量体裁衣” 式的优化,本质上是阿里与苹果硬件的一次深度且积极的协同。
Qwen3的MLX适配,直接解决了苹果在中国市场的本地化需求。通过开源策略,阿里巴巴吸引开发者共建生态,为国行版Apple Intelligence的推出奠定基础。
对阿里巴巴而言,Qwen3成为首个适配苹果生态的国产大模型,打破此前华为、小米等厂商在安卓阵营的主导地位。通过MLX框架,Qwen3可无缝集成到苹果开发者工具链中,覆盖全球数亿苹果用户。而且苹果生态的高付费用户群体,为Qwen3的商业化(如API调用、定制服务)提供广阔市场。
目前,全球大模型市场呈现“中美双雄”格局,美国市场以谷歌Gemini、微软Phi-3、Meta Llama 3为代表,主打云端大模型与企业级服务;中国阵营以通义千问、文心一言、百川智能为代表,聚焦端侧部署与场景化落地。
Qwen3登陆MLX不仅是技术优化,更是阿里向苹果生态注入的“中国解决方案”。