5月13日消息,据外媒报道,苹果智能眼镜将搭载一款名为FastVLM的AI大模型。FastVLM是一种视觉语言模型(VLM),它基于苹果2023年发布的MLX框架。MLX是一个专为苹果芯片设计的开源机器学习框架,旨在为开发者提供一种轻量级的本地模型训练和运行方式,同时保持与传统AI开发框架和语言的兼容性。
FastVLM的核心是一个名为FastViTHD的编码器,该编码器专门为高效处理高分辨率图像而设计。它比类似的模型快3.2倍,体积小3.6倍。这意味着设备可以在本地快速处理信息,无需依赖云端来生成对用户请求或所见内容的响应。此外,FastVLM在生成响应时输出的标记数量更少,这对于模型的推理步骤至关重要。根据苹果的说法,其模型的首次标记生成时间比类似模型快85倍。
VRPinea独家点评:苹果从来都不受制于人。
消息来源:9to5mac,本消息由VRPinea编译。