您所在的位置:首页 - 科技 - 正文科技
揭秘!页文档拆解苹果智能,从架构数据到训练和优化
锐朵
2024-08-01
【科技】
954人已围观
摘要在2024年全球开发者大会上,苹果重磅推出了AppleIntelligence,这是一个全新的个性化智能系统,可以提供实用的智能服务,覆盖iPhone、iPad和Mac,并深度集成在iOS18、iPadOS18和macOSSequoia中。库克曾经表示,AppleIntelligence是苹果创新的新篇章,将改变用户使用产品的方式。他强调,苹果独特的方法结合了生成式人工智能和用户的个人信息,能提供真正有用的智能服务。此外,AppleIntelligence能够以完全私密和安全的方式访问信息,帮助
在2024年全球开发者大会上,苹果重磅推出了AppleIntelligence,这是一个全新的个性化智能系统,可以提供实用的智能服务,覆盖iPhone、iPad和Mac,并深度集成在iOS18、iPadOS18和macOSSequoia中。
库克曾经表示,AppleIntelligence是苹果创新的新篇章,将改变用户使用产品的方式。他强调,苹果独特的方法结合了生成式人工智能和用户的个人信息,能提供真正有用的智能服务。此外,AppleIntelligence能够以完全私密和安全的方式访问信息,帮助用户完成对他们最重要的事情。这是苹果独有的AI体验。
如今,距离AppleIntelligence官宣一个多月过去了,这项技术终于落地智能设备,相关技术文档也终于放出。
在刚刚过去的一天,拥有iPhone15Pro或iPhone15ProMax的用户可以下载iOS18.1开发测试版,并可以体验AppleIntelligence的功能了。
随着这篇长达47页技术报告的出炉,我们可以更加深入的了解AppleIntelligence背后的秘密武器。
报告地址:https://machinelearning.apple.com/papers/apple_intelligence_foundation_language_models.pdf报告详细介绍了其中两款模型——AFM-on-device,AFM代表AppleFoundationModel,是一个约30亿参数的语言模型,以及一个更大的基于服务器的语言模型AFM-server,可以高效、准确和负责地执行专门的任务(图1)。
这两个基础模型作为苹果更大的生成模型系列的一部分存在。
架构及训练
AFM基础模型是基于Transformer架构构建的密集解码器模型,采用如下设计:
共享输入/输出嵌入矩阵,以减少用于参数的内存使用。
使用RMSNorm进行预归一化以提高训练稳定性。
查询/键归一化以提高训练稳定性。
具有8个键值头的分组查询注意力(GQA),以减少KV缓存内存占用。
SwiGLU激活,以提高效率。
RoPE位置嵌入,基频(basefrequency)设置为500k,以支持长上下文。
AFM预训练过程在开发高性能语言模型,以支持一系列AppleIntelligence功能方面发挥着关键作用。研究团队注重效率和数据质量,揭秘!页文档拆解苹果智能,从架构数据到训练和优化以获得高质量的端到端用户体验。
在后训练方面,研究团队发现改进通用后训练可以提升AppleIntelligence所有功能的性能,因为模型在遵循指令、推理和写作方面会具有更强的能力。
为了确保这些模型功能符合苹果对保护用户隐私的承诺,以及苹果的ResponsibleAI原则,后训练工作包括一系列数据收集和生成、指令调整和对齐创新。后训练过程包含两个阶段:监督微调(SFT)和来自人类反馈的强化学习(RLHF)。研究团队提出了两种新的后训练算法:(1)带有teachercommittee(iTeC)的拒绝采样微调算法,以及(2)一种用于强化学习迭代的RLHF算法,带有镜像下降策略优化(mirrordescentpolicyoptimization)和留一法优势估计器(leave-one-outadvantageestimator)(MDLOO),使得模型质量显著提高。
AppleIntelligence特性
基础模型是为AppleIntelligence专门设计的,这是一个支持iPhone、iPad和Mac的个人智能系统。
苹果发现,针对特定任务的微调,他们可以将小模型的性能提升到一流水平,除此以外,他们还开发了一种基于运行时可交换适配器(runtime-swappableadapters)的架构,使单一基础模型能够专门用于数十个此类任务。图2显示了高级概述。
适配器架构
苹果使用LoRA适配器来针对特定任务进行模型微调。对于每项任务,研究者会调整AFM自注意力层中的所有线性投影矩阵以及逐点前馈网络中的全连接层。仅通过微调适配器,基础预训练模型的原始参数保持不变,可以保留模型的一般知识,同时定制适配器以支持特定任务。
量化
为了将AFM纳入内存预算有限的边缘设备并降低推理成本,需要考虑量化技术。先前的研究发现,与原始的32/16位浮点相比,经过4位量化的模型损失会很小。
为了在模型容量和推理性能之间实现最佳平衡,苹果开发了最先进的量化方法和利用准确率-恢复适配器(accuracy-recoveryadapters)的框架。使得模型在每个权重平均小于4位的情况下,还能实现近乎无损的量化,并提供灵活的量化方案选择。
方法
经过后训练,模型被压缩和量化,得到平均低于4位的权重。量化模型通常表现出中等程度的质量损失。因此,苹果不会将量化后的模型直接用于功能开发,而是附加一组参数高效的LoRA适配器以进行质量恢复。
值得注意的是,训练准确率-恢复适配器具有样本效率,可以看作是训练基础模型的迷你版本。在适配器的预训练阶段,只需要大约100亿个token(约占基础模型训练的0.15%)即可完全恢复量化模型的能力。
由于应用程序适配器将从这些准确率-恢复适配器微调而来,因此它们不会产生任何额外的内存使用或推理成本。关于适配器大小,苹果发现适配器秩为16时提供了模型容量和推理性能之间的最佳权衡。
但是,为了灵活性,苹果提供了一套具有不同秩{8、16、32}的准确率-恢复适配器供应用程序团队选择。
混合精度量化
AFM中的每个transformer块和每个层都存在残差连接。因此,所有层都具有同等重要性的可能性不大。根据这一直觉,苹果通过推动某些层使用2位量化(默认为4位)来进一步减少内存使用量。平均而言,AFM-on-device可以压缩到每个权重仅约3.5位(bpw),而不会造成显著的质量损失。
评估
研究团队使用常见的开源评估工具和基准来评估AFM预训练模型。表2展示了在HELMMMLUv1.5.0上AFM-on-device和AFM-server的结果。
这些基准测试表明,AFM预训练模型具有强大的语言和推理能力,为后训练和特征微调提供了坚实的基础。
AFM与开源模型(Phi-3、Gemma-1.1、Llama-3、Mistral、DBRX-Instruct)和商业模型(GPT3.5和GPT-4)的比较结果如下图3所示。与其他模型相比,AFM模型更受人类评估人员的青睐。特别是,AFM-on-device与Phi-3-mini相比,尽管模型规模小了25%,但仍获得了47.7%的胜率,甚至优于开源强基线Gemma-7B和Mistral-7B。
为了衡量模型生成响应遵循提示中指令的能力,研究团队在IFEval基准上评估了AFM-on-device和AFM-server,结果如下图4所示:
如图5所示,AFM-server实现了最佳的整体准确率,优于Gemini-1.5-Pro-Preview-0514和GPT-4。
苹果将AFM与一些最出色的模型以及规模较小的开源模型进行了比较。如图6所示,与Gemma-7B和Mistral-7B相比,AFM-on-device可以实现相当或更好的性能。AFM-server的性能明显优于DBRX-Instruct和GPT3.5,并且与GPT4相当。
图7比较了经过后训练的AFM在数学基准上的表现。结果发现,AFM-on-device的性能明显优于Mistral-7B和Gemma-7B,即使规模不到它们的一半。
下图为人类评分员评估AFM-on-device适配器、Phi-3-mini、Llama-3-8B和Gemma-7B在摘要任务上的质量。图8显示AFM-on-device-adapter总体上优于其他模型。
负责任的AI
AppleIntelligence的开发和设计都注重保护用户隐私。

图9总结了人类评分员在不同模型上给出的违规率,越低越好。AFM-on-device和AFM-server都对对抗性提示具有鲁棒性,其违规率明显低于开源和商业模型。
图10表明,与其他模型相比,AFM模型更受人类评分员的青睐。
Tags: 揭秘!页文档拆解苹果智能从架构数据到训练和优化
版权声明: 感谢您对【奚诗百科网】网站平台的认可,无特别说明,本站所有文章均归【奚诗百科网】平台所有,转载请说明文章出处“来源【奚诗百科网】”。 https://sptgyg.com/post/10833.html
上一篇: 苹果官网有二手手机吗
下一篇: :微软等公司必须付费才能抓取数据
最近发表
- 音乐与视频的数字化时代,免费下载的利与弊
- 探索播放软件的星辰大海,2023年播放软件排行榜前十名
- 艺术类毕业生的公务员之路,探索适合的艺术岗位
- 艺术类学生报考公务员的广阔天地,探索适合的单位与职位
- 探索音乐世界,最佳音乐软件指南
- iPhone 7 Plus,经典与创新的完美融合
- 探索音乐播放器,音质与体验的完美融合
- 穿越时空的课堂,六年级学生的历史资料大揭秘
- 音乐播放器性价比大比拼,如何找到你的音乐灵魂伴侣
- 中关村在线,探索中国科技心脏的官方网站与电脑市场
- 音乐播放器终极指南,哪款最适合你?
- 探索历史的奥秘,六年级学生的历史课体验
- 六上道法必背知识点,掌握核心,轻松应对考试
- 探索iOS音乐播放器,最佳选择与独特功能
- 探索免费音乐的海洋,不收费的音乐播放器推荐
- 荣耀90 Pro,性能与创新的巅峰之作
- 京东二手手机交易平台,安全、便捷、高效的选择
- 为孩子选择合适的音乐播放器,家长指南
- 音乐发烧友的福音,发烧音乐播放器推荐指南
- 荣耀10,性能与美学的完美结合
- 探索未来,下一张1070,技术的飞跃与生活的影响
- 音乐之旅,国产音乐播放器的宝藏推荐
- 一键焕新,vivo手机的强制恢复出厂设置指南
- 探索音乐新境界,2023年最佳苹果手机音乐播放器推荐
- 人教版六年级历史知识点,深入理解与学习指南
- 穿越时空的课堂,小学六年级历史知识全解析
- ThinkPad X系列,性能与便携的完美平衡
- 穿越时空的课堂,中国历史六年级第一册深度解析
- 穿越时空的课堂,6年级历史知识整理指南
- 好听儿的儿歌,童年的旋律与教育的力量
- 穿越时空的探险,初中六年级历史知识点大揭秘
- 艺术类专业毕业生的公务员之路,机遇与挑战并存
- 穿越时空的钥匙,历史必背知识点总结
- 轻松掌握,如何用MP3播放器下载音乐
- 探索热门歌曲MP3下载,音乐爱好者的指南
- 探索音乐世界,如何在不同平台上下载MP3文件
- 艺术类学生能考公务员吗?探索艺术生的职业新路径
- 探索音乐的海洋,如何下载好听的MP3歌曲
- 六年级知识点全攻略,掌握核心知识,轻松应对小升初
- 艺术之翼,艺术生也能翱翔公务员的天空
- 探索历史的奥秘,六年级学生的历史学习指南
- 如何在互联网上轻松下载MP3格式音乐
- 艺术生考公务员,跨领域挑战与机遇并存
- 如何轻松下载MP3音乐,一个全面的指南
- 穿越时空的课堂,六年级历史必背知识点全解析
- 戴尔笔记本家族,技术与便携性的完美融合
- 探索本地音乐下载的艺术,如何高效地保存和享受你的音乐收藏
- 音乐之旅,探索手机本地音乐的隐藏角落
- 三星5G手机,连接未来的桥梁
- 探索播音传媒专业毕业生的多彩职业道路