Apple fait fonctionner une IA géante dans l’iPhone sans saturer la RAM.
Apple a présenté une astuce d’ingénierie lors de la WWDC 2026 pour faire tourner son modèle d’IA, l’AFM 3 Core Advanced, qui compte 20 milliards de paramètres, dans la mémoire flash plutôt que dans la RAM. Ce modèle est réservé aux iPhones 17 Pro et plus récents, ainsi qu’aux Mac avec une puce M3 ou supérieure et aux iPads M4 ou supérieurs.
Pour faire fonctionner son modèle d’intelligence artificielle le plus performant directement dans l’iPhone, Apple a mis au point une technique d’ingénierie peu commune : la stocker dans la mémoire flash plutôt que dans la RAM. Ce réalisme, détaillé dans un article de recherche publié par Apple lors de la WWDC 2026, représente une avancée significative.
Faire tenir un modèle d’IA complexe dans un téléphone présente un défi d’espace. Ces modèles sont volumineux et la mémoire vive d’un iPhone, la RAM, est limitée et déjà fortement sollicitée. En règle générale, tous les paramètres résident dans cette RAM, ce qui restreint rapidement la taille du modèle. Dans l’article de recherche diffusé pour la WWDC 2026, Apple explique comment il a levé cette contrainte avec l’AFM 3 Core Advanced, son modèle local le plus sophistiqué.
Ce modèle comprend 20 milliards de paramètres, mais n’en active que de 1 à 4 milliards à la fois, selon la complexité de la requête. Surtout, le modèle complet n’est pas chargé dans la RAM : il est conservé dans la mémoire flash, la NAND, généralement dédiée au stockage. Cependant, le transfert entre la flash et la RAM est trop lent pour un échange constant des paramètres, comme le nécessitent les architectures classiques. Apple a contourné cet obstacle en déléguant le choix des paramètres aux capacités de la demande.
À noter : la technique qui consiste à stocker les paramètres dans la mémoire flash et à ne charger en RAM que ceux qui sont utilisés n’est pas une nouveauté de cette année. Apple l’avait déjà présentée dans son article de recherche de 2023, « LLM in a flash », démontrant déjà comment faire fonctionner un modèle deux fois plus grand que la RAM disponible. L’AFM 3 Core Advanced en est l’aboutissement.
Concrètement, au lieu de sélectionner en permanence quelles parties du modèle, ou « experts », activer, l’AFM 3 Core Advanced prend cette décision une fois par requête. Un petit bloc dense choisit dès le départ un ensemble fixe d’experts, qu’il réactualise occasionnellement pendant la génération. Pour limiter les transferts, le modèle maintient une grande partie des experts toujours actifs, ne chargeant en RAM que ceux qui sont spécialisés lorsqu’ils sont nécessaires. Cette méthode repose sur une technique développée par des chercheurs d’Apple et de l’Université de Californie à Santa Barbara, appelée élargissement guidé par l’instruction, ou Instruction-Following Pruning.
L’intérêt dépasse la simple économie d’espace. Le modèle ajuste le nombre de paramètres actifs en fonction de la tâche : peu pour une requête simple, davantage pour une demande plus complexe. Cela représente une certaine élasticité permettant, sur le papier, d’atteindre une taille de modèle bien au-dessus des limites de la RAM, tout en gardant la latence maîtrisée. Ce compromis entre ambition et contrainte physique rend l’IA locale crédible sur un appareil portable.
Voyons maintenant qui bénéficie concrètement de cette innovation. Ce fonctionnement explique pourquoi l’AFM 3 Core Advanced est réservé aux puces les plus puissantes, c’est-à-dire l’iPhone 17 Pro et les modèles plus récents, les Mac équipés d’une puce M3 ou supérieure ainsi que les iPad M4 ou supérieurs.
Ce modèle est principalement utilisé pour les fonctions vocales, telles que les voix expressives et la dictée améliorée, où Apple annonce une nette amélioration de la qualité. Pour le reste, la majorité des nouveautés fonctionnent sur le modèle local standard ou dans le cloud, et sont opérationnelles dès l’iPhone 15 Pro. Cela prouve que disposer du dernier modèle n’est pas indispensable pour bénéficier d’iOS 27.
Voici toutes les annonces à retenir de la keynote d’ouverture de la WWDC 2026 d’Apple.
– Le nouveau Siri AI et les informations générales
– iOS 27
– macOS 27 Golden Gate
– watchOS 27

