High-tech

Utilisateurs de Codex : Votre SSD ne doit pas souffrir, découvrez pourquoi.

Codex écrivait jusqu’à 640 To de données par an sur le SSD de ses utilisateurs, pouvant user un SSD de 1 To en moins d’un an. OpenAI a reconnu le problème et a fusionné trois correctifs le 23 juin, qui suppriment environ 85 % des écritures inutiles.


Codex, l’assistant de programmation d’OpenAI, écrivait discrètement jusqu’à 640 To par an sur le SSD de ses utilisateurs, pouvant ainsi user un SSD en moins d’un an, tout en cachant les traces de cette activité.

Codex est un outil conçu pour aider les développeurs à écrire et corriger du code, que ce soit en ligne de commande ou via une application. Le problème ne réside pas dans le code qu’il produit, mais dans les données qu’il génère. Le 14 juin, Rui Fan, développeur et membre du comité de pilotage du projet Apache Flink, a signalé sur le dépôt GitHub de Codex qu’environ 37 téraoctets de données avaient été écrits sur son SSD principal en seulement 21 jours d’utilisation. La cause : les journaux de diagnostic de l’application.

37 téraoctets en trois semaines équivalent à environ 640 To par an. Pour référence, un SSD de 1 To est généralement garanti pour 600 To d’écritures tout au long de sa durée de vie, ce qui signifie que Codex pouvait altérer l’endurance d’un SSD en moins d’un an.

Le plus alarmant est que cette usure passait inaperçue. La base de données qui stocke ces journaux fonctionne en écrivant et en effaçant de manière répétée, ce qui fait que le fichier apparaît minuscule sur l’écran, alors que la mémoire flash enregistre des téraoctets bien réels. En d’autres termes, alors que l’explorateur de fichiers affiche quelques mégaoctets, le SSD subit une dégradation réelle. Ce problème provient d’un paramètre de journalisation configuré pour être le plus verbeux possible par défaut, ignorant même les commandes censées réduire son activité.

OpenAI a reconnu l’existence de ce problème et a intégré trois correctifs le 23 juin : selon Rui Fan, ces correctifs permettent d’éliminer environ 85 % des écritures superflues.

En attendant, pour les utilisateurs de Linux et macOS, il est possible de rediriger le fichier de journaux vers la mémoire vive afin de préserver le SSD, bien que les données soient perdues au redémarrage. Pour les utilisateurs de Windows, il n’existe pas de solution simple. Si Codex est utilisé en permanence, il est conseillé de vérifier la version installée et de passer à la dernière, des correctifs ayant été apportés à partir de la version 0.142.0.