OpenXML, ce format de document pas open

keep-calm-and-free-softwareTout le monde connaît le format de document « .docx », moins de monde sait qu’il s’agit du sulfureux « OpenXML » de Microsoft.

Sulfureux, parce que le terme Open de OpenXML est mensonger, l’éditeur a bien gardé sa stratégie de format privateur.
Ainsi, utiliser du docx c’est mal pour notre vie numérique, démonstration ci-après avec quelques arguments éthiques, techniques, fonctionnels et même réglementaires.

OpenXML et l’éthique, un désamour

Nous étions pourtant sensibilisés à la façon particulière dont Microsoft traite ses clients. Qu’ils paient et se taisent, peu importe les considérations non éthiques sur l’obsolescence programmée (y compris celle des logiciels).

Besoin de format ouvert

Sur les formats de document, Microsoft a toujours agi avec une recette secrète. Les spécifications du format « .doc » (très répandu) sont secrètes, propriétés du géant de Redmond.
Voir cela en comparaison avec le format de document HTML, géré par le W3C, à spécifications publiques. Autre exemple, le format PDF propriété d’Adobe mais dont les spécifications sont publiées à l’ISO.
Le « .doc » est donc un format dit « privateur », parce qu’il prive les humains de lire et écrire librement correctement un tel fichier sans le logiciel non-libre et payant Microsoft Office.

L’exigence de l’interopérabilité

L’État français a souhaité des formats ouverts pour la gestion des données publiques numériques. Et éviter les formats privateurs, cela semble une affaire de bon sens. Il a donc une liste des formats recommandables favorisant l’interopérabilité. L’interopérabilité c’est la capacité de traiter librement dans un dispositif B des données provenant d’un dispositif A.

La réponse visible de Microsoft

Alors Microsoft, en bon lobbyiste, a fait pression, en (presque-)vain. Pour entrer dans la liste des formats recommandés du RGI, il a donc publié à l’ISO une version du successeur de « .doc »: OpenXML.

Le format privateur OpenXML tel que généré avec Microsoft Word 2010 (ou toute autre version de chez Microsoft par défaut) ne respecte pas les spécifications que Microsoft a lui même déposé à l’ISO pour standardisation. Les développeurs ont dérivé depuis, et ces dérives n’ont pas été publiées en retour.
Donc tout logiciel non Microsoft n’a pas de moyen fiable de présenter correctement un document ainsi créé.

Fonctionnellement, des problèmes déjà rencontrés

Retour vers le futur

Comme tout format propriétaire, il est condamné à poser des soucis d’interopérabilité.

Exemple: les « .doc » créés avec Word6 en 1995, il y a à peine plus de 20 ans (une goutte d’eau en matière de conservation documentaire). Les filtres d’import n’existent plus chez Microsoft. Ils ont été éradiqués par l’éditeur lui-même de sa propre ligne produit, sans consultation des utilisateurs.
En 2035, quel logiciel sera capable de lire correctement le .docx créé aujourd’hui avec Word2010 ?

Que publier, que conserver?

De surcroît, OpenXML est un format d’élaboration documentaire, pas de publication (tel PDF). C’est pourquoi seul le PDF est autorisé par le ministère de l’Intérieur pour la conservation des actes administratifs.

Certes, chacun peut se dire que « ce n’est pas mon problème », et continuer de produire et stocker n’importe comment.

Une bombe à retardement

Techniquement , un « .docx » un peu sophistiqué peut faire exploser un OpenOffice ou LibreOffice, simplement parce que ce format n’est pas documenté.

Il ne faut pas utiliser de docx, parce que ce n’est pas éthiquement professionnel, ni durable.

Et l’administration dans tout ça?

Contrairement au format ODF, ce bidule « Office Open XML » n’est même pas recommandé par le RGI (référentiel général d’interopérabilité). Le RGI contient la liste des protocoles de communication recommandables, etc. et notamment les formats de fichiers garantissant une bonne interopérabilité.
Celui-ci s’impose d’ailleurs aux administrations et collectivités territoriales, malgré les lourdes actions de lobbying (et dessous de table?) de la société Microsoft auprès de l’État.
NB: ils sont doués dans ce domaine, voyez ce que ça donne pour les contrats open-bar Microsoft avec la Défense, l’éducation nationale et le ministère de la culture, à plusieurs millions d’euros et sans appel d’offre ni marché public…

Le RGI v2

Un billet publié sur le site de l’April résume bien le travail réalisé autour de ces efforts de rationnalisation: à lire et faire lire!
https://www.april.org/approbation-du-rgi-v-20-lapril-salue-le-travail-de-la-disicdinsic

Extrait du RGI ci-après :

Office Open XML est une norme ISO/CEI 29500 créée par Microsoft, destinée à répondre à la demande d’interopérabilité dans les environnements de bureautique. Ce format (dont les suffixes sont .docx, .xlsx, .pptx…) est utilisé à partir de Microsoft Office 2007, en remplacement des précédents formats Microsoft (reconnus à leurs suffixes tels que : .doc, .xls, .ppt), il est toutefois légèrement différent, pour ces versions d’office, de la norme ISO définitive, qui a tenu compte des remarques des membres de l’organisme normalisateur. Seule la suite Office à partir de la version 2013 est totalement compatible avec la norme (en lecture et en écriture).

Le standard est conservé dans le RGI au statut « en observation ». Sa complexité, son manque d’ouverture (notamment dans la gouvernance de la norme) et le strict respect tardif de la norme par Microsoft même n’ont pas permis de réviser son statut.
La version « transitionnal » de la norme n’est quant à elle pas recommandée.

Pour des besoins d’échanges d’informations sous forme de tableaux qui notamment embarquerait du code, l’utilisation d’OOXML peut être une alternative. C’est toutefois une pratique à encadrer.

NB: la remarque sur Office2013 n’est valable seulement lorsque ce logiciel est explicitement configuré pour produire du « OpenXML normé ISO ». Ce n’est naturellement pas le cas par défaut. Étonnant, non?

Éveil aux bonnes pratiques numériques

Cela devrait être enseigné à l’école (l’est-ce?) pour nos enfants, et faire partie de la conduite du changement pour la génération qui travaille.
De la même manière que dans d’autres domaines il convient de:

  • « éjecter le média » en barre de tache Windows avant d’arracher sauvagement sa clé USB: la plupart du temps ça marche quand on ne le fait pas, sauf quand la clé se corrompt.
  • regarder à gauche et à droite avant de traverser la rue: la plupart du temps ça passe quand on ne le fait pas, après tout!

 

Ressources

Texte du RGI: http://references.modernisation.gouv.fr/sites/default/files/Referentiel_General_Interoperabilite_V2.pdf

 

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.