今更聞けない~意外と知らずに使っているOffice Open XMLとは?

Officeを保存した時の形式はご存じでしょうか?
もしかすると気にしたことがない方もいるかもしれません。
Office2003以前はWordであれば.doc形式
Excelであれば.xls形式が保存する時に一般的でした。

それがOffice2007以降はWordは.docx、Excelはxlsxの形式へと新しくなりました。
(新しいとはいえ2007からもう12年経過していますが…)

.docxや.xlsxなど新しい形式は2003以前のOfficeでは開けない為
古いパソコン環境をそのまま使っている場合は開けない事があります。

Microsoftは何故、昔の形式をそのまま使い続けず
新しい別の形式に変更したのでしょうか?

いつまでも.docのままじゃいられない!?

先日、メールの添付ファイルが送れないと持ち込まれた方がいました。
色々と試してみた結果.docは送信できず、.docxであれば送信できる事がわかりました。

原因としてはサーバーが弾いていると考えるしかありません。
今回の件とは別ですが過去にはDrWeb(ロシア製ウイルス対策ソフト)が稼動している一部のレンタルサーバーで
.docと.xlsがウイルス扱いの誤検知で送信できない事例もありました。

サポート終了した古いOfficeは怪しいとの判断されてしまったのでしょうか
今現在であればメール送受信障害として復旧されますが
いずれあらゆるウイルス対策ソフトで
本当に古い形式は切り捨てられる時が来るかもしれません。

そんな時が来ても滞りなく業務が続けられるよう
差し支えなければ新しいOffice形式に保存し直して
使用するのが良いかと思われます。

.docx、.xlsxのxとは何か?

.docxも.xlsxも2007以降の形式にはxが付いています。
このxは何か?それはズバリxmlxと考えていいでしょう。

.docxと.xlsxの実態はzip圧縮されたxmlなのです。
.docxや.xlsxをzip拡張子に変更してやると構造がわかります。

極端な話をすればそのzipフォルダに入っているdocument.xmlを編集すれば
word無しでも文章を書き換える事も可能です。
その場合は圧縮ソフトでzipに圧縮し直してはいけません。
圧縮ソフトで圧縮されたzipは.docxに拡張子を戻しても開けなくなります。
純粋な.docxのzipをエクスプローラーで開いて
そこに編集したdocument.xmlを置き換える必要があります。

このようなやり方での編集を推奨しているわけではありませんので
下手に弄って壊す可能性を考えれば、あえてxmlから編集する必要はありません。

Office Open XMLを標準フォーマットにするメリット

重要な電子書類は長期間の保有が必要となります。
特定の企業のワープロソフトを使用しているとソフトが開発停止したり
最悪倒産してソフトウェアが無くなってしまうかもしれません。
そうなると今までのデータが読めなくなる危険性があります。
Microsoftは簡単に倒産する事もないと思われる大企業ですが
100年先、150年先、さらにその先までは誰にもわかりません。

OpenXML を標準フォーマットとして採用することで

  • Microsoft Office をインストールされていない環境でもファイルの読み書きが可能
  • パーツの再利用が容易になる
  • パーツに分けることによりファイル破損のリスクを限定する事ができる
  • zip圧縮されることでファイルサイズが小さくなる

といったメリットが期待される。

Wikipedia 「Office Open XML」より引用

かつてのバイナリ形式ではMicrosoftから仕様書を入手し
Office文書を解析しなければ他のアプリで読み込む事ができませんでした。
それをXML化する事で比較的簡単に内容を読んで再利用する事ができます。
Office Open XMLは国際標準となっているので
互換ファイルを簡単に出力できると言ったメリットがあります。

残した情報が後世で扱えなくなって困らないように
独占ではなく標準化していく流れなのでしょうね。
世の中の賢人達には本当に頭が下がります。