文書管理について


デジタル化された文書をどのような形式で保存すればよいのか。デジタル資料は、コピーが簡単なので、断片的な文書がすぐに堆積する(堆積するだけで、纏まらないのが、実は、最大の悩みなのだ)。しかしその一方で、コンピュータソフトが恒常的に更新され、数年前のソフトがサポートされていないということがでてきている。まったく困ったものだ。

文書ファイルの保存の条件としては、次の二つがポイントになるのではないかと思う。

1 汎用性がある(どんなコンピュータでも使える)。
2 Grep検索(ファイルを縦断して検索すること)ができる。

最近、たまたま立ち読みした雑誌には、全部、PDF 形式に変換して保存してしまう、といったようなことが書いてあって、なるほどと感心した。最新のバージョンは、全文検索機能もついているのだとか。

もっと安上がりにすませようとすると、テキストファイル(.txt)や、ウェブ形式の文書(.xhtml)として保存するということが考えられる。

しかし、そうなるとドイツ語特殊文字をどう処理すればよいのか、というのがこのサイトのテーマである。

ウェブ形式の方は、あまり問題がなさそうです。

最近のワープロソフトは簡単に、ウェブ形式に変換できます。欧文特殊文字も自動的に変換してもらえるようです。

ソースを覗いてみるとわかりますが、ウムラウトは、大体、"&*uml;"になっています。たとえば、"ä" と書くと、"ä" が出てくるし、"ß" は、"ß"です。

ファイルを縦断的に検索するソフトも、ちょっと探せば見つかりそうです。ちなみに、Google は、"ästhetisch" など、ウムラウトをそのまま直接入力すれば、その語を含むサイトを検索します。

ただ、検索を論文執筆など、一連の作業の中で、行うとなると、ウェブ形式の文書をブラウザを使って立ち上げるのは、なんともまどろっこしい感じがします。渋滞なく、作業するには、やはりテキスト形式にしておくほうがよいでしょう。

テキストファイルとしてドイツ語の文書を管理するには、初期設定で、パーティションして、日本語版の OS とは別に、英語版の OS を使えばいいのだ、という話しをずいぶん前に聞いたことがありますが、まだ試みたことはありません。

で、どうしているかというと、わたしは、個人的に(つまり、わたしのコンピュータ内でしか、汎用性がないわけですが)、"ä" は a+ 、"ß" は s+ のように書き換えて保存しています。

ウェブ形式より便利な点は、スピードのほかに、どんなソフトにも(多分)このシステムで対応できること。たとえば、文献資料管理に使っているデータベースソフト(TCard というのを使っているのですが・・・)にも同じように書き込むことができます。また、いったん記号化しておけば、そこから特殊記号を復元したり、あるいは、ウェブ形式に書き換えたりが自由にできます。さらに、テクスト形式ならば、古いパソコンでも平気で使えうことができるという利点もあります。そして、(記号に慣れれば)日本語設定でそのまま入力できるので、日独混在文章でもスムーズに書き込んでいくことができます。

弱点は、図表が完全に欠落すること。また、他の人にデータを送るときは、説明文をつけるか、ウェブ文書などに書き換えなければなりません。

さらに、書き換えのヴァリエーションが限られてくるという難点もあります。わたしは、+ 、 # 、 : の三つの符号を組み合わせて、ドイツ語とフランス語の特殊記号を一応カバーしていますが(たとえば、"è" は "e#+" といった具合です)、しかし、これだけでも結構めんどくさい。特に、日ごろあまり使わないフランス語の方は、自分で決めたことでありながら、あれ、なんだったっけ? ということになります。

書き換えは、マクロ機能を使って、一括変換します。簡単なのは、Word2003 (+ Win.XP) で置換作業をマクロに記録することです(マクロに特殊文字を書き込むことができるのは、さすがです)。

同じような操作は、OpenOfficeorg Vers.1.1.0 でもできるようです。このワープロソフトは、フリーで手に入るにもかかわらず(少なくとも、Writer に関しては)、ほとんど、オフィイスソフトを揃える必要がなくなってしまうくらいの機能を備えているようです。ただし、マクロについては、Word との互換性はありません。

ドイツ語と日本語が混在していなければ、「秀丸」が速い。Ver. 4 では、エンコードの種類を簡単に指定できるので、UTF−8 か、「欧文」を指定すると、大抵のドイツ語文はなんとかなります。検索も、マクロも、特殊文字を使うことができます。

Grep検索は、フリーの検索ソフトで実行することができます。特殊文字を、+ やら # やらに置き換えておけば、厳密な検索が可能です。
もちろん、検索ソフトを買うならば、MSWordのファイルもGrep検索にかけることができます。しかし、実際使ってみると、フリーソフトの方がはるかに軽快で、手間がかからないようです。

さて、しかし、これで文書は完全に保管できるのでしょうか。

わたしは、正直なところ、不安です。

そもそもコンピュータのような中がどうなっているのかわからないようなものに、大切な資料を預けておいていいものでしょうか。10年もしないうちに起動できなくなるようなソフトを創っている連中が、文献資料のなんたるかを理解しているとはとても思えないということもあります。

というわけで、結局、重要な資料(特に、文献データ)は紙に印刷して、さらに、(地震やら火事やらのことを考えて)家と研究室で一部ずつ保管することにしています(あるいは、ここら辺りにわたしの限界があるのかもしれない)。

紙も、最近は寿命が短くなっているという話しですが、まあ、わたしの目が霞んで役に立たなくなるまでくらいなら、今、印刷したインクでなんとかもつのではないかと思う次第です。

2003.8. / 2004.9.

ホームページに戻る。