漢字種別をルビ表示するためのAWK Script
文章に使われている漢字の配当学年が分かると便利だろうと思います。
のなみは入試問題を作るときに常用漢字外の漢字にはルビを振るようにしていますが、当該の漢字が常用漢字なのかそうでないのかが簡単に分かればいいなぁと思っていました。
で、awkのスクリプトで作ってみました。
kanjihaitou.awkです。右クリック「対象をファイルに保存」でお持ち帰り下さい。(ブラウザで表示しても、どうにもなりません)
出力サンプルは、芥川の「蜜柑」です。
ルビの位置に、教育漢字なら配当学年・教育漢字外の常用漢字なら「常」・常用漢字外の漢字なら「外」を表示します。(標準の文字サイズだとルビが見にくいので「大」にして見てください)
最後に、漢字種別ごとの延べ文字数を表示します。
「ああ、これ使ってみたい。でも、awkなんて知らんぞ。」という方のための、簡単な使い方
- 解凍ソフトを使ったことがない方は、「LZH形式で圧縮されたファイルを解凍するためのソフト」をご覧になって、使えるようにしておいてください。次で必要になります。(面倒がらずに、圧縮されたファイルを解凍できるようになりましょう。インターネット利用の基本的スキルです)
- mawk MBCS (32bit版)を貰ってきて解凍すると、mw32r27というフォルダが作られ、その中に mawk32.exe ができています。
- kanjihaitou.awk を動かすためのバッチファイルkanjihaitou.batを、右クリック「対象をファイルに保存」でお持ち帰り下さい。
- 「スタート」−「マイコンピュータ」とすすんで、「C:」をクリックすると、ハードディスク C:の最上階層が開きます。
ここに右クリック「新規作成」−「フォルダ」で、awk(半角小文字で)というフォルダを作ります。
- この awkというフォルダの中に、
を入れてください。
- 調べたいテキストファイルを kanjihaitou.bat にドラッグアンドドロップすると、「出力サンプル」のように表示します。
awkという簡易言語に興味を持たれた方は、簡単なawkの使い方を御参考に。いろいろいじってみると、使えるようになると思います。
awk とか perl とか ruby とかのスクリプト言語を使えるようになると便利ですよ。テキストに関しての「魔法」を身につけるという感じです。あるいは、自分が手作業でやると面倒で・時間がかかって・間違いがたくさん出るような仕事を、正確に素早く実行する秘書がいるような感じです。
mailto: nonami@cc.osaka-kyoiku.ac.jp
スパムメール対策として、フリ−メールは受信拒否しています。