日本語形態素解析システムとawkscriptを使って、小説に使われている語彙の比較を行う。この研究は実験用具先行の研究であって、何らかの仮説を検証しようという研究ではない。実験用具がどの程度使えるものなのかの見当がつくことを研究の目的にしている。
日本語形態素解析システム茶筌(ChaSen) version 2.0 for Windowsを使って、芥川龍之介『羅生門』と志賀直哉『小僧の神様』の形態素解析を行うと以下の結果を得る。
表層語 | 基本形 | 品詞 |
---|---|---|
記号-空白 | ||
或 | 或 | 連体詞 |
日 | 日 | 名詞-非自立-副詞可能 |
の | の | 助詞-連体化 |
暮方 | 暮方 | 名詞-副詞可能 |
の | の | 助詞-連体化 |
事 | 事 | 名詞-非自立-一般 |
で | だ | 助動詞 |
ある | ある | 助動詞 |
。 | 。 | 記号-句点 |
EOS |
表層語 | 基本形 | 品詞 |
---|---|---|
記号-空白 | ||
仙 | 仙 | 名詞-固有名詞-地域-一般 |
吉 | 吉 | 名詞-一般 |
は | は | 助詞-係助詞 |
神田 | 神田 | 名詞-固有名詞-人名-姓 |
の | の | 助詞-連体化 |
ある | ある | 動詞-自立 |
秤 | 秤 | 名詞-一般 |
屋 | 屋 | 名詞-接尾-一般 |
の | の | 助詞-連体化 |
店 | 店 | 名詞-一般 |
に | に | 助詞-格助詞-一般 |
奉公 | 奉公 | 名詞-サ変接続 |
し | する | 動詞-自立 |
て | て | 助詞-接続助詞 |
いる | いる | 動詞-非自立 |
。 | 。 | 記号-句点 |
EOS |
表の項目は左から 表層語・基本形・品詞で、語彙を集計するには基本形を集計対象にする。小僧の神様の「仙吉」や「秤屋」は固有名詞やそれに準ずる名詞であるがゆえに解析辞書に載っていなかったのであろう、「未知語」でもいいのに無理に解析して、おかしな結果になっている。ただし、解析結果が場合によって変わるのではなく、常に同じ解析結果になるので(揺れないので)、対応をすればいいだけである。(解析結果に完全を求め、完全な解析結果が出るまでは使用しないという考え方は、ないものねだりである。)
#----------------------ここから # いくつかのテキストファイルをドロップすると、並べて表示する。 BEGIN{ for(i=1;i< ARGC;i++ ){ n=split(ARGV[i],aaa,"\\"); sub(".txt.cha","",aaa[n]); fname[i]=aaa[n]; c=1; s[i]=0; while(getline < ARGV[i]){ s[i]=s[i]+jlength($1); g[$2 "\t" $3]++; d[fname[i],$2 "\t" $3]++; } } printf"抽出した語\t品詞\t逆順\t"; for(j=1;j< ARGC;j++ ){ printf fname[j] "/実数\t"; } for(j=1;j< ARGC;j++ ){ printf fname[j] "/出現率(ppm)\t"; } print "最大値(ppm)\t最小値(ppm)\t最大値(ppm)-最小値(ppm)\t出現率合計(ppm)\t最大値(ppm)/最小値(ppm)"; for(i in g){ max=0; min=1000000; sss=0; printf i "\t"; split(i,aaa,"\t"); vv=aaa[1]; sv=""; ll=jlength(vv); for(pp=0;pp< ll;pp++){ sv=sv jsubstr(vv,ll-pp,1); } printf sv "\t"; for(j=1;j< ARGC;j++ ){ printf"%d\t",d[fname[j],i]; } for(j=1;j< ARGC;j++ ){ dat=d[fname[j],i]/s[j]*1000000; printf"%5.2f\t",dat; if(max< dat){max=dat} if(min>dat){min=dat} sss=sss+dat; } printf"%5.2f\t%5.2f\t%5.2f\t%5.2f\t",max,min,max-min,sss; if(min>0){ printf"%5.2f\n",max/min; } else{ print "-9999"; } } } #----------------------ここまで
Windowsのコマンドラインやコマンドプロンプトや「ファイル名を指定して実行」から
c:\copal\mawk32.exe -f goi_hindo22.awk 調べたい小説1.txt調べたい小説2.txt > 結果.txt
と、入力するか(すべてパスを通しておくこと)
Copal32pro(最新版配布場所 http://copalpro.sourceforge.jp/)を使うと、スクリプトを開いておいて、調べたいテキストファイルをドラッグ&ドロップするだけで済む。
Copal32proとmawk32の使い方はhttp://satsuki.ex.osaka-kyoiku.ac.jp/~nonami/joho/6.html
を参考に。
そのページのawk_set.lzhには、copal32proとmawk32とサンプルスクリプトが入っていて、容易に試せる。
出力結果は以下のようになる。
抽出語 | 品詞 | 逆順 | 芥川 羅生門 頻度 | 志賀 小僧の… 頻度 | 羅生門 出現率 (ppm) | 小僧の… 出現率 (ppm) | 最大値 (ppm) | 最小値 (ppm) | 最大値 ― 最小値 | 出現率 合計 | 最大値 / 最小値 |
---|---|---|---|---|---|---|---|---|---|---|---|
、 | 記号-読点 | 、 | 400 | 162 | 69384 | 24501 | 69384 | 24501 | 44883 | 93885 | 2.83 |
た | 助動詞 | た | 145 | 219 | 25152 | 33122 | 33122 | 25152 | 7970 | 58273 | 1.32 |
。 | 記号-句点 | 。 | 145 | 187 | 25152 | 28282 | 28282 | 25152 | 3130 | 53434 | 1.12 |
の | 助詞-連体化 | の | 178 | 134 | 30876 | 20266 | 30876 | 20266 | 10610 | 51142 | 1.52 |
を | 助詞-格助詞-一般 | を | 155 | 133 | 26886 | 20115 | 26886 | 20115 | 6771 | 47001 | 1.34 |
て | 助詞-接続助詞 | て | 124 | 152 | 21509 | 22989 | 22989 | 21509 | 1479 | 44498 | 1.07 |
は | 助詞-係助詞 | は | 111 | 165 | 19254 | 24955 | 24955 | 19254 | 5701 | 44209 | 1.3 |
に | 助詞-格助詞-一般 | に | 115 | 102 | 19948 | 15427 | 19948 | 15427 | 4521 | 35374 | 1.29 |
だ | 助動詞 | だ | 88 | 110 | 15265 | 16636 | 16636 | 15265 | 1372 | 31901 | 1.09 |
する | 動詞-自立 | るす | 70 | 75 | 12142 | 11343 | 12142 | 11343 | 799 | 23485 | 1.07 |
項目は左から、
集計表をエクセルに読ませて、
志賀小僧の神様で頻度が高く、芥川羅生門で出現しない上位10語は次の通り。
抽出語 | 品詞 | 志賀直哉『小僧の神様』 頻度 |
---|---|---|
鮨 | 名詞-一般 | 33 |
彼 | 名詞-代名詞-一般 | 32 |
小僧 | 名詞-一般 | 30 |
屋 | 名詞-接尾-一般 | 26 |
吉 | 名詞-一般 | 24 |
仙 | 名詞-固有名詞-地域-一般 | 23 |
客 | 名詞-一般 | 17 |
番頭 | 名詞-一般 | 14 |
あの | 連体詞 | 13 |
店 | 名詞-一般 | 12 |
品詞 | 基本形(頻度) |
---|---|
感動詞 | ええ(3) へえ(3) |
形容詞-自立 | 小さい(11) 淋しい(7) 旨い(6) 若い(4) 忙しい(2) |
助詞-終助詞 | ネ(11) ね(2) |
助詞-接続助詞 | ちゃ(2) |
助動詞 | ます(11) です(10) |
接続詞 | そして(10) つまり(2) |
接頭詞-名詞接続 | 不(2) |
動詞-自立 | 食う(8) 喜ぶ(6) 聴く(6) 入る(6) 立つ(5) 握る(4) 食べる(4) 置く(4) 通る(4) 貰う(4) そう(3) 会う(3) 笑う(3) 食える(3) 潜る(3) 想う(3) 通り過ぎる(3) 歩く(3) かく(2) しく(2) へる(2) ます(2) やる(2) 解る(2) 教わる(2) 向う(2) 坐る(2) 思い切る(2) 出せる(2) 出掛ける(2) 乗る(2) 頂く(2) 渡す(2) 挽く(2) 並ぶ(2) 連れる(2) |
動詞-接尾 | せる(2) |
動詞-非自立 | やる(5) |
副詞-一般 | 然(10) 一寸(8) とにかく(3) 段々(3) さぞ(2) どうして(2) まあ(2) 只(2) 殆ど(2) |
副詞-助詞類接続 | 直ぐ(7) 全く(3) |
未知語 | 憶(3) 此(2) 俥(2) |
名詞-サ変接続 | 御馳走(11) 一緒(4) 位置(2) 往復(2) 想像(2) 躊躇(2) |
名詞-一般 | 秤(9) 了(9) 気持(8) 暖簾(8) 稲荷(6) 屋台(6) 電車(6) 細君(5) 通(5) かみさん(4) 鮪(4) 感じ(3) 子供(3) 処(3) 番地(3) 腹(3) 名(3) 冷汗(3) お辞儀(2) 横(2) 横町(2) 外濠(2) 喜び(2) 議員(2) 具合(2) 故(2) 自動車(2) 若(2) 手車(2) 宿(2) 出鱈目(2) 場(2) 神様(2) 図(2) 恥(2) 帳面(2) 超自然(2) 夫人(2) 様子(2) |
名詞-形容動詞語幹 | 変(9) 主(3) 妙(3) いや(2) 不思議(2) 無闇(2) |
名詞-固有名詞 | 京橋(4) 中(2) 掛(2) 平(2) 松屋(3) 統(2) 与兵衛(2) 神田(2) 本(2) |
名詞-数 | 三(4) 八(2) |
名詞-接尾 | 後(2) つ(5) 銭(3) さん(8) 達(6) 様(6) 方(4) 通(3) 橋(2) 使(2) |
名詞-代名詞 | 私(4) 何時(2) |
名詞-非自立 | 故(2) ん(7) 風(3) |
名詞-副詞可能 | 先日(4) 偶然(2) |
連体詞 | そんな(8) |
芥川羅生門で頻度が高く、志賀小僧の神様で出現しない上位10語は次の通り。
抽出語 | 品詞 | 芥川龍之介『羅生門』 頻度 |
---|---|---|
下人 | 名詞-一般 | 44 |
老婆 | 名詞-一般 | 28 |
門 | 名詞-一般 | 15 |
屍骸 | 名詞-一般 | 14 |
雨 | 名詞-一般 | 12 |
そうして | 接続詞 | 11 |
男 | 名詞-一般 | 11 |
死 | 名詞-一般 | 9 |
梯子 | 名詞-一般 | 9 |
火 | 名詞-一般 | 8 |
死人 | 名詞-一般 | 8 |
饑 | 未知語 | 8 |
頻度2以上の語()内は頻度
品詞 | 基本形(頻度) |
---|---|
感動詞- | じゃ(2) |
形容詞-自立 | 長い(4) 広い(3) 高い(3) 低い(3) 暗い(2) 白い(2) |
助詞-格助詞 | より(4) として(3) に対する(3) に従って(2) |
助詞-係助詞 | さえ(4) |
助詞-終助詞 | ぞ(3) |
助詞-副助詞 | ずつ(5) とも(2) |
助動詞 | まい(2) |
接続詞 | そこで(7) しかも(2) |
動詞-自立 | 抜く(7) かける(5) 見える(5) 売る(4) とる(3) ふる(3) 棄てる(3) 眺める(3) 動かす(3) 動く(3) 燃える(3) 覗く(3) かかる(2) ちぢめる(2) つかむ(2) つぶやく(2) とまる(2) ともす(2) 往ぬ(2) 押す(2) 干る(2) 見開く(2) 持って来る(2) 重ねる(2) 棲む(2) 挿す(2) 奪う(2) 着る(2) 這う(2) 剥ぐ(2) 抜ける(2) 飛ぶ(2) 喘ぐ(2) 啼く(2) |
動詞-非自立 | る(6) しまう(4) |
副詞-一般 | 勿論(6) どうにか(3) どうせ(2) とうとう(2) どうにも(2) 唯(2) |
副詞-助詞類接続 | さっき(6) いきなり(2) やっと(2) 一層(2) 全然(2) |
未知語 | 殆(3) 引(2) 掩(2) 暫(2) 頸(2) |
名詞-サ変接続 | 憎悪(3) 恐怖(2) 肯定(2) 失望(2) 衰微(2) 息(2) |
名詞-ナイ形容詞語幹 | 仕方(4) |
名詞-一般 | 女(7) 太刀(7) 髪の毛(6) 右(5) 光(5) 声(5) 盗人(5) 唯(5) 鴉(5) やみ(4) 己(4) 着物(4) 髪(4) 頬(4) 面皰(4) 悪(3) 猿(3) 肩(3) 段(3) 柱(3) 皮(3) 鼻(3) まわり(2) わし(2) 唖(2) 一通り(2) 襖(2) 可(2) 暇(2) 旧記(2) 喉(2) 手段(2) 床(2) 鞘(2) 石段(2) 足(2) 大路(2) 丹(2) 丹塗(2) 膿(2) 白髪(2) 部分(2) 幅(2) 夕闇(2) 裸(2) 洛中(2) 腕(2) 檜(2) 蟋蟀(2) |
名詞-形容動詞語幹 | 急(2) |
名詞-固有名詞 | 羅生門(7) 京都(3) 松の木(3) 朱雀(2) 聖(2) |
名詞-接尾 | 楼(5) 上(3) 片(3) ども(2) 羽(2) 色(2) 帯(2) 段(2) 的(2) 柄(2) 本(2) |
名詞-代名詞 | そこ(2) どこ(2) わし(2) |
名詞-非自立 | 程(5) 者(4) 為(2) |
文番号 | 本文 |
---|---|
11 | 「あの家のを食っちゃア、この辺のは食えないからネ」 |
126 | 「お前さん、あの旦那とは前からお馴染なの?」 |
175 | 若しかしたら、あの場に居たんだ、と思った。 |
179 | そう云えば、今日連れて行かれた家はやはり先日番頭達の噂をしていた、あの家だ。 |
180 | 全体どうして番頭達の噂まであの客は知ったろう? |
183 | 彼は一途に自分が番頭達の噂話を聴いた、その同じ時の噂話をあの客も知っていて、今日自分を連れて行ってくれたに違いないと思い込んで了った。 |
184 | そうでなければ、あの前にも二三軒鮨屋の前を通りながら、通り過ぎて了った事が解らないと考えた。 |
185 | とにかくあの客は只者ではないと云う風に段々考えられて来た。 |
186 | 自分が屋台鮨屋で恥をかいた事も、番頭達があの鮨屋の噂をしていた事も、その上第一自分の心の中まで見透して、あんなに充分、御馳走をしてくれた。 |
201 | 仙吉には「あの客」が益々忘れられないものになって行った。 |
205 | 彼は悲しい時、苦しい時に必ず「あの客」を想った。 |
207 | 彼は何時かは又「あの客」が思わぬ恵みを持って自分の前に現れて来る事を信じていた。 |
209 | 実は小僧が「あの客」の本体を確めたい要求から、番頭に番地と名前を教えて貰って其処を尋ねて行く事を書こうと思った。 |
仙吉が寿司を食べさせてくれた「あの客」のことを考える時に「あの」が使われている。回想に伴う遠称である。
羅生門には過去の出来事を書いた部分が三ヶ所ある。
一つは、羅生門が現在のようになった経緯「羅生門の修理などは、元より誰も捨てて顧る者がなかった。するとその荒れ果てたのをよい事にして、狐狸が棲む。盗人が棲む。とうとうしまいには、引取り手のない死人を、この門へ持って来て、棄てて行くと云う習慣さえ出来た。そこで、日の目が見えなくなると、誰でも気味を悪るがって、この門の近所へは足ぶみをしない事になってしまったのである。」
二つめは下人が今の境遇になった経緯「ところがその主人からは、四五日前に暇を出された。前にも書いたように、当時京都の町は一通りならず衰微していた。今この下人が、永年、使われていた主人から、暇を出されたのも、実はこの衰微の小さな余波に外ならない。」
以上二つの部分は語り手の解説である。語り手が回想しても構わないのであるが、下人や老婆という登場人物とは役割を分けて小説世界を観察し解説する機能をもたせようとしたのであろう。
三つめは老婆の言い訳「成程な、死人の髪の毛を抜くと云う事は、何ぼう悪い事かも知れぬ。じゃが、ここにいる死人どもは、皆、その位な事を、されてもいい人間ばかりだぞよ。現在、わしが今、髪を抜いた女などはな、蛇を四寸ばかりずつに切って干したのを、干魚だと云うて、太刀帯の陣へ売りに往んだわ。疫病にかかって死ななんだら、今でも売りに往んでいた事であろ。それもよ、この女の売る干魚は、味がよいと云うて、太刀帯どもが、欠かさず菜料に買っていたそうな。わしは、この女のした事が悪いとは思うていぬ。せねば、饑死をするのじゃて、仕方がなくした事であろ。されば、今又、わしのしていた事も悪い事とは思わぬぞよ。これとてもやはりせねば、饑死をするじゃて、仕方がなくする事じゃわいの。じゃて、その仕方がない事を、よく知っていたこの女は、大方わしのする事も大目に見てくれるであろ」である。老婆は女の死体と伴にいて「この女」と言って「あの女」とは言わない。「いま、ここ、これ」によって現在の緊迫した小説世界を作り出しているのである。
抽出語 | 品詞 | 芥川龍之介『羅生門』 頻度 | 志賀直哉『小僧の神様』 頻度 | 羅生門出現率(ppm) | 小僧の…出現率(ppm) |
---|---|---|---|---|---|
、 | 記号-読点 | 400 | 162 | 69384 | 24501 |
た | 助動詞 | 145 | 219 | 25152 | 33122 |
の | 助詞-連体化 | 178 | 134 | 30876 | 20266 |
。 | 記号-句点 | 145 | 187 | 25152 | 28282 |
を | 助詞-格助詞-一般 | 155 | 133 | 26886 | 20115 |
は | 助詞-係助詞 | 111 | 165 | 19254 | 24955 |
て | 助詞-接続助詞 | 124 | 152 | 21509 | 22989 |
に | 助詞-格助詞-一般 | 115 | 102 | 19948 | 15427 |
だ | 助動詞 | 88 | 110 | 15265 | 16636 |
が | 助詞-格助詞-一般 | 80 | 61 | 13877 | 9226 |
する | 動詞-自立 | 70 | 75 | 12142 | 11343 |
句読点と助動詞と助詞と動詞の「する」が出現率に差がない。当然である。日本語の文に必須の成分であるから。
句点読点は文長や一文中の句の数に関係する。
両方に現れる副詞を出現率の合計でソートした。
抽出語 | 品詞 | 芥川龍之介『羅生門』 頻度 | 志賀直哉『小僧の神様』 頻度 | 出現率合計 | 最大値/最小値 |
---|---|---|---|---|---|
そう | 副詞-一般 | 2 | 17 | 2918 | 7.41 |
少し | 副詞-助詞類接続 | 3 | 10 | 2033 | 2.91 |
こう | 副詞-助詞類接続 | 3 | 7 | 1579 | 2.03 |
又 | 副詞-一般 | 4 | 5 | 1450 | 1.09 |
どう | 副詞-助詞類接続 | 2 | 5 | 1103 | 2.18 |
もう | 副詞-一般 | 4 | 2 | 996 | 2.29 |
まだ | 副詞-助詞類接続 | 2 | 2 | 649 | 1.15 |
やはり | 副詞-一般 | 1 | 2 | 476 | 1.74 |
何故 | 副詞-一般 | 1 | 2 | 476 | 1.74 |
きっと | 副詞-助詞類接続 | 1 | 2 | 476 | 1.74 |
ともかく | 副詞-一般 | 1 | 1 | 325 | 1.15 |
よく | 副詞-一般 | 1 | 1 | 325 | 1.15 |
既に | 副詞-一般 | 1 | 1 | 325 | 1.15 |
丁度 | 副詞-一般 | 1 | 1 | 325 | 1.15 |
間もなく | 副詞-助詞類接続 | 1 | 1 | 325 | 1.15 |
当然 | 副詞-助詞類接続 | 1 | 1 | 325 | 1.15 |
特に小説世界の動きを特徴付ける副詞は見当たらない。一般的に用いられる副詞なのであろう。
芥川龍之介『羅生門』 | 志賀直哉『小僧の神様』 | ||
---|---|---|---|
抽出語 | 頻度 | 抽出語 | 頻度 |
勿論 | 6 | 一寸 | 8 |
さっき | 6 | 直ぐ | 7 |
どうにか | 3 | とにかく | 3 |
どうせ | 2 | 段々 | 3 |
とうとう | 2 | 全く | 3 |
どうにも | 2 | さぞ | 2 |
唯 | 2 | どうして | 2 |
いきなり | 2 | まあ | 2 |
やっと | 2 | 只 | 2 |
一層 | 2 | 殆ど | 2 |
全然 | 2 | ||
頻度1 | 頻度1 | ||
あっと ごろごろ じっと とうに ぼんやり まるで わなわな 一目 何時の間にか 何分 改めて 格別 恐らく 今まで 次第に 存外 多分 大体 同時に 平に しまいに すぐ それほど とても はじめて はっきり 何故 恐る恐る ああ がつがつ さして ジロジロ どうか どうも ぶらぶら ブルブル もっと 一度 益々 何しろ 何だか 何とか 何故か 結構 忽ち 若し 充分 順に 尚 人知れず 漸く 大分 大変 沢山 如何にも 頻りに 別に あんなに かなり かねて そろそろ ペコペコ もう少し 案の定 再び 再三 初めて 色々 心から 必ず | ああ がつがつ さして ジロジロ どうか どうも ぶらぶら ブルブル もっと 一度 益々 何しろ 何だか 何とか 何故か 結構 忽ち 若し 充分 順に 尚 人知れず 漸く 大分 大変 沢山 如何にも 頻りに 別に あんなに かなり かねて そろそろ ペコペコ もう少し 案の定 再び 再三 初めて 色々 心から 必ず |
芥川龍之介『羅生門』だけに現れる副詞(頻度2以上)は、芥川の愛用語「勿論」、心理語「どうせ」、時を示す「さっき・とうとう・いきなり・やっと」である。それらを使って、小説世界を語り手が解説し、登場人物の心理を詳細に示し、時を示して動きを見せるという芥川の叙述法が副詞の使用頻度から観察できそうである。頻度1の副詞も頻度2以上の副詞と同じ機能を持っている。
志賀直哉『小僧の神様』だけに現れる副詞で特徴的なのは、「一寸」である。
「一寸」で登場人物が優柔不断であることを表している。
文番号 | 本文 |
---|---|
47 | 彼は一寸躊躇した。 |
61 | 小僧はいやな顔をしながら、その場が一寸動けなくなった。 |
79 | 「勇気かどうか知らないが、ともかくそう云う勇気は一寸出せない。直ぐ一緒に出て他所で御馳走するなら、まだやれるかも知れないが」 |
89 | 「そう……」とAは仙吉を見ながら一寸考えて、「その小僧さんは今、手隙かネ?」と云った。 |
96 | Aは一寸弱った。 |
113 | 「一寸待ってくれ」 |
161 | 細君は一寸考える風だった。 |
171 | 然し、こんな旨いもので一杯にした事は一寸憶い出せなかった。 |
最後の2文は細君と仙吉だが、それより前の6文はAの行動や言動内で使われている。
「一寸」が何度も使われているので気づくけれども、使われている副詞が一般的に使う副詞であると気づきにくいことがある。そういう微妙な表現に気づくことができる可能性が有りそうである。
抽出語 | 品詞 | 芥川龍之介『羅生門』頻度 | 志賀直哉『小僧の神様』頻度 | 出現率合計 | 最大値/最小値 |
---|---|---|---|---|---|
しかし・然し | 接続詞 | 6 | 11 | 2704 | 1.60 |
それから | 接続詞 | 5 | 3 | 1321 | 1.91 |
いや | 接続詞 | 1 | 1 | 325 | 1.15 |
すると | 接続詞 | 1 | 1 | 325 | 1.15 |
では | 接続詞 | 1 | 1 | 325 | 1.15 |
両方に使われる語には特徴がないということを補強するだけのデータのように見えるが、果たしてそうか。逆接の「しかし・然し」について確かめる。
連文関係 | 例数 |
---|---|
逆接関係 | 1例 |
間接的逆接関係 | 4例 |
解釈によって逆接関係になるか関節逆接関係になるか揺れる | 1例 |
志賀直哉の場合はどうであろうか。
「稲荷様かも知れない、と考えた」ことと、「お稲荷様にしてはハイカラなのが少し変にも思われた。」こととが肯定対否定の逆接関係である。心理変化に使っている。
志賀直哉の「然し」は
連文関係 | 例数 |
---|---|
逆接関係 | 4例 |
間接的逆接関係 | 4例 |
怒るでしかし | 3例 |
抽出語 | 芥川龍之介『羅生門』頻度 | 抽出語 | 志賀直哉『小僧の神様』頻度 |
---|---|---|---|
そうして | 11 | そして | 10 |
そこで | 7 | つまり | 2 |
しかも | 2 | が | 1 |
じゃが | 1 | じゃあ | 1 |
それでも | 1 | それに | 1 |
だから | 1 | それにしても | 1 |
と同時に | 1 | ||
実は | 1 | ||
従って | 1 | ||
又 | 1 | ||
尤も | 1 |
芥川「そうして」志賀「そして」の違い、芥川が接続詞を若干多様に用いるという程度のことがが認められる。
抽出語 | 品詞 | 芥川龍之介『羅生門』頻度 | 志賀直哉『小僧の神様』頻度 | 出現率合計 | 最大値/最小値 |
---|---|---|---|---|---|
ない | 形容詞-自立 | 17 | 10 | 4461 | 1.95 |
よい | 形容詞-自立 | 3 | 7 | 1579 | 2.03 |
悪い | 形容詞-自立 | 4 | 4 | 1299 | 1.15 |
赤い | 形容詞-自立 | 3 | 1 | 672 | 3.44 |
いい | 形容詞-非自立 | 1 | 3 | 627 | 2.62 |
強い | 形容詞-自立 | 2 | 1 | 498 | 2.29 |
大きい | 形容詞-自立 | 1 | 2 | 476 | 1.74 |
いい | 形容詞-自立 | 1 | 1 | 325 | 1.15 |
少い | 形容詞-自立 | 1 | 1 | 325 | 1.15 |
よい | 形容詞-非自立 | 1 | 1 | 325 | 1.15 |
『羅生門』の「赤い」は、
芥川龍之介『羅生門』 | 志賀直哉『小僧の神様』 | ||
---|---|---|---|
抽出語 | 頻度 | 抽出語 | 頻度 |
長い | 4 | 小さい | 11 |
広い | 3 | 淋しい | 7 |
高い | 3 | 旨い | 6 |
低い | 3 | 若い | 4 |
暗い | 2 | 忙しい | 2 |
白い | 2 | ||
あかい うい うすい けわしい こい すばやい とぼしい はげしい 鋭い 遠慮ない 黄いろい 寒い 狭い 細い 手荒い 重たい 短い 遅い 欲しい | ありがたい うまい くい ずるい たまらない 遠い 何気ない 可愛い 怪しい 嬉しい 恐ろしい 苦しい 軽々しい 厚い 惨い 早い 薄気味悪い 悲しい 力強い |
芥川『羅生門』にだけ使われた形容詞は、ほぼ外形を形容するものであるのに対し、志賀『小僧の神様』にだけ使われた形容詞の中には「淋しい ありがたい ずるい たまらない 何気ない 可愛い 怪しい 嬉しい 恐ろしい 苦しい 軽々しい 惨い 薄気味悪い 悲しい 力強い」などの心理内容や事物に対する評価を表すものが含まれている。
以上 5656文字の芥川龍之介『羅生門』と6168文字の志賀直哉『小僧の神様』の語彙を比較した。同じくらいの文字数の作品でどの程度のことがわかるかを調べたことになる。 出現率を出しておいたのは、サイズの違う文章の語彙を比較する時のためである。10KBと100KBというような大きな差がある場合は注意しないといけないが、いろいろなザイズの文章を扱って、出現する語を比較することで、文章表現上の秘密に迫っていきたい。