大阪教育大学 国語教育講座 野浪研究室 ←戻る counter

近代小説に使われた身体語彙について
―― 大量テキストを語彙検索することによって得られるもの ――

「学大国文 53号」大阪教育大学国語国文学研究室 2010年3月

野浪正隆(のなみまさたか)

0.はじめに

 拙稿「近代小説に使われた故事成語」(学大国文52号)で筆者は次のように述べた。

確立した方法によって現象を分析し、分析結果から結論を導き出す研究がある一方、結論よりも現象を分析する方法の確立を目指す研究がある。後者の結論は「この方法は、……程度有効である」であって、前者の結論「この現象は、……である」とは違う。
 本研究は、現象を分析する方法の確立を目指す研究である。具体的には、人間の代わりにコンピュータに文章中のキーワードを検査させて、何らかの思考材料を得るという方法がどの程度有効であるのかを判定するものである。
 本論文は、上記論文に続くもので、「故事成語」を「身体語彙」に変えて、近代小説に現れる「身体性」を探ろうというものである。

1.用意したもの (前掲論文と同じであるが、参照する必要がないように再掲する。)

1.1 テキスト

 「新潮文庫の100冊[CD-ROM]」 新潮社 (1995/12)と「新潮の文庫 明治の文豪[CD-ROM]」新潮社 (1997/01)と「新潮の文庫 大正の文豪[CD-ROM]」新潮社 (1997/07)に収録された日本文学作品は、以下の通り(作者名のJISコード順)である。
阿川弘之:『山本五十六』『山本五十六』作品後記
安部公房:『砂の女』
伊藤左千夫:『姪子』『守の家』『浜菊』『野菊の墓』
井上ひさし:『ブンとフン』
井上靖:『あすなろ物語』
井伏鱒二:『黒い雨』
遠藤周作:『沈黙』『沈黙』切支丹屋敷役人日記
塩野七生:『コンスタンティノープルの陥落』
夏目漱石:『こころ』『ケーベル先生』『三四郎』『二百十日』『倫敦塔』『坊ちゃん』『坑夫』『変な音』『夢十夜』『彼岸過迄』『思い出す事など』『我輩は猫である』『手紙』『文鳥』『明暗』『永日小品』『硝子戸の中』『草枕』『虞美人草』『行人』『道草』『野分』『門』
芥川龍之介:『あばばばば』『おぎん』『おしの』『きりしとほろ上人伝』『さまよえる猶太人』『るしへる』『アグニの神』『トロッコ』『一塊の土』『仙人』『侏儒の言葉』『俊寛』『偸盗』『六の宮の姫君』『地獄変』『報恩記』『大導寺信輔の半生』『奉教人の死』『好色』『年末の一日』『庭』『往生絵巻』『或日の大石内蔵之助』『或阿呆の一生』『戯作三昧』『文芸的な、余りに文芸的な』『杜子春』『枯野抄』『歯車』『河童』『澄江堂雑記』『煙草と悪魔』『犬と笛』『猿蟹合戦』『玄鶴山房』『白』『神神の微笑』『秋』『竜』『糸女覚え書』『羅生門』『舞踏会』『芋粥』『藪の中』『蜃気楼』『蜘蛛の糸』『蜜柑』『袈裟と盛遠』『西方の人』『運』『邪宗門』『開化の殺人』『雛』『魔術』『黒衣聖母』『鼻』
開高健:『パニック』『巨人と玩具』『流亡記』『裸の王様』
梶井基次郎:『ある崖上の感情』『ある心の風景』『のんきな患者』『交尾』『冬の日』『冬の蠅』『器楽的幻覚』『城のある町にて』『愛撫』『桜の樹の下には』『橡の花』『檸檬』『泥濘』『筧の話』『蒼穹』『路上』『過古』『闇の絵巻『雪後』『Kの昇天』
葛西善蔵:『仲間』『呪はれた手』『埋葬そのほか』『子をつれて』『悪魔』『春』『暗い部屋にて』『椎の若葉』『湖畔手記』『酔狂者の独白』
岩野泡鳴:『憑き物』『憑き物補遺』『放浪』『断橋』『毒薬を飲む女』『発展』
菊池寛:『ある恋の話』『俊寛』『入れ札』『屋上の狂人』『形』『忠直卿行状記』『恩を返す話』『恩讐の彼方に』『敵討以上』『時勢は移る』『極楽』『海の勇者』『父帰る』『真似』『籐十郎の恋(戯曲)』『義民甚兵衛』『藤十郎の恋』『蘭学事始』
吉行淳之介:『樹々は緑か』『砂の上の植物群』
吉村昭:『戦艦武蔵』『戦艦武蔵』あとがき
久米正雄:『学生時代』
宮沢賢治:『ひのきとひなげし』『よだかの星』『オツベルと象』『カイロ団長』『シグナルとシグナレス』『セロ弾きのゴーシュ』『ビジテリアン大祭』『マリヴロンと少女』『北守将軍と三人兄弟の医者』『双子の星』『猫の事務所』『銀河鉄道の夜』『饑餓陣営』『黄いろのトマト』
宮本輝:『錦繍』
五木寛之:『風に吹かれて』
幸田露伴:『太公望』『文字と秦の丞相李斯』『晋の僧法顕南アメリカに至る?』『楊貴妃と香』『王羲之』『画題としての詩仙』『芭蕉入門』『蘇子瞻米元章』『蘇東坡と海南島』
高野悦子:『二十歳の原点』
国木田独歩:『おとづれ』『たき火』『わかれ』『二老人』『初孫』『初恋』『号外』『富岡先生』『少年の悲哀』『岡本の手帳』『巡査』『忘れえぬ人々』『星』『春の鳥』『武蔵野』『死』『河霧』『渚』『源叔父』『牛肉と馬鈴薯』『疲労』『空知川の岸辺』『窮死』『竹の木戸』『糸くず』『絶望』『詩想』『運命論者』『遺言』『郊外』『酒中日記』『鹿狩』
三浦綾子:『塩狩峠』
三浦哲郎:『忍ぶ川』
三島由紀夫:『金閣寺』
三木清:『人生論ノート』『人生論ノート』後記
山本周五郎:『さぶ』
山本有三:『路傍の石』『路傍の石』あとがき『路傍の石』ペンを折る『路傍の石』付録
司馬遼太郎:『国盗り物語』
志賀直哉:『佐々木の場合』『冬の往来』『十一月三日午後の事』『城の崎にて』『好人物の夫婦』『小僧の神様』『山科の記憶』『晩秋』『流行感冒』『濠端の住まい』『焚火』『瑣事』『痴情』『真鶴』『赤西蠣太』『転生』『雨蛙』『雪の日』
小林秀雄:『モオツァルト』『偶像崇拝』『光悦と宗達』『実朝』『平家物語』『当麻』『徒然草』『無常という事』『真贋』『蘇我馬子の墓』『西行』『鉄斎』『雪舟』『骨董』
松本清張:『点と線』
新田次郎:『孤高の人』
森 鴎外:『かのように』『じいさんばあさん』『カズイスチカ』『ヰタ・セクスアリス』『二人の友』『余興』『堺事件』『妄想』『寒山拾得』『山椒大夫』『普請中』『最後の一句』『杯』『百物語』『興津弥五右衛門の遺書』『舞姫』『護持院原の敵討』『阿部一族』『附寒山拾得縁起』『雁』『青年』『高瀬舟』『高瀬舟縁起』『鶏』
水上 勉:『越前竹人形』『雁の寺』
星 新一:『人民は弱し、官吏は強し』
石川淳:『かよい小町』『マルスの歌』『処女懐胎』『喜寿童女』『変化雑載』『山桜』『張柏端』『焼跡のイエス』『葦手』
石川啄木:『一握の砂・悲しき玩具』
石川達三:『青春の蹉跌』
赤川次郎:『女社長に乾杯!』
川端康成:『雪国』
泉 鏡花:『国貞えがく』『売色鴨南蛮』『女客』『婦系図』『歌行燈』『高野聖』
曽野綾子:『太郎物語』高校編 大学編1 大学編2
倉橋由美子:『聖少女』
倉田百三:『出家とその弟子』
村上春樹:『世界の終りとハードボイルド・ワンダーランド:』
太宰 治:『人間失格』
大岡昇平:『野火』
大江健三郎:『不意の唖』『人間の羊』『他人の足』『戦いの今日』『死者の奢り』『飼育』
沢木耕太郎:『一瞬の夏』
谷崎潤一郎:『痴人の愛』
池波正太郎:『剣客商売』
竹山道雄:『ビルマの竪琴』
中島 敦:『名人伝』『山月記』『弟子』『李陵』
長塚 節:『土』
長与善郎:『青銅の基督』
椎名誠:『新橋烏森口青春篇』
田山花袋:『生』『田舎教師』『蒲団』『重右衛門の最後』
田辺聖子:『新源氏物語』『源氏物語』とつきあって
渡辺淳一:『花埋み』
島崎藤村:『ある女の生涯』『三人』『並木』『伸び支度』『分配』『刺繍』『千曲川のスケッチ』『夜明け前』『家』『岩石の間』『嵐』『市井にありて』『新生』『旧主人』『春』『桃の雫』『桜の実の熟する時』『海へ』『熱海土産』『破戒』『船』『芽生』『藁草履』『藤村詩稿』『藤村詩集』『足袋』『食堂』
筒井康隆:『エディプスの恋人』
藤原正彦:『若き数学者のアメリカ』
徳田秋声:『あらくれ』『縮図』
二葉亭四迷:『あひびき』『くされ縁』『其面影』『平凡』『浮雲』『片恋』
樋口一葉:『うつせみ』『たけくらベ』『にごりえ』『ゆく雲』『わかれ道』『われから』『十三夜』『大つごもり』
尾崎紅葉:『新続金色夜叉』『続続金色夜叉』『続金色夜叉』『金色夜叉』
武者小路実篤:『友情』『友情』自序友情
福永武彦:『草の花』
北原白秋詩集:『思ひ出』『東京景物詩』『歌謡』『水墨集』『海豹と雲』『白金之独楽』『真珠抄』『第二白金之独楽』
北杜夫:『楡家の人びと』
堀 辰雄:『美しい村』『風立ちぬ』
野坂昭如:『アメリカひじき』『プアボーイ』『ラ・クンパルシータ』『死児を育てる』『火垂るの墓』『焼土層』
柳田国男:『遠野物語』
有吉佐和子:『華岡青洲の妻』
有島武郎:『小さき者へ』『惜みなく愛は奪う』『或る女』『生れ出づる悩み』
里見 ク:『多情仏心』
立原正秋:『冬の旅』
林芙美子:『放浪記』
壺井 栄:『二十四の瞳』

1.2 検索語としての身体語彙

 「分類語彙表」(国立国語研究所編 大日本図書 2004.1)に「身体」として分類されている1344語

アレルギー体質体-1.56:身体-1.5600:身体
どざえもん体-1.56:身体-1.5600:身体
|
卵白体-1.56:身体-1.5608:卵
体-1.56:身体-1.5608:卵
と「生命」に分類されている948語を検索語として用いた。
バイオリズム体-1.57:生命-1.5710:生理
アレルギー体-1.57:生命-1.5710:生理
|
体-1.57:生命-1.5721:病気・体調
体-1.57:生命-1.5721:病気・体調

 前掲論文では検索語が「故事成語」という2文字以上の語であったからそれに語を付け加えていても、故事成語性は減じなかったが、身体語では例えば「体」に「全」を付け加えて「全体」という語を作る。元々は「全体」で「身体全体」を意味していたのであろうが、現在「全体」は単に「all・すべて」しか意味しない。(だから「身体全体」と身体を付け加えなければならなくなっている)。「体」で検索すると「全体」も拾ってくる緩いスクリプトを書いているので、こういう事態は悩ましい。

 これに対して2つの方法がある。

  1. もはや身体語でない語は検索語群から外す。
  2. 現在身体性がほとんどない語にも身体性を見て、検索語群から外さない。
 今回は後者の方法をとった。身体性を測定することが困難であるからである。
 また、身体語彙なのだから「身体」に分類されている語を検索語にするだけでいいのだが、「生命」に分類されている
体-1.57:生命-1.5710:生理    203語
体-1.57:生命-1.5720:障害・けが 127語
体-1.57:生命-1.5721:病気・体調 588語
を付け加えたのは、状態も身体のうちだと考えるからである。それならば、身体の動きも身体語として扱うか。これは問題である。大部分の動詞が身体の動きを表すものであろう。それらに身体性はあるけれども、動詞を対象にした研究になってしまう。動詞は扱わないことにする。

2.0 作家ごとの出現率上位10語

 さて、作品から「身体語彙」を検索して、作家ごとに集計をした。誰がどんな語を何回使っているかを算出しても仕方がない。作品ごとに文章量が違うので、出現率で比較する。また、検索語すべてを示すと紙面が尽きる(というか学大国文一冊に収まらないだろう)ので、出現率上位10語を示す。

表1 作家ごとの出現率上位10語
作家名延べ数身体語出現率
(パーミリオン)
頻出語上位10位
(パーミリオン)
阿川弘之2959115手(1481) 目(652) 面(578) 口(473) 身(428) 指(398) 頭(329) 体(306) 顔(286) 首(271)
安部公房29917905手(2088) 目(1167) 体(1048) 口(905) 面(651) 足(636) 顔(531) 身(494) 眼(479) 指(322)
伊藤左千夫9212832手(1561) 顔(1142) 口(1028) 目(895) 面(628) 足(571) 涙(438) 胸(381) 身(381) 眼(343)
井上ひさし14210004手(1729) 目(525) 面(501) 口(453) 毛(405) 体(382) 首(358) 便(346) 顔(298) 頭(203)
井上靖15613093手(1923) 顔(1234) 眼(1121) 口(936) 目(741) 面(679) 身(525) 体(370) 頭(360) 足(339)
井伏鱒二35918090手(1620) 目(918) 口(769) 顔(749) 病(692) 体(559) 足(544) 身(502) 頭(482) 面(461)
遠藤周作17014783顔(1466) 眼(1297) 手(1109) 口(813) 足(692) 体(632) 面(491) 頭(437) 首(417) 耳(410)
塩野七生1168058手(794) 眼(683) 首(564) 指(508) 身(481) 口(446) 目(418) 頭(334) 面(313) 息(306)
夏目漱石61514434手(1547) 顔(1032) 口(946) 面(849) 眼(847) 目(791) 頭(712) 足(600) 体(320) 身(292)
芥川龍之介43813315手(1305) 顔(890) 身(863) 目(841) 眼(725) 口(567) 足(484) 面(465) 頭(424) 体(381)
開高健25615127手(1687) 口(1148) 顔(740) 体(722) 眼(698) 足(633) 目(527) 頭(385) 身(361) 首(331)
梶井基次郎20613330手(1308) 顔(886) 眼(726) 面(465) 目(458) 体(443) 身(436) 口(436) 足(429) 身体(407)
葛西善蔵24413003手(1097) 顔(895) 眼(606) 目(520) 口(520) 面(462) 身(368) 頭(361) 体(354) 病気(317)
岩野泡鳴28910950手(1568) 目(1160) 顔(854) 面(693) 口(626) 身(577) 足(407) 熱(264) 体(232) 病気(223)
菊池寛22313072手(2043) 身(993) 口(823) 目(747) 顔(621) 頭(621) 足(514) 面(371) 病(300) 眼(295)
吉行淳之介20220393眼(2261) 顔(1973) 口(1641) 手(1048) 頭(864) 目(681) 面(559) 身(559) 唇(541) 髪(506)
吉村昭16013505体(1729) 面(1616) 手(964) 甲(805) 目(778) 口(765) 首(632) 眼(598) 指(572) 顔(545)
久米正雄17012266手(1778) 顔(1335) 目(848) 口(772) 眼(690) 面(633) 身(538) 頭(430) 足(354) 体(342)
宮沢賢治16410458手(1013) 眼(700) 顔(675) 口(583) 頭(436) 目(436) 面(368) 足(338) 体(276) 肉(258)
宮本輝18512166手(2185) 目(1229) 顔(733) 口(676) 尾(489) 体(460) 息(374) 身(287) 足(287) 面(280)
五木寛之1659549手(1440) 目(1017) 面(876) 顔(505) 口(438) 頭(394) 足(342) 身(327) 体(304) 首(171)
幸田露伴1518775面(928) 手(837) 脳(620) 眼(512) 体(428) 身(379) 目(379) 足(331) 口(295) 顔(235)
高野悦子1339655体(1417) 身(830) 手(742) 目(653) 眼(410) 弱(343) 顔(321) 面(310) 血(299) 足(288)
国木田独歩24213067手(1414) 顔(1161) 眼(952) 口(777) 面(736) 目(703) 頭(557) 身(520) 足(498) 涙(245)
三浦綾子18910759手(1432) 顔(1195) 目(991) 口(678) 足(393) 体(377) 身(361) 頭(339) 胸(328) 涙(275)
三浦哲郎29916904目(1869) 手(1726) 顔(1095) 口(803) 身(528) 胸(482) 頭(476) 足(453) 面(413) 血(321)
三島由紀夫22713880目(1636) 手(1334) 足(886) 顔(824) 身(750) 口(615) 体(486) 面(474) 頭(406) 背(264)
三木清436506傷(1127) 体(1028) 身(676) 健康(662) 手(493) 面(352) 病気(310) 目(268) 身体(211) 生理(169)
山本周五郎18414330手(2090) 眼(1259) 口(1126) 顔(1002) 足(841) 頭(736) 首(408) 身(351) 息(309) 面(266)
山本有三1577501手(1351) 目(732) 顔(601) 口(470) 足(299) 頭(240) 腹(197) 身(197) 面(175) 涙(171)
司馬遼太郎44211342手(1440) 身(671) 足(671) 顔(571) 目(546) 尾(503) 口(456) 頭(435) 眼(385) 面(349)
志賀直哉17113400手(1292) 顔(1096) 眼(883) 頭(630) 口(589) 身(564) 目(531) 面(515) 足(499) 腹(384)
小林秀雄1378832手(1075) 眼(610) 身(508) 面(457) 目(449) 体(415) 口(406) 足(373) 顔(305) 骨(296)
松本清張1189733目(1849) 顔(934) 手(934) 口(495) 死体(439) 頭(374) 身(290) 指(280) 便(262) 熱(252)
新田次郎26012552眼(1414) 顔(1262) 手(1099) 口(932) 足(653) 頭(635) 身(462) 面(425) 目(408) 尾(388)
森鴎外31712636手(1683) 目(1455) 顔(1030) 口(696) 面(659) 足(555) 頭(478) 身(472) 体(423) 背(248)
水上勉23516212顔(1745) 眼(1524) 手(1183) 頭(1130) 口(702) 目(501) 足(461) 背(354) かいな(334) 面(287)
星新一1267985手(1313) 目(761) 面(693) 口(626) 頭(438) 指(337) 足(323) 顔(283) 体(256) 熱(249)
石川淳24013418手(1874) 目(823) 顔(738) 口(732) 身(637) 眼(504) 足(504) 息(297) 面(244) 肉体(244)
石川啄木8716784手(2460) 目(1664) 病(1266) 顔(1085) 眼(760) 口(615) 胸(543) 足(543) 首(398) 面(398)
石川達三15710601手(1526) 身(756) 体(694) 眼(506) 顔(493) 足(465) 口(458) 目(409) 面(402) 頭(361)
赤川次郎16313207尾(2161) 口(1997) 手(1409) 目(1069) 顔(1008) 息(448) 面(401) 頭(392) 体(387) 足(359)
川端康成15114958手(1486) 目(1200) 顔(1132) 頭(573) 足(573) 口(518) 体(518) 身(491) 面(464) 胸(409)
泉鏡花28319383手(2529) 目(1645) 顔(1255) 口(1104) 面(657) 身(649) 足(530) 膝(527) 胸(480) 肩(455)
曽野綾子3098350手(926) 目(596) 顔(500) 口(460) 頭(373) 体(338) 面(327) 息(293) 身(285) 足(255)
倉橋由美子29315655手(1271) 顔(991) 口(875) 眼(820) 頭(622) 身(431) 目(417) 首(328) 肉(321) 足(308)
倉田百三1219447顔(1151) 手(1050) 身(720) 涙(677) 目(499) 眼(449) 口(372) 体(347) 面(262) 息(237)
村上春樹31113950手(1652) 目(1039) 体(809) 面(612) 口(598) 頭(545) 身(543) 頭骨(523) 足(437) 顔(329)
太宰治15611256手(1424) 顔(1219) 口(616) 眼(520) 身(493) 目(424) 面(301) 傷(219) 体(192) 病(192)
大岡昇平19616449手(1409) 体(1121) 眼(1089) 足(897) 面(854) 病(587) 目(576) 口(544) 身(544) 顔(534)
大江健三郎25623510眼(1351) 口(1294) 手(1013) 顔(774) 腕(725) 足(703) 熱(696) 死体(689) 背(640) 頭(598)
沢木耕太郎2239942手(1446) 口(938) 体(722) 顔(574) 眼(533) 目(481) 足(383) 面(303) 身(238) 頭(232)
谷崎潤一郎21712688手(1352) 顔(927) 口(782) 眼(693) 体(653) 足(553) 面(547) 目(491) 身(352) 肩(285)
池波正太郎19716320小兵(4074) 手(1594) 身(857) 目(708) 顔(655) 口(581) 足(447) 息(410) 面(395) 眼(358)
竹山道雄15112163手(1318) 目(849) 身(557) 口(513) 体(495) 首(460) 顔(425) 肩(416) 面(416) 頭(407)
中島敦12410944身(1016) 手(943) 目(913) 顔(604) 口(486) 面(442) 足(442) 頭(412) 眼(309) 体(265)
長塚節23316193手(3286) 目(1480) 口(1302) 足(892) 身体(584) 身(517) 頭(334) 顔(325) 耳(325) 首(325)
長与善郎13413876顔(1478) 眼(1278) 手(955) 口(862) 頭(693) 身(616) 足(554) 目(477) 面(447) 体(416)
椎名誠16612000顔(1466) 手(1457) 目(866) 口(841) 体(691) 頭(541) 面(425) 小耳(408) 眼(308) 背(225)
田山花袋24813401手(1721) 顔(1206) 目(650) 眼(599) 胸(590) 身(572) 面(560) 口(488) 足(419) 病(398)
田辺聖子23110363手(1443) 身(1338) 目(836) 顔(665) 息(619) 面(470) 口(411) 涙(399) 乳(256) 胸(237)
渡辺淳一32714525手(1324) 目(1187) 顔(874) 眼(870) 体(741) 身(600) 口(570) 頭(505) 熱(403) 面(386)
島崎藤村51211221手(1464) 顔(682) 眼(679) 身(596) 口(522) 目(502) 足(475) 面(388) 頭(368) 胸(346)
筒井康隆15810110手(939) 尾(760) 身(701) 眼(664) 口(611) 目(596) 体(462) 顔(418) 脇(313) 面(261)
藤原正彦21011060目(1315) 手(1170) 顔(636) 面(612) 口(491) 身(455) 頭(327) 足(315) 体(303) 涙(248)
徳田秋声24413793手(1709) 目(1517) 顔(1274) 口(906) 身(727) 体(503) 面(489) 足(444) 頭(328) 病(292)
二葉亭四迷28715365面(1758) 手(1605) 口(1093) 目(987) 顔(972) 眼(802) 身(637) 足(505) 頭(477) 息(316)
樋口一葉18517778身(2128) 手(2119) 目(1260) 口(1208) 顔(1115) 足(715) 面(613) 頭(391) 尾(366) 胸(366)
尾崎紅葉23514288手(1390) 身(1375) 目(1351) 面(947) 顔(658) 口(539) 足(495) 胸(448) 頭(408) 体(380)
武者小路実篤748539手(1753) 目(998) 顔(665) 口(453) 病気(333) 面(257) 骨(257) 身体(242) 体(227) 腹(212)
福永武彦17013246手(1951) 顔(1142) 足(680) 口(625) 眼(618) 目(578) 面(340) 病(319) 身体(306) 身(306)
北原白秋詩集9819391眼(1853) 手(1537) 身(1175) 頭(768) 目(768) 涙(678) 面(678) 毛(633) 指(542) 血(452)
北杜夫58617307病(1768) 手(1611) 目(1176) 顔(782) 口(778) 面(625) 体(565) 足(537) 身(492) 頭(401)
堀辰雄11212548目(1323) 手(1251) 病(1035) 顔(943) 身(841) 足(615) 口(513) 背(441) 面(369) 眼(328)
野坂昭如29116470手(1558) 口(1027) 眼(636) 体(594) 顔(573) 身(552) 目(531) 足(482) 頭(475) 指(468)
柳田国男639968口(1618) 手(1127) 顔(693) 足(636) 眼(462) 面(404) 身(376) 頭(347) 目(318) 病(289)
有吉佐和子25318906手(2143) 目(1618) 口(1031) 身(850) 顔(741) 背(624) 息(561) 乳(524) 足(488) 頭(434)
有島武郎38115704手(1631) 眼(1538) 顔(1040) 身(773) 足(558) 目(552) 面(550) 口(490) 頭(475) 胸(429)
里見16114944手(1924) 目(1222) 口(1180) 顔(983) 面(730) 体(604) 身(506) 足(506) 耳(365) 眼(337)
立原正秋2118889手(1722) 目(958) 面(796) 顔(490) 息(452) 身(261) 口(248) 足(242) 頭(201) 指(194)
林芙美子27012868手(1016) 顔(712) 目(583) 眼(538) 口(498) 頭(461) 足(409) 涙(401) 面(364) 胸(352)
壺井栄1178141顔(1430) 手(1134) 目(1032) 口(728) 足(550) 頭(389) 身(195) くそ(178) 指(127) ひび(127)

2.1 頻出身体語 20語

 作家ごとの出現率上位10位語には共通性がある。それをまとめたのが次表である。

表2 頻出身体語 20語
順位身体語分類述べ語数出現率の平均使用作家数
1体-1.56:身体-1.5603:手足・指32428146882
2体-1.56:身体-1.5601:頭・目鼻・顔1780483881
3体-1.56:身体-1.5601:頭・目鼻・顔1731383182
4体-1.56:身体-1.5601:頭・目鼻・顔1516871682
5体-1.56:身体-1.5600:身体1180153982
6体-1.56:身体-1.5601:頭・目鼻・顔1171849582
7体-1.56:身体-1.5601:頭・目鼻・顔1168752181
8体-1.56:身体-1.5603:手足・指1021544382
9体-1.56:身体-1.5601:頭・目鼻・顔919639282
10体-1.56:身体-1.5600:身体764240481
11体-1.57:生命-1.5710:生理448120980
12体-1.56:身体-1.5602:胸・背・腹447919481
13体-1.57:生命-1.5721:病気・体調444419981
14体-1.56:身体-1.5603:手足・指355917682
15体-1.56:身体-1.5601:頭・目鼻・顔354015781
16体-1.57:生命-1.5710:生理352715882
17体-1.56:身体-1.5601:頭・目鼻・顔332016981
18体-1.56:身体-1.5602:胸・背・腹317117282
19体-1.56:身体-1.5602:胸・背・腹310714680
20体-1.56:身体-1.5602:胸・背・腹280612678

 もちろん、1字語であるから、他の語と組み合わさって、身体語らしからぬ語を作っている可能性がある。ノイズの発生である。

3 上位20語を変数に用いて作家をクラスター分析する。

 手から腰までの20語の出現率によって、作家群をクラスターに分ける。同じような使用傾向がある作家のグループをつくるのである。

表3 上位20語を変数に用いた作家のクラスター分析
 最大値   最小値 
 第1クラスター第2クラスター第3クラスター第4クラスター第5クラスター第6クラスター
1464.014 1537.000 1213.857 2119.000 964.000 3286.000
787.761 271.000 1385.714 1115.000 545.000 325.000
862.127 768.000 378.286 1260.000 778.000 1480.000
671.507 362.000 1052.857 1208.000 765.000 1302.000
521.493 1175.000 421.000 2128.000 372.000 517.000
486.69 678.000 415.857 613.000 1616.000 196.000
409.831 1853.000 1483.429 119.000 598.000 134.000
422.915 316.000 592.571 715.000 266.000 892.000
357.197 768.000 727.571 391.000 233.000 334.000
400.338 45.000 328.714 162.000 1729.000 94.000
202.718 271.000 239.429 230.000 80.000 49.000
189.606 45.000 237.143 366.000 93.000 89.000
207.211 226.000 129.000 187.000 13.000 98.000
159.859 542.000 242.000 187.000 572.000 111.000
145.662 136.000 231.429 213.000 60.000 325.000
149.915 407.000 210.857 51.000 153.000 214.000
150.859 181.000 252.143 102.000 632.000 325.000
157.507 316.000 304.000 247.000 100.000 94.000
135.648 226.000 195.000 196.000 66.000 201.000
114.225 181.000 173.000 136.000 53.000 125.000
群内項目 井伏鱒二 北原白秋 吉行淳之介 樋口一葉 吉村昭 長塚節
  塩野七生   新田次郎      
  立原正秋   長与善郎      
  渡辺淳一   遠藤周作      
  田山花袋   大江健三郎      
  井上ひさし   山本周五郎      
  尾崎紅葉   水上勉      
  中略          
  沢木耕太郎          

第1クラスターは身体語の使用に関して「普通の作家たち」といえる。他の特徴がある作家たちと比較して特徴がない。
井伏鱒二 塩野七生 立原正秋 渡辺淳一 田山花袋 井上ひさし 尾崎紅葉 村上春樹 三浦綾子 有吉佐和子 山本有三 武者小路実篤 司馬遼太郎 里見 阿川弘之 高野悦子 久米正雄 安部公房 徳田秋声 三木清 梶井基次郎 田辺聖子 竹山道雄 倉田百三 葛西善蔵 夏目漱石 島崎藤村 五木寛之 宮沢賢治 井上靖 藤原正彦 椎名誠 森鴎外 岩野泡鳴 志賀直哉 福永武彦 赤川次郎 菊池寛 伊藤左千夫 小林秀雄 北杜夫 池波正太郎 有島武郎 星新一 幸田露伴 石川淳 宮本輝 芥川龍之介 堀辰雄 開高健 三島由紀夫 柳田国男 川端康成 松本清張 石川啄木 石川達三 谷崎潤一郎 大岡昇平 壺井栄 倉橋由美子 太宰治 曽野綾子 三浦哲郎 野坂昭如 筒井康隆 国木田独歩 二葉亭四迷 泉鏡花 林芙美子 中島敦 沢木耕太郎

第2クラスターには北原白秋一人が含まれる。

という特徴をもつ。ただし、サンプルは詩集であるし、文章量が小説に比べてわずかであるので、小説と同一に扱うのは間違っているかもしれない。(それをクラスター分析が明らかにしているという点で、クラスター分析の有効性の証拠になるかもしれない)

第3クラスターは、「顔」を多用する作家たちである。さらに、「目」を使う代わりに「眼」を使うところに特徴がある。これは第2クラスターの北原白秋の特徴でもある。

第4クラスターには樋口一葉一人が含まれる。

という特徴を持つ。
 樋口一葉作品から「胸」の使用部分を挙げる。(■は目印用に論者が施した。以下同様)

「大つごもり」

1段落:これ/\と、此詞が目覺しの時計より■胸にひゞきて、三言とは呼ばれもせず帶より先に襷がけの甲斐/\しく、
3段落:苦勞はかけまじと思へど見す見す大晦日に迫りたる家の難義、■胸に痞への病は癪にあらねど
9段落:すご/\と勝手に立てば正午の號砲の音たかく、かゝる折ふし殊更■胸にひゞくものなり。
17段落:それほど度■胸すわれど奧の間へ行く心は屠處の羊なり。

「うつせみ」

8段落:母は情なき思ひの■胸に迫り來て、
12段落:浴衣の■胸少しあらはに成りて
20段落:樂しげに笑ふは無心の昔しを夢みてなるべく、■胸を抱きて苦悶するは遣るかた無かりし當時のさまの再び現にあらはるゝなるべし。

「たけくらべ」

3段落:正太ばかり客にしたのも■胸にあるわな、いくら金が有るとつて質屋のくづれの高利貸が何たら樣だ
6段落:黒襦子と染分絞りの晝夜帶■胸だかに、
10段落:此方は言葉もなく袖を捉へて驅け出せば、息がはづむ、■胸が痛い、そんなに急ぐならば此方は知らぬ、
16段落:又あの事を言ひ出すかと■胸の中もやくやして、

「胸」には、大きく二通りの用法があって、一つは身体の「胸」を指すために用いる場合、もう一つは
「大つごもり」1段落:これ/\と、此詞が目覺しの時計より■胸にひゞきて、
のように、登場人物の心理状態を示す場合で、「大つごもり」3・9・17段落、「うつせみ」8段落、「たけくらべ」16段落が同じ用法である。「心」の代わりに「胸」を含んだ慣用表現を用いるので他のクラスターより多くなるのである。また、「胸」を含んだ慣用表現を使うと、「心」を用いるより、身体語が持つ非分析的な情感性が現れるようである。

第5クラスターには吉村昭一人が含まれる。

という特徴を持つ。この「面」「体」「指」「首」は身体語彙らしくないことがありそうで、吉村昭作品でどのように使用されているか確かめる。
各語が含まれている語の上位10語を挙げる。

面:海面(90) 図面(45) 面(10) 水面(8) 方面(6) 進水海面(5) 側面(5) 設計図面(4) 全面的(3) 正面(3)
体:船体(146) 体(35) 船体工事(9) 巨体(8) 艦体(7) 機体(6) 全体(5) 具体化(4) 遺体(4) 死体(3)
指:指令(20) 指示(13) 指揮(6) 指揮者(4) 総指揮(4) 御指導(3) 作戦指揮(3) 指定(3) 指摘(2) 注排水指揮室(2)
首:艦首(38) 首席監督官(23) 首席監督官室(6) 平田首席監督官(3) 首(3) 艦隊首脳部(2) 島本首席監督官(2) 可能艦首水線下(1) 首席監督官平田大佐(1) 栗田艦隊首脳部(1)

「戦艦大和」や「海軍」に関する語が大部分である。身体語彙「面・体・指・首」が占める割合は低い。身体語彙「面・体・指・首」だけの出現率であれば、他のクラスターと違いがないだろう。
 叙述対象の量と質とを本文にあたって調べなければ言えないことだけれども、この「戦艦大和」は、個々の人間を細かく描くよりも、「戦艦大和」や「海軍」を描いている作品ではないかと推測できる。

第6クラスターには長塚節一人が含まれる。

という特徴を持つ。
「手」をよく使うことと長塚節が農民文学者であることとが関係するように思える。
そして、長塚節が他のクラスターより多用する「手」「足」「耳」を吉村明は比較的使わないし、吉村明が多用する「面」「指」「首」を長塚節は比較的使わないという正反対の関係がある。

4.語彙の身体位置分類によるクラスター分析

 身体語そのものの使用によってではなく、身体語が身体のどの位置にあるかという分類によって作家作品を分析してみる。
分類語彙表は、身体語を

体-1.56:身体-1.5600:身体
体-1.56:身体-1.5601:頭・目鼻・顔
体-1.56:身体-1.5602:胸・背・腹
体-1.56:身体-1.5603:手足・指
体-1.56:身体-1.5604:膜・筋・神経・内臓
体-1.56:身体-1.5605:皮・毛髪・羽毛
体-1.56:身体-1.5606:骨・歯・爪・角・甲
体-1.56:身体-1.5607:体液・分泌物
体-1.56:身体-1.5608:卵
体-1.57:生命-1.5710:生理
体-1.57:生命-1.5720:障害・けが
体-1.57:生命-1.5721:病気・体調
に分類している。次の表は、サンプルに現れた身体語の「延べ語数」「出現率平均」をカウントして「延べ語数/出現率平均」で並べたものである。どの類の語がサンプルに現れやすかったかということがわかる。

表4 身体語分類ごとの出現率
順位分類述べ語数出現率平均述べ語数/出現率平均
1体-1.56:身体-1.5601:頭・目鼻・顔3823852858133.8
2体-1.56:身体-1.5603:手足・指2166781876115.5
3体-1.56:身体-1.5602:胸・背・腹87918125470.1
4体-1.56:身体-1.5600:身体111089186059.7
5体-1.56:身体-1.5607:体液・分泌物44053114238.6
6体-1.57:生命-1.5710:生理62220177635.0
7体-1.56:身体-1.5606:骨・歯・爪・角・甲1770762928.2
8体-1.56:身体-1.5605:皮・毛髪・羽毛40982151027.1
9体-1.56:身体-1.5604:膜・筋・神経・内臓27443119722.9
10体-1.57:生命-1.5720:障害・けが1866983022.5
11体-1.56:身体-1.5608:卵17558321.1
12体-1.57:生命-1.5721:病気・体調57862295419.6
表5 身体語分類ごとの出現率による作家のクラスター分析
  第1クラスター 第2クラスター 第3クラスター 第4クラスター 第5クラスター 第6クラスター
身体 1451.306 1076.850 1356.000 2341.000 1982.000 5766.000
頭・目鼻・顔 5612.861 3747.550 9833.000 1682.500 6623.000 3976.000
胸・背・腹 1219.889 865.650 1914.000 267.500 2864.500 1198.000
手足・指 3021.083 2282.725 2960.000 1050.500 4283.000 2983.000
膜・筋・神経・内臓 373.722 300.150 577.000 263.000 396.500 87.000
皮・毛髪・羽毛 591.556 377.175 1439.000 111.500 1288.500 360.000
骨・歯・爪・角・甲 258.306 181.175 157.000 11.000 395.000 192.000
体液・分泌物 616.833 456.275 533.000 343.000 1044.500 288.000
29.556 15.600 17.000 5.500 16.000 7.000
生理 807.194 693.325 786.000 578.500 1280.000 925.000
障害・けが 247.028 190.750 280.000 670.000 211.500 103.000
病気・体調 832.583 583.125 551.000 749.000 1062.500 390.000
群内項目 井伏鱒二 塩野七生 吉行淳之介 高野悦子 大江健三郎 池波正太郎
渡辺淳一 立原正秋 三木清 泉鏡花
| |
二葉亭四迷 沢木耕太郎

 作家たちが使用した身体語彙は表4のとおりであるが、作家ごとにカウントしたものを比較すれば、偏りが出てくる。クラスター分析によって偏りのさまを見てみる。

第1クラスターに含まれる作家は、井伏鱒二 渡辺淳一 北原白秋詩集 尾崎紅葉 新田次郎 長与善郎 有吉佐和子 里見 久米正雄 遠藤周作 安部公房 徳田秋声 山本周五郎 夏目漱石 井上靖 椎名誠 森鴎外 樋口一葉 赤川次郎 吉村昭 北杜夫 有島武郎 芥川龍之介 開高健 三島由紀夫 川端康成 水上勉 石川啄木 谷崎潤一郎 大岡昇平 倉橋由美子 三浦哲郎 野坂昭如 国木田独歩 長塚節 二葉亭四迷である。
すべての身体語分類ごとの出現率が平均的な値を示し、特徴は「卵」に分類される語を他のクラスターより多用するということだけである。

第2クラスターに含まれる作家は、塩野七生 立原正秋 田山花袋 井上ひさし 村上春樹 三浦綾子 山本有三 武者小路実篤 司馬遼太郎 阿川弘之 梶井基次郎 田辺聖子 竹山道雄 倉田百三 葛西善蔵 島崎藤村 五木寛之 宮沢賢治 藤原正彦 岩野泡鳴 志賀直哉 福永武彦 菊池寛 伊藤左千夫 小林秀雄 星新一 幸田露伴 石川淳 宮本輝 堀辰雄 柳田国男 松本清張 石川達三 壺井栄 太宰治 曽野綾子 筒井康隆 林芙美子 中島敦 沢木耕太郎である。
 すべての身体語分類ごとの出現率が平均的な値を示し、特徴は「身体」に分類される語を他のクラスターより少なく用いるということだけである。

第3クラスターは吉行淳之介の単独クラスターである。

吉行の身体性を示したことで、クラスター分析の有用性が確認できる。

第4クラスターには、小説家でない高野悦子・三木清が含まれる。

という特徴を持つ。
 小説でない文章が、小説から独立したとも言えるので、これもクラスター分析の有用性が確認できたといえるだろう。

第5クラスターには、大江健三郎・泉鏡花が含まれる。

に分類される語が他のクラスターより多用されている。
大江健三郎・泉鏡花の身体性を示していると言える。

第6クラスターは、池波正太郎の単独クラスターである。

という特徴を持つ。
 人物を総合的に身体レベルで述べて、細部には言及しないのであろうか。剣技が詳しく書かれないことと関係がありそうである。

5.おわりに

前掲論文の「3.0 結論ではなく」で以下のように述べた。

 キーワード群を検索語として、大量のテキストデータ内を検索することで、気付かなかったことに気付かされることがわかった。その点で、今回の試みには、有用性がある。気付きであって、それはもっと綿密な調査・分析によって明らかにするべきことであるが。
 今回は、前回おこなった「キーワード群を検索語として、大量のテキストデータ内を検索する」を進めて、検索によって得た検索語の出現率と検索語の分類項目に要約した場合の出現率によってクラスター分析を行った。
 人為的には何も行っていないデータからサンプルのいろいろな特徴が現れてきた。これは、なかなか使えそうである。
 ただし、1.2で述べたように、検索結果には「ノイズ」と言えば言える内容が含まれている。それをどう処理するかが課題である。構文解析を行って品詞の情報を付加してから検索結果として残すかどうかをきめるというのが良さそうであるが、構文解析ソフトの正答率が100%でないので、 のどちらかを行うことになる。  自動化によって研究対象を拡大することと、そこにノイズが紛れ込むこととは、切り離せないようである。ノイズが紛れ込んでも影響を受けないように数値処理できるのかもしれない。
 次回は色名検索を予定している。

参考文献

1. 村上征勝,田村義保編著, 「パソコンによるデータ解析」, 朝倉書店, 1988
2. 村上征勝, 「真贋の科学−計量文献学入門−」, 朝倉書店, 1994
3. 岡野雅雄,「宮沢賢治の童謡作品に表れた身体語彙」,計量国語学Vol27.No3,(2009),計量国語学会
大阪教育大学 国語教育講座 野浪研究室 △ ページTop ←戻る