
「日本語が乱れている」と言われて久しい昨今、果たして自分が使っている表現は正しいのだろうか──。
そんな疑問を解消に導くのが、「コーパス」だ。コーパスとは、言語研究資料としてコンピュータで用例を検索できる言葉のデータベースのこと。1960年代以降に世界各国で構築が進められ、遅れていた日本でも2006年に国立国語研究所が「KOTONOHA」計画としてコーパス整備に着手した。近年出版された書籍や雑誌、新聞のデータに加え、図書館収蔵の書籍データ、インターネット上の文書や白書などのデータを収集し、2011年4月以降の公開時には1億語以上の蓄積を目標としている。現在は、webページ上で無償試験公開しており、書籍や白書、インターネット情報などのジャンルと年代別に、任意の文字列検索が可能だ。
新旧の様々な文書における「生きた日本語」が検索でき、用例を比較できるコーパスは、言語研究以外にもメリットをもたらす。冒頭の疑問のように、曖昧な日本語表現の使い方が確認できるのも、活用法のひとつ。たとえば「風景」と「光景」のように同じような言葉でも、その使われ方を比較すればそれぞれの特徴が見えてくる。試験公開中の「KOTONOHA」によると、「風景」は「授業風景」の様に他の名詞と結びつく例がたくさんあるが、「光景」はわずか数例で、それも「神話的光景」など「的」を伴っていることから複合語にはなりにくいことが分かるのだ。これは、日本人が感覚的に使い分けているが、辞書などを見ても把握しにくい部分であり、日本語の用法を確認する上での貴重な資料だと言える。
このようにとても便利なコーパスだが、そこにあるのは「正解」ではなく、あくまでも「傾向」であることを忘れてはいけない。インターネット上で多く使われている用法が、公共の場ではふさわしくないとされることもあるだろう。多くの用例があるから正しいと思っても、それは誤りだと判断する人間もいる。言語感覚は人それぞれなので、「誰にとっても正しい」という答えを出すのは難しいのだ。利用する際は、データをふまえて自らの言語感覚に訴えかけ、検索結果を吟味する必要がある。
とは言え、コーパスを上手く利用することで「生きた日本語」に触れれば、これまで無意識に使っていた言葉の新たな意味や用法が見えてくるだろう。用法に迷ったときのみならず、自らの言語感覚を磨くためにもコーパスを活用してみてはいかがだろうか。