コーパスと遊ぼう(kotoba news)
kotobaに関する気になるトピックを短期連載で紹介していきます。
-
- 2022年09月27日 『6. コーパスと遊ぼう:芙美さんの言葉遣い 砂川有里子(筑波大学名誉教授)』
-
ハナヒゲウツボになりたい芙美さん
この夏、町田そのこの『波間に浮かぶイエロー』という短編小説を読みました(新潮文庫『夜空に泳ぐチョコレートグラミー』所収)。商店街の外れにある「ブルーリボン」という軽食屋がこの小説の舞台です。店のオーナーは芙美さんという元男性です。芙美さんは黄色いハナヒゲウツボになりたくていつも黄色い衣装を着ています。
ハナヒゲウツボというのは変わった海洋生物で、若いときの性別は雄なのですが、ブルーだった体が成長とともに黄色に変わり、体の大部分が黄色になった頃には雌に変化しているのだそうです。ハナヒゲウツボという名前はあまりパッとしませんが、実は非常に美しい生き物です。親指くらいの太さしかないのに、長さが1メートルもあるらしく、海の中をたゆたっている様子は、新体操の選手が操るリボンのように優美な動きを見せてくれるに違いありません。芙美さんの店の名は、ハナヒゲウツボの英語名「ブルーリボン」だったのです。
ハナヒゲウツボ
https://www.croissant-island.com/sakana/hanahigeutubo.html
芙美さんは男性として成人し、男性として会社勤めを経験した人ですが、ある時から自分の気持ちに素直に従い、女性として振る舞うことを決意します。その時に、言葉も女性のように変えようと努力するのです。芙美さんの言葉遣いは次のようなものです。
★ うるさい女ねぇ。嫌なら食うんじゃないわよ。沙世、こいつの皿片付けちゃいな。
★ あ、何すんのよ!わたしの皿から味見しなくていいじゃない!
★ あ、またその名前で呼んだわね。今度その名前を口にしたら、追い出すからね。あたし、本気よ。
芙美さんとしては女性の言葉を使っているつもりなのでしょうが、どうみてもオネエ言葉にしか聞こえません。歌舞伎の女形は女性より女性らしく見えるのに、オネエ言葉が女性らしく聞こえないのはどうしてなのでしょう。少なくとも、女性が使う「わよ」「わね」「のよ」のような文末や「あたし」のような自称詞の中に、「食う」や「こいつ」のような乱暴な言葉が混ざっているところがオネエ言葉っぽい、ということは言えそうです。芙美さんは自分のことを「わたし」と言ったり「あたし」と言ったりするのですが、オネエ言葉に「あたし」がよく使われるというのはどこかで読んだ記憶があります。
オネエ言葉は役割語
オネエ言葉の「オネエ」を辞書で引いてみると、「女性言葉を使う男性」(『明鏡国語辞典』)と書いてありました。しかし、芙美さんの言葉遣いは女性言葉と少し違うように思います。芙美さんの言葉を聞いても、普通の女性を思い浮かべる人は少ないのではないでしょうか。「うるさい女ねぇ」「何すんのよ」「あたし、本気よ」などと聞くと、やはりオネエのイメージを思い浮かべてしまうように思います。
金水敏氏が『ヴァーチャル日本語 役割語の謎』(岩波書店)の中で、特定の言葉遣いから特定の人物像を思い浮かべたり、特定の人物像から特定の言葉遣いを思い浮かべたりするとき、その言葉遣いを「役割語」と名づけています。オネエ言葉はまさに特定の職業やキャラクターと結びついた役割語だと言えるでしょう。
芙美さんは町田そのこ氏が創作した人物なので、その言葉遣いは実際のオネエ言葉と違うかもしれません。しかし、テレビに出てくるオネエタレントの言葉遣いをちょっと誇張してそれらしく表現しているようには感じられます。女性っぽさを強調しているようでいて、女性の自然な話し方とは違っているという感覚は、オネエタレントの言葉を聞くたびに感じるところなのですが、芙美さんの言葉からもそんな感じを受けてしまいます。そこで、今回は芙美さんの言葉遣いにこだわってみたいと思います。芙美さんの言葉遣いは女性の言葉遣いとどこがどう違うのでしょうか、あるいはどこがどう同じなのでしょうか。
芙美さんの言葉を調べるには
「日本語日常会話コーパス(CEJC)」
この謎を解き明かすために、芙美さんの使っていた言葉が私たちの日常生活の中でどのように使われているのか、その実態を調べてみることにします。こういうときは、国立国語研究所の『日本語日常会話コーパス(CEJC)』が頼りになります。このコーパスは、普通の人たちの日常生活の中にビデオカメラとI Cレコーダーを持ち込んで、いろいろな状況の中で自然に生じた会話を記録したものです。音声も公開され、有償版契約者なら映像も参照できます。ここでは登録するだけで使える無料の「中納言版」を使うことにします。「中納言」というアプリは4回目のコラムでも使ったことがありますので、覚えている方もいるのではないかと思います。以下のサイトから登録すれば誰でも使えます。https://chunagon.ninjal.ac.jp/useraccount/register。
「あたし」の使用実態
さて、まずは、オネエ言葉でよく使われる「あたし」の使用実態について調べることにしましょう。「あたし」は「わたし」が変化した言葉ですが、「私」系の自称詞には、このほかに「わたくし」「あたくし」などもあります。これらの自称詞が「CEJC」でどのくらい使われているのか、男女別に調べてみました。その結果が表1です。聞こえたままに表記されていますので、「最後にある“し”って何?」と思われるかもしれませんが、自分自身を指すときに「し」と言っているようにしか聞こえなかったので、それがそのまま書き起こされていると理解してください。
表1 「私」系自称詞の男女別の使用
「私」の
バリエーション
女性
男性
合計(100%)
あたし
2978 (99%)
33 (1%)
3011
わたし
1781 (81%)
422 (19%)
2203
わたくし
11 (34%)
21 (66%)
32
あたくし
8 (89%)
1 (11%)
9
わたしゃ
3 (75%)
1 (25%)
4
あたしゃ
2 (67%)
1 (33%)
3
わたす
1 (100%)
0 (0%)
1
あたす
1 (100%)
0 (0%)
1
し
0 (0%)
1 (100%)
1
総計
4785 (91%)
480 (9%)
5265
全体としてみると、「私」系の自称詞は91%が女性に使われています。数あるバリエーションの中では、「あたし」と「わたし」が圧倒的に多く、それ以外はあまり使われていません。「わたし」の使用の男女比は81%対19%で、男性もある程度は使っていますが、「あたし」の方は99%対1%で、男性はほとんど使用していません。このことを考えると、「あたし」はやはり、女性に特徴的な言葉遣いだと言ってよさそうです。
「あたし」と言う男性
とはいうものの、実際に男性が使った用例を見てみると、それほど女性っぽい感じを受けないのが不思議です。以下に、男性が友人や家族と雑談しているときの発話を示します。〈 〉は話し相手の発話です。( )の中は、「年齢/話し相手/会話のタイプ」の順に並んでいます。聞こえた通りの書き起こしですので、読みにくい箇所があるかもしれませんが、彼らの声を想像しながら読んでみてください。(1)はトランプの大貧民をやっているときの友人との会話、(2)と(3)は飲み会の席での元同僚や友人との会話、(4)は家庭での子供との会話です。
(1) あら。手札が真っ赤。あっちゃー。これは革命できないですね。〈遂に。〉あら。あたしあれですよ。大貧民ですよね。〈うん。〉 最低。(20-24歳/友人・知人/雑談)。
(2) 〈なんかアつまみがなくなったんじゃないあれ。俺が持ってるっけ。〉じゃない。いっすか。あれ。どっかありましたか。あたし持ってましたっけ。あ。ンガ。おー。なんかあんじゃん。(25-29歳/元同僚/雑談)
(3) 〈わたしはウーロンハイ。あ。おー。ビールでいいの。〉あー。あたしもあの焼酎いただきます。はい。焼酎。はい。(35-39歳/友人・知人/雑談)
(4) うーん。何か。何か問題でも。〈ある。〉ママにゆってくれ。ママに。あたしではありません。ママです。(40-44歳/家族/雑談)
男性が使った33件の「あたし」は、ほとんどが知人や家族との雑談でした。しかし、中には次のように仕事関係の人との会合で使われているものもありました。
(5) 〈意見よろしいですか。〉はい。あ。一応あの運営委員会方式でも構わないですけど。ウあのあたしとしては例えば分科会ってのまあほかでやってないんで(35歳-39歳/仕事関係/会議・会合)
(6) だいぶ違いますね。〈はい。そうね。〉まああたしとしてはなんかぱっと見た時にうーん安っぽくならない方だったら全然(30-34歳/仕事関係/会議・会合)
これらの「あたし」は、音声を聞いてみても、特に女性っぽくは感じられませんでした。友人や家族との雑談の中でかなりリラックスした場面で使われているようですし、会議・会合の場面でも肩肘張らない比較的リラックスした雰囲気で使われているようです。そんな時に男性が「あたし」と言っても、女性の真似をしているとか、女性っぽい口調になっているという印象は受けないのではないかと思います。
オネエ言葉の女性っぽさ
男性が「あたし」を使うからといって女性っぽく響くわけではないとしたら、オネエ言葉が女性っぽさを強調していると感じられるのはどうしてでしょうか。もう一度先ほどの芙美さんの言葉を思い出してみましょう。
★ 嫌なら食うんじゃないわよ。
★ あ、何すんのよ!
★ あ、またその名前で呼んだわね。
文末の「わよ」「のよ」「わね」という終助詞が、なんとなくオネエ言葉っぽく感じられますね。しかし、「のよ」は女性だけでなく男性も比較的広い年齢層で使っているようです。「CEJC」からの用例をお示しします。どちらも下降調で発話されています。
(7) そこで温泉とかあって。〈うん。うん。〉そこそこにね太極拳で行ったのよ。〈あー。はいはい。〉あそこおすすめ(25-29歳/友人・知人/雑談)
(8) あとそうあの話し聞いてて思ったのがそのシムシティみたいのイメージしたのよ。〈あー〉であれってさあのセーブしてどんどんツク作っていくじゃん。(30-34歳/友人・知人/雑談)
「わね」は、若い男性の使用例はなかったのですが、比較的年配の人は使っていました。こちらは、低い「わ」で始まり「ね」は上昇して下降します。
(9) せっかくいい商材を持ちながらなかなかそれを活かし切れてないってゆうのが現状ですわね。(65-69歳/友人・知人/雑談)
(10) 〈時代は変わったんだよ。〉〈変わってんのよ。やっぱりね。〉そりゃ変わるわね。(60-64歳/友人・知人/雑談)
「わね」はこのように、男の人も使わないことはない表現ですが、イントネーションを少し変えれば女性っぽい印象が強くなるように思います。芙美さんは多分、低い「わ」で始まり「ね」で上昇したまま下降せず、強く決めつけるような言い方をしていたのではないでしょうか。
このように、「のよ」や「わね」は男性が使う場合もありますが、「わよ」の方は女性専用の言い方のような気がします。「CEJC」で「わよ」を検索してみると、139件検出されました。その中の134件は女性で、予想通り男性は少ないです。しかも、男性が発した5件の「わよ」は、2件は女性の発話を引用しているもの、1件はオネエ言葉の真似をしているものでした。この結果の限りでは「わよ」は女性に特徴的な言い方だと言ってよいようです。以下は女性の用例です。
(11) 穏やかでね。〈うんうん。〉優しそうでってしっかりしてるからね頼りになるわよ。(80-84歳/家族/雑談)
(12) **さん。あたしそろそろお腹減ってきたわよ。まだ来ないの。(20-24歳/友人・知人/用談・相談)
年代別の「わよ」の使用
ところで、最近の若者は、「わね」「のよ」「わよ」などをあまり使わなくなっているような気がします。そこで、「わよ」について、女性の使用頻度を年代別に調べてみました。図1は各年代の人数を50名に調整した数値を示しています。
予想通り、若者はあまり使っていません。10代は全く使っていませんし、20代、30代と年代が上がるにつれて増えていきますが、そう多くはありません。目立つのは、60代以上の年代で突出して多くなっていることです。この年代の人達の若い頃は、「わよ」が盛んに使われていたのだと思います。それ以来、年を経るごとに若い人たちが使わなくなり、今では昔から使っていた年代の人たちに使われることで、かろうじて生き残っているといった状況なのでしょう。私自身は70代ですので昔はよく使っていたのかもしれませんが、今はほとんど使いません(もしかしたら無意識に使っているかもしれないですが)。
若い頃、私はどんな言葉遣いをしていたのでしょうか。図1を眺めているうちにそのことが気になり始めました。国立国語研究所には「昭和話し言葉コーパス(SSC)」があるので、それを使って昭和時代の「わよ」の使い方を調べてみたいと思います。
懐かしい昭和の時代
「昭和話し言葉コーパス(SSC)」
このコーパスは1950年代から1970年代にかけて録音された資料を集めて『中納言』で検索できるようにしたものです。この期間は私が生まれてから成人するまでの20年間とほぼ重なります。講演、祝辞、雑談、会議・会合など44時間分の録音が元となっていて、音声と、それを書き起こしたテキストを検索することができます。
このコーパスを使って「わよ」を調べた結果、ヒット数は249件、うち男性は2件だけで、しかもそのうちの1件は女性の発話を引用したものでした。この時代の男性も現代の男性と同様に、「わよ」はほとんど使わなかったようです。
一方、「わよ」を使用する女性の年代は現代と大きく異なります。図2は各年代50名に調整した昭和の女性の使用頻度を示したものです。
この時代は10代でも「わよ」を普通に使っていることが分かります。今の時代で「わよ」を一番多く使っているのは、図1が示すように、80代の64回ですが、図2では、10代でも90回、一番多い50代では150回も使用しています。昭和の時代に頻繁に「わよ」を使っていた人たちも、時を経ると共に時代の風潮に合わせてあまり使わなくなっていることが分かります。昭和の女性たちの「わよ」の用例は次のようなものです。
(13) 〈もう少しいいんでしょう。これ。〉あそこでもう一回見たからいいわよ。やっぱしいいわね。〈やっぱしいいわ〉(10-14歳/家族・友人/雑談)
(14) あの二年生になって勉強しろたって誰もしないわね。〈ねしない。〉結局しないわよ。三年になってからじゃなきゃ。(15-19歳/高校生/雑談)
(15) 〈だってあの北海道に行きましょうよ。〉行くわよ絶対。(20-24歳/大学生/雑談)
(16) 〈ふーん。ベレーみたいな。〉ベレーじゃないわよ植木鉢逆さまにしたような格好だから。(25-29歳/夫/雑談)
(17) んーもう戦争は嫌です。今の若い人はみんな忘れちゃったらしいわよ。今の人たちね。だからみんなアメリカ参戦よね。(45-49歳/職場の仲間/雑談)
(18) **ちゃん**ちゃんだめですわよ。おやこれはいつの分だ。(50-54歳/美容院の客/雑談)
いかがでしたでしょうか。(13)と(14)は10代の若者なのですが、今読むともっと年取った人の発話のように感じられませんか?私も中学生や高校生の頃はきっとこのような話し方をしていたのでしょうけれど、今となってはどんなだったかすっかり忘れています。昔に戻ってその頃の自分の声を聞いてみたい気がします。
失われつつある女言葉
かつては女言葉と言われた言葉が今ではあまり使われなくなり、女性と男性の言葉遣いが区別しにくくなってきました。私は職業柄、ときどき会話を書き起こしたデータを読むのですが、発話者の性別が書かれていないデータの場合は、男性の発話か女性の発話か判断がつかないことがよくあります。言葉の調査をするときも、身体の性と自認する性の不一致に悩む人が多いことが知られてきているので、男性か女性かという二者択一的な問の立て方では済まなくなってきています。これからは、言葉の性差はどんどん小さくなって、いずれ、それを問うこと自体が意味のない時代になるのかもしれません。
芙美さんが女性らしく振る舞おうと頑張って言葉遣いを変える努力をしていたのは、言葉の性差が曖昧になりつつある現代なのです。そんな時代に女性らしい言葉使いをしようとしたら、現代の女性がもはや使わなくなった古めかしい女言葉を使うしかなくなっているのかもしれません。
コーパスからの気付きと発見
コーパスは実際に使われた言葉を大量に集めた言葉の貯蔵庫です。中には言い間違いや書き間違いが含まれているかもしれません。それに、コーパスを調べて出現数がゼロだからといって、その言葉が現実に使われていないと結論づけることはできません。たまたまその言葉がコーパスに含まれていなかっただけということがあり得るからです。にもかかわらず、大量の用例を観察することによって、頭のなかであれこれ考えても分からないことの答えが得られたり、思いもよらない面白い発見をしたりすることが少なくないのです。このコラムでは私が体験したそのような楽しさをみなさんにお伝えしました。
今回のコラムで紹介しきれなかったコーパスはたくさんありますし、これからも新しいコーパスが次々に作られていくだろうと思います。大量の言葉の貯蔵庫という宝物が私たちの手に届くところにたくさんあるのです。みなさんも、ちょっと気になることばを見つけたら、コーパスと遊んでみませんか?思いがけない気付きや素敵な発見を手に入れられるかもしれませんよ。
-
- 2022年09月20日 『5. コーパスと遊ぼう:逃亡先は海外か国外か 砂川有里子(筑波大学名誉教授)』
-
海外の日本語教師たち
海外の人々に日本語を教える日本人が世界中で活躍しています。国際交流基金が2018年度に実施した調査によると、海外で日本語教師をしている日本人の数は1万6千人強、日本語教育が行われている国や地域の数は142もあるそうです(この調査では「日本語母語教師」とあるので、必ずしも日本人とは限りませんが、便宜上、ここでは「日本人」と書きます)。異郷の地で日本語を教えている人がそんなにたくさん存在することは驚きですが、海外の日本語教師全体の数からすると日本人の割合は比較的小さく、21%を占めるだけだそうです。つまり、残りの79%は外国語として日本語を身につけた現地の教師たちで、その数は6万1千人を超えるというのですからこれも驚きです。
私は、大学で日本語教師の養成を担当してきた関係で、現職の日本語教師研修のため海外に招かれることが少なくありません。海外の研修には日本人教師だけでなく日本語を母語としない現地の教師も多数参加します。その中には、元はロシア語やフランス語の教師だったけれど、日本語を習いたい学生が増えたため、自身も日本語を学んで急遽日本語教師に鞍替えした人もいました。日本語学習者が急激に増えた1980-90年代にはそんな人たちとの出会いが何回かありました。今まで教えていた言語とは全く別の新しい言語を学習して、習いたての言語を教えるなんて、どれだけのエネルギーが必要なのかと思いますが、彼らはまさにエネルギーの塊で、真剣に日本語と日本語教授法の研修に取り組んでいました。
良い用例を考えるのは難しい
日本語を教えるためには学生に単語の意味や使い方を教えたり、語彙や文法教材のための用例を作ったりしなければなりません。語彙や文法の理解を促すことのできる良い用例を考えることは、日本語教師が身に付けなければならない重要な技能の一つなのです。しかし、それは日本語の母語教師にとってもなかなか難しいことですし、言語直観に母語話者ほどの自信がない非母語教師たちにはさらに負担の大きな作業となります。そこで日本語教師研修では、母語教師と非母語教師が協力して、辞書を参照しながら良い用例を考えるワークショップを行ったりしています。以下はそんなワークショップでの一コマです。
******
メキシコ人の先生から次の質問を受けました。
この辞書には「私の部屋は狭いので、友達が来ても、泊まれるスペースがない」という用例が載っていますが、スペイン語ではこんな時、「私の部屋は狭いので」とは言わず、「私の部屋は小さいので」と言います。日本語の「狭い」と「小さい」の違いは何ですか?
なるほど、日本語の「狭い」には「幅が小さい」という意味のほかに、「スペースにゆとりがない」という意味がありますが、スペイン語の「狭い」の方は「幅が小さい」という意味しか表さないようです。そういえば英語のnarrowもスペイン語と同じですね。後で知り合いに聞いてみたら、中国語の狭窄(Xiázhǎi)も英語やスペイン語と同じだそうですが、韓国語の촙다(チョプタ)は日本語と同じように「幅が小さい」だけでなく「スペースにゆとりがない」という意味も表すそうです。
メキシコ人の先生には、日本語の「狭い」は幅の狭さだけでなくゆとりのなさを表す意味もあるけれど、「小さい」はサイズの大小を表すものでゆとりのあるなしは関係ありませんと説明して分かってもらいました。
そのときはそれで済んだのですが、日本語の説明が理解できない初級の学習者に、「狭い」と「小さい」の違いを分からせるのにどんな方法があるかは依然として問題です。その方法について、ここであらためて考えてみたいと思います。
どうやったら分かってもらえるか
まず、対義語を提示してみてはどうでしょうか。「狭い」の対義語は「広い」、「小さい」の対義語は「大きい」です。「広い」と「大きい」の違いなら、初級の学習者にも理解してもらえそうですので、対義語を手がかりに「狭い」と「小さい」の違いを感じ取ってもらうのです。
しかし、それがうまくいかない場合もあるでしょう。そのような時は、「狭い」と「小さい」のイメージを絵で示すのはどうでしょうか。例えば、家具や人でいっぱいの部屋と小さいけれど何も置いていない部屋の絵を示しながら、「狭い」と「小さい」の用例を示すというアイデアです。
実物を持ってきて示す方法もありますね。家に見立てた箱にチェスのコマを入れながら、「小さいけれど狭くない」とか「小さくて狭い」と言いながら「狭い」と「小さい」の違いを感じてもらうアイデアです。子供には喜んでもらえそうです。
ほかにも、言える用例と言えない用例を示す方法があります。例えば、「道が狭くてトラックが入れない」は言えるが「道が小さくてトラックが入れない」は言えない、「サイズが小さくて着られない」は言えるが「サイズが狭くて着られない」は言えないというような用例をいくつか示して、分かってもらう方法です。
このように色々な方法が考えられますが、どの方法を使った場合でも良い用例を示せるかどうかがとても重要なポイントになります。
「海外」と「国外」はどう違う?
日本語教育の現場ではこのような類義語の使い分けが問題となる場面にしばしば遭遇します。そんな時、非母語教師だけでなく、母語教師にも助けとなるのがコーパスです。コーパスを使えば、その言葉が実際に使われた事例を一度にたくさん見比べることができますので、母語話者も気づかない類義語の微妙な違いに気づかされることが少なくありません。そこで、今回もコーパスを使って類義語の違いを調べてみましょう。
先ほど海外の日本語教師の話をしましたが、「海外の」ではなく「国外の日本語教師」と言ってみてください。なんとなく変な気がしませんか。「カルロス・ゴーンは◯◯へ逃亡した」という場合はどうでしょうか。これなら「海外」でも「国外」でも言えそうな気がします。「夏休みは◯◯へ旅行したい」という場合、「海外」ならOKですが、「国外」はおかしく感じられますよね。「海外」と「国外」の違いはなんなのか、類義語の使い分けの例として、この問題を取り上げることにします。
類義語を比較できる便利なアプリ
NINJAL-LWP for BCCWJ (NLB)
今回使用するのは、NINJAL-LWP for BCCWJ(NLB)というアプリです。これを使えば国立国語研究所が構築した「現代日本語書き言葉均衡コーパス(BCCWJ)」という1億語のコーパスからさまざまなコロケーション(語と語の結びつき)を調べることができます。国立国語研究所(NINJAL)とLago言語研究所が共同で開発したアプリで、3回目のコラムで使った「NLT」と同じ仕様で設計されています。https://tsukubawebcorpus.jp
「NLB」では二つの語を同時に検索できる「2語比較検索」という機能が使えます(「NLT」も同様です)。これにより2語を同時に検索し、それぞれのコロケーションを比較することができます。「2語比較検索」は類義語の調査にもってこいですので、早速使ってみましょう。
「海外」と「国外」を調べてみよう!
「NLB」の「2語比較検索」で「海外」と「国外」を検索すると、図1の画面が表示されます。
画面左上に「海外 頻度=8,424」と書かれた黄色い囲みと「国外 頻度=591」と書かれた紫の囲みがあります。これは1億語のコーパスの中で「海外」と「国外」がそれぞれ何回出現したかを表しています。8,424回対591回ですから、「海外」は「国外」の10倍以上の頻度で使われていることが分かります。私はこの数値を見るまで、「海外」と「国外」の使用にそんなに大きな差があるとは思ってもいませんでした。日本語教育の観点から見ると、頻度の高い「海外」の方が重要で、「国外」より早い段階で学習すべき単語だと言えそうです。
次に、この図の右側半分の黄色く色づけられた箇所を見てください。ここには「海外に」と一緒に使われる表現が、結びつきの強い順に列挙されています。一番が(海外に) 「進出する」で、それ以下は「依存する」「派遣する」「在住する」「留学する」…と続きます。ざっとみた限りでは、ものの移動を表す動詞が多そうです。その右隣の空白部分は、「国外に」で始まる用例が記載される箇所です。ここが空白になっているのは、(国外に)「進出する」「依存する」「派遣する」…という用例が1億語のコーパスの中に一つも見つからなかったためです。
続いて、「国外に」と結びつく力の強い表現を見てみたいと思います。使うのは、画面の右上にある「LD差」です。LDとは語と語の結びつきの強さを表すログダイスという統計の数値です。左側のコロケーション(この場合は「海外に…」)のLDから右側のコロケーション(この場合は「国外に…」)のLDを引いた数値が「LD差」です。この数値が大きいほど「海外に」と強く共起する語が、小さいほど(つまりマイナスの数値が大きいほど)「国外に」と強く共起する語が表示されます。
図1の画面の「LD差」をクリックすると、図2のように画面が大きく変わります。右半分が紫色になり、左半分は空白が目立っています。真ん中あたりの「海外に脱出する」と「国外に脱出する」は、どちらの用例も出現したことを表しています。カルロス・ゴーンの逃亡の例を前に挙げましたが、「逃亡する」の箇所を見てみると、「海外に逃亡する」が6回、「国外に逃亡する」が5回出現したことが示されています。
紫色の部分をもう少し詳しくみてみましょう。上から「退去する」「追放する」「放逐する」「搬出する」となっていて、ものの移動を表す語が多いことが分かります。移動を表す語としては「逃げ出す」「引き渡す」「連れ出す」「逃れる」なども見られます。移動を表す語が多い点は「海外」と同じです。
一方、「海外」と違う点もあるようです。「国外」で上位に並んでいるのは「退去する」「追放する」「放逐する」のようなネガティブな意味合いのある語です。ところが「海外」の場合は、図1のとおり、「進出する」「派遣する」「留学する」「旅行する」など、どちらかというとポジティブな意味合いの語が多く混在しています。
旅先は海外か国外か
ここまでは「海外に」と「国外に」のコロケーションを観察しましたが、別のパターンのコロケーションも見てみたいと思います。図1の画面の左側にある「パターン」に、さまざまなコロケーションのパターンが表示されています。図1はとても小さいので、拡大したものを図3に示します。
この中から試しに「海外を」「国外を」を選んでクリックしてみます。そうすると、右側の部分が図4のように変わります。
画面左上の「海外を…26」「国外を…3」の表示は、「海外を」のコロケーションが26種類、「国外を」のコロケーションが3種類検出されたことを表しています。その下には「海外を」のコロケーションがLD値の大きい順に並んでいます。「国外を」は空白が目立ちますが、「国外を旅する」でようやく1つ目のコロケーションが出現しています。画面をさらに下にスクロールしていくか画面右上の「LD差」をクリックすると、残りの2つも表示されます。見つかったのは「国外を含む」と「国外を動き回る」でした。移動を表す「国外を旅する」と「国外を動き回る」の用例を示します。
(1) 国外を旅する際には身分証明書となるパスポートが必要になるのはどちらも同じだが、船旅ではパスポートは船に預ける。 (夜月桔梗著 『恋の紳士協定』, 2002, 913)
(2) 以上は、今から十年ばかり前、私が生まれて初めて日本国外を旅したときの、ロンドンでの話である。 (現代文, 2007, 高)
(3) 著名なる某外交官が、「日本の天皇が国外を動き回られないことは、日本の外交に千鈞の重みを加えるものである」と言っていたのを読んだ記憶がある。(渡部昇一著 『古事記と日本人』, 2004, 304)
(1) は日本の外に出て旅する際の出入国管理に関する内容を表しています。(2)と(3)は「日本という国の外」を旅したり動き回ったりするという意味を表しています。どれも日本に軸足を置き、日本国内を基点とした見方からの記述であると言うことができます。
「旅する」については「海外を」の方に次のような用例が見つかりました。「国外を旅する」の用例と比べてみましょう。
(4) 日本で働いてお金が貯まったらアジアをメインに海外を旅していた。(溝口恵美,秋葉文子共著 『沖縄移住計画』, 2004, 302)
(5) イギリスをはじめ、海外を旅すると、私はひどく現地のファッションに興味を持つ。(井形慶子著 『ときどきイギリス暮らし』, 2001, 293)
(6) 海外を旅していて、これまでに何度か結婚式に遭遇したことがある。(俵万智著 『ひまわりの日々』, 1995, 914)
(4)や(5)はアジアやイギリスなどでの旅、(6)は海外のどこかでの旅が表されています。いずれも基点が海外にあり、日本に軸足を置いて「外の世界」を表す「国外」の場合とは異なっています。「海外を旅する」には、ほかにもいくつか例がありましたが、日本を基点として描写しているものは一つもありませんでした。そして、そのことは図1の上位に並ぶ「海外を踊り歩く」「海外を放浪する」「海外を飛び回る」などの表現にも共通します。
「海の向こう」への憧れ
これらのことから考えますと、「国外」は「自国の外」、「海外」は、「海の外(=海の向こう)」という意味で、まさに「国外」と「海外」の漢字が表す意味をそのまま体現していることに気づきます。「国外」にネガティブな意味合いを表すものが多かったのも、これで頷けます。自国の外は言葉や文化の壁に阻まれることが多いし国家の庇護も及びにくい地域です。「退去する」「追放する」「放逐する」のはそのような危険な場所への移動を強いられるという意味を表していたわけです。「国外」という語がネガティブな意味を持つ語と相性が良いのは、「自国の外」という意味から来ていたわけです。
一方、「海外」は「海の向こう」というなんとなくロマンを感じる言葉です。「海外進出」「海外留学」「海外旅行」「海外派遣」など、積極的な活動を意味する語との相性が良いのは、海の向こうに対する憧れの気持ちが反映しているからかもしれません。
「海外」と「国外」、一見同じような意味を表している言葉のようですが、コーパスを使って比較してみると、意外にきちんと使い分けられていることが分かりました。
「カルロス・ゴーンが海外に逃亡した」と「カルロス・ゴーンが国外に逃亡した」
どちらも同じ意味を表しているように感じますが、もしかしたら、日本国家に軸足を置く入管職員や検察官たちは「国外に逃亡した」としか言わないのかもしれません。このあたり、誰かに確かめてみたいところです。
-
- 2022年09月13日 『4. コーパスと遊ぼう:○○活と○○感 砂川有里子(筑波大学名誉教授)』
-
あれも「活」これも「活」
大学を定年退職して何年か経った元同僚と久しぶりに再会したときのことです。「砂川さん、私ね、最近シューカツ始めたのよ」、彼女は明るい笑顔で私に話しかけてくれました。「え?すごいね。まだこれから仕事に就くつもりなの?」と驚く私。彼女の方もちょっとびっくりした顔をして、「砂川さん、何言ってるの!就職の就活じゃないわよ。終わる方の終活だってば!」と呆れられてしまいました。なるほど、私たちの年恰好からしたら今さら就活のはずはないよな、と深く納得し、自分の大ボケ具合に自分でも呆れるほかありませんでした。
この「○○活」という言い方、最近、随分たくさん聞くようになりましたね。「就活」や「婚活」はかなり前から使われていて、いくつかの国語辞典にはすでに取り上げられています。しかし、巷にはまだ辞書に載せてもらえそうにない「○○活」が溢れかえっているようです。
今年(2022年)の7月23日の朝日新聞に「あれもこれも『活』」という特集記事が掲載されました。その中で隠居生活ライターの大原扁理氏は、「妊活」「ラン活」「呆活」という私が初めて聞く言葉を取り上げて論じていました。「妊活」なら、私でもどんな意味か大体想像がつきますが、「ラン活」や「呆活」はさっぱりわかりません。一体何のことなのでしょう。
大原氏の説明によると、「ラン活」とは、子供や孫にランドセルを買うため、早めに資料請求したり展示場に行ったりすることなのだそうです。小学校入学前の子供に親や祖父母が競ってランドセルを買おうとするなんて、私が子供の頃には思いもよらない光景です。これも少子化社会ゆえのことなのでしょう。それに、今ではピンクや黄色や緑など色とりどりのランドセルが店頭に並び、性別を問わず自分の好きな色を選ぶそうですから世の中は変わったものです。
もう一つの「呆活」ですが、こちらは「ボーカツ」なのか「ホーカツ」なのか、私には意味だけでなく読み方すら分かりませんでした。どうやら「ボーカツ」と読むようです。「呆」は「呆然」とか「呆ける」という語がありますからなんとなく不活発な印象を受けますけれど、「活」は「活動」「活発」「活性」などから勢いのある元気の良い印象を受けます。私には「呆」と「活」の語義が矛盾しているように感じられるのですが、これら二つを合体してどんな意味になるのかというと、「ただボーッとすること」なのだそうです。おそらく、「ただボーッとすること」を「意識的に頑張って実践する」という意味なのでしょう。今の世は、頑張らなければボーッとできないくらい忙しいのでこんな言葉が使われるようになったのかもしれません。
同じ特集記事の中で、N H K放送文化研究所主任研究員の塩田雄大氏は、「○○活」がこんなにも多用されている要因の一つに、「キムタク」「ダメもと」など、4つの音をもつ「4拍」の言葉が日本語の省略の基本形であることを指摘しています。ちょっと考えてみても、「棚ぼた」「コンビニ」「ファミレス」「スポコン」「リア充」…。確かに4拍の略語は多いですね。「○○活」も4拍語が多いような気がします。巷でどんな「○○活」が使われているのか、調べてみたいと思います。こんな時もコーパスの出番になります。
「○○活」を調べてみよう!
NINJAL-LWP for TWC(NLT)
今回もまた、「筑波ウェブコーパス(TWC)」からコロケーションを検索できるNINJAL-LWP for TWC(略称NLT)を使うことにします。図1の左側の「パターン」の中から「名詞+活」を選んでクリックすると、真ん中の列にあるように、「婚活」「朝活」「恋活」「特活」「失活」「学活」「産活」…と実に多種多様の「○○活」が表示されます。
中には「失活」のような専門用語も混じっていますが(化学物質などの活性が失われ、反応を起こさなくなることだそうです)、多くは日常生活で流行り言葉として使われている言葉です。それらにどんなタイプがあるのか、ざっと眺めてみますと、おおよそ次のようなタイプのあることが分かります。
A) ○○の実現に向けて活動すること:婚活、恋活、就活、産活、エコ活、保活、休活、友活
B) ○○としての活動をすること:ママ活、母活、官活、民活
C) ○○での活動をすること:部活、班活、学活、野活、地活
D) ○○の時間帯に活動すること:朝活、夜活
確かに4拍語が多いですね。私にとってはほとんどが耳慣れない言葉です。「妊活」なら妊娠することを目指して努力することだと想像がつきますが、「産活」がお産にかかわる語だとは思いもしませんでした。意味は妊娠が判明した後に安全なお産を目指して努力することなのだそうです。育児に関するものでは「保活」というのもあります。これは保育園に入れるための活動という意味だそうです。
上の分類のどこにも属さないものに、「特活」というのがあります。これは学校などで集団活動や体験活動を通して社会的実践力を養う「特別活動」のことで、「別」と「動」を省略して短くしたものです。同じようなタイプに「人活」があります。これはどうやら「人材活用」を短くしたもののようです。学校教育関連の仕事をしている人たち、あるいは企業に勤める人たちでないと伝わらない業界用語みたいなものなのでしょうか。学校関係では「野活」「学活」「班活」など、その世界でしか通じない「○○活」が多いように思います。このほか、最近では、ポイントを貯めて上手に使う「ポイ活」、オタク的な趣味の活動をする「オタ活」、アイドルやアニメキャラクターなどの「推し」を応援する「推し活」、一人の時間を楽しむ「ソロ活」など、実に多種多様な「○○活」が出現しています。
「○○活」が流行るのは
これらの言葉は、特定の集団や活動の範囲内で通用する仲間内のジャーゴン(特定の職業などのグループ内で使う用語)のように使われていて、そのグループに属する人の帰属意識を高める働きを持っているように感じます。「産活」「ママ活」「オタ活」「推し活」などは、自分が「○○活」をしていると表明することで、同じ活動をしている人たちとつながり、そのグループの一員として迎え入れられたという安心感が生じるのではないでしょうか。元同僚の「終活してる」という発言は、私も終活しなきゃいけない年齢だという自覚を私に促し、あなたもそろそろ終活世代の仲間入りをしなさいよとお尻を押されたような気がしました。
「終活」とは、「人生の終わりを迎えるために身辺整理などの準備をすること」なのですが、こんなに多くの言葉を費やさなくても、「終活」というとても短い言葉で言いたいことを端的に伝えられます。それに、「人生の終わりを迎えるために…」なんて言ったらちょっとしんみりしてしまいそうですが、「終活」なら明るく軽やかに活動するイメージです。このように、「終活」は気楽に使えて何かと便利です。その一方で、自分の人生を振り返ったり、出会った多くの人々のことを思い返したり、後に残される人々へ想いを馳せたりしながら自分の最後の時に向けて準備をするという当人にとっては意味の深い活動です。それを、「終活」だなんて一言で軽々しく片付けていいのかなあ、という思いもよぎります。
コーパスに現れる「○○活」という言葉を眺めてあれこれ思いを巡らせていると、明るく便利な「○○活」と、軽くてちょっと安っぽく感じる「○○活」が混在しているように感じてきました。「脂肪の多いものや刺激の強いものを避け、バランスの整った食活を心がけることが大切です。」などと聞くと、私たちの生活にしっかり根付いた「食生活」という言葉があるのに、なんで「食活」なんて安っぽい言葉を使うのだろうと感じたりしてしまいます。
「○○感」も調べてみよう!
国語研日本語ウェブコーパス 中納言版(NWJC)
「○○活」がこんなにも色々な新しい言い方を生み出せた背景には、漢語の存在が欠かせません。明治維新に西欧のさまざまな文献を翻訳するのに漢語の造語力が多いに役立ったことはよく知られています。中でも特に1字漢語の造語力は強力で、「非・不・超・激」などの接頭辞や「化・性・度・中」などの接尾辞は、外国語の翻訳や時代に即した言葉造りで大活躍しています。このコラムで扱った「活」もそのような接尾辞の一つです。そこでもう一つ、最近新しい表現をどんどん生み出している接尾辞の「感」について調べてみることにしましょう。
今回は「国語研日本語ウェブコーパス 中納言版」(略称はNWJC)を使ってみたいと思います。このコーパスは、100億語を超える日本語をウェブから集めて作った国立国語研究所のコーパスです。そのうちの約8億6千語が「中納言」というコーパス検索アプリケーションを使って調べられますので、今回はそれを使いたいと思います。このアプリケーションを利用するには1回目のコラムで述べたように登録が必要です。以下のサイトから登録すれば無料で使えますので、興味のある方はぜひ使ってみてください。https://chunagon.ninjal.ac.jp/useraccount/register
「○○感」の多彩なバリエーション
それでは本題に戻りましょう。「感」の付く単語といえば「違和感」「存在感」「高級感」など、漢語を使った「○○感」が思い浮かびます。「ボリューム感」「スピード感」「リズム感」など、外来語の「○○感」もお馴染みです。では、和語の付く「○○感」にはどんなものがあるでしょう。
「中納言」で「和語+感」を検索すると、4,069件のヒットがありました。図2がその一部です。
このままだと特徴が捉えにくいので、この結果をダウンロードしてエクセル表を作り、そこから語彙表を作ってみました。その語彙表の上位30位までを示したのが表1です。
ここでまず目に付くのは「た感」「てる感」など1位から6位までの「○○感」です(3位の「おかん」は無視してください。誤解析です)。一体何だろうとお思いの方が多いと思いますが、これらについては後で触れることにして、まずは7位以下の項目を見てみることにします。
ざっと眺めただけでも、「ドキドキ感」「ワクワク感」「いらいら感」「キラキラ感」
といった感情や感覚を表すオノマトペが多いことに気付きます。これらと似たものに「しっとり感」「ふんわり感」などがあります。ちょっと変わったところでは「今更感」「きちんと感」などが見られます。なんだかわからない15位の「いう感」、20位の「尽くし感」、27位の「って感」というのは、次のような例です。このコーパスの出典はID番号だけなので省略します。
(1) だが、印象としては、穏やかで気楽で“美味しかったネ”という感が残る。
(2) 東証2部重複売買開始のアゼアスは材料出尽くし感を強めもみ合い。
(3) なんかムリヤリって感がありますが。
18位以下には「締め付ける」「尽くす」「遅れる」という和語動詞が付いた「締め付け感」「尽くし感」「遅れ感」というのがありますが、30位以下まで見てみると、さらに「つっぱり感」「ふらつき感」「のぼせ感」などの例が見られます。
30位以下には、「重さ感」「明るさ感」など、わざわざ「感」を付ける必要があると言えるのか疑わしくなるようなものも見つかります。
(4) 振ったときの重さ感がちょうどいい。
(5) 消費電力はそのままに、より太陽光に近いパワフルな白色光で、明るさ感を大幅に向上します。
なるほど、これらは物理的な「重さ」や「明るさ」とは違う、主観的な「感覚」を問題にしているようですね。それなら「感」をつけたくなる気持ちも分からないではありません。
「た」や「てる」に付く「○○感」
以上は、名詞・副詞・動詞といった自立語が使われている例ですが、それ以外に「ない」「た」「れる」「ます」などの助動詞や補助動詞の「てる」が付いている例も相当数見られます。それが先ほど後回しにした表1の1位から6位までの例です。その中でも特に多いのが1位の「〜た感」と2位の「〜てる感」ですので、少し例を見てみましょう。
(6) ご本人の、やり切った感漂う笑顔が印象的でした。
(7) でも上の2枚に比べると若干構図取りに失敗した感がある。
(8) ”作ってる感”とか”やらされてる感”がない。
(9) おいていかれちゃってる感がハンパないので、またみんなで遊びたいですっ。
これらの例から、「〜したという感じ」「〜しているという感じ」を「○○感」という短い言葉で言い表していることが分かります。「ない」「れる」「ます」に付く例としては次のようなものがあります。
(10) ぶっちゃけいえば最近の業界の大変動にはついていけない感があります。
(11) 炊き込みご飯って嫌いではないがおかずを食べると邪魔される感がある気がする。
(12) ファンデーションの場合やっぱりお化粧してます感がどうしても出てしまうので。
ここまでくると、「〜という感じ」の「〜」の部分には何を入れてもよいと言えそうです。
その場限りで生みされる「臨時一語」の数々
国語学者の林四郎氏は「臨時一語の構造」という論文(『國語学』131号)の中で、私たちがコミュニケーションを行う際に、その場限りのものとして臨時に生み出す表現のことを「臨時一語」と名づけています。本来は複数の言葉が結びついて表される表現を一時的に合成させて、その場限りの一つの単語のような形で表現したものです。
臨時一語は文字制限の厳しい新聞にはたくさん出現します。例えば、朝日新聞デジタルの見出しに「今夏の猛暑、温暖化で「底上げ」 起こりやすさ240倍に」というのがありました(2022年9月7日)。これは、「今年の夏の猛暑は、地球温暖化の影響により「底上げ」され、温暖化がなかった時代に比べ、起こりやすさが約240倍になった」という長い文を、半分以下の語数に短縮して表現したものです。
このコラムで調べた「○○活」や「○○感」は、その場で思いついた臨時一語を生産できる便利な表現です。仲間内の気楽な雰囲気の中でしか使えませんが、深刻さを忘れさせたり、その時の気分を自在に表したり、聞き手や読み手の感性や感覚的な理解に訴えたりする力を秘めた表現だったのです。
「○○活」も「○○感」も、使い方を間違えれば場違いだし、「○○活」や「○○感」の濫用に違和感や不快感を感じる方がいるかもしれません。しかし、その一方で、漢語の造語力ってすごいなあ、と感心させられる言葉でもあります。読者の皆さんはこんな言葉の流行に対していかがお感じですか?
-
- 2022年09月06日 『3. コーパスと遊ぼう:○○音痴と○○外れ 砂川有里子(筑波大学名誉教授)』
-
駅前ホテルが見つからない
私は方向音痴です。どこに行くにもスマホのマップが手放せません。でも、スマホがあるからと言っても安心はできないのです。マップの指示する方向に歩いていると思っていたのに、しばらくして真っ逆さまに進んでいると気づくことがよくあるからです。方向が違っていたら教えてくれても良さそうなものなのに、マップはそこまで親切ではありません。また、西も東も分からない土地なのに、「南西に進みます」のような指示があるとむかっ腹が立ちます。
先日も神戸の三宮で、予約したホテルを探すのに大いに迷いました。神戸は以前住んだことのある町なので、ホテルの位置はおおよそ把握できていました。でも、念のため、三宮駅でスマホのマップを立ち上げ、その指示に従って歩き始めました。しばらくすると、「南西に進みます」という音声が流れました。神戸は海側が南、山側が北なので、私でも方角が分かります。そこで、南西に進むと、しばらくして「南東に進みます」という音声が流れるではありませんか。そんなこんなで右往左往した挙句、ようやくのことでホテルにたどり着いてみると、三宮駅の目の前でした。なんのことはない、駅から南に向かう大きなワンブロックを一周し、駅のすぐ近くに戻ってきたのでした。
今回は、この「方向音痴」というときの「音痴」にこだわってみたいと思います。そもそも音痴という語は、音に対する感覚が鈍いため、正しい音程で歌が歌えないことや、歌えない人のことを表します。「方向音痴」というのはそこから派生してできた意味で、似たものに「運動音痴」や「機械音痴」などがあります。本来は音の感覚を表す言葉なのに、方向感覚や運動神経という音以外の感覚が鈍いことや機械の知識や技能が足りないことを表すようになっているわけです。
意味や用法が転用されたり拡張されたりして、いろいろな「音痴」が現れたということのようですが、では、どんな「音痴」があるのでしょうか。それを調べるのにとても便利なアプリがあるのでご紹介します。
コロケーションが調べられる便利なアプリ
NINJAL-LWP for TWC (NLT)
今回使用するのは、NINJAL-LWP for TWCというコーパス検索アプリケーションです。これは、ウェブサイトから11億語の日本語を収集して作った「筑波ウェブコーパス(TWC)」を検索するために国立国語研究所とLago言語研究所が共同で開発したアプリです。名前の中にあるNINJALというのは国立国語研究所の英語名 ‘National Institute for Japanese Language and Linguistics’の略語です。LWPのLは開発に携わったLago言語研究所の頭文字、WPは、Word Profiler(語彙プロファイラー)という意味です。Word ProfilerはLexical Profilerとも言い、コーパスの中に出現する語が別のどんな語と結びつくか、これを「コロケーション」といいますが、そのコロケーションの結びつきの強さを計算した結果が検索できるように設計されているアプリのことです。
NINJAL-LWP for TWCの略称は「NLT」です。「NLT」は無料で、しかも登録もいりませんので、ウェブに繋ぎさえすればすぐ使えます。以下のサイトに丁寧な使い方が書かれた操作説明書が用意されていますし、使い方も至って簡単ですので、ぜひ一度使ってみてください。
https://tsukubawebcorpus.jp
「○○音痴」を調べよう!
「NLT」を使うと、「音痴」がいろいろな語と共起した用例を簡単に調べることができます。例えば、図1は、「音痴」が「が」「は」「も」などの助詞と共起した事例を示しています。小さくて見にくいかもしれませんが、一番左の「パターン」の「音痴が」というところと、真ん中の「コロケーション」の「音痴がいる」というところを見てください(表の列が薄い緑になっている箇所です)。そこを見れば、「音痴が…」というのが11億語の中で45回出現し、その中でも「音痴がいる」というのが10回で最も頻度が高いこと、次が7回の「音痴が治る」であることなどが分かります。
一番右の列は用例が一覧表示される箇所です。図1では「音痴がいる」の用例が表示されています。別の用例、例えば「音痴が治る」の用例が見たい場合は、「コロケーション」の「音痴が治る」の箇所をクリックすれば、その用例の画面に変わります。
「○○音痴」の豊富なバリエーション
画面を、さらに下に向かってスクロールすると、図2の矢印の箇所に「名詞+音痴」という表示がみられます。そこをクリックすると、真ん中の「コロケーション」の列に、「名詞+音痴」の事例が一覧表示されます。先ほどと同様に、ここでもいろいろな事例が頻度順に並べられています。
多いものから順に、「方向音痴」「運動音痴」「機械音痴」「経済音痴」「味音痴」「メカ音痴」「パソコン音痴」「味覚音痴」「政治音痴」…と続きます。「方向音痴」や「運動音痴」は「感覚が鈍い」という意味ですが、「○○音痴」にはそのほかにもいろいろな意味がありそうです。例えば、機械・メカ・経済・政治・金融などの技能面や知識面での弱さを表す場合によく使われています。また、そもそもは音の感覚に関する意味だったのに、「味音痴」のように味覚に関する「音痴」もあります。「英語音痴」は英語ができないとか下手だという意味ですが、「野球音痴」や「サッカー音痴」は野球やサッカーが下手だという意味ではなく、次のように、野球やサッカーに関する知識不足という意味で使われています。
(1) 端から試合の機微など理解出来ない野球オンチの僕からすれば、逆にそこがとっつき易かったポイントである。(夢と現実の狭間をたゆたう、“生き様”に感涙せよ!「マネーボール」 - goo 映画)
(2) 「ミラ〜ンって何ですか?」すでにおわかりの賢明な読者も多いだろう。「イタリアのサッカーチームですよ」と、シチリア出身のR先生。「あ〜そうか」サッカーオンチの高嶋紀子もやっとわかった。(随筆「竹の音」)
図2の「コロケーション」の部分をもっと下の方にスクロールすると、「花音痴」「お金音痴」「小籠包音痴」「健康音痴」など、何のことかよく分からないものが現れます。それらの例は次のようなものです。
(3) ご近所の庭に咲いている白い花、なんていう花だろう?と思っていましたら、藤だそうです!白い藤なんてあるんですね。何しろ花音痴なものですから・・・。(テーマ「花」のブログ記事一覧 おじさん行政書士奮闘記! /ウェブリブログ)
(4) 「お金に強くなろう」という内容でまずはお金オンチから脱出して貯金をしようというものでした。(**貯金0からのHAPPY OL生活**: わたしの貯金の先生)
(5) にぽぽも小籠包オンチです。
熱い・・・としか感じたことが無い(笑)、完全に猫舌のせいです。(健幸料理研究所@泰の国 台北の最後の食事はやっぱり!? 台北旅行記その9)
(6) 直観とヤマ勘に命をあずけるピーマン頭、理性と分析で全てが解決すると考える近代バカ、からだを使い捨てる健康音痴、これらの人種にはなりたくないものです。(薬師禅寺 和尚さんの手の話し)
これらは、花に関する知識がない、金銭管理がうまくできない、小籠包のことをよく知らない、健康に関心を持たないという意味を表しているようです。
「感覚が鈍い」「知識がない」「得意ではない」など、いろいろな意味を簡便に表す方法として「○○音痴」は実によく使われています。最近では、会話や場の空気を読めない人のことを「空気音痴」といったりもするそうですよ。
音痴と音外れ
ここで、「音痴」という言葉について、あらためて考えてみましょう。今まで気にもせず普通に使っていましたが、よくよく眺めてみると、「音」に関する「痴呆」や「白痴」という意味にもとれる残酷な響きを持つ言葉なんですね。単に音程が外れるだけなのですから「痴」などという漢字を使わずに、単純に「音外れ」といってもいいように思うのですが、実は、この「音外れ」は「音痴」と少し違う意味で使われているのです。
(7) 「カサブランカ・ダンディ」のイントロのピアノの音にまずやられるこ(ママ)のピアノの音があるとないとでは、曲自体のノリに雲泥の差が出て来る。しかし「ボギー、ボーギー」の「ギー」は微妙に音が外れている箇所がいくつかある。取り直しできなかったのだろうか?この程度の音はずれはいいのか。(royal straight flush)
(8) 音程や技術(腕)は悪かったが、年1回の定期ライブは毎回100人近くの観客が来てくれたのは”何かやってくれそうなバンド”ということで、”音はずれ”(?)等の危うさを秘めた我々のサウンドに興味を持ってくれたからだと思う。(自分史〔社会人〜30代〕:前田のライフ)
このように、「音痴」の方はそのものに常に関わる音感の鈍さを表すのですが、「音外れ」はそのときのタイミングで一時的に音が外れることを表しています。つまり「音痴」は音感の鈍さという“属性”を表すのに対して、「音外れ」は音程を外すという“現象”を表すという違いがあるのです。
多彩な「○○外れ」
ここまで調べてきて、「○○外れ」の方も気になり始めました。そこで、「NLT」で「名詞+外れ」も調べてみました。すると、「○○音痴」に負けず劣らず、いろいろな「○○外れ」が検出されました。頻度の高い順に「期待外れ」「当り外れ」「常識外れ」「見当外れ」「村外れ」「ピント外れ」…と続きます。「当たり外れ」は対義語の「当たり」と「外れ」を並立させたものですが、そのほかは「○○から外れる」とか「○○とは違う結果になる」という意味を表しています。
これらの中で「街外れ」「村外れ」などは私たちに馴染みのある言い方ですね。これらは「○○」がある範囲の土地を指し、「○○外れ」はその範囲からわずかに外に出た所という意味を表しています。この種の中にも、「部落外れ」「宿場外れ」など、私にはあまり馴染みのないものが見られます。もっと小さな地域を指す例として「構内外れ」や「駅外れ」というのまで見つかりました。これらは次のような鉄道関係の文章に出てきています。
(9) その折り返し列車で塔ノ沢駅へ向う。駅外れの踏切には同業者が1名、結構噂が広まっていたのか?(異電圧・異規格が存在する鉄路 箱根登山鉄道)
(10) 開業区間はここまでで、北見枝幸方の線路は構内外れで合流した後途切れていた。(美幸線廃線跡調査2)
また、ちょっと変わったところでは、「時代外れ」や「流行外れ」というのが見つかりました。これらは「時代遅れ」や「流行遅れ」と同じような気がするのですが、どこか違うところがあるのでしょうか。用例を見てみましょう。
(11) 『不忍』と記された奇妙な仮面と時代外れの洋装を身に纏う元忍者。(MMM ― 刀語シリーズ キャラクター紹介3)
(12) その辺、全部焼け野原で、あたりに人影も稀だったが、苛烈な空襲下、日本服の着流しの人は如何にも珍しく、謂わば時勢を知らない流行外れなのである。(豊島与志雄 楊先生)
忍者は普通、古式豊かな黒装束です。それに対して洋装は、忍者にとって時代遅れどころか時代に先駆けた衣装です。これらの用例を見てみると、時代や流行に「遅れている」という感覚ではなく、その時代やその時の流行に「合っていない」という感覚で使われているようです。「時節外れ」と「シーズン外れ」の意味も似ていますが、「時節外れ」の「時節」は四季折々の季節のこと、「シーズン外れ」の「シーズン」はイベントや流行のシーズンのことを表していて、やはり同じ意味とは言えません。
(13) 芸能祭が行われる由良小学校までの途中にあるその食堂は、シーズンはずれか暖簾も出していない。(伝説の島、興居島その2)
(14) 時節はずれに花が咲けば、これを狂い咲きという。(PHP 道をひらく)
「○○外れ」も「○○音痴」と同様に、新しい言葉をどんどん生み出す力を秘めた言葉のようです。「常識外れ」「見当外れ」「仲間外れ」など、すでに十分に定着した表現がたくさんありますが、保育や育児の世界では「おむつ外れ」という微笑ましい表現を、漁師や釣り師は「針外れ」、自転車の愛好者は「チェーン外れ」というそのものズバリの表現を使っていることが分かりました。これからもどんな「○○外れ」や「○○音痴」が生まれてくるのか注目していきたいと思います。
コーパスで新しい言葉を探索する
最近の若者たちはテレビや新聞のようなマスメディアよりもネットによるパーソナルメディアに触れることの方が多いと聞きます。私は今、四半世紀前に作った辞書の改訂をしている最中なのですが、その辞書の中で使った「子供はこんな時間までテレビを見てはいけません」という用例について、編集者から「今の子供たちはYouTubeなどを見るほうが多いと思うので修正した方がいい」という意見が出てきて驚きました。
以前はテレビや雑誌などのマスメディアを通じて新しい言葉が生まれたり流行ったりしたものですが、今ではネットの世界の中で新しい言葉がどんどん生まれてきています。そんな言葉の使い方や流行語の流行り廃りを調べたりするのにも、コーパスは有力な道具となりそうです。
-
- 2022年08月30日 『2. コーパスと遊ぼう:学習者コーパスの面白さ 砂川有里子(筑波大学名誉教授)』
-
学習者の日本語から得られる意外な気付き
1回目のコラムでは、外国語や第二言語として日本語を学ぶ人たちの言葉を集めた「I-JAS」というコーパスの調査を試みました。この種のコーパスは、学習者の日本語を集めたものなので「学習者コーパス」と呼ばれています。
私はこのところ学習者コーパスの調査にはまっています。その理由は、私がかつて長い間日本語教師をしていたことによるのだろうと思います。日本語を学ぶ人たちは、実に熱心で、日本語教室の中は、彼らが発する文型や会話練習の声が飛び交い、常に活気に満ちていました。時には虚をつかれるような質問に面食らったり、うまく説明できない誤用を発見したりして、教師としての課題がたくさん得られる充実した日々でした。それにも関わらず、残念なことに、当時の私は忙しさにかまけて学生たちの質問や誤用をメモすることも覚えていることもできませんでした。
先日、小林ミナ著『外国語として出会う日本語』(岩波書店、2007年)という本を読んだのですが、そこには教室や研究室で得られた留学生からの質問や誤用がたくさん紹介されていました。多忙な教師生活の中で小林先生が学生たちの質問や誤用を一つ一つきちんと記録して分析し、日本語の面白さを伝えておられるのには本当に頭が下がりました。
こんな私ではありますが、学習者コーパスさえあれば、メモや記憶に頼ることなく、誤用やちょっと変な表現をいとも簡単に集めて調べることができます。今回は、1回目のコラムと同じく「I-JAS」という学習者コーパスを使い、意外なことに気付かされたケースをご紹介しましょう。
「対話」データを見てみよう
1回目で使ったのは、「鍵」というストーリーテリングのデータでした。「I -JAS」にはそのほかにいろいろな種類のデータが含まれています。この回では、その中から「対話」というデータを選んで使ってみたいと思います。「対話」というのは調査者と学習者がインタビュー形式で行った対話を、できるだけ忠実に書き起こしたデータです。書き起こしたスクリプトを読むことはもちろん、録音した音声を聞くこともできます。
次の例に登場するEさんはドイツ語を母語とする学習者で、S P O Tという日本語能力テストで上級者と判定された人です。そのお相手のIさんはインタビュアーを務める日本人の調査者です。〈 〉の中はEさんのあいづちです。
I: はい、今日はどうもありがとうございましたー。
E: あー、よろしくお願いします。
I: えーとー、住んでいる家はこの近くですか?
E: す住んでいる、家はー、あー【駅名】の近くです、つまりこっから15分くらい離れています。
I: あ、そうですかー。
E: 歩いて、はい。
I: はいはい、あのー、じゃあ、あの今日いらしたのは、〈はい〉あのー、バスとか電車とか、〈はい〉使って来られましたか?
E: はい、【路線名】のバスに乗って来ました、はい。
I: あー、何分ぐらいかかりますか?
E: それはー、まあ、徒歩よりー、早くてー、だいたい2分3分くらいかかります。
I: 2分3分。
E: はい。
I: だったら、歩いて来てもいいんじゃないですか?{笑}
E: そうですね、まあ、あさあの言ったように、歩いてはー、3ー、ん15分ぐらいかかります。
I: あーそうなんですか。
これはインタビュー開始部分の発話です。IさんとEさんは初対面ですが、最初からこのように打ち解けた雰囲気で話し合っています。
学習者と母語話者の「テシマウ」はどう違う?
このコーパスでは、同じようなインタビューを母語話者に対しても行っています。そのデータを観察していて、母語話者は「ちゃいます」や「てしまいます」という表現をとてもよく使っているのに気づきました。私自身も「ちゃいます」や「てしまいます」を口癖のような感じでよく使っていて、そのことが以前から気になっていました。そこで、この機会に学習者と母語話者が使った「ちゃいます」と「てしまいます」について「対話」データを調べてみることにしました。これ以降は「テシマウ」というカタカナ表記で、それらの表現をまとめて表すことにします。
図1に示した棒グラフは、母語話者と学習者の1万語あたりの発話に「テシマウ」が何回使われていたかを示したものです。学習者は初級・中級・上級にレベル分けされています。
この図が示すとおり、学習者の使用頻度は初級から中級、上級へと進むに従ってどんどん増えていきます。しかし、上級レベルに到達しても、母語話者の使用頻度の半分弱しか使われていません。この違いは一体何によるのでしょうか。
この問題の手がかりを得るために、「テシマウ」が実際にどんな形で使われているのか調べてみようと思います。「対話」データを使って「テシマウ」が使われた用例を検索すると、2図のような形式で結果が示されます。
真ん中の「キー」の部分に、「壊れてしまっ」「遅れてしまい」「落ちてしまい」など、検索された「テシマウ」の形が表示されます。その左側は「テシマウ」の前に述べられた部分、右側は後に述べられた部分で、これらを含めて読み下せば、「テシマウ」がどんな文の中で使われていたのかを知ることができます。青のマーカーで示されたのが学習者の発話、黄色のマーカーで示されたのがインタビュアーの発話です。赤の下線や赤文字のアルファベットなどがごちゃごちゃしていて読みにくいですが、それらは発話に何らかの問題が起こっていることを示しています。図2は学習者データの検索結果ですので、赤の下線がたくさんありますが、母語話者データの場合はもう少し整っていてこれよりは読みやすいです。なお、検索結果はダウンロードして、エクセル表に変換することができますので、調査結果の分析をするときにはエクセル表を使うことをお勧めします。
頻度だけでなく使い方も違う
さて、学習者と母語話者の「テシマウ」を検索し、たくさん得られた用例に一通りざっと目を通してみました。すると、学習者の発話には「てしまいました」や「ちゃった」といった過去形が多いのに対して、母語話者の発話には、「てしまいます」「てしまおう」「ちゃって」など、過去形以外の形が多いことが分かりました。そこで、過去形とそれ以外の形の使い方に学習者と母語話者でどのくらい大きな違いが生じるのか調べてみることにしました。その結果が図3です。この図には過去形を使った数と過去形以外の形を使った数の比率が示されています。
予想通り過去形の比率は母語話者より学習者の方がずっと大きいことが分かります。初級、中級、上級とレベルが上がるにつれてその比率はどんどん小さくなりますが、上級に進んでもなお47%を占めており、母語話者の30%には遠く及びません。
母語話者に比べて学習者の「テシマウ」の使用頻度が非常に少ないということはすでに観察しましたが、違いはそれだけでなく、過去形と過去形以外の使用比率も学習者と母語話者とで大きく違うことが分かりました。つまり、学習者の「テシマウ」は、使用頻度だけでなく、その使い方も母語話者とは大きく異なっていたのです。
学習者が過去形を使いたがるのはなぜ?
このような現象が生じるのは、もしかしたら日本語教育の教材や教え方に原因があるのかもしれません。日本語教育で「テシマウ」が教えられるのは初級の後半くらいの段階なのですが、その際、次の2つの用法があると説明されるのが普通です。
I. 「全部読んでしまいました」「早く宿題をやってしまいなさい」のように「全部/完全に…を済ませる」ということを表す。
II. 「先生に叱られてしまいました」「財布を落としてしまいました」のように「よくないことが起こって残念だ、取り返しがつかないことが起こって困った」という気持ちを表す。
教科書や参考書には過去形以外の用例もきちんと挙げられているのですが、教室の中でドリル練習をするときは過去形を使ったドリルに偏るようです。さらに、「完全に済ませる」とか「取り返しがつかないことが起こった」という意味には「完了」や「過去」というイメージがつきまといがちであることも、過去形と「テシマウ」の結びつきを強化する要因になっているのでしょう。このように、日本語を習い始めた初期の段階で過去形と「テシマウ」の結びつきが学習者に強く刷り込まれてしまうことが、上級になっても過去形以外の「テシマウ」をなかなか使うことのできない理由のように思われます。
「完全に済ませる」でも「残念だ」でもない「テシマウ」
しかし、「対話」データの母語話者の発話を観察してみると、原因はどうもそれだけではないようです。次に示すのは、母語話者が過去形以外の形で「テシマウ」を使った用例です。〈 〉の中はインタビュアーのあいづちです。
(1) 黒田官兵衛はいわゆるエースなのでー〈はーい〉なんでもできちゃうんですね。
(2) なんかそこの旅館が気に入ってしまって何回かまたリピートしちゃってます。
(3) 初めてだ、だい、海外に行ったの大学生の時だったんですけど〈はい〉、はい、一回行ってその楽しさにし目覚めてまって〈へー〉、ま海外旅行で今まで三十か国、か、三十か国ほどあのトータルで、国の数、旅行したんです。
(4) その人間側としてはその寄生虫ってのは、まあ、まあ、いわまあ害虫みたいな物で、〈ん、ん、ん〉まあ殺してしまえばいいんじゃないかという話になるんですけど。
これらの用例は、「全部/完全に…を済ませる」という意味ではないし「残念だ、困った」という意味でもありません。強いて言うなら、(1)〜(3)は、「その人の意思と関わりなく、思いがけずに何かが起こる」という意味、(4)は、「少し抵抗があるけれど、思い切って何かをする」という意味を表しているように思われます。
このような「テシマウ」は、私たちの日常生活の中で頻繁に使われているのではないでしょうか。例えば、「先輩におごってもらっちゃった」とか「宝くじが当たっちゃった」と友達が言ったとしたら、自分の意思と関わりなく、思いがけずに何かが起こった喜びを表しているように聞こえますし、「そんなに辛いなら辞めてしまったらどうですか」とか「早く告白しちゃいなさいよ」と言われたとしたら、思い切ってそうしろと勧められているように感じます。
「テシマウ」には教科書で説明されているものだけでなく、いろいろな意味や用法があるのです。それらは私たちの日常生活でかなり頻繁に使われていると思うのですが、このような意味や用法は、なかなか教科書に書かれませんし辞書にも載りません。母語話者の使用頻度が学習者よりずっと多かったのは、学習者が使えないタイプの「テシマウ」を母語話者が縦横無尽に使っていたからだろうと思います。母語話者は無意識のうちに、教科書や辞書に載らない多様な「テシマウ」を使いこなしていたのです。
学習者の日本語は宝の山
こんなことに気付かされるのも、学習者と母語話者の日本語を大量に比べることのできるコーパスのおかげだと言えそうです。みなさんも、身近に日本語を学ぶ人々がいたら、ぜひその人たちの日本語を観察してみてください。そして、言い間違いや何か変だと思う表現が見つかったら、そのように感じる理由を考えて、もしその理由がうまく説明できなかったら、ぜひ学習者コーパスを使って調べてみてください。私たちが普段何気なく使っている日本語には、まだまだ未知の面白さがたくさん詰まっています。学習者の日本語は宝の山です。彼らの日本語に学べば、きっと新しい発見に出会えることと思います。
-
- 2022年08月23日 『1. コーパスと遊ぼう:コーパスって何? 砂川有里子(筑波大学名誉教授)』
-
コーパスは「言葉の貯蔵庫」
このコラムの読者の中には「コーパスって何?」とお思いの方も、コーパスを楽々と使いこなしている方もいらっしゃると思います。私は辞書づくりや日本語の研究に携わる関係で、コーパスから大きな恩恵を受けていますが、それだけではなく、ちょっと気になる言葉を知りたいと思ったとき、コーパスを相手にあれこれ考えたりして、「コーパスと遊ぶ」ことの面白みを日々感じています。1回目のこのコラムでは、コーパスを使うことに長けている方たちにはしばらく我慢していただいて、まずはコーパスとはどのようなものなのかということについてお話しします。
コーパスというのは、簡単に言ってしまえば、私たちが様々なコミュニケーション場面で実際に使った言葉を、あちこちから大量に集めて電子化した言葉の貯蔵庫のことです。ここで重要なのは、「実際に使った言葉」という点です。辞書の編集者や日本語の研究者が自分の頭で考えて作り上げた例文ではなく、どこかで誰かが実際に話したり書いたりした「生の」言葉が格納されているという点です。だから、もしかしたらコーパスには言い間違いや書き間違いが含まれているかもしれません。しかし、「大量に集める」というもう一つの重要な特徴によって、その問題はかなり解消できます。そして、コーパスにはもう一つ、非常に重要な特徴があります。それは、「電子化されている」という点です。電子化されていればコンピュータを使って処理することができるからです。たとえ何億あるいは何兆という膨大な数の言葉でも、コンピュータで処理することができれば、それらの言葉がどのように使われているか、どのような機能を果たしているか、その実態を手軽に調べることができます。コーパスは大量のデータを手軽に調査できる実に便利なツールなのです。
コーパスがなかった私の学生時代
ところで、私が学生だった頃はコーパスなんてありませんでした。それに、一般人がコンピュータを使うなど考えられない時代でもありました。当時、私は大学院で日本語学を専攻している院生でしたので、研究のために言葉を調べる必要に迫られていました。そんなときは、新聞記事や小説や雑誌に目を通し、見つけた用例を片っ端から小さなカードに書き写しました。そして、そのようにして集めた大量の用例カードを床一面に広げ、上から俯瞰したり這いつくばって読んだりして分類し、必要とあればカードにメモを書き加え、立ったり座ったり……と、なんともきつい重労働の日々に明け暮れたものでした。
それからさらに数十年の時を経て、長年勤めた大学を退職するので研究室を片付けていたときのことでした。書棚の片隅から用例カードがぎっしり詰まった段ボール箱がいくつも出てきたのです。カードはきっちり分類されており、あちこちにマーカーの印やカラーペンの書き込みが見られます。懐かしいやら切ないやら、涙を飲んで断捨離しましたが、しばらくの間、昔の苦労を思って感慨に耽ったものです。
無料で使える国立国語研究所のコーパス
さて、コーパスの話に戻りましょう。先ほどコーパスのことを「言葉の貯蔵庫」と言いました。しかし、ただ闇雲に言葉を集めればよいというわけではありません。例えば、最近の流行り言葉を調べるのに明治時代の言葉を集めてみても意味がありません。コーパスには目的に応じたいろいろな種類があるのです。それらの中から自分の目的に合ったコーパスを選ぶか、技術と余裕のある人は、自分の目的に合った自前のコーパスを作成するといったことが必要になります。
国立国語研究所は数多くのコーパスを構築し、無料で公開していますので、そのサイトを覗いてみることにしましょう。このサイトに入るには以下のサイトから「中納言」というコーパス検索アプリケーションに登録する必要があります。
https://chunagon.ninjal.ac.jp/useraccount/register
登録さえ済ませば、誰でもいつでも無料で使えます。
「中納言」のサイトに入ると、図1のように各種のコーパスが一覧できます。ここには、現代語だけでなく、古代から近世までの言葉を集めた「日本語歴史コーパス」がありますし、標準語だけでなく各地の方言を集めた「日本語諸方言コーパス」もあります。話し言葉だけに限っても、講演や講義などの独話が主体の「日本語話し言葉コーパス」、日常会話を集めた「日本語日常会話コーパス」、職場での会話を集めた「現日研・職場談話コーパス」など、さまざまな場面で使われた話し言葉が調べられます。
さらに、珍しいところでは、外国語や第二言語として日本語を学習する人々の日本語を集めた「中国語・韓国語母語の日本語学習者縦断発話コーパス」、「多言語母語の日本語学習者横断コーパス」があります。これら2つの名前にある「縦断」や「横断」とは何のことかとお思いでしょうが、「縦断コーパス」というのは、同じ人たちの言葉を数年間に渡って収録し続けて作ったコーパス、「横断コーパス」というのは、同時期にたくさんの人たちの言葉を収録して作ったコーパスという意味です。日本語を母語としない人達がどのように日本語を習得していったのかをじっくり観察したい場合は「縦断コーパス」、いろいろな言語を母語とする人達やいろいろなレベルの人たちの大量のデータを一気に比較したい場合は「横断コーパス」を使うのが適しています。
実際に使ってみよう!
「多言語母語の日本語学習者横断コーパス(I-JAS)」
ところで、日本語を母語としない人たちの使う日本語には、間違った表現やちょっと変な表現が数多く含まれています。それらは日本語や外国語について知るための手掛かりを私たちに与えてくれる貴重な資源です。毎日使っている言葉なのに気が付かなかった日本語の仕組みや日本語の面白さに気付かされることが少なくありませんし、外国語と日本語の違いや外国語の特徴を考えるのにいい題材を手に入れることもできます。
そこで、試しに「多言語母語の日本語学習者横断コーパス」を使ってみることにしましょう。このコーパスは、ベトナム語、英語、中国語、韓国語など、12の言語を母語とする日本語学習者の話し言葉や書き言葉を集めたコーパスです。略称は英語名のInternational Corpus of Japanese as a Second Languageの頭文字を使い、「I-JAS」と言います。
「I-JAS」の中にはいろいろなデータが含まれていますが、そのなかの1つにストーリーテリングというものがあります。「鍵」と題する図2の4コマ漫画を見て、内容を理解した上で、「ケンはうちの鍵を持っていませんでした」という文に続けて物語を語るというタスクです。例として中国人のAさんが語った物語をご紹介します。以下の文章は、Aさんの発話をできる限り忠実に書き起こしたものです。音声を聞くこともできます。
[ケンはうちの鍵を持っていませんでした]
えー、ケンはマリを、あーマリを呼ぼう、えと、思っている、けど、マリは寝ている。そして、ケンは梯子を使って、上ろうとしたときに、警官に見つかり、えー変な人だと思われました。で、そしてマリ、マリ、が起きて、えーケンー、マリが起きて、あの誤解を解けました。
つっかえつっかえだし、助詞の間違いはありますが、ストーリーはよく分かりますね。ところで、「I-JAS」には、Aさんのように日本語を母語としない人たち(「学習者」と呼びます)のデータと比較するために日本語の母語話者(「母語話者」と呼びます)のデータも入っています。次に、母語話者のBさんの語りを見てみましょう。
[ケンはうちの鍵を持っていませんでした]
えー、ドアをあけ、開けようとすると閉まっており、えーチャイムを鳴らすが、まったく対応がありません。それもそのはずで、零時を、深夜零時を過ぎてるため、妻のマリが、深く眠りに入っておりました。そこで、梯子をかけて、2階から入ろうとしたところ、警官に見つかってしまい、君は何をしてるんだとゆう、ことを言われてしまいました。えーと、そういった騒ぎの間に、妻が起き、起きたので、警官との、疑いは晴れることになりました。
AさんとBさんのどちらの語りにも「えー」「えーと」など、「フィラー」と呼ばれる言い淀みの表現が多く使われています。「マリ、マリが」「あけ、開けようとすると」「起き、起きたので」のような繰り返しも見られます。言い淀みはAさんのほうが多いですが、繰り返しはBさんのほうが多いようです。
このように、ひとりひとりのデータを比べると多少の違いは分かりますが、もしかしたらこの違いは学習者と母語話者の違いではなく、AさんとBさんの個人的な話し癖の違いなのかもしれません。学習者と母語話者の違いを知るには、もっと多くのデータを比較しなければ確かなことは分からないはずです。「I-JAS」には海外の学習者850人分、日本語の母語話者50人分という大量のデータが格納されていますので、そのデータを使って調べてみることにします。
学習者の使うフィラー(言い淀み)の違いが分かった!
まずは、学習者と母語話者がどんなフィラーをどのくらいの頻度で使っているのか調べることにしましょう。学習者と母語話者の人数には大きな開きがあるため、ここでは1万語あたりの発話にどんなフィラーがどのくらいの頻度で出現したかを調べました。その結果の上位10位までを表1に示します。
学習者も母語話者も「えー」や「えーと」など「え」を使ったフィラーをたくさん使っていますが、「あ」を使ったフィラーも少なくありません。そのうちの「あー」に関しては学習者の方が圧倒的に多く、母語話者が3回しか使っていないのに、学習者は365回も使っています。テレビに出演する外国人は日本語が上手な人が多いですが、それでも時として曖昧な「あー」という音のフィラーが多くて、外国人っぽいと感じることがありますよね。ただ、全ての言語を母語とする外国人が同じように「あー」をたくさん使うかというと、そういうわけではありません。コーパスを調べてみると、学習者の母語によって「あー」の使用頻度にかなり大きな差が生じていることが分かります。その結果を示したのが図3です。
この図を見て分かるように、一番左のロシア語話者と一番右のスペイン語話者とでは、「あー」の使用に実に大きな開きがあります。1万語あたりに換算すると、ロシア語話者は862回、スペイン語話者は60回ですので、14倍もの差があるのです。この図を見ていると、それぞれの母語のどんな特徴からこのような結果が生じたのか気になりませんか?これは、卒論や修論の面白い研究テーマになりそうです。「我こそは!」と思う方は是非この研究にチャレンジしてみてください。
コーパスで広がる言葉の世界
外国語や第二言語として日本語を学ぶ人たちが使う日本語から、これまで気づかなかった日本語や外国語の面白さに気付かされることがお分かりいただけたでしょうか。こんなことが手軽に調べられるのもコーパスのおかげです。次回からは、国立国語研究所が開発したいろいろなコーパスを使って遊んでみたいと思います。ぜひみなさんもコーパスと一緒に遊んでみてください。
-
- 2022年07月05日 『8月からの新連載と秋・冬の新書 刊行予定のお知らせ』
-
8月23日からの6回の連載は砂川有里子先生(筑波大学名誉教授)による、「コーパスと遊ぼう」です。砂川先生は文法や談話についての研究をされており、辞書やコーパス作成のプロジェクトを通じて教育にも貢献されています。この連載では、母語話者コーパス、学習者コーパス、児童・生徒作文コーパスを使って、どんな面白いことができるかをご紹介くださる予定です。(野口)
秋・冬の新書 刊行予定
『サンスクリットの源流〜ヴェーダ語のかなり濃い話〜古代インドの世界観から牛フェチまで』(仮題)堂山英次郎著(リベラルアーツコトバ双書3)ISBN978-4-910292-03-8 2023年2月刊行予定。サイトの連載を全面的に改稿。より文化寄りの言語現象を追い、新たな言語文化的現象の記述を追加して、全12章とする。
『情報倫理学入門-プライバシー・著作権からインターネット研究倫理まで』(仮題)
大谷卓史著(リベラルアーツコトバ双書4)ISBN978-4-910292-04-5
2023年2月刊行予定。サイトの連載を全面的に改稿。
第1章 情報倫理の基礎(1) 情報倫理とは何か
第2章 情報倫理の基礎(2) 著作権の基礎
第3章 情報倫理の基礎(3) 著作権の現代的課題
第4章 情報倫理の基礎(4) プライバシーとは何か
第5章 情報倫理の基礎(5) 個人情報保護法は何を保護するのか
第6章 情報倫理の基礎(6) ソーシャルメディア時代の表現・言論の自由
後半では、インターネット研究倫理に関して論じる。
『不自然な日本語の文』(仮題)天野みどり著(リベラルアーツ言語学双書2)ISBN978-4-910292-05-2 2022年11月刊行予定。
著者「はじめに」から抜粋
「文の意味」とはどのような場面・状況でも、その文が発せられれば伝達される、言語形式の持つ意味です。これに対して、「発話の意味」は、言語形式としては現れていないけれども、ある状況の中で推論される意味なので、発話された場面・状況・文脈が異なれば異なる意味となります。(中略)
本書で問題にするのは、前者の「文の意味」です。日本語には様々な文の形があり、その形が違えば「文の意味」は異なります。その文の形と意味の結びつきに関する、慣習的に築かれた文法規則を発見することが本書の目的です。(中略)
本書の特徴は、その文法規則を発見するために、少し不自然な日本語の文を考察することです。少し不自然なのになぜ意味理解できるのかを考えることにより、日本語母語話者の持つ文法規則がどのようなものであるのかを明らかにしていこうと思います。