google 検索を利用した日本語の低頻度複合動詞の...

15
「飲み倒す」とはどういう意味なのか Google 検索を利用した日本語の低頻度複合動詞の分析― * 徐 敏徹 (立命館大学大学院言語教育情報研究科) What Is the Meaning of ‘Nomi-Taosu’? : Analysis of Japanese Low-Frequency Compound Verbs by Using Google Search Mincheol Seo (Graduate School of Language Education and Information Science, Ritsumeikan University) 要旨 コーパスという用語の定義には、おおむね「大規模」という単語が登場する。しかし、その ような(大規模な)コーパスであっても、日常生活における使用頻度の低い言葉に関しては、 そこから有用な情報を得ることが難しい。 本研究では、意味記述が不十分だと考えられる日本語の低頻度語彙的複合動詞を取り上げ、 Google の検索エンジンとクローラーを利用し、用例を網羅的に収集した。このような方法は、 従来困難であった低頻度語彙の用例分析を可能とする。 本稿では、低頻度複合動詞である「飲み倒す」を取り上げ、その特徴を記述し、類義関係に ある「飲み尽くす」「飲み潰す」「踏み倒す」との比較分析を行った。分析結果、「飲み倒す」は 「酒を飲んでその代金を払わないままにする」という本来の意味よりも、「たくさん飲む」とい う派生的な意味での使用が顕著であることが明らかになった。また、類義関係にある語の中で は、「飲み尽くす」との類似性が高いことがわかった。 1. はじめに 大勢の人が無意識のうちに使用する言葉には、ときおり一定の規則が見られる。そのような 一定の規則に基づいて、言葉の意味や用法を詳細に記述したものを我々は「辞書(もしくは辞 典)」と呼ぶ。しかし、日常生活においてそれほど使用頻度が高くない言葉に関しては、辞書 における意味記述が十分だとは言い難い。その一因として挙げられるのが、分析可能な用例数 の不足である。言葉が実際の場面でどのように使われているのかを把握するのが困難であるた め、辞書における意味記述も不十分になるのである。本稿では、使用頻度が低い言葉の意味記 述をより充実させるためには、大規模な言語資料を用いることが重要であることを示す。その 手始めとして、日本語の低頻度語彙的複合動詞に焦点を当てて分析を行う。 * 本稿は平成 29 12 13 日、立命館大学文学部に提出した卒業論文を加筆修正したものである。 lt0715ix {at} ed.ritsumei.ac.jp 【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します 220 2018年9月4日-5日

Upload: others

Post on 21-Jan-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

「飲み倒す」とはどういう意味なのか

―Google検索を利用した日本語の低頻度複合動詞の分析―∗

徐 敏徹 (立命館大学大学院言語教育情報研究科) †

What Is the Meaning of ‘Nomi-Taosu’? : Analysis of

Japanese Low-Frequency Compound Verbs by Using

Google Search

Mincheol Seo (Graduate School of Language Education and Information Science,

Ritsumeikan University)

要旨

コーパスという用語の定義には、おおむね「大規模」という単語が登場する。しかし、その

ような(大規模な)コーパスであっても、日常生活における使用頻度の低い言葉に関しては、

そこから有用な情報を得ることが難しい。

本研究では、意味記述が不十分だと考えられる日本語の低頻度語彙的複合動詞を取り上げ、

Googleの検索エンジンとクローラーを利用し、用例を網羅的に収集した。このような方法は、

従来困難であった低頻度語彙の用例分析を可能とする。

本稿では、低頻度複合動詞である「飲み倒す」を取り上げ、その特徴を記述し、類義関係に

ある「飲み尽くす」「飲み潰す」「踏み倒す」との比較分析を行った。分析結果、「飲み倒す」は

「酒を飲んでその代金を払わないままにする」という本来の意味よりも、「たくさん飲む」とい

う派生的な意味での使用が顕著であることが明らかになった。また、類義関係にある語の中で

は、「飲み尽くす」との類似性が高いことがわかった。

1. はじめに

大勢の人が無意識のうちに使用する言葉には、ときおり一定の規則が見られる。そのような

一定の規則に基づいて、言葉の意味や用法を詳細に記述したものを我々は「辞書(もしくは辞

典)」と呼ぶ。しかし、日常生活においてそれほど使用頻度が高くない言葉に関しては、辞書

における意味記述が十分だとは言い難い。その一因として挙げられるのが、分析可能な用例数

の不足である。言葉が実際の場面でどのように使われているのかを把握するのが困難であるた

め、辞書における意味記述も不十分になるのである。本稿では、使用頻度が低い言葉の意味記

述をより充実させるためには、大規模な言語資料を用いることが重要であることを示す。その

手始めとして、日本語の低頻度語彙的複合動詞に焦点を当てて分析を行う。

∗ 本稿は平成 29年 12月 13日、立命館大学文学部に提出した卒業論文を加筆修正したものである。† lt0715ix {at} ed.ritsumei.ac.jp

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

220 2018年9月4日-5日

Page 2: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

2. 先行研究

日本語の複合動詞に関する研究は、影山 (1993)以降、主に理論言語学的な観点から活発に

行われている。一方、複合動詞の実例を分析した研究はそれほど多くない。影山 (2013)から

は、複合動詞分析における実例の重要性を垣間見ることができる。影山 (1993)では複合動詞

を統語的複合動詞(「食べ終える」「走り続ける」等)と、語彙的複合動詞(「繰り返す」「思い出

す」等)に分けている。また、語彙的複合動詞における前項動詞(以下 V1)と後項動詞(以下

V2)の間に見られる抽象的な機能関係を並列関係、右側主要部の関係、補文関係に分類してい

る。そのうち、補文関係にあたる語彙的複合動詞(「見逃す」「聞き漏らす」等)はその数が少

なく、「例外的であろうと何となく想定されていた (影山 2013:p.8)」。しかし、実際に使われた

語彙的複合動詞の用例を集めると、補文関係に当てはめるしかないと思われる例が予想以上に

多いことから、従来の語彙的複合動詞を主題関係複合動詞とアスペクト複合動詞に再編成した

のである。とりわけ、語彙的な複合動詞の V1が反復形を許すことを証明するために、「ウェブ

から収集したもの (影山 2013:p.32)」を証拠として挙げている点は注目に値する。

普段さほど見聞きしない語に関しては、その語の前後にどのような語が共起するのか、母語

話者の内省による判断だけでは限界がある (滝沢 2007, 2010)。このとき、有用な道具となるの

がコーパスである。コーパスとは、コンピュータで利用することができる言語研究のための大

規模なデータのことで、実際に使われた用例がその言語の在り方を正しく反映するように、組

織的に収集して公開したものを指す (前川 2009)。このようなデータの活用は、母語話者の直

観に基づく従来の言語研究では成し得なかった隠れていた言語現象をあぶり出し、とりわけ、

辞書編纂において言葉のより精緻な記述を可能としている (田野村 2010, 滝沢 2017)。しかし、

コーパスであっても限界はあり、低頻度語彙に関しては検索結果がないか、あるとしてもわず

かな量に過ぎない。ここで代案となるのがウェブ検索である。ウェブ検索を利用すると、既

存のコーパスからは得られない用例を集めることができる。このことは、岡島 (1997)をはじ

め、多くの研究者が指摘している点でもある (橋本 2007, 杉村 2007, 荻野・田野村 2011, 杉村

2014, 荻野 2014, 滝沢 2017, Taylor 2017)。しかしながら、それを活用した低頻度複合動詞の

研究は、筆者の知る限り見当たらない。

そこで、本研究では、現代日本語における低頻度語彙的複合動詞の用例をウェブ検索で収集

し、どのような語が複合動詞とよく共起しているのか分析することを目的とした。ウェブペー

ジを大規模なコーパスと見なし、そこから複合動詞の用例を収集・分析することで、複合動詞

の意味記述を現在より充実させることが期待される。とりわけ、低頻度複合動詞は用例数の不

足により、共起語分析が等閑視されて来たが、本研究を行うことによって初めて、それが実現

可能になると考えられる。また、収集した用例に対し、一定の規程に従って再利用可能な形で

整理を行う。このような作業は、集めた用例を今後の複合動詞研究にも活用可能にするであろ

う。

本研究でウェブ検索の対象とした複合動詞は、頻度調査の結果得られた低頻度複合動詞 617

語のうち 10 語である。しかし、本稿では紙面の都合上、その 10 語のうち、さらに範囲を絞

り、「飲み倒す」だけを取り上げることにする。以下は、本研究における研究課題である。

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

221 2018年9月4日-5日

Page 3: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

1. 「飲み倒す」がヲ格を取るとき、目的語としてはどのような名詞が現れているのか。

2. 「飲み倒す」から見られる特徴は、類義関係にある他の複合動詞「飲み尽くす」「飲み潰

す」「踏み倒す」からは見られないのか。

本稿の流れとしては、次の第 3 章で低頻度語彙的複合動詞の選別方法、検索エンジンやク

ローラーを用いた用例収集および整理方法について述べる。また、どのような過程を経て「飲

み倒す」が研究対象として選ばれたのかも、そこで触れることにする。次に、第 4章では、「飲

み倒す」と類義関係にある「飲み尽くす」「飲み潰す」「踏み倒す」の分析結果を報告する。な

お、第 5章では考察をし、最後の第 6章で本稿の結論を述べる。

3. 研究方法

以下第 3章では、最初に今回分析対象となった低頻度複合動詞をどのように選定したのかに

ついて述べる。その後、Googleからの用例収集方法およびデータの整理方法を簡潔に説明す

る。

3.1 低頻度語彙的複合動詞の選別

3.1.1 複合動詞レキシコン

国立国語研究所(以下国語研)では、『複合動詞レキシコン(国際版 ver.1.10)』というデー

タベースを公開し、語彙的複合動詞(以下では便宜上、単に複合動詞と略す)約 2,700語に関

する情報を提供している。ここから、低頻度複合動詞を選別するためには、『複合動詞レキシ

コン(以下レキシコン)』にある約 2,700語の頻度情報が必要である。しかし、『レキシコン』

上では、複合動詞の頻度情報を網羅的に確認する術がない(1)。ゆえに、何らかの基準を設けて

頻度調査を行い、複合動詞の頻度表を作成する必要がある。そこで利用したのが BCCWJの

語彙表である。

3.1.2 BCCWJの語彙表

国語研のコーパス開発センターでは、「『現代日本語書き言葉均衡コーパス(The Balanced

Corpus of Contemporary Written Japanese、以下 BCCWJ)』語彙表」を公開している。本

稿では、「BCCWJ 主要コーパス語彙表(Version 1.0)」を使用し、複合動詞の頻度調査を行っ

た。この語彙表を使用した理由は、後述する出版・図書館サブコーパスにおける固定長サンプ

ルの度数を取得するのが容易だったからである(2)。 今回の頻度調査では、出版 (書籍・雑誌・

(1) 『レキシコン』の各見出し語には、国立国語研究所・Lago言語研究所が開発した BCCWJ検索システムであるNINJAL-LWP for BCCWJ(以下 NLB)へのリンクがあり、そこから見出し語の頻度情報が確認できる。しかし、そのような方法で 2,700 語以上の頻度を得るためには、その分退屈な作業を繰り返さなければならない。クローラーを用いると簡単にできる作業ではあるが、筆者はその当時、プログラミングについての知識がなかった。

(2) 「BCCWJ 主要コーパス語彙表」ではなく、「BCCWJ 語彙表 (全体):短単位語彙表データ」を使用してもよい。実際に、両語彙表を使用して複合動詞の頻度調査を行った結果、高頻度複合動詞においては最大 73回の差が

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

222 2018年9月4日-5日

Page 4: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

新聞)サブコーパスと、図書館 (書籍)サブコーパスのみを対象としている。BCCWJには他に

も多様なサブコーパスがあるが、その中で最も均衡的なものは出版・図書館サブコーパスの固

定長サンプルである (田野村 2014:pp.121-122)。『「現代日本語書き言葉均衡コーパス」利用の

手引』には、固定長サンプルが「母集団(=推計された総文字数)からの抽出比が明確である

点で、基本語彙表や漢字表の作成、語彙・文字調査など、統計的な言語研究に向く(p.30)」と

明記されている。このようなバランスの取れたサブコーパスの固定長サンプルを使えば、頻度

調査における偏りをなるべく抑制できると考えられる。

3.1.3 動詞の頻度表作成

頻度表を作成するために、「BCCWJ 主要コーパス語彙表」を基にし、『レキシコン』にある

複合動詞約 2,700語の頻度調査を行った。詳細な頻度表の作成過程、同音異義語や同字異音語

の取り扱いなどは、次の URLから確認することができる (http://bit.ly/2uEfC1G)。得ら

れた複合動詞の頻度表から、低頻度複合動詞(以下では「低頻度」という言葉を、「使用頻度が

0に等しい複合動詞」を指すときに使用する)だけを取り出すと 617語になる。このままでは

数が多すぎるので、Excelを利用し、各々の複合動詞に乱数を付与してから昇順に並び替えた。

その後、上位の 10語まで絞り込んだ結果、以下の語が得られた。

(1) 飲み倒す、打ち仰ぐ、聞きっぱなす、困り切る、裂け広がる、使い慣れる、言い消す、咳

き入る、微笑み掛ける、飲み交わす

「飲み倒す」が本稿の分析対象となった理由は、ここからわかるように、単純に最も上に位置

していたからに過ぎない。

3.2 用例収集

3.2.1 用例検索および収集日

「飲み倒す」の用例検索および収集は、2017年 9月 14日から 15日にかけて行った。時間帯

は検索エンジンに対する負荷を減らすために、午前零時(日本標準時)を過ぎてからにした。

なお、「飲み倒す」と類義関係にある「飲み潰す」、「飲み尽くす」の用例検索および収集は、そ

れぞれ 2017年 10月 31日、同年 11月 3日に行った。

3.2.2 検索エンジンの選択

複合動詞を検索する前に、まずは検索エンジンを選択しなければならない。代表的な検索エ

ンジンとして、以下のようなものが挙げられる。

(2) a. Google(https://www.google.co.jp)

b. Yahoo!(https://www.yahoo.co.jp)

c. goo(https://www.goo.ne.jp)

出た。たとえば、「繰り返す」の使用頻度は「BCCWJ 主要コーパス語彙表」で 1,658回、「BCCWJ語彙表 (全体):短単位語彙表データ」で 1,585回となっている。しかし、すでに述べたように本研究では低頻度複合動詞だけを扱っている。ゆえに、高頻度複合動詞におけるこのような頻度の差が本研究に影響を与えるとは考え難い。

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

223 2018年9月4日-5日

Page 5: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

本研究で使用した検索エンジンは、比較的に用例の数が多かった (2a)の Googleである。ウェ

ブ検索による日本語研究の先駆的研究とも言える荻野 (2014)は、検索エンジンの不安定さに

言及し、比較的に安定的なヒット件数が得られる goo の使用を促している。しかし、本研究

で検索エンジンを利用する主な目的は、複合動詞の実例を収集することである。また、2017

年 10月 31日現在、gooはヒット件数を表示していないため、ヒット件数を用いて研究するこ

とができない状態である。なお、同じ語句を Googleと gooで検索してみると、前者の方が検

索結果の件数が多い。たとえば、「飲み倒す」を後述するフレーズ検索(3.2.5 参照)すると、

得られる用例の件数は Google で 239 件、Yahoo!は 238 件ヒットするのに対し、goo では約

120 件である(検索日:2017 年 10 月 31 日)。 ・約  120 件と書いたのは、すでに述べたように

gooではヒット件数を表示しないため、検索結果を直接数え上げたからである。一方、Google

と Yahoo!を検索エンジンとして比較するのは、あまり意味がない。なぜなら、2010年の秋か

ら、Yahoo!は Googleの検索エンジンと検索連動型広告配信システムを採用しているからであ

る(3)。実際に、上述した「飲み倒す」のフレーズ検索結果では1件の差しか見られていない。

3.2.3 複合動詞の表記に関する問題

複合動詞を検索する前に、もう一つ考えなければならないのは、複合動詞の書字形である。

文部科学省の「送り仮名の付け方(昭和 48年内閣告示第 2号)」には、複合の語の送り仮名の

付け方として、以下の本則を設けている。

(3) 複合の語(通則 7を適用する語を除く。)の送り仮名は、その複合の語を書き表す漢字

の、それぞれの音訓を用いた単独の語の送り仮名の付け方による。

【出典】 文部科学省『送り仮名の付け方』

たとえば、単独の語「思う」と「出す」の複合語は、それぞれの送り仮名の付け方を使用し、

「思い出す」と表記する。しかし、(3) のような本則はあくまでも仮名遣いのよりどころであ

り、それ以外の表記も当然可能である。一例として、「繰り返す」は「繰り返す」という表記

が最もよく用いられている。しかし、「繰返す」や「繰りかえす」、もしくは「くり返す」、さ

らにはすべてをひらがなで「くりかえす」と書く場合もある。その証拠として、以下の表 1に

BCCWJにおける「繰り返す」の書字形頻度を示す(4)。

表 1 BCCWJにおける「繰り返す」の書字形頻度

書字形 頻度 割合

繰り返す 6,445 80%

くり返す 816 10%

くりかえす 551 7%

繰返す 143 2%

繰りかえす 80 1%

(3) Yahoo! Japan - プレスリリース(https://about.yahoo.co.jp/pr/release/2010/0727a.html)(4) 検索には NLBを利用した(検索日:2017年 10月 9日)。

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

224 2018年9月4日-5日

Page 6: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

一方、「思い付く」の場合は「思いつく」の方が一般的であろう。このような複合動詞の表記

のゆれを考慮し、Googleで検索する際には多様な複合動詞の書字形を用いている。最終的に、

Googleで検索した複合動詞およびその書字形は以下の通りである。

(4) a. 飲み倒す、飲みたおす、のみたおす

b. 打ち仰ぐ、打仰ぐ、打ちあおぐ、うち仰ぐ、うちあおぐ

c. 聞きっぱなす、ききっぱなす

d. 困り切る、困切る、困りきる、こまりきる

e. 裂け広がる、裂広がる

f. 言い消す、言消す、言いけす、いい消す、いいけす

g. 咳き入る、咳入る、咳きいる、せき入る、せきいる

h. 飲み交わす、飲交わす、飲交す、飲みかわす、のみ交わす、のみ交す、のみかわす

i. 使い慣れる、使いなれる、使慣れる、つかい慣れる、つかいなれる

j. 微笑み掛ける、微笑みかける、微笑掛ける、微笑かける、ほほえみ掛ける、ほほえみ

かける

なお、「のみ倒す、ききっ放す、こまり切る」は検索対象から取り除いた。その理由は、分析に

使用可能な用例がほとんど、あるいは、まったくなかったからである。

3.2.4 用例収集のためのクローラー

検索エンジンで複合動詞を検索し、用例を収集する作業は、すべてクローラーが自動的に

行った。クローラー (crawler)とは、「ウェブ上を常に這いまわって、新しい情報とウェブペー

ジをかき集め、中央のリポジトリに蓄えるようにする (Langville and Meyer 2009:pp.15-16)」

仮想的なロボットである。クローラー作成にはプログラミング言語 pythonを使用した。ソー

スコードは、次の URLから確認できる (http://bit.ly/2uEfC1G)。

3.2.5 複合動詞の活用語尾に関する問題

クローラーが Google で複合動詞を検索する際には、フレーズ検索を基本としている。フ

レーズ検索とは、検索語句をダブルクオーテーションで囲んで検索する方法である。Google

ではこのような検索方法をフレーズ検索と呼んでいる (Dornfest et al. 2007)。検索エンジン

を利用して言語研究を行う場合、フレーズ検索は必須とも言える (荻野 2014)。

クローラーは、複合動詞が五段活用する場合、語尾を変換しながらフレーズ検索を行う。く

わえて、複合動詞がテ形になる場合の音便「っ」「ん」「い」も付け加えて検索する。つまり、

一つの複合動詞の書字形に対して計 6回の検索を行うことになる (語尾が「す」で終わる場合

は 5回)。たとえば、「困り切る」の場合、検索語句は以下のようになる。

(5) 困り切ら、困り切り、困り切る、困り切れ、困り切ろ、困り切っ

なお、3.2.3で述べたように「困り切る」の他の書字形として「困切る」「困りきる」「こまりき

る」もある。結果的には、語彙素「困り切る」に対して計 24回の検索をすることになる。一

方、下一段活用動詞に対しては、書字形ごとに計 7回の検索を行った。たとえば、「使い慣れ

る」の場合、以下のような検索を行っている。

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

225 2018年9月4日-5日

Page 7: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

(6) 使い慣れ、、使い慣れな、使い慣れる、使い慣れれ、使い慣れろ、使い慣れよ、使い慣

れて

「使い慣れ、」には読点(、)がついているが、検索エンジンは一部の演算子を除き、基本的には

記号を無視して処理する。にもかかわらず、読点を挿入している理由は、単に語尾が変換する

ことを示すためである。

3.2.6 データベースの整理および形態素解析

収集した用例のうち、不適切な例や重複して登場する例などは削除した。以下、どのような

基準に従って用例を削除したのか、その基準の一部を示す。

(7) a. 性的な表現が含まれている場合

b. 有益な情報を導き出せない場合(やはり全花火必須だな 飲み倒さ...)

c. 動詞と動詞の間に記号が含まれている場合(…なくてもいい。消さない。)

その後、形態素解析器MeCab(mecab of 0.996)と電子化辞書UniDic(unidic-mecabver. 2.1.2)

を使い、形態素解析を行った。詳細は補足資料を参照されたい (http://bit.ly/2uEfC1G)。

3.3 筑波ウェブコーパスの活用

本稿では、低頻度複合動詞と類義関係にある複合動詞も分析している。その際、類義関係に

ある複合動詞の用例が他のコーパスに一定量以上ある場合、それを使うようにした。すでに触

れたように、本稿でウェブ検索を活用している理由は、既存のコーパスから低頻度複合動詞の

用例を探しても、わずかな数しかないか皆無だったからである。しかし、類義関係にある複合

動詞まで低頻度だとは言い切れない。実際、「飲み倒す」と類義関係にある「踏み倒す」の場

合、今回の頻度調査では 18回となっている。本稿では既存のコーパスとして、筑波ウェブコー

パス(Tsukuba Web Corpus: TWC)を、検索ツールとしては国立国語研究所・Lago 言語研

究所が開発した「NINJAL-LWP for TWC(以下 NLT)」を利用した。

4. 分析結果

本章では、低頻度複合動詞 617語を昇順で並び替えた結果から最も上に位置していた「飲み

倒す」を取り上げ、分析結果を報告する。また、「飲み倒す」の特徴を探るために類義関係にあ

る複合動詞、「飲み尽くす」「飲み潰す」「踏み倒す」との比較分析も行った。

4.1 「飲み倒す」とは

まず、そもそも「飲み倒す」とはどういう意味なのかを確認しておきたい。「飲み倒す」には

辞書に記載されている本来の意味と、V2の「倒す」によって生み出される派生的な意味とが

ある。『日本国語大辞典(第二版、以下日国)』では「飲み倒す」を以下のように記述しており、

これは「飲み倒す」の本来の意味にあたる。

1. 酒を飲んでその代金を払わないままにする。飲みつぶす。

2. 酒を飲んで財産をつぶす。飲みつぶす。

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

226 2018年9月4日-5日

Page 8: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

【出典】 日本国語大辞典

『レキシコン』でも「飲み倒す」を「酒を飲んで、代金を倒す(代金を払わない)」と記述し、そ

の例文として (8)を示している。

(8) 彼は酒を飲み倒した.

【出典】 複合動詞レキシコン

また、以下の (9)は今回集めた用例の中で「飲み倒す」を上述した本来の意味で使用している

例である(下線部筆者)。

(9) a. てめえのような奴は、おおかた年中、その手で飲み屋を飲み倒しているのだろう(吉

川英治『宮本武蔵』)。

b. 人を殺し、酒屋を飲みたおし、その尻尾は童学草舎へ持って行けなどという乱暴者

から、そういわれてはたまらない(吉川英治『三国志』)。

c. 酒場を飲み倒したり、女を強奪したり、人を恐喝するなどもっての外じゃ(金史良

『天馬』)。

【出典】 WWW(Google ブックス)

ところで、収集した用例の中には、(9)のような「酒代を払わない」という意味ではなく、「た

くさん飲む」や「十分に飲む」という意味での使用が目立っている。これは「飲み倒す」の派

生的な意味にあたる。以下の (10)にその例を挙げる。

(10) a. 有楽町~銀座で朝まで飲み倒してみた

b. 健康にいいと言われるものを片っ端から試し、サプリメントを飲み倒すようになる

かもしれない。

c. 何と飲み放題で、何の気兼ねもなく、飲み倒していただけます……しかし

高いお酒を飲み倒されると、お店の裏で店長が静かに泣いていることをお忘れなく

【出典】 WWW

このように「倒す」が複合動詞の V2に位置すると、「倒す」が本来的に持つ語彙的な意味が希

薄になり、V1が表す行為や動作の反復強調を示す場合がある (長谷部 2012, 影山 2013)。

4.2 用例分析結果

「飲み倒す」がどういう意味を持っているのかを確認したところで、以下では「飲み倒す」を

はじめ、「飲み尽くす」「飲み潰す」「踏み倒す」の用例分析結果を報告する。

4.2.1 「飲み倒す」

分析に用いた「飲み倒す」の用例数は 924 例、使用頻度は 964 回である。用例数と使用頻

度が異なっている理由は、一つの用例の中に複合動詞が複数回使われている例があるからであ

る。まず、「~を飲み倒す」に前方共起する名詞を次ページの表 2に示す。

「飲み倒す」がヲ格を取るとき、目的語位置に現れる名詞の延べ語数は 114語、異なり語数は

59語である。表 2を見ると、酒が 21回で最も頻度が高く、次にビールが 19回、ワインが 10

回、焼酎が 3回現れており、これらの名詞だけで延べ語数全体の 46%を占めている。表に載っ

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

227 2018年9月4日-5日

Page 9: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

表 2 「~を飲み倒す」に前方共起する名詞(上位 5語、頻度降順)

名詞 助詞 複合動詞 頻度

を 飲み倒す

21

ビール 19

ワイン 10

焼酎 3

夜 3

ていない飲み物まで合計すると使用頻度は 86回となり、延べ語数の 75%以上を占めることに

なる。4.1で触れたように、「飲み倒す」は本来の意味ではなく、ほとんどが「たくさん飲む」

という派生的な意味で使われていることがわかる。その分、「飲み倒す」の目的語として「飲

料」が占める割合は高い。それでは、「飲み倒す」と類義関係にある「飲み尽くす」「飲み潰す」

「踏み倒す」からもこのような傾向が見られるのだろうか。

4.2.2 「飲み尽くす」

「飲み尽くす」は統語的複合動詞であるが、本稿では便宜上、単に複合動詞と呼ぶことにす

る。「飲み尽くす」の用例数は 1,336例、使用頻度は 1,369回である。日国では「飲み尽くす」

を以下のように記述している。

余すところなく飲む。すっかり飲む。

【出典】 日本国語大辞典

以下の表 3は、「~を飲み尽くす」に前方共起する頻度 10以上の名詞である。

表 3 「~を飲み尽くす」に前方共起する名詞(頻度 10以上、頻度降順)

名詞 助詞 複合動詞 頻度

ビール

を 飲み尽くす

101

酒 51

ワイン 48

水 13

スープ 13

全て 12

「飲み尽くす」がヲ格を取るとき、目的語位置に現れる名詞の延べ語数は 522語、異なり語数は

196語である。「~を飲み尽くす」は「~を飲み倒す」と同じく、「飲料」に属する名詞の出現

が目立っている。ビール(101回)をはじめ、酒(51回)、ワイン(48回)、水(13回)、スー

プ(13回)が現れており、これらの名詞だけで延べ語数の 43%を占めている。一方、「飲み尽

くす」の用例からは以下の (11)のように、飲み物の「種類」に言及している例も相当数見られ

ている。

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

228 2018年9月4日-5日

Page 10: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

(11) a. 年末は夜を徹して100種類の日本酒を飲み尽くせ!

b. これまで日本全国の牛乳 150種類を飲み尽くしたという、牛乳マニア……

c. 1000種類以上の海外のクラフトビールはあらかた飲み尽くしてしまったので

【出典】 WWW

このような用例は他にも 53例あり、「飲み尽くす」の全体用例に占める割合は 3.97%である。

これは「飲み尽くす」の特徴的な用法だと言える。「飲み倒す」にもこの類の用例はあるが、6

例(0.65%)しかない。「飲み潰す」からは 3例(0.79%)見られる。

4.2.3 「飲み潰す」

「飲み潰す」の用例数は 379例、使用頻度は 389回である。日国では「飲み潰す」を以下の

ように説明している。

1. 酒を飲んでむなしく日を暮らす。

2. 飲酒にふけって財産をすっかりなくす。飲みたおす。

3. 「のみたおす(飲倒)(1)」に同じ。

【出典】 日本国語大辞典

『レキシコン』ではこの複合動詞を「酒を飲んで(酒代で)財産をなくしてしまう」と記述し、

次の用例を示している。

(12) 彼は財産を飲み潰した.

【出典】 複合動詞レキシコン

「飲み潰す」と前方共起する名詞には、酒(6回)、相手(5回)、身代(4回)等が現れている。

「飲み倒す」と同様、「飲み潰す」の目的語としても「飲料」が出現してはいるが、その割合は

高くない。一方、次の表 4に示したように、「飲み潰す」は助動詞「れる」との共起が目立って

いる(5)。

表 4 「飲み潰す」と後方共起する助動詞(上位 5語、頻度降順)

複合動詞 助動詞 頻度

飲み潰さ れる 97

飲み潰し た 36

飲み潰さ ない 9

飲み潰し てる 4

飲み潰さ なく 4

4.2.4 「踏み倒す」

「踏み倒す」の用例は、3.3で述べたように、TWCを利用して検索した。TWCにおける「踏

み倒す」の出現頻度は 595回である。日国では「踏み倒す」を以下のように記述している。

(5) 「飲み潰される」が受身を表す用例数は 96例(使用頻度は 97回)で、全体用例の 25.33%を占めている。それに比べ、「飲み倒される」は 19例で 2.06%、「飲み尽くされる」は 57例で 4.27%である。この点については、本研究の研究課題と直接的に関係しないため、これ以上詳しくは立ち入らないことにする。

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

229 2018年9月4日-5日

Page 11: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

1. 踏みつけて倒す。足げにして倒す。

2. 代金や借金などを支払わないですませる。他人に損害を与える。また、他人の体面や信

用などを傷つける。

【出典】 日本国語大辞典

また、『レキシコン』では「代金や借金を意図的に払わずに終わらせる」と記述し、次の例を示

している。

(13) 男は、飲み代を踏み倒した.

【出典】 複合動詞レキシコン

ここで「踏み倒す」と「飲み倒す」の「倒す」に注目してみたい。もし、両者における「倒す」

が同じ働き、つまり「動作の反復や強調」の意味を持っているのならば、「踏み倒す」を「たく

さん踏む」「十分に踏む」「繰り返して踏む」、もしくは「踏むという動作の強調」と解釈できる

はずである。しかし、TWCの用例を観察すると、そのような意味だと考えられる用例は以下

の (14)くらいしか見当たらない。

(14) 数百メートル先に見えるゴール目がけ、53-11という重いギアを全力で踏み倒す!

【出典】 TWC、下線部筆者

このように、「踏み倒す」は「飲み倒す」や「飲み潰す」から見られる派生的な意味での解釈が

一般的ではないことがわかる。一方、以下の (15)は、「踏み倒す」を「酒を飲んで代金を払わ

ないままにする」という意味で使用している例である。

(15) a. ……酒代を踏み倒したエピソードなどが悪意を持って書かれている。

b. 外で酒を飲んで遊んでも、金は払わず踏み倒していたに違いない。

c. 飲み代を集金するため旧社屋にやってきたクラブのママが、誰もいないので

踏み倒されたと思い……

【出典】 TWC、下線部筆者

「踏み倒す」と「飲み倒す」は、「酒代を払わない」という意味は共通しているが、決定的な相

違点がある。それは、ヲ格の補語として「踏み倒す」は「金銭」、「飲み倒す」は「酒を供する

店」、もしくは「飲料」に関する語を必要とする点である。一例として、(15a)の「踏み倒す」

を「飲み倒す」に置き換えると、次のようになる。

(16) ……酒代を飲み倒したエピソードなどが悪意を持って書かれている。

この例が非文だとは言い切れない。しかし、本稿での分析結果に基づくと、「酒代」は「飲み倒

す」の目的語としてふさわしくない。4.2.1では「飲み倒す」がヲ格を取るとき、目的語位置に

は酒、ビール、ワイン、焼酎等、主に飲み物が来ると述べた。むろん、飲み物ではない名詞も

現れてはいるが、その中で次ページの表 5にある名詞、つまり、借金、料金、金、~費等は現

れていない。反対に、「踏み倒す」がヲ格を取るときの目的語には、酒、ビール、ワイン等の飲

み物は現れない。

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

230 2018年9月4日-5日

Page 12: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

表 5 「~を踏み倒す」に前方共起する名詞(NLTを基に作成、頻度 5以上、頻度降順)

名詞 助詞 複合動詞 頻度

借金

を 踏み倒す

75

料金 12

金 10

費 9

債務 7

代金 6

代 6

お金 6

5. 考察

分析結果を基に、「飲み倒す」と、「飲み尽くす」「飲み潰す」「踏み倒す」の関係を下の図 1

のようにまとめることができる。

飲み倒す

xxpppppp

ppppp

&&NNNNN

NNNNNN

酒代

wwoooooo

ooooo

��

飲料

�� $$JJJ

JJJJ

JJJ

他人の財産

金銭

��

酒を供する店

--

自分の財産

��

種類

��

zzuuuuuu

uuuu

pp

踏み倒す 飲み潰す 飲み尽くす

図 1 「飲み倒す」の意味分化による類義関係の複合動詞選択

複合動詞「飲み倒す」は、「酒代」に関わる(本来の)意味と、「飲料」に関わる(派生的な)意

味を持っている。まず前者を見ると、それが「他人の財産」と関係があるのか、それとも「自

分の財産」と関係があるのかによって枝分かれする。もし、「他人の財産」と関係があり、か

つ、それの指示対象が金銭であれば「踏み倒す」が選択される。一方、「他人の財産」と関係

があり、かつ、それが酒を供する店を指している場合は「飲み倒す」を使う。今度は、酒代が

「自分の財産」と関係がある場合、「飲み潰す」が使われる。次に、「飲み倒す」の意味が「飲

料」に関わる場合は、「種類」と「量」に分かれる。飲み物の「種類」に関して言及するときに

は「飲み倒す」ではなく、「飲み尽くす」を使う。一方、「飲み物の量、とりわけ大量」を表す

場合は、「飲み倒す」または「飲み尽くす」のどちらも使用される傾向がある。

複合動詞の数は、語彙的複合動詞に限っても 2,000語以上ある。普段よく使う複合動詞の数

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

231 2018年9月4日-5日

Page 13: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

は、この膨大な量のうち一部に過ぎないであろう。馴染みの薄い複合動詞の意味を記述する

場合、母語話者の内省だけでは限界がある。このような問題点を克服するため、本研究では

Google検索を利用し、低頻度複合動詞の用例を収集した。

本稿では第 2章で述べてように、研究課題を二つ設定した。それに対する答えは次の通りで

ある。「飲み倒す」がヲ格を取るとき、目的語としては「飲料(酒、ビール、ワイン等)」が最

もよく現れている(研究課題 1)。「飲み倒す」の場合、「酒代を払わない」という(語彙的複合

動詞の)本来の意味ではなく、「たくさん飲む」という派生的な意味でよく使われている。この

ことは、「飲み倒す」がヲ格を取るとき、目的語として飲料が 75%以上を占めていることから

も明らかである。また、このような「飲み倒す」の特徴は、類義関係にある「飲み尽くす」か

ら最も顕著に見られている。一方、「飲み潰す」にはそのような傾向があまり見られず、「踏み

倒す」からは見られない(研究課題 2)。したがって、「飲み倒す」を「たくさん飲む」という

意味で使うのであれば、それを「飲み尽くす」に置き換えても問題はない。

複合動詞の実証的研究は、主に V2と結合する V1に焦点を当てる傾向がある。日本語にお

ける複合語の主要部は右側であることを考えると、このような傾向は当然のことかもしれな

い。しかし、コーパスやウェブなどの大規模な言語資料を使えば、複合動詞の内部結合にとど

まらず、そこから少し離れて外部を観察することもできる。なかんずく、ウェブ検索は低頻度

語彙に関しても、そのような言語研究を可能とする。それゆえ、従来のままでは不十分であっ

た低頻度複合動詞の意味記述をも充実させることができるのである。

本研究では、頻度調査において一部の同音異義語を区別した。場合によっては、考察対象か

ら外した複合動詞もある。しかし、低頻度複合動詞を探ることに主眼を置いた以上、このよう

な作業はもっと慎重に行わなければならない。たとえば、「取り上げる」と同音異義語である

「撮り上げる」の BCCWJにおける使用頻度は 0である。つまり、本研究の指針によると、こ

の語は低頻度複合動詞に当てはまるのである。この矛盾に気づいたのは、卒業論文提出を一か

月控えていた 2017年 11月 13日だった(頻度調査を行ったのは 2017年 2月ごろである)。今

後、低頻度複合動詞の研究を続ける際には、削除した複合動詞を綿密に観察し、複合動詞の頻

度表を修正する必要がある。

用例を集める際には、重複用例の収集を防ぐためにクローラーが URLを参照している。し

かし、それだけでは限界があり、最終的にはすべての用例を目視で確認しなければならない。

しかしながら、研究者個人が膨大な数の用例を一々覚えながら、重複する用例を取り除くこと

は現実的に不可能である。ゆえに、本稿で利用した用例にもいくつかの重複用例が紛れ込んで

いる可能性がある。

6. おわりに

辞書で「飲み倒す」を引くと「酒を飲んでその代金を払わないままにする」と書いてある。

しかし、Googleで「飲み倒す」を検索し、用例を分析した結果、ほとんどの人が辞書には書い

ていない「たくさん飲む」という意味でこの言葉を使用していることがわかった。「飲み倒す」

と類義関係にある複合動詞であっても、互いには微妙な意味上の違いがある。このような低頻

度語彙の意味を把握するためには、用例の分析が重要になってくる。日常生活の中での使用が

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

232 2018年9月4日-5日

Page 14: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

限られているからこそ、ひたすら辞書を眺めたり、考え込むだけでは、その単語がどのような

意味で使われているのか気づきにくい。言葉は変化する生き物だと言われる。そのような言葉

が、我々の生活の中でどのような振る舞いをしているのか、まんべんなく目を配り、その特性

をなるべく詳細に記述することは、言語の本質を究明するためにも欠かせない作業であると考

えられる。

第 2章で述べたように、本来は「飲み倒す」だけではなく、他の低頻度複合動詞の分析も行

う予定であった。今後は、選別した他の複合動詞に関しても分析を行い、低頻度だからこそ普

段認識できなかった隠れていた言語現象を明らかにしたい。

文 献

Amy N. Langville, and C. D. Meyer (2009)『Google PageRankの数理 : 最強検索エンジン

のランキング手法を求めて』岩野和生・黒川利明・黒川洋訳, 共立出版.

岡島昭浩 (1997)「インタ-ネットで調べる (特集ことばを調べる)」日本語学, 16:12, pp. 52–59.

荻野綱男 (2014)『ウェブ検索による日本語研究』朝倉書店.

荻野綱男・田野村忠温編 (2011)『コーパスとしてのウェブ』明治書院.

影山太郎 (1993)『文法と語形成』ひつじ書房.

影山太郎編 (2013)『複合動詞研究の最先端 : 謎の解明に向けて』ひつじ書房.

杉村泰 (2007)「コーパスを利用した複合動詞の類義分析–インターネット検索エンジンの利用」

言葉と文化, (8), pp. 289–304.

(http://hdl.handle.net/2237/8349よりダウンロード可能)

杉村泰 (2014)「コーパスを利用した複合動詞「V1-抜く」と「V1-抜ける」の意味分析」言語文

化論集, 35:2, pp. 55–68.

(http://hdl.handle.net/2237/19706よりダウンロード可能)

John R. Taylor (2017)『メンタル・コーパス : 母語話者の頭の中には何があるのか』西村義

樹ほか編訳, くろしお出版.

滝沢直宏 (2007)「巨大データの必要性–言語の周辺的・慣習的側面を探るために (特集インター

ネットと言語研究–情報を選り分け、活用するために)」言語, 36:7, pp. 34–41.

滝沢直宏 (2010)「シンポジウム 周辺部を記述するための大規模コーパスの利用–その方法と留

意点」英語語法文法研究, (17), pp. 23–37.

滝沢直宏 (2017)『ことばの実際 2 コーパスと英文法』内田聖二・八木克正・安井泉編, 研究社.

田野村忠温 (2010)「日本語コーパスとコロケーション–辞書記述への応用の可能性 (特集 コー

パスを活用した言語研究 (1))」言語研究, (138), pp. 1–23.

(http://www.ls-japan.org/modules/documents/LSJpapers/journals/138 tanomura.pdf

よりダウンロード可能)

田野村忠温 (2014)「BCCWJの資料的特性―コーパス理解の重要性」石井正彦ほか『コーパス

と日本語学』田野村忠温編, 朝倉書店, pp. 119-151.

橋本和佳 (2007)「名詞とそれを修飾する形容詞の関係 (特集コロケーション)」日本語学, 26:12,

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

233 2018年9月4日-5日

Page 15: Google 検索を利用した日本語の低頻度複合動詞の …...「飲み倒す」とはどういう意味なのか ―Google 検索を利用した日本語の低頻度複合動詞の分析―

pp. 38–46.

長谷部郁子 (2012)「語彙的アスペクト動詞としての『~倒す』について」「日本語レ

キシコン」共同研究発表会(複合動詞特集、2012 年 9 月 24 日、於:東北大学).

(http://pj.ninjal.ac.jp/lexicon/長谷部(2012-09-24).pdfよりダウンロード可能)

前川喜久雄 (2009)「導入 コーパスとは何か (特集 日本語研究とコーパス)」国文学 : 解釈と鑑

賞, 74:1, pp. 6–14.

Rael Dornfest, Paul Bausch, and Tara Calishain (2007)『Google Hacks : プロが使うテク

ニック&ツール 100選(第 3版)』石川隼輔ほか訳, オライリー・ジャパン,オーム社 (発売).

関連URL

国立国語研究所コーパス開発センター『現代日本語書き言葉均衡コーパス語彙表』http:

//pj.ninjal.ac.jp/corpus_center/bccwj/freq-list.html

国立国語研究所コーパス開発センター『「現代日本語書き言葉均衡コーパス」利用の手

引 (第 1.1版)』http://pj.ninjal.ac.jp/corpus_center/bccwj/doc/manual/BCCWJ_

Manual_03.pdf

国立国語研究所『コーパス検索アプリケーション「中納言」』https://chunagon.ninjal.ac.

jp/

国立国語研究所『複合動詞レキシコン』http://vvlexicon.ninjal.ac.jp

国立国語研究所・Lago言語研究所『NINJAL-LWP for BCCWJ』http://nlb.ninjal.ac.jp

小学館『日本国語大辞典(第二版)』https://japanknowledge.com/contents/nikkoku/

筑波大学・国立国語研究所・Lago 言語研究所『NINJAL-LWP for TWC』http://nlt.

tsukuba.lagoinst.info

文 部 科 学 省『 送 り 仮 名 の 付 け 方 』http://www.mext.go.jp/b_menu/hakusho/nc/

k19730618001/k19730618001.html

【当日用:Web 公開版】 言語資源活用ワークショップ2018発表論文集 ※後程リポジトリ版を公開します

234 2018年9月4日-5日