Nick EllisのUsage-based Language Learning(用法基盤学習)に関する動画を視聴しました②

Usage-based Language Learning(用法基盤学習)

昨日のUsage-based Language Learning(用法基盤学習)の動画の続きです。

  • “Usage-based Language: Investigating the Latent Structures that Underpin Acquisition,” Nick Ellis. Wiley, 2013.

 

Nick EllisはUsage-based Language Learningについて多く執筆しています。

  • Ellis, N. C., Römer, U. & O’Donnell, M. B. (2016). Usage-based Approaches to Language Acquisition and Processing: Cognitive and Corpus Investigations of Construction Grammar. Language Learning Monograph Series. Wiley-Blackwell.

この動画では、ジョージ・キングズリー・ジップ(George Kingsley Zipf)の提唱したジップの法則についても少し説明していました。全部理解したかわかりませんが、理解した範囲で記録しておきます。

L字型分布

ある文章で頻出頻度が高い順に単語を並べ、その頻度をグラフに表すと「L」の字のようになるようです。

つまり、少数の上位の単語の頻出頻度が非常に高く、その他の単語の頻度は非常に低いということになります。

これは文章でなくて、構文でもあてはまるようです。

例えば、動画に出てきていた例ですが、「動詞+along」という構文で考えてみると、

  • Get along
  • Come along

などいくつかの動詞の頻度が非常に高いようです。

 

それ以外の「動詞+along」の構文(driving alone, sing alongなど)の頻度は少ないようです。

 

ジップの法則(ジフの法則)

ジョージ・キングズリー・ジップ(George Kingsley Zipf)は、「頻度がN番目に大きい要素が全体に占める割合は1/Nに比例する」という法則も提示しています。

 

例えば、ある文章で、一番多いのが「の」、二番目が「を」、三番目が「に」という助詞だったとすると、一番多い「の」が全体に占める割合は10%、二番目の「を」は5%、三番目の「に」は3%になるようです。

 

これから、頻度がN番目に大きい要素が全体に占める割合は「10/順位(N)」で表せるといっているようです。

1番目の「の」は「10/1=10(%)」、2番目の「を」の場合「10/2= 5(%)」、3番目の「に」の場合は「10/3=3.333 %」ということになるようです。