ンに、子音にのみ注目するとする。そうしてAの国語における子音の総数をnとする。次に問題をできるだけ簡単にするためにB国語の子音をもこれと同数だとする。さらにいちばん簡単な場合を考えて、各子音がそれぞれ各国語に出現する頻度《ひんど》あるいは確率が一様で、皆νに等しいとすると、ν = 1/n [#「1/n」は分数]で均一になる。(これは少し乱暴に見えるかもしれないが、統計的方法では多くの場合近似の一法として許される事である。場合により頻度の著しく小さいものは省略する事もやってみてよい。)次に語彙《ごい》中で子音一つより成るもの、二つ、三つ、四つよりなるものというふうに分類する。そしてそれらのおのおのがAB両国語に現われる確率をそれぞれ a1 a2 a3 …… b1 b2 b3 ……[#アラビア数字はすべて下付き小文字]で示すとする。さすればA語のうちi個の子音より成るものの中のある一つを取って、それと同義の語がB語でも同じi個の子音の同順の排列からなるという事の確率は biνi[#2文字目の「i」は下付き小文字、4文字目の「i」は上付き小文字] であると考える事ができる。(無論Aでiが2のものを取る場合、Bでiが2でないものはこの統計には入れない事にするのである)。ただしこれはA語一つに対するB語に同じi級のシノニムが他にないと仮定する場合で、もしシノニムがそれぞれ si[#「i」は下付き小文字] 個ずつあるとすればこの確率は si[#「i」は下付き小文字] 倍に増加する。もしこの上にメタセシスを許し、またA語の一子音に対すべきB語子音の転訛《てんか》範囲《はんい》を拡張すればこれはさらに増加する。それがいかに増加するかは計算しようと思えばされるはずのものである。しかしここでは最も簡単な場合として、同数シノニムというまでにとどめると結局AB両国《りょうこく》語彙《ごい》一般の比較によって得らるべき純偶然的一致の確率は、
[#ここから5字下げ、ここから数式]
P = s1a1b1ν + s2a2b2ν2 + s3a3b3ν3 + ……[# s、a、b に続くアラビア数字はすべて下付き小文字、νに続くアラビア数字はすべて上付き小文字]
[#ここで字下げ終わり、ここで数式終わり]
で与えられるはずである。この中に出現するs、a、b、νの各数はともかくも統計的になんとかして求め
前へ 次へ
全19ページ中11ページ目


小説の先頭へ
文字数選び直し
寺田 寅彦 の一覧に戻る
作家の選択に戻る
◆作家・作品検索◆
トップページ 登録 ご利用方法 ログイン
携帯用掲示板レンタル
携帯キャッシング