混成語の長さについて

元のポストが、言語学者以外の人には、取っつきにくくなったので、改めて。


元のポストはここ

まず、「混成語」とは、次のような語のことです。

ゴジラ (ゴリラ+くじら)
キャベジン (キャベツ+ニンジン)
バイナラ (バイバイ+さよなら)
バトポン (バトミントン+ピンポン)
(窪薗 (1998) より引用)

窪薗 (2008) によれば、混成語には、次の3つの特性があります。

(1) 意味のよく似た2語が混成する。
(2) 最初の語の前半ともう一つの語の後半が結合する。
(3) 結果として出来上がった混成語の長さは、後半の要素の元の長さと一致する。

さて、日本語の単語の長さを測る単位として、モーラ(もしくは拍、だいたい平仮名や片仮名の一文字分に相当する)と音節(だいたい母音の数に一致する)の2つが考えられています。

「ジン」や「トン」や「モー」や「カイ」は、モーラで数えれば、2モーラだけど、音節で数えれば、1音節となります。(モーには、長母音が1つ、カイには、二重母音が1つ入っています。)これらの音節の最初のモーラが自立拍で2番目のモーラが特殊拍と呼ばれます。

ここまでが、前提で、これを元に居酒屋の看板を見ると、「ジンギスカン」の「ジン」の部分を「トリ」で置き換えた例がありますから、「ジン」と「トリ」は、同じ長さと考えられます。音節で考えると、前者は1つで後者は2つですから、長さが合わないことになりますが、拍(モーラ)で数えるとともに2つで長さが一致します。

つまり、「ン」のような特殊拍と「リ」のような自立拍が同等に扱われているということになります。

ちなみに、英語の場合、混成語としては、下のような例があります。
これらを見ると、英語では、長さを音節で測っているということが分かります。

smog (smoke + fog)
snark (snake + shark)
spork (spoon + fork)
brunch (breakfast + lunch)
lupper (lunch + supper)
(例は、窪薗 (2008)より)

| | コメント (0) | トラックバック (0)

The CMU Pronouncing Dictionary (cmudict.0.6d) を sdic で引けるようにする。

The CMU Pronouncing Dictionary を emacs から検索してみようと思い、sdic の形式に変換してみた。

awk のスクリプト。

{$1 = "< K>" tolower($1) "</K>"}
/^<K>##<\/K>/ { $1 = "##" }
{ gsub(/\([1-9]/," &") }
{print}

たったこれだけ。

ちょっとメモ。

cmudict では、行頭から最初のスペースまでが、見出し。

しかし、これが大文字。sdic は、キーワードを小文字にする必要があるようだ。

そこで、$1 を tolower() して、小文字にし、さらにその前後を<K> と <\/K>で挟む。

(ここまで1行目)

するとファイルの先頭などにあるコメントの行の $1 にも<K>##<\/K>の様になってしまうので、それを直す。

(ここまで2行目)

さらに、cmudict では、一つの単語に別の発音があるときには、二番目の単語以降に(2)...という具合に番号をつける。このままだとそれらの発音が検索が難しい。で、( の前にスペースを入れることにした。すると、ともに検索される。

(ここまで3行目)

最後の {print} で出力。これが4行目。

これで変換したファイルを適当な場所(例えば、~/sdic/cmu.sdic)において、.emacs などで次の様にすれば、ばっちり。

(setq sdic-eiwa-dictionary-list
'((sdicf-client "~/sdic/cmu.sdic")
(sdicf-client "/usr/local/share/dict/gene.sdic")
))

以上。

| | コメント (0) | トラックバック (0)

WAになっておどろう

むすこの保育園で、訳あってV6の「WAになっておどろう」を保護者がみんなで歌う企画が進んでいる。

で、子供たちも練習というか口遊んだりしている。ここにも minimal word effect を見つけた。
あまり短い単語は、自然言語の単語としてはありえないということ。
「わ」(輪)という語は、1音節で1モーラ。これは、短すぎるわけだ。
で、子供たち(3歳児あたり)は、「輪になっておどろう」を「ワニ、なっておどろう」と
解析してしまう。日本語では、よく助詞が落ちるから、例えば、「ウサギさん(の役)になって」の意味で「うさぎさんなって」のような言い方ができるということを踏まえれば、「わになって」を「輪になって」ではなく、「ワニ、なって」と考えるのは、無理なことではない。

類例で、有名なのは、「かにさされた」(蚊に刺された)と言うべきところを「かににさされた」と言うとか、「血が出た」を「ちががでた」と言ったりするということがある。


| | コメント (0) | トラックバック (0)

English Phonetic Symbol KK(Windows95/98/Me / 学習&教育)

加藤さんという方が作った
English Phonetic Symbol KK(Windows95/98/Me / 学習&教育)という TrueType のフォント。なかなか便利。英語の音声学音韻論に限れば、これだけあれば大丈夫でしょう。キーボードから打てるように工夫してあるところがすばらしい。

| | コメント (0) | トラックバック (0)

[Trees/Word] 続 MS-Word で均整のとれた樹形図を書く方法

[Trees/Word] 続 MS-Word で均整のとれた樹形図を書く方法

リンク: [Trees/Word] 続 MS-Word で均整のとれた樹形図を書く方法.

だいぶ前に考案した方法。統語構造の樹形図を簡単に書くために。

| | コメント (0) | トラックバック (0)

Honma's Computer Life Monthly Index

以前、http://member.nifty.ne.jp/honmat/diarylist.html で公開していた日記。

Honma's Computer Life Monthly Index.

この member.nifty.ne.jp というサーバーがなくなってから、ハードディクスの肥やしにしてあったのを、あらためて公開。リンクなど古いかも。できるだけ、自分の管理しているリンク先にはちゃんとリンクするようにしてみてはある。リンク切れやらおかしなところがあれば、お知らせいただけるとありがたい。

情報は、古いが自分にとってはいろいろ思い出があるし、役に立ちそうなこともある。

| | コメント (0) | トラックバック (0)

LaTeX for Linguists

リンク: LaTeX for Linguists.

| | コメント (0) | トラックバック (0)

Syntax Tree Drawer – Linguiste.org

リンク: Syntax Tree Drawer – Linguiste.org.

| | コメント (0) | トラックバック (0)

the rest of the day

期末テストの採点。

"the rest of the day" って、「休みの日」?
"rest" を「休み」と理解しているのか?
さらに "A of B" を「BのA」じゃなくて、「AのB」のように解釈しているようだ。

これって、Rinse in Shampoo のせいじゃないかと思ったり。
リンスインシャンプーってリンスの入ったシャンプーってことみたいだし。

そもそも、「リンス」は、和製英語。
動詞で使えば、「濯ぐ」、
名詞で使えば、「濯ぐこと」もしくは「濯ぎ洗い」。

リンスは、英語で言うなら、conditioner あたり。

とほほ。

| | コメント (2) | トラックバック (0)

syntax tree drawer

統語構造の樹形図を描くためのMicrosoft Word 用のマクロを見つけた。

リンク: syntax tree drawer.

これも便利そうだ。

| | コメント (0) | トラックバック (0)