« The CMU Pronouncing Dictionary (cmudict.0.6d) を sdic で引けるようにする。 | トップページ | うちの5歳児の息子、補助輪なしで自転車に乗れた。 »

The CMU Pronouncing Dictionary の新しいバージョンが出てた。cmudict.0.7a

The CMU Pronouncing Dictionary を sdic の形式に変換してみたのだが、調べなおしてみたら、バージョンが上がっていたみたいだ。

収録語彙が少し増えているらしい。

ただし、コメントの記号が ## から ;;; に変えられていた。
sdic形式では、# がコメント行の印なので、この部分ちょっと工夫がいる。

で、スクリプトを変更しました。

awk のスクリプト for cmudict.0.7a

{$1 = "< K>" tolower($1) "</K>"}
/^<K>;;;<\/K>/ { $1 = "##" }
{ gsub(/\([1-9]/," &") }
{print}

|

« The CMU Pronouncing Dictionary (cmudict.0.6d) を sdic で引けるようにする。 | トップページ | うちの5歳児の息子、補助輪なしで自転車に乗れた。 »

コメント

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: The CMU Pronouncing Dictionary の新しいバージョンが出てた。cmudict.0.7a:

« The CMU Pronouncing Dictionary (cmudict.0.6d) を sdic で引けるようにする。 | トップページ | うちの5歳児の息子、補助輪なしで自転車に乗れた。 »