2009年01月19日

前処理と2つの辞書

プログラムをできるかぎりシンプルにするために、翻訳する文章に使われている単語だけを集めた臨時の辞書を用意することにしました。元の辞書を大辞典と呼び、臨時の辞書を小辞典と呼ぼうと思います。翻訳する文章を大辞典VortaroJ0と照合することによって小辞典VortaroJ1は自動的に生成されます。大辞典に登録されてない単語が使われているのが見つかれば、ここでプログラムは未登録語の一覧表を吐き出して止まります。

翻訳の本処理にはVortaroJ0は関与しません。必要なデータはすべてVortaroJ1にバトン・タッチしているので、出る幕はないのです。

なでしこ版に取り組む前に作成した BASIC版では、このような前処理は行なっていませんでした。なでしこ版の前処理プログラムを作るのと並行して、BASIC版を作り直したいと思います。

翻訳プログラムでは、文字レベル、単語レベル、句レベル、文レベルといったレベルの間で何度も上のレベルに行ったり、下のレベルに行ったりします。このレベル間の行き来が、なでしこでは段違いに楽に行なえるので、BASIC版を作っていたときには思いつかなかったアイデアをいくつか得ることができました。BASICでは木を見て森が見えなかったのが、なでしこでは森が見えるようになったのです。

posted by アキラ at 18:39| Comment(0) | 日記 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。