大辞典・小辞典のダブル辞書方式を採用すれば、上野さんの翻訳システムの最大の弱点がカバーできます。今日になってそのことに気がつきました。
前置詞を含む文を訳そうとすると明らかにボロが出てしまうので、前処理で問題を取り除くことにするのです。
We live there.
We live in Tokyo.
上野式は1番目の文はすんなり訳せますが、2番目のような文は苦手とします。だったら、その原因である"in Tokyo"を単純な副詞に変えてしまえばいい。「コロンブスの卵」的なアイデアでした。前処理する段階で原文を修正することとし、"in Tokyo"という句を"in_Tokyo"という語に置き換え、"in_Tokyo"を副詞として小辞典に自動的に登録してしまうのです。この小辞典は臨時ファイルだから翻訳が済めば消去されてしまいます。
"without milk"も"with milk and sugar"も、あたかもそれが一つの長い単語であるかのように扱うわけです。前処理のプログラムは少々肥大化しますが、たぶんこれが最もシンプルな解決策だと思います。
2009年01月28日
この記事へのコメント
コメントを書く

