Ermitejo - エスペラント語日本語翻訳

#BLOGO
2009/1/29

HPSGとオブジェクト指向言語による機械翻訳序論

分類: 開発記 / タグ: , , , , , , , , ,

日本広しといえど、今更エスペラントと日本語の翻訳システムという「車輪の再発明」を行おうという物好きは私くらいのものだと思っていましたが、先日物好きの仲間が増えました。アキラさんという方です。「エスペラントを勉強せずに」というブログを立ち上げられ、精力的に更新を続けていらっしゃいます。

ブログを数ヶ月も平気で放置するどこかの誰かはアキラさんの爪の垢を煎じて飲むべきだと思いました。

という反省はさて措き。そんなアキラさんが上野式システムにいたく驚かれているようです。「上野式」というのは、故・上野俊夫氏が1985年4~6月の「PCマガジン」(ラッセル社)に連載された機械翻訳のシステムです。その後同社から『パーソナルコンピュータによる機械翻訳プログラムの制作』として書籍にもまとめられています。

その「驚き」というのは、私もいつか来た道です。現在は「敬意を表して別の道を行く」こととしています。この記事では、自然言語処理を趣味で取り組んでいる方へ向けて、「別の道」を採った判断根拠や、「別の道」としてのHPSGやオブジェクト指向Perlという道具仕立ての利点などを、簡単ではありますが紹介してみます。

(「HPSGとオブジェクト指向言語による機械翻訳序論」の続きを読む)

2008/2/17

穴を掘って埋め戻す見出し語表示

分類: 公開, 開発記 / タグ: , , ,
コメント1件

辞書引き機能のversio 2.3.0を公開しました。見出し語表示で品詞・分野情報・同義語等を表示するようにしたものです。

これまでは先発アプリケーションに対してともすれば劣位な表示であったのですが、「わざわざそうしていたのは辞書引き機能が翻訳システムの副産物だからだ」という開発者の以下の言い分も聞いてあげてください。勿論、今回の改版内容を何故最初から施さなかったのだというご批判はごもっともですが……。

(「穴を掘って埋め戻す見出し語表示」の続きを読む)

2008/1/27

言葉の海へ ~ 辞書引き機能第二版公開

分類: 公開, 開発記 / タグ: , , ,

第一版公開時の「次版は半年後とは言わず、ご案内出来る日が遠からずまたやって来ようかと見通しております」という舌の根も乾かぬ内……もとい、キーボードの打鍵音の反響が収まらぬ内……という程すぐではありませんでしたが、ともあれ「辞書引き機能」の第二版を公開しました。

最大の特長は「見出し語検索」の実装ですが、単にこれまで通りに実装して満足しないのが情報技術職人の端くれとしての矜恃というものです。

(「言葉の海へ ~ 辞書引き機能第二版公開」の続きを読む)

2007/9/23

文章内単語訳機能の新設

分類: 公開, 開発記 / タグ: ,
コメント1件

文章内単語訳機能を公開しました。これまでの単語辞書引き機能と違い、エスペラント語の「文章」を与え、それぞれの単語の辞書引き結果を連続的に表示する機能です。

「翻訳」「逐語訳」ではなく「単語訳」ですので、構文解析の成果は一切、これっぽっちも反映されていません。また、エスペラント単語に該当する日本語も、訳し分け(複数の訳語がある場合の取捨選択)や形態素生成(格・数・時制等々を考慮して訳語を一部変換する処理)も、少なくとも初版の現在は全く対応していません。

ですが、これまでちまちまと単語訳を繰り返していたことと比べ、例えばエスペラント文を他のウェブページからコピペして一斉に辞書引きすることが出来るため、散文的な文章、特に技術的な文書や、エスペラント版ウィキペディアのような文書では、訳された単語を並べてみるだけでもそれなりに理解が出来ようかと思います。「荒訳」という程のものではありませんが、造語解析の成果によって、未知語が殆ど存在しないことに驚かれるかも知れません。これこそまさにエスペラントの真髄です。

なお、これにあわせ、辞書引き機能のトップページを新たに設けました。これまではサブドメインを直接指定しても、単語辞書引き機能のページへリダイレクトしていましたが、単語辞書引き・文章内単語訳の両方のフロントエンドとするべくページを新設したものです。その他、ドキュメント類(ヘルプ等)はこれから整理して参ります。

この新味に乏しいけれども効果は少なからぬ機能が、エスペラントを介した相互理解やエスペラント学習の一助となれば幸いです。

とはいえ、まだまだα版という趣が強く、エラー処理や特殊処理等は殆ど手つかずであり、往々にしてエラーを吐くこともあろうかと存じます。これについては、今後の改版を見守っていただければと考えています。

2007/9/18

和エス単語辞書引き機能の需要のあるやなしや

分類: 開発記 / タグ: , , ,

改めて語るまでもなく本サイトの使命はエスペラント日本語翻訳システムの完成・運用にありますが、その副産物として運用している辞書引き機能について、考えあぐねていることがあります。アクセス統計を見る限りでは、少なからぬ割合(3割前後)で、エス和ではなく和エスの単語検索を試みていらっしゃいます。こうした逆引きは、「エスペラント語の文書から日本語の文章へ翻訳する」という方向とは正反対であるため、これまで開発・提供しておりませんでした。

しかし、使う側の立場に立ってみれば、辞書引き機能がどのような計画の副産物であるかは気にしないはずです。ヘルプを見れば逆引きが出来ない旨は記載してありますし、Ajaxによって逆引きと思われる要求は画面遷移なしに提供対象外機能である旨を表示していますが、これも利用者にとってみれば、一般的にはどうでもよいことです。

送り手側の事情をつまびらかにすると、実のところ構文解析機能はそれなりに大変で、目新しい機能の提供はこの先短い期間では望めないということがあります。他機能への少々の浮気というか脱線の一つも出来ない甲斐性なしでは、開発継続の気分を高揚出来ないのではないかと思っています。また、エス和方向の訳語絞り込み方法の着想を、逆引きの和エス方向の開発で得ることが出来れば嬉しいなとも思っています。

このような辺境のドメインには、お越しになる方はあまり多くはないかも知れませんが、もしご希望・ご意見・その他がありましたら、コメント欄等にでもその旨を記載いただければ幸いです。

< 脇書非表示 > 脇書表示