総括
今後の開発 …… 構文解析の構築へ向けて
目下構文解析機能を開発中ですが、形態素解析機能で例示出来るように、実際に動かし初めて分かる問題や湧くアイデアが多く、設計はほんと走りながら(コードを書きながら)作り直す日々でした。
畑違いで色々苦労することもありますが、HPSGという強力な文法理論とPerlという強力なプログラミング言語を活用し、下手の横好き・岡目八目の気概で今後とも開発を続けて行きたいと考えています。
辞書引き機能 …… 独り立ちへ向けて増補改訂を
形態素解析機能の副産物として、いわば「おから」扱いとして出発した機能ですが、片手間で済めば電子辞書は要らない訳で、辞書引き機能としての完成度を上げるべく、辞書としてこれまで重ねてきた機能追加をさらに発展させて参ります。
具体的には、ウェブアプリケーションならではの利点を追求するつもりです。
例えば、昨日届いた月刊「エスペラント」誌の内容がヒントになったのですが、語根区切り表示からリンクを張り、mal/am/iからam/iにもジャンプ出来るようにしたり、am/iからはam/iを含む派生語や、am/の他品詞語へジャンプ出来るようにしたりといったものです。これは、現在「見出し語インクリメンタルサーチ」だけで実装している前方一致・後方一致・部分一致・完全一致の場合分けを、辞書引き結果へも波及させる意味合いを持ちます。
また、JavaScriptの「ブックマークレット」(bookmarklet)で、他のページから直接辞書引きを行える仕組みも検討しています。
既存機能についても見直しを進めて参りますので、皆様もご意見・ご感想等がありましたら是非コメントやメールでお寄せください。
その他
高性能なホスティングサービスに契約更改したこともあり、この資源を有効活用出来るように、強力なウェブサービスを展開して参ります。
期待をお寄せいただいている「メール辞書引き」機能のように、これまでなかったような斬新なサービスを色々構想しています。2008年中は構文解析に注力するつもりですが、それに軸足を置きつつも、元来趣味の範疇で興味の赴くままに開発をしているので、面白そうな機能があれば手を付けてみたいと思います。2008年は国際言語年ということもあり、自然言語処理の楽しさを敷衍して行けたら良いなと考えています。
私は意志が強くないので、コメントやメールをいただいたり、「エスペラント」誌のように定期的なアクセントがないと、なかなか開発の手を動かせないのがお恥ずかしいところです。開発の士気を上げたり、エスペランティストの自然言語処理に対する明示的・暗黙的な需要を掴むためにも、エスペラントの学習も継続的に行うと同時に、地元のエスペラント会にも参加して行くつもりです。そして、これを開発に是非役立てたいと思っています。
また、開発だけではなく、ウェブログの場でも、開発に際しての考え方の説明や、機械翻訳の活用事例等をご案内できたらと考えています。稼業の方は2008年はかなり危険で、ロード増が容易に想像出来る状態ではありますが、疲れて帰宅したとしても(体を壊さない程度に)自宅での開発作業に時間を割きたいと考えています。
皆様も、期待する機能等がありましたら、どしどしとコメントやメールをお寄せください。
2008年のErmitejoに乞うご期待!
いずれも、構想はまた記事を改めて紹介しようと思います。是非ご期待ください。
今年はどうもありがとうございました。また来年もよろしくお願い致します。それでは、よいお年をお迎えください。