Ermitejo - エスペラント語日本語翻訳

#BLOGO
2009/2/1

簡易フレームワーク、Faktro

分類: 開発記 / タグ: ,

最近オレオレフレームワーク話をして来ましたが、語感がよろしくないうえに愛着も湧かないので、ささやかながら新たな名前を与えることにしました。その名はFaktro(ファクトロ)です。

エスペラントのFundamentaj Adekvataj Klasoj por Tipa Reta aplika programaro kaj Objektema programadoの頭字語で、「典型的なウェブアプリケーションオブジェクト指向プログラミングのための基盤的で必要十分なクラス群」というような意味です。英語ではfundamental adequate classes for typical web application systems and objective programmingとでも表現出来ましょうか。

Faktroの概要や、今後のErmitejoの開発見込みなどを、以下に簡単に述べてみます。

(「簡易フレームワーク、Faktro」の続きを読む)

2009/1/29

HPSGとオブジェクト指向言語による機械翻訳序論

分類: 開発記 / タグ: , , , , , , , , ,

日本広しといえど、今更エスペラントと日本語の翻訳システムという「車輪の再発明」を行おうという物好きは私くらいのものだと思っていましたが、先日物好きの仲間が増えました。アキラさんという方です。「エスペラントを勉強せずに」というブログを立ち上げられ、精力的に更新を続けていらっしゃいます。

ブログを数ヶ月も平気で放置するどこかの誰かはアキラさんの爪の垢を煎じて飲むべきだと思いました。

という反省はさて措き。そんなアキラさんが上野式システムにいたく驚かれているようです。「上野式」というのは、故・上野俊夫氏が1985年4~6月の「PCマガジン」(ラッセル社)に連載された機械翻訳のシステムです。その後同社から『パーソナルコンピュータによる機械翻訳プログラムの制作』として書籍にもまとめられています。

その「驚き」というのは、私もいつか来た道です。現在は「敬意を表して別の道を行く」こととしています。この記事では、自然言語処理を趣味で取り組んでいる方へ向けて、「別の道」を採った判断根拠や、「別の道」としてのHPSGやオブジェクト指向Perlという道具仕立ての利点などを、簡単ではありますが紹介してみます。

(「HPSGとオブジェクト指向言語による機械翻訳序論」の続きを読む)

2008/8/3

急げども回ら(れ)ない

分類: 備忘録, 開発記 / タグ: , ,

ウェブログの死亡フラグ、というより死亡認定の閾値であるところの3ヶ月を閲して参りましたErmitejoですが、どっこい生きています。Ermitejoの更新を楽しみにお待ちいただいている全国数十万人のユーザの方々、Ermitejoの翻訳システムの完成が待ち遠しくて日々ご飯が喉を通らなくなったアジア数百万人のユーザの方々、Ermitejoという文言があれば毎日が幸せで仕方がないという全世界数千万のユーザの方々には、大変お待たせ致しました。

……という悪ふざけを出来るような状況でないことは承知していますが、いやはや見通しが甘かったです。というのも、4月5月は仕事が忙しいことは分かっていたのですが、6月になったらまったりするだろうと構えていたら、いきなりの電撃異動辞令が発令されました。以降、それ以前にも増して仕事を通しての自己実現に励んでいました……と言えば聞こえはいいのですが、その実毎日帰宅して寝るだけ(土日のうち土曜日は丸一日寝込み、日曜も覇気無く過ごすという体たらく)という非生産的な毎日を送っていました。

……などと書いているからには一段落付いたのかと思いきや、その実、状況は全く変わっていないどころか、より焦臭さが増してくる素敵な夏になりました。というわけで、一朝一夕に大胆な更新が入る余地が薄いのですが、「時間がないと嘆くより進んで時間を作ろう」というどこかで聴いた標語に則り、細々と更新を続けていけたらと思います。

言い訳を重ねても見苦しいですし、既に十分見苦しいという説もありますが、こっそりとトップページ等で(6月初頭、異動直前の凪の頃に)更新していたことを明らかにしていた、辞書引き機能の更新点等を今頃引っ張り出してみることにします。

(「急げども回ら(れ)ない」の続きを読む)

2007/9/20

語順が自由なエスペラントをHPSGで実装する

分類: 開発記 / タグ: , , , ,
コメント1件

エスペラントは日本語と同様に語順が比較的自由です。対格(akuzativo; 英accusative)の名詞句は述語(predikato; 英predicate)の目的語(objekto; 英object)であり、主格の名詞句は主語(subjekto; 英subject, nominative)となることによります。よって、以下のいずれも非文(nefrazo, 英nonsentence)とはなりません。

歯の浮くような例を挙げましたが、それはそれとして、エスペラント語日本語翻訳システム「Ermitejo」では、構文解析と意味解析に主辞駆動句構造文法(HPSG: Head-driven Phrase Structure Grammar)という近代的な文法を採用しています。より正直に述べるなら、採用を決めて実現可能性調査を終えた段階で、まさに文法を記述し始めて間もない段階です。

さてそこで問題となるのは、HPSGにこの自由語順言語をどう実装していくかというものです。

御多分に漏れず、HPSGは英語の実装についての研究が最も盛んであり、英語は語順が比較的固定されているので、英語のHPSGの文法(規則・制約・語彙辞書)をそのまま用いることは出来ません。日本語のHPSGによる実装の研究もありますが、限られた公開物を拝見する限りでは私の頭では理解が追いつきかねました。

そこで、備忘録を兼ねて以下に実装方法の考察を述べてみます。

(「語順が自由なエスペラントをHPSGで実装する」の続きを読む)

2007/7/16

投稿日the_date()の年月日を個別に取り扱う

分類: WordPress / タグ: , , ,

WordPressを触り始めたばかりですが、せっかく設定変更を自由に行えるのですから、色々と凝りたいのが人の性というもの。まだテーマ自体作成途上とはいえ、早速末梢的なことに凝ってしまいました。今回の変更対象は、投稿日です。

投稿日を表示するthe_date()をそのまま呼ぶと何とも味気ない表示になりますので、中央揃えした矩形の中に年月日を思い思いに配列することにしました。結果はご覧の通りなのですが、それなりに躓きそうな点があったので、備忘録として書いておきます。

(「投稿日the_date()の年月日を個別に取り扱う」の続きを読む)

< 脇書非表示 > 脇書表示