Ermitejo - エスペラント語日本語翻訳

#BLOGO
2009/4/1

開発機の故障によるErmitejoの開発停止

分類: 開発記 / タグ: ,

この度、エスペラント日本語翻訳システムErmitejoの開発に使っております機器が一斉に故障致しました。このため、Ermitejoのソースなどの開発資源の一切を失ってしまいました。Ermitejoの完成を心待ちにしてくださっているユーザの方々に、深くお詫び申し上げます。

今晩、年度末の大掃除をしようとしたところ、LAN配線に足を引っ掛けて転んでしまったのが直接の原因です。その拍子にLANケーブルで繋がった全ての機器が机から棚から次々に雪崩を打って落下してしまいました。これにより、開発用ワークステーションやバックアップ用の正副両系統のNASのHDDが軒並みdisk errorを引き起こしております。

また、機器が落下したことによってバランスを崩した棚が、その脇の本棚に衝突し、本棚のガラス戸を破り、中に保存していたDVD-R, CD-R, MO, USBメモリ, FDなどを物理的に損傷してしまいました。これらのメディアも読み取ることが出来なくなっています。

HDDのデータサルベージ業者などをこれから手配致しますが、物理的な損傷を来したため、復旧の見込みはまだ経っておりませんし、復旧する可能性自体も極めて低いものと想定しております。復旧が不可能である場合には、開発者である私の記憶の残る限り、元のコードの復元に努めることを考えています。ただし、設計文書なども含めて全ての資源が失われたため、原状に戻るまでには数年程度の時間が掛かりそうです。

システムの一部分として先行公開している辞書引きシステムでさえも、多くのユーザの皆様にお使いいただき、ご指導やご鞭撻を賜って少しずつシステムを成長させてきたのですが、今回の事件でその前途に重大な障害が発生したことについて、とても残念でなりません。散々ヴェイパーウェアだと自虐して参りましたが、まさか本当に雲散霧消してしまうとは、予想だにしておりませんでした。どのような形でお詫び申し上げたらよいのかも、皆目検討が付かない状態です。

今後についての詳細は以下に述べますが、まずは取り急ぎご連絡させてください。

(「開発機の故障によるErmitejoの開発停止」の続きを読む)

2007/11/24

AMD Phenom解禁即入手の決め手

分類: ハードウェア / タグ: , ,

CPU界のボジョレー・ヌーヴォー、AMD Phenom 9500

AMD Phenom 9500が2007年11月22日(木)の昼に国内でも解禁されました。明けて23日にAMDのイベントが開催されましたので、AMD党の私も出掛けて行きました。その道すがら、記念としてご祝儀的に購入してみたりしました。

この刹那的な行動の意図は那辺にあるのでしょうか。

(「AMD Phenom解禁即入手の決め手」の続きを読む)

2007/9/10

字上符付き文字の葛藤 (単語辞書引き機能 versio 0.9.4)

分類: 公開, 開発記 / タグ: , , , , ,

音韻関係のモジュールを先の辞書引き機能の改版に合わせて新規に作成したのですが、予想通り、初物の機能はなかなか安定しませんでした。それというのも、エスペラントの規則性を過大評価したというかこれに甘えてしまい、乏しいテストケースしか用意しなかったのが敗因と言えます。結果、連日連夜の改版を行うこととなりました。大多数の場合は問題なかったとはいえ、誤った発音が表示されたり、処理が異常終了したりすることがあり、反省しています。

もう少し具体的に述べますと、エスペラントの規則性に例外があるというのではなく(sam/ide/an/oやらといった場合は除きますが)、Perlで字上符付き文字を実装する際に手抜きをしており、これが後々尾を引いているといったところでしょうか。

実は、エスペラント語日本語翻訳システム「Ermitejo」は、21世紀、このUnicodeの時代に、字上符付き文字の内部処理を前時代的なx後置式の代用表記で行っています。関数名やら変数名やらをエスペラント式に名付けているだけなら特に問題がないのですが、取り扱うデータを代用表記すると、色々不都合が起きます。

普通に処理している場合には、外部から正書法ないし代用表記で突っ込まれたデータのアルファベートを変換して内部で使い、外部に表示する際には逆変換して正書法で返しているので問題はありませんでした。しかし、エスペラントの誇る1文字1音という原則が崩れ、「ĉ」の音「ʧ」を「cx」と2文字で表現することになりますので、音韻関係の機能の実装で舞台裏が拙さが露見したという次第です。

責任転嫁するつもりは毛頭ありませんが、コーディングに使っているエディタのサクラエディタがUTF-8への対応が甘く、なかなかこうした悪癖を改められないという思いもあります。サクラエディタは内部コードがUTF-8等ではなくShift-JISなので、UTF-8のファイルの読み書き自体は出来ますが、エスペラントの字上符付き文字等やIPA等は保存出来ないので、痛いところです。今更秀丸にも戻れませんが、さりとてサクラエディタの抜本的な書き直しを行える技量も時間も私には無いので、開発者の方々に声援を送ることしか出来ません。

【追記】kobake氏のウェブサイト「digital hole」にて、UNICODE版サクラエディタの開発が進められています。

ということで、そうした発音関係の修正を中心として、ここ数日での改版点の委細を以下に転記します。

(「字上符付き文字の葛藤 (単語辞書引き機能 versio 0.9.4)」の続きを読む)

< 脇書非表示 > 脇書表示