Ermitejo - エスペラント語日本語翻訳

#BLOGO
字上符付き文字の葛藤 (単語辞書引き機能 versio 0.9.4) >
2007/9/8

発音関連情報の追加、他 (単語辞書引き機能 versio 0.9.1)

分類: 公開, 開発記 / タグ: , ,

構文解析機能の開発の息抜きに、エスペラント語の単語辞書引き機能へ発音関連情報を追加しました。辞書引き結果に国際音声記号(IPA)とカタカナ読みの表記を新たに加えることにしたものです。

エスペラント語は表記と発音が完全に一致している言語ですので、実装は割合簡単でした。接尾辞や文法語尾等は語幹と融合し、その一方で接頭辞と語幹や語幹同士は融合しないという規則さえあれば、後は単にエスペラントの字母(アルファベート)をIPAに字訳したり、「子音」「母音」「子音+母音」でカタカナに置換したりするだけで実現出来ました。アクツェント(アクセント)も後ろから二番目の母音に必ず付与されますし、その後ろに子音が二つ連続している場合を除いて長母音とすることも、一貫した論理(ロジック)で記述出来ます。

とはいえ、sam/ide/an/oを「サムイデアーノ」ではなく慣用化した「サミデアーノ」と読む場合は例外ですので、今は実装していません。また、アクツェント付き母音の直後にtr, dr, br, bl, kv, dzのように連続した子音がある場合には人により長母音にすることもあるそうですが、これも未実装です。なにぶん息抜き程度の機能なので、今後の実装優先度も低い物と考えています。

上記の通り、(ほぼ)完全な規則性に基づく発音なので、初学者の方や、興味本位でエスペラントの“触り”を眺めたい方以外には無用の長物かも知れません。とはいえ、エスペラント語日本語翻訳システムが完成した暁には、そうした方々にもお使いいただいて、エスペランティストの間口を広げたいと思っているので、こうした「言わずもがな」な機能を敢えて盛り込むことも大事だと、私は思っています。

なお、9月7日の朝日新聞の夕刊に、JR釜石線の駅にエスペラントの愛称が付けられている旨の記事(矢野直美氏のコラム「鉄子の鉄学」より、「銀河ドリームライン」)が載っていたため、それで興味を抱いて当サイトを訪れたというシナリオで何気なくluna noktoを検索してみたところ、versio 0.9.1で是正することになった障害が判明しました。いやはや、業務ですらコーディングから離れつつあるというのに、いわんや業務でないとテストケースがなおざりになりがちで、反省するところしきりでした。

その他、ここ数日で連続した改版点の委細は、以下の通りです。

修正点 versio 0.8.3 ~ 0.9.1

その他の改版履歴は、「改版履歴」ページにあります。

versio 0.9.1 (19-a publikigo, en 2007/09/07)

  • 【機能追加】ハイフンで区切られた熟語(iele-tiele等)も、空白(スペース)で区切られた熟語と同様に処理されるようにしました。これまでハイフンは単語の区切りではなく語根の区切りとしていた(すなわち、一つの単語として処理していた)ものを改めたものです。
  • 【障害対応】一部の未知語(熟語の未知語等)を検索した場合に異常終了(HTTP 500 Internal Server Error)していた不具合を是正しました。これはversio 0.8.3の品詞継承漏れ修正時の過剰作用(エンバグ)によるものでした。
  • 【その他】versio 0.9.0で新規追加した発音関係モジュールについて、保守性・可読性を高めるよう書き改めました。

versio 0.9.0 (18-a publikigo, en 2007/09/06)

  • 【機能追加】国際音声記号(IPA)を表示するようにしました。ただし、アルファベートを翻字し、長母音とアクセントを付与しただけなので、一部の言語現象(補助記号や、「連結」等の超分節要素等)は未実装です。また、慣用化した読み(sam/ide/an/oに於ける、samとideの両語根の融合)も未実装です。
  • 【機能追加】発音のカタカナ読みを表示するようにしました。IPAと同様、慣用化した読みは未実装です。

versio 0.8.3 (17-a publikigo, en 2007/09/05)

  • 【障害対応】複雑な複合語を検索した場合に、形態素毎の品詞を誤設定することがある問題を修正しました。
  • 【障害対応】複雑な複合語を検索した場合に、「接辞語根区切り付き表記」を誤設定することがある問題を修正しました。

#32 (2007/09/08 00:34:08), Gardejo

コメントはまだありません »

コメントはまだありません。

このコメント欄の RSS フィード トラックバック URL

ご意見・ご感想をお寄せください

字上符付き文字の葛藤 (単語辞書引き機能 versio 0.9.4) >
< 脇書非表示 > 脇書表示