ひっそりとLa Esperoのイントロを初音ミクに歌わせてみるテスト。ここでFélicien Menu de Ménilのマーチではなくて敢えてAdelsköldのアリア版を持ってくる辺り、私のひねくれ具合は推して知るべしといったところでしょう。
例えば上記の例ですと、venisのsを「す」と読ませると母音のuが目立ってしまうようです。子音のsだけは発音出来ないので、仕方なしにヴェロシティを下げています。エスペラントで歌って貰う試みですが、日本語で歌う場合も同様に頭を悩ませることが多いのだなとつくづく感じ入った次第で、この辺りの技術情報が世に求められているのだとの思いを新たにしました。やはり音楽は奥深いです。
随分間が開いてしまいましたが、その間に翻訳システムの開発が進んだかというとそういうわけでもなく、有り体に書くなら単に仕事に追われていました。あまりにも更新がないと死亡認定されてしまいそうで心配なので、小手先の実装の話も芸がないということもあって、この辺で設計について少々論じてみます。
主題は、およそ自然言語処理に携わる以上は避けては通れない道、語彙(語義)・構文・文意・文脈等の曖昧性解消を如何にすべきか、というものです。
車輪の再発明どころか、発明という言葉を用いるのもおこがましい作業ですが、ともあれこのウェブログのサイドバーの表示・非表示を切り替える(トグルする)機能を追加しました。検索ボックス近傍サイドバー上部にある「段組非表示」「段組表示」という箇所が切り替えの引き金です。通常は二段組みの割り付けですが、サイドバーを非表示にすると本文部のみを表示させることが出来ます。
やっていることは極めて単純です。
document.getElementById('komplemento').style.visibility = 'visible';するか、或いは'hidden';する。厳密にはdisplay = 'none';かdisplay = 'block';を切り替えても良い。サイドバーという用語自体、GUIなユーザエージェントを念頭としたもので気にくわないので、内部的には補足(komplemento)というid属性を与えているのですが、それはさて措いて。document.getElementById('universala').style.marginLeft = '1em';するか、或いは'14em';する。委細はソースのstandardo.jsをそのままご覧いただくとして、ここでは意外にも蹴っ躓いた点を備忘録的に記述しておきます。
先月末頃から、(主に海外からの)プログラム化されたスパム的トラックバックの被害に遭い始めました。既に運営方針でも掲げているように、いくらスパマーさんが頑張っても、天下のAkismetプラグインがこれらを蹴散らしてくれているので、実害は表面的にはありません。しかし、細かいところでは色々と問題があります。例えばWordPressはコメント(感想)もトラックバック(言及通知)も同じように採番していますが、それ故に、「最近のコメント」で掲示しているコメントIDが恐ろしいほどに飛び飛びになってしまいました(#8の次は#158!)。
流石にこのまま日に数件増えるのはぞっとしないので、ばっさりと.htaccess側でスパムを遮断するようにしました。島国日本鎖国根性で生活するなら、日本のIPアドレス範囲をざっくりと決めて、それ以外のアクセスを遮断するのでしょうが、国際交流を謳うエスペラントに関するウェブサイトを運営しておいてそれはあんまりなので、明らかにスパムと思われるユーザエージェントによるPOSTメソッドによるアクセスを拒否した次第です。
以降、嘘のようにWordPress側まで到達するPOSTが無くなり、ログで見ても面白いようにスパマーがHTTP 403(forbidden)に引っ掛かるようになりました。かくして、私の心の平安は保たれたという訳です。
ここまでは単純にめでたしめでたしなのですが、万が一想定の範囲を超えてアクセスを遮断しているといけませんので、上記の制限を行った旨を公開しようと思いました。GETメソッドは遮断していないので、このウェブログの記事として書けば問題ありません。こうして、Mi refuzis partan aliron (アクセス一部制限のご連絡)という記事を公開しました。
……しかし、ここでふと気が付きました。トラックバック(英: TrackBack)はエスペラントでは何というのでしょうか?
Mi obstrukcis partan aliron al ĉi tiu blogo, nur per metodo de “informu” (”POST” en la angla), ĉar mi volas liberiĝi de “trudaĵo de respurado (spuro reen)” (”TrackBack Spam” en la angla).
トラックバックスパム対策のため、一部のPOSTメソッドによる本ウェブログへのアクセスを遮断致しましたので、ご連絡致します。
Mi rifuzas komentojn kaj respuradojn el agento de uzulo (”User-Agent” en la angla), kiu estas aplikiĝita al ĉi tiu okazo de regula esprimo (”regular expression” en la angla), jene:
上記に掲げた正規表現のいずれかに該当するユーザエージェントからは、このウェブログへトラックバックの送信およびコメントの投稿を行っていただけません。なお、上記はblog@browncat.orgのWordPressもUserAgentでスパムを拒否してみるを参照させていただきました。
Ordiga uzado ne malhelpiĝas de la procedo. Sed vi estus malhelpata ekstersupoze, bonvolu poŝti retpoŝton al mi.
通常のアクセスは、この措置によって阻害されることはありませんが、万が一投稿が想定外に失敗する場合には、恐れ入りますがその旨をメールにてご連絡ください。
Kaj mi konvene plibonigos la procedon, laŭ statistiko el ĵurnaloj, de nun.
なお、この制限は、今後のアクセス状況を参考に、適宜更新致します。
| 月 | 火 | 水 | 木 | 金 | 土 | 日 |
|---|---|---|---|---|---|---|
| « 9 月 | 11 月 » | |||||
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 | ||||