2007年第4四半期の公開を予定していた「メール辞書引き機能」を近日中に公開出来る目処が立ちましたので、ご報告申し上げます。
この「メール辞書引き機能」とは、メール本文にエスペラント単語を書いて送信すると、その辞書引き結果が返信されるサービスです。或る事柄についての質問内容のメールを送信すると、その回答をメールで受け取れるサービスとしては、他に以下のようなものがあります。
本サイトではエスペラント日本語翻訳システムを開発中ですが、その副産物として公開している辞書引き機能と同等の検索結果を得られます。出先でちょっとした確認をしたい場合には気軽に、また自宅でもパソコン等を起動する手間無く、PHS・携帯電話で辞書引きが出来るようになります。勿論、移動体通信(PHS・携帯電話)以外のメールアドレスからでもご利用いただけます。
また、これまでの辞書引きウェブページへのアクセスと違って必要な文字情報のみを取得出来ますので、パケット通信料の低減にも繋がります。WILLCOMの「ウィルコム定額プラン」はメール送受信が無料ですので、さらに安心してお使いいただけます。
なお、本サービスの提供と併せて、より高速で安定したホスティングサービスへの契約変更を行います。
以下では、本サービスの技術的な実装方法の概要をご紹介します。
AMD Phenom 9500が2007年11月22日(木)の昼に国内でも解禁されました。明けて23日にAMDのイベントが開催されましたので、AMD党の私も出掛けて行きました。その道すがら、記念としてご祝儀的に購入してみたりしました。
この刹那的な行動の意図は那辺にあるのでしょうか。
この度、辞書引き機能を正式版として改めて公開する運びとなりましたので、謹んでご連絡申し上げます。形態素解析機能に関連した副産物として2007/05/20に公開し、半年間に及ぶ試験稼働を終えることが出来ました。構文解析の研究・設計を行っていたり、或いは翻訳システム自体の開発に飛び石的に携わざるをえなかったりと、辞書引き機能に常に目を向けられていた訳ではありませんが、30回に及ぶ改版を経て、半年間の間に十分に揉んでいただいた辞書引き機能は着実に歩みを重ねて来られたと考えています。
本サイトの本来の使命は翻訳システムの開発ですが、その副産物としての辞書引き機能がこれほどまでにご利用いただけているとは、開発者自身予想だにしておりませんでした。しかしこうして栄えあるversio 1を刻めたことは、ひとえに、まだまだ発展途上であるこの辞書引き機能をご利用いただいた皆様あっての帰結であろうと感謝しております。改めてご利用者の方々にお礼を申し上げます。
現在は形態素解析処理の結果を素に辞書中の日本語訳語をそのまま用いているだけであり、日本語の訳語としては甚だ不十分な状態であることは認識しております。これは日本語の文字列生成処理を加えていない所為でありますが、次版に向けては勿論、新たに発見された不具合(バグ)の修正や、上記以外の機能追加についても積極的に取り組んで参る所存です。ご意見・ご感想・ご要望等も楽しみにお待ちしております。
次版は半年後とは言わず、ご案内出来る日が遠からずまたやって来ようかと見通しておりますので、今後ともどうぞよろしくお願い申し上げます。
なお、最近の修正点は以下の通りです。
国際共通語エスペラントなんでも掲示板という掲示板を紹介致します。これは、エスペラントについて、改造論やら政治・思想やらを含む一切のタブーなしに議論する場として設けられた、国内の掲示板です。papageno氏のウェブログのリンクから辿って辿り着いたのですが、もっと早く知っておきたかったです。
これまで邦語のエスペラント関連の掲示板の大きなものとしては、タブーが存在していたり、特定の思想に傾斜気味の場となっていたり、システム上多くの話題を並行させにくかったり、ところによっては無意味に煽られたりという場が大勢でしたが、この掲示板はスレッドフロート式の掲示板(「したらば」がホストしています)ですし、運営方針もしっかりとしているので固定ハンドルで落ち着いて議論を深められそうです。
エスペラントと思想との関係や、今後のこのサイトの身の振り方についての想念も、ついでに述べてみます。
畑違いの言語学をかじり始めて何に参ったかというと、その略語の多さです。例えばS→NP, VPという字面を見て、言語学関連の人間でなければ、Sentence(文), Noun Phrase(名詞句), Verb Phrase(動詞句)という字面への類推は容易ではないでしょう。いわんや(隆盛の理論とはいえ)分野がさらに限られる文法理論のHPSGに於いてをや、です。pn-lxmという字面を見て、どうしてproper noun lexeme(普通名詞語彙素)という字面を類推出来ましょう。
無論、何度も何度も同じ学術用語を繰り返す身にとって見れば略語を使うのが正義でしょうし、言語学徒にとってみても何度も何度も何度も同じ学術用語を見るのもまどろっこしいでしょう。ゆえに双方の利益を増大するために略語が多用されるのは容易に窺い知れるのですが、ここでいきなり畑違いの人間が趣味の世界で言語学関連の書籍やらウェブサイトやらにあたると、何度も何度も何度も何度も略語で躓く羽目になるのです。
この略語の多用は、歴史学ではなかなかに考えにくいことです。情報工学ではITという略語が示すように略語が大好きであるにせよ、例えばコーディング時にわずかなバイト数をけちるために怪しげな略語を使えば、大昔の省資源コーディング礼賛時代とは違い、現代のPerlではたちまちダミアン先生に怒られることでしょう。……と胸を張って言えないところが金融系の中枢システムであるCOBOLの世界ですが……。
ともあれ、これも郷に入りては郷に従うというか、唯々諾々と従うようにしました。何事も批判するのは簡単ですが、仮に批判するにしても相手を知らずして批判することは非常識ですし。
などと訳知り顔で述べたところで、 構文解析機能の難航を覆い隠せるものではありません(ばればれです)。文法書があるのにHPSG式にこれを書き始めようかというその最初の一歩がとても重いのです。ちょうど、詳細要件定義書すらあるのに実装するプログラミング言語が判らなくてエディタが真っ白な状態に似ています。
などと愚痴ばかりを漏らしても生産的ではないので、私がどのようにこうした問題に立ち向かっているか、目下の対策をご案内することにします。
| 月 | 火 | 水 | 木 | 金 | 土 | 日 |
|---|---|---|---|---|---|---|
| « 10 月 | 12 月 » | |||||
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 | ||