メモ。

 少しばかり急な話ですが、投稿後最大で3日間ほど更新を停止します。日記タイトル関連の都合で身支度etc色々あるもので……。
 返答が中途半端になっていますが、落ち着き次第……ということで。
 (2006年8月30日20:17:43追記、予定確定……土曜日は終日(?)外出することに。)


 人間は「めんどくさい度合い」を量的に・絶対量で捉えることは出来ないが、感覚的に・相対量で拾うことは出来る。
 机上の計算である程度妥当性を確認したら、後は「やってみる→検証してみる→……」の繰り返しが重要。
 目的無く闇雲にやっても結果は得られないし、机上の計算のみでは現実とのギャップに泣かされるので。
 その過程を経ずに「ただパクって来ただけ」の技術は、その場でしか役に立たない。目先の成果を出すために必要なのは、過程ではなく結果。持続可能な進歩をするために必要なのは、結果ではなく過程。


 辞書・ニュースなど、投稿は自国語・データベースは中間言語(機械処理用、プレビュー時に返すのは中間言語化後のテキストをさらに逆変換したもの)・表示は各国語……とか、そういうシステムがあると面白そう。
 中間言語は語順に依存しないように「プレフィクス膠着語」様の言語形態で(そうする必要があるかどうかは不明)、単語は各国語が持つ揺らぎ(語の適応範囲)に左右されないように「必要十分な程度に細分化して、各項目に1つのIDナンバーを振る(語彙を特定の言語に頼らない)」。データは通常バイナリ形式で保持し、テキスト形式にする場合はBase64エンコードを通す……と。いや、時代が時代だからXML様のテキスト形式で統一するほうがいいのかも。
 中間言語がこんな感じなので、訳出される成果物は(特別な処理をしない限りは)トロール英語に近い簡易的な表記が適当かもしれない。「正しく伝わればそれで良い」レベルの方が、「その言語的に正しい」レベルを目指すよりもよほど楽だし、再変換時のミスをゼロに持ち込むことが可能かもしれない。
 ちょうど、翻訳エンジンを使って「機械翻訳に適するテキストを作る」のと同じ感覚で、(機械処理を前提とした)中間言語を生成してみたいわけで。
 ……って、作れもしないことを書いてどーすると言うのだろうか>自分。