字上符付き文字の代用表記

 エスペラントの字上符付き文字 ĉ , ĝ , ĥ , ĵ , ŝ , ŭ )を含むコンピュータ用の文字セットは,現在では,ISOが定めたものに「ISO 8859-3 LATIN-3」および「ISO 10646」があり,JISが定めたものに「JIS X0213(いわゆるJIS第3,第4水準)」および「JIS X0221(ISO 10646に相当)」があります。しかし,以前のJISやASCIIにはエスペラントの字上符付き文字がありませんでした。そのため,パソコン通信やインターネットでは長い間,字上符付き文字に対して代用表記が使われてきました。残念ながら,この代用表記法については,統一された方式がありません。以下にその代表的な方式をあげます。

(1)ザメンホフ推奨方式
  ch , gh , hh , jh , sh , u

(2)字上符文字後置方式
  c^ , g^ , h^ , j^ , s^ , u^  (u~)

(3)字上符文字前置方式
  ^c , ^g , ^h , ^j , ^s , ^u

(4)x 後置方式
  cx , gx , hx , jx , sx , ux

ユニコードについて
 ユニコードとは「ISO 10646」の一部として標準化された文字コード体系で,エスペラントの字上符付き文字はユニコードのラテン拡張Aブロックに含まれています。Windows XPではOS内部の文字コードとしてユニコードを使用しており,最近ではユニコードを取り扱えるワープロやエディタ,インターネットブラウザ等のアプリケーションも充実してきました。エスペラントのウェブ・サイトの中にも,UTF-8表記のページを掲げる所が増えてきました。

 しかしながら,ユニコードを簡単・確実には取り扱えないOSやソフトウェアもまだ多く使われており,文字化けの可能性が常に残っています。また,東アジア漢字圏への対応に問題があり,ユニコードは多言語文字集合として不完全だという批判もあります。インターネットの電子メールでは,7ビットの US-ASCIIコードの伝送しか保証しない古いシステムが残っているため,文字化けや脱落が発生することがあります。

 根本的な解決のためには,パソコンやネットワーク上ですべての言語のすべての文字を統一的に扱うことのできる標準的な方式が確立されることが必要です。

 2005.03.05 記