Java

JEditPane() でHTMLリッチテキストエディタ(簡易)の制作。

getText()で取得した文字列が、HTMLエンコードされている。
< が &lt; とか半端なものではなく、

あ⇒&#12354; とか文字は全てエンコードされている。

なんと、これを元に戻す標準APIはないらしい。
ネット検索で見つかるのは、URLエンコードの話題ばかりだ。

標準ではないということで、

http://commons.apache.org/

のパッケージを使えば良い、ということが分かる。

http://commons.apache.org/lang/download_lang.cgi

ここからダウンロードできるパッケージで、

org.apache.commons.lang.StringEscapeUtils;

を使って、

StringEscapeUtils.unescapeHtml(str);

とすれば、無事に、「あ」が取得できた。
[PR]
by miries | 2011-02-16 15:34 | 備忘録


<< Java SwingでHTML... batファイルなどのパラメータ >>