Tedious days

最近ハマっているTwitterですが、Linuxで「〜」と入力すると Windows版のTwitterクライアントである Twit では「?」と表示されてしまうようだ。

Linux（EUC-JP？）の「〜」とWindows（CP932？）の「〜」とでは文字コードが違うのだろうとチョット調べてみた。

uconv ドキュメント
以前のバージョンでは WAVE DASH [U+301C] と FULL WIDTH TILDE
[U+FF5E] を EUC-JP に変換する際，両方とも '〜' (EUC-JP:
A1C1) にしていましたが，version 0.4 では FULL WIDTH TILDE は
未定義文字になります。逆に EUC-JP の '〜' を UCS-2 または
UTF-8 に変換する場合は U+FF5E に変換していましたが，U+301C
に変換するようになりました。

やはり、LinuxやMacで「〜」を入力するとU+301Cに、Windowsで「〜」を入力するとU+FF5Eとして、Twitterに送信される模様。
LinuxではU+FF5Eでも「〜」として表示されるので、Windowsを意識して「〜」はU+FF5EとしてTwitterにポストするのがいいのかもしれない。

まぁ、Windows版のruby/Gtkでは、ちょっと見栄えが違うけどU+301Cも「〜」として表示されるんだけど…

文字コードの違いって難しい。

Tedious days

徒然なるままに...

2007/05/21

〜

kichi2007

検索

最近のコメント