文字コード
tDiary から php にトラックバック送信すると確実に文字化けしてしまう。しかもその文字化けのせいで xml が valid でなくなる。ホント困った。なんでちゃんと変換できないんだろう。
mb_language("uni");
mb_internal_encoding("UTF-8");
mb_convert_encoding(htmlspecialchars($name, ENT_NOQUOTES), "UTF-8", "auto");
utf8 以外で送られてきたら絶対に化ける……はぁ。
mb_language("Japanese"); にしてなおる。何故だかは知らない。せっかくユニコード使ってるんだから、スクリプト側で言語設定なんてしたくないんだけど……
マルチバイト圏内はみんな悩むんだろうなぁ。韓国とか中国はどうなのよ。もっとめんどくさ系ですか。
そういや CJK で IC タグの規格を共通化とかなんとか。
今のところ php スクリプト自体は 500 行ぐらいのやつ。もともと php は xslt するためのトリガ程度にしか使う予定じゃなかったから妥当な長さ? データファイルは別のディレクトリに置いたほうがいいような気がしてきた。一個オプション導入してガガガガと書き換えるかー。でも面倒臭い。
日記のマークアップも超適当にやってきてしまったから、ちゃんとさせなければ。link 要素も不完全。むむむー。細かいのが多くなると突然ダルくなる。
関連エントリー
- むむむ、wb.php ホストを取得できてない。トラックバックの excerpt も記録されてない。 excerpt はスペルミスですた。 文字コード変換がうまくい...
- 日本語 日本語フォントのない環境で、日本語で書かれたページを見たら文字化けみたいに見えるのかな。 外国の CD 情報収集しているサイトで一部の日本の...
- 日本語 日本語フォントのない環境で、日本語で書かれたページを見たら文字化けみたいに見えるのかな。 外国の CD 情報収集しているサイトで一部の日本の...
- Perl でバイト数を制限しつつ、文字列を妥当なバイト列に変換したい use strict; use warnings; use utf8; use Encode; sub encode_with_limit ...
- eBook makedoc.rb で作成してみたけど、文字化けする。Array#filter はむかしの Array#collect! らしい。 utf...