棚からパルチャギ

日々の雑記、ニュース拾いとか

2007. 08. 11

日本語の取り扱いが得意な萌え萌えRDBMS「MoSQL」
MySQL関連で情報を探していたらこんなものまでw
5.0以降での日本語の取り扱いについては、携帯絵文字なんかも含めて特に問題と感じるようなことはないので、 本家に対するアドバンテージがいまいち分からないのですが、Senna導入済みてことくらいかなー。

とりあえずトップ画像が萌えないのは共通認識だと思いますので、早急に差し替えるべきだと思うのです
MySQL 5.x のUTF-8対応
結合文字に関連して。 「Appendix 2: 日本語処理における注意事項」によると、Windows Vistaから利用可能になったJIS第3/第4水準の漢字について、 MySQL 5.0では3byteまでのUTF-8しか対応していないため4byte目は格納されませんよ、というお話。地味に怖いです。

バックエンドにMySQLを利用しているシステムでは、そういった文字が入力されないように判定する必要があるかもですね。 これまで代用文字が使われていた地名や人名が、正規の文字で入力されると正しく保存されないわけで。 あと、第3/第4水準の漢字には痛いペンネームに使われそうなカッコイイ漢字が多く含まれているので、 ネトゲのキャラ名に付けたら文字化けしたよヽ(`Д´)ノ みたいなことになりそうな予感w
(追記:結合文字じゃなければ関係なかったぽいです。拡張文字→4byteかと思ってしまった…)

一応、本家のドキュメントにも記載されてました。対応は6.0の予定?
【適当に翻訳】 MySQLはUTF-8の補助文字(4byteのUTF-8)に対応していません。 対応しているのはUnicodeの0面/BMP(Basic Multilingual Plane)だけで、一部の漢字とかは非対応だけど(゚⊿゚)シラネ
バグとして報告されたこともあったけど、却下しました。ぶっちゃけ、(次の文字見るまでは)結合文字なのか判定できないから無理なのです。
最近は携帯関連の仕事ばかりだったので、Vista対応とかあんまし考えてなかったなー。
参考:MySQLの現行UTF-8の問題とその対処方法について
UTF-8-MACとか
仕事でもプライベートでもMacに関わることは殆どないのですが、Macユーザとのデータのやり取りではまったのでめも。
  • Mac OS Xでファイル名に使用されるエンコードは一般的なUTF-8とは異なり、NFD(Normalization Form D)という正規化形式が採用されている (参考:MacWiki - UTF-8-MAC)
  • UTF-8-MACでは、日本語の濁音や半濁音が結合文字として表現される
  • UTF-8-MACに対応したWindows用のFTPクライアントは手持ちのだとNextFTP(4.80)のみ ※FileZilla(2.2.32)、FFFTP(1.92a/UTF-8 私家対応版)、WinSCP(4.0.3)はファイル名破損等でダメ
あと、ファイル名に「:」(コロン)が含まれていたりもしてWindowsマシンでは結構ぐんにょり。

ファイル名に「:」とかありえなくないですかー、みたいなことを遠まわしにはてなで訊いたら、 「というか『/』とNUL以外なら全部使えますが何か?」と言われてショック。 「|」とか「>」とか「*」なんかもファイル名に含められるんですね。 だからどうだというか、やっぱり使えちゃダメでしょと思うわけなのですが…orz
今日の浪費
「かんなぎ (3)」「SOUL GADGET RADIANT (5)」「DDD (2)」。

「かんなぎ」は本編よりもまず「樋上いたるとの合作ピンナップ」が原型留めて無さすぎで吹いたんですが。 前巻の竜騎士07氏といい、斜め上を行くゲストの選定は作者のセンスなんでしょうか。 あと、特典が「ざんげちゃん非公式ファンクラブ会員カード」とか。


ところで、狼と香辛料の公式見てたんですが漫画化もされるんですね。 小梅けいと氏はどちらかというと派手目な絵の印象が強いので原作のイメージを考えると意外だったんですが、 尻尾のふさふさっぷりを見るにアニメ版よりも期待しても良さそうな感じです。
電撃「マ)王は読んでないのでコミックス待ちかー。というか『「マ)』ってどういう表記ですか。