nkf を使用した文字コード変換ライブラリCinnamonのUCS4->UTF8の変換

sirocco https://blog.hatena.ne.jp/sirocco/ sirocco の書いてもすぐに忘れるメモ https://sirocco.hatenadiary.org/ Haskell nkf を使用した文字コード変換ライブラリCinnamon についてUCS4⇔UTF8の変換にてバグらしきものを発見したと指摘があります。指摘されているのは UCS4 の1文字を Utf8 の複数バイトに変換する ucs4CharToUtf8Chars 関数です。文字列を変換して比較し、ucs4CharToUtf8Chars について検証してみました。まず、rfc2279。 module Main where import Data.Bits ((.&.), (.|.), shiftR) import Data.Char (chr, ord) import Codec.Binary.UTF8… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fsirocco.hatenadiary.org%2Fentry%2F20121204%2F1354590090" title="nkf を使用した文字コード変換ライブラリCinnamonのUCS4->UTF8の変換 - sirocco の書いてもすぐに忘れるメモ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2012-12-04 12:01:30 nkf を使用した文字コード変換ライブラリCinnamonのUCS4->UTF8の変換 rich https://sirocco.hatenadiary.org/entry/20121204/1354590090 1.0 100%