あるUnicodeの文字列が中国語かどうかを判定したい

Shinya_131 https://blog.hatena.ne.jp/Shinya_131/ 機略戦記 https://shinya131-note.hatenablog.jp/ ruby 書捨てスクリプトこのエントリを書いた人間はUnicodeや中国語について素人です。このエントリに載っている情報は誤っている可能性があります。結論厳密では無いが、Unicode Han Database(Unihan)を参照して広東語または北京語の発音を持ちかつ音読みまたは訓読みの発音を持たない文字が含まれているかどうかで判定できそうだ。概要最初に試みた方法: 「/[ぁ-ん]/にマッチする文字列を取り出すことでひらがなのみが取り出せるように、中国語のみを正規表現で取り出せないか」。 Unicode上で漢字は、中国語・日本語・朝鮮語で使われている漢字をひとまとめにしたCJK統合漢字という概念で扱われてい… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fshinya131-note.hatenablog.jp%2Fentry%2F2015%2F07%2F10%2F004853" title="あるUnicodeの文字列が中国語かどうかを判定したい - 機略戦記" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2015-07-10 00:48:53 あるUnicodeの文字列が中国語かどうかを判定したい rich https://shinya131-note.hatenablog.jp/entry/2015/07/10/004853 1.0 100%