Windowsマシンでpythonを使ってutf-8のBOM付きファイルを触る

malibu-bulldog https://blog.hatena.ne.jp/malibu-bulldog/ malibu-bulldogの日記 https://malibu-bulldog.hatenadiary.org/ Program Technique 相変わらずpythonの文字コードの扱いを腰を据えて勉強しないまま公私共にpythonをガンガン使っているんだが… 当然のように文字列処理でちょこちょこ詰まります。（文字コードの扱いをしっかりやってないので当たり前ですね）この前はまったのはutf-8形式のテキストファイルにBOMと呼ばれる情報があった場合はpythonでは素直にやっていたのでは読み込めない件。どういう事かというと… まずBOMとはバイト・オーダー・マークの略で，Unicodeのデータの先頭数バイトに存在してデータの種類を表すもの。ところが，符号単位を8bitにとるutf-8はその形式上バイト・オーダー・マークが必要ない。 … 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fmalibu-bulldog.hatenadiary.org%2Fentry%2F20130818%2Fp1" title="Windowsマシンでpythonを使ってutf-8のBOM付きファイルを触る - malibu-bulldogの日記" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2013-08-18 00:00:00 Windowsマシンでpythonを使ってutf-8のBOM付きファイルを触る rich https://malibu-bulldog.hatenadiary.org/entry/20130818/p1 1.0 100%