<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>hayataka2049</author_name>
  <author_url>https://blog.hatena.ne.jp/hayataka2049/</author_url>
  <blog_title>静かなる名辞</blog_title>
  <blog_url>https://hayataka2049.hatenablog.jp/</blog_url>
  <categories>
    <anon>python</anon>
    <anon>sklearn</anon>
    <anon>クラスタリング</anon>
    <anon>評価指標</anon>
    <anon>機械学習</anon>
  </categories>
  <description>はじめに クラスタリング結果の良し悪しを評価したいことがあります。 正解ラベルがないデータに対してクラスタリングを行った場合（つまり本当に教師なし学習でやる場合）、基本的にクラスタ内距離二乗和やクラスタ中心間の距離などを使ってやる以外の方法はありません*1。 しかし、正解ラベルがあるデータに対してクラスタリングをかける、というシチュエーションもあります。たとえばクラスタリング手法の性能評価だとか、相手にするデータセットが教師なしでやってどれくらいまとまる性質があるか調べるとか、そんな感じのときです。 こういうとき、評価指標がないと困ります。そこで、評価指標を考えます。何通りかあるようですが、簡…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fhayataka2049.hatenablog.jp%2Fentry%2F2018%2F03%2F15%2F070029&quot; title=&quot;【python】クラスタリング結果をエントロピーで評価する - 静かなる名辞&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>https://chart.apis.google.com/chart?cht=tx&amp;chl=%20H%28P%29%20%3D%20-%20%5Csum_%7BA%5Cin%5COmega%7D%20P%28A%29%20%5Clog_2%20P%28A%29</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2018-03-15 07:00:29</published>
  <title>【python】クラスタリング結果をエントロピーで評価する</title>
  <type>rich</type>
  <url>https://hayataka2049.hatenablog.jp/entry/2018/03/15/070029</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
