機械学習用のデータを早く大量にラベルづけする方法

harajune https://blog.hatena.ne.jp/harajune/ 技ビス：技術、ビジネス、スタートアップ https://blog.gijutsuya.jp/ 機械学習用のデータのラベル付けを行うscale.comの記事から。要旨 Open AIプロジェクトのfine tuning GPT-2のデータラベル付にscale AIが使われている任意の人にラベル付をしてもらうとき、スケーラビリティの問題がある。「labelerがお互いの品質をチェックすることなしに、どうやって品質を高めるか」さらに、従来はラベルとデータから学習してモデルを作っていた(オフライン)が、scaleではラベル付とモデル作りを繰り返し(オンライン)て、モデルのチューニングを行なっているこれを実現するために30分以内でのラベルづけと1時間5000ラベルづけという、低レイテンシ… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fblog.gijutsuya.jp%2Fentry%2F2019%2F11%2F18%2F085009" title="機械学習用のデータを早く大量にラベルづけする方法 - 技ビス：技術、ビジネス、スタートアップ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2019-11-18 08:50:09 機械学習用のデータを早く大量にラベルづけする方法 rich https://blog.gijutsuya.jp/entry/2019/11/18/085009 1.0 100%