AWS CUR のデータ量を Glue 事前集計で削減する方法（Athena スキャン課金対策）

yatta47 https://blog.hatena.ne.jp/yatta47/ /var/www/yatta47.log https://yatta47.hateblo.jp/ aws CUR（Cost and Usage Report）を Athena でクエリしていて、スキャン量が思ったより多くてびっくりした。調べてたら、Glue ETL で事前に集計しておくと劇的にデータ量を削減できるとわかったのでまとめておく。 CUR の生データがどれだけ大きいか CUR を Hourly + リソース別で設定している場合、「1リソース × 1時間 × 1課金タイプ = 1行」になる。 EC2 を例にとると、50 インスタンス × 3 課金タイプ（インスタンス時間・EBS・データ転送など）× 24 時間 × 30 日 = 108,000 行、これだけで EC2 だけの数字だ。さら… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fyatta47.hateblo.jp%2Fentry%2F2026%2F04%2F16%2F090000" title="AWS CUR のデータ量を Glue 事前集計で削減する方法（Athena スキャン課金対策） - /var/www/yatta47.log" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> Hatena Blog https://hatena.blog 2026-04-16 09:00:00 AWS CUR のデータ量を Glue 事前集計で削減する方法（Athena スキャン課金対策） rich https://yatta47.hateblo.jp/entry/2026/04/16/090000 1.0 100%