<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>swx-murakami</author_name>
  <author_url>https://blog.hatena.ne.jp/swx-murakami/</author_url>
  <blog_title>サーバーワークスエンジニアブログ</blog_title>
  <blog_url>https://blog.serverworks.co.jp/</blog_url>
  <categories>
    <anon>AWS Glue</anon>
    <anon>Amazon S3</anon>
    <anon>Amazon S3 Tables</anon>
    <anon>Apache Iceberg</anon>
    <anon>Apache Parquet</anon>
    <anon>Hive</anon>
  </categories>
  <description>サーバーワークスの村上です。 今回はAmazon S3上にあるデータを外部テーブルとして分析する際、どのような方法があるか、主にHiveとApache Icebergを中心に比べてみました。 想定シーン パターン一覧 結論：Hive形式 とApache Iceberg形式の比較 扱うJSONデータ 想定オペレーション 参考比較：Amazon S3内のJSONを直接クエリ（非推奨） パターン①：S3にParquet保存 + Hive形式テーブル AWS Glue Data Catalog のテーブル作成 Amazon Data Firehoseの作成 Parquetに変換するよう設定する 動的パ…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Fblog.serverworks.co.jp%2Fs3-query-hive-iceberg&quot; title=&quot;Amazon S3上のデータを分析するアーキテクチャ例~HiveとApache Iceberg比較~ - サーバーワークスエンジニアブログ&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>https://cdn-ak.f.st-hatena.com/images/fotolife/s/swx-murakami/20250724/20250724141726_120.jpg</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2025-07-24 11:02:34</published>
  <title>Amazon S3上のデータを分析するアーキテクチャ例~HiveとApache Iceberg比較~</title>
  <type>rich</type>
  <url>https://blog.serverworks.co.jp/s3-query-hive-iceberg</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
