<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <author_name>yuutookun</author_name>
  <author_url>https://blog.hatena.ne.jp/yuutookun/</author_url>
  <blog_title>Gunosy Tech Blog</blog_title>
  <blog_url>https://tech.gunosy.io/</blog_url>
  <categories>
    <anon>AWS</anon>
    <anon>ApacheHudi</anon>
    <anon>ApacheSpark</anon>
  </categories>
  <description>広告技術部のUT@mocyutoです。 こちらの記事はGunosy Advent Calendar 2021の4日目の記事です。 昨日は内田さんの その設定、pyproject.tomlに全部書けます - Gunosyデータ分析ブログ でした 今回はApache Hudiを用いたユーザデータ基盤の刷新を紹介します。 背景 仕組み 課題 対応策 データの持ち方を変える Apache Hudiとは 構成 Glue + PySpark Athenaによる抽出 移行し終えて 背景 Gunosyの広告システムではユーザに対して最適な広告を届けるために、接触済みのユーザに対して何度も同じ広告を出さないよう…</description>
  <height>190</height>
  <html>&lt;iframe src=&quot;https://hatenablog-parts.com/embed?url=https%3A%2F%2Ftech.gunosy.io%2Fentry%2Fapache_hudi&quot; title=&quot;更新できるデータレイクを作る 〜Apache Hudiを用いたユーザデータ基盤の刷新〜 - Gunosy Tech Blog&quot; class=&quot;embed-card embed-blogcard&quot; scrolling=&quot;no&quot; frameborder=&quot;0&quot; style=&quot;display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;&quot;&gt;&lt;/iframe&gt;</html>
  <image_url>https://cdn-ak.f.st-hatena.com/images/fotolife/y/yuutookun/20211204/20211204102309.png</image_url>
  <provider_name>Hatena Blog</provider_name>
  <provider_url>https://hatena.blog</provider_url>
  <published>2021-12-04 10:19:33</published>
  <title>更新できるデータレイクを作る 〜Apache Hudiを用いたユーザデータ基盤の刷新〜</title>
  <type>rich</type>
  <url>https://tech.gunosy.io/entry/apache_hudi</url>
  <version>1.0</version>
  <width>100%</width>
</oembed>
