近刊検索 デルタ

2020年7月9日発売

テッキーメディア

AWSではじめるデータレイク

クラウドによる統合型データリポジトリ構築入門
このエントリーをはてなブックマークに追加
内容紹介
「データレイク」は、大量データ分析/生成データの活用を視野に入れた新しいデータストアのかたちです。従来のデータベース/データウェアハウスの範囲に収まらない多様なデータを大量に保管し、高度な統計分析や機械学習に役立つ情報基盤を作ることが可能です。
本書ではデータレイクの概念や特徴、必要とされる機能などを基本から解説し、さらにAmazonが運営するパブリッククラウドサービスAWS(Amazon Web Services)で実現する方法を解説します。
従来では想定しえなかった大量のデータを確実に保管するため、データレイクの世界ではクラウドのようなサービス型インフラストラクチャの活用が注目されます。さらにAWSではオブジェクトストレージS3上のデータを直接分析するAmazon Athena、データウェアハウスのAmazon Redshift、機械学習を実現するAmazon SageMakerなど、データレイクを支えるさまざまな仕組みが存在します。
本書ではそれらの活用の指針を解説するとともに、後半ではシステムの構築例を具体的に解説していきます。ビジネスデータ分析とログなどの生成データ分析を例に、システム構築の流れを詳しく紹介し、機械学習や統計分析をビジネスの現場で活かせる仕組みの技術的なヒントを数多く提供します。
目次
第1部 データレイクの概念と知識

序章 データレイ クを始めよう
第1章 データレイクの構築
第2章 データレイクの活用
第3章 データレイクの運用
第4章 データレイクのセキュリティ

第2部 データレイクの実践(基礎編)

第5章 ハンズオンの概要 ービジネスデータのデータレイクー
第6章 データを可視化する
第7章 サーバーレスSQLによるデータ分析
第8章 データを変換する
第9章 データを分析する(データウェアハウス)

第3部 データレイクの実践(応用編)

第10章 システムの概要 ーログデータのデータレイクー
第11章 ログを集める
第12章 ログの保管とカタログ化
第13章 ログを加工する
第14章 ログを分析する
著者略歴
上原 誠(ウエハラ マコト uehara makoto)
上原 誠(うえはら まこと)。ソリューションアーキテクト。おもにISV/SaaSのお客様に対する技術支援を担当。技術的な得意/興味領域としては、アナリティクス系テクノロジー、広告系ソリューション、Aerospikeなど。
志村 誠(シムラ マコト shimura makoto)
志村 誠(しむら まこと)。スペシャリストソリューションアーキテクト、アナリティクス。Web企業におけるHadoop基盤の開発/運用やデータ活用を経て、2016年にAWSにジョイン。アナリティクスおよび機械学習分野のソリューションアーキテクトとして、幅広いお客様のAWS上でのデータ活用を支援。Amazon Athena、AWS Glue、Amazon Elasticsearch Service、Amazon SageMakerがおもな守備範囲。
下佐粉 昭(シモサコ アキラ shimosako akira)
下佐粉 昭(しもさこ あきら)。スペシャリストソリューションアーキテクト、アナリティクス。データベースソフトのプリセールスエンジニア、ソフトウェアアーキテクトを経て、2015年よりAWSのソリューションアーキテクト。データレイク、データウェアハウス、BI等の領域でお客様の技術支援を実施。高度な技術を誰もが使える形で届けることが一番の興味。
関山 宜孝(セキヤマ ノリタカ sekiyama noritaka)
関山 宜孝(せきやま のりたか)。AWS Glue & Lake Formation 開発チーム、シニアビッグデータアーキテクト。2014年にAWSにジョイン。5年間AWSサポートにて技術支援を担当。2019年より現職にて、データレイクに関するユーザーに近い部分(ライブラリ/サンプル等)の開発や技術支援を担当。Apache Sparkの開発にも貢献。休日はいつも子どもと虫取り(ダンゴムシ、チョウチョ、バッタ、カタツムリ等)。
タイトルヨミ
カナ:エーダブリューエスデハジメルデータレイク
ローマ字:eedaburyuuesudehajimerudeetareiku

※近刊検索デルタの書誌情報はopenBDのAPIを使用しています。

-- 広告 -- AD --

【AD】
今、注目すべき第三書館の本
ザ・殺人術
人の殺し方を本にしていいのか

-- 広告 -- AD --

関山 宜孝 最近の著作
もうすぐ発売(1週間以内)

※近刊検索デルタの書誌情報はopenBDのAPIを利用しています。