20130928 jaws festa in kansai 2013 ♡redshift girls♡
DESCRIPTION
人生が変わるその日 「JAWS FESTA Kansai」でどんまいと一緒にRedshift Girlsやったときの資料。 http://jfk2013.jaws-ug.jp/TRANSCRIPT
RedshiftGirls
株式会社サーバーワークスなかじま どんまいこながふち ぎょり
れっどしふと
がーる
ず
降臨
自己紹介(ぎょり)
• 株式会社サーバーワークス
– Sales 3年目
• 永淵 恭子(ながふち ぎょり きょうこ)
• Twitter:@Nagafuchik
• クラウド女子会コアメンバー
• 最近はまっていること
–代表いじり
– POKO PANG
自己紹介(どんまいこ)
• 株式会社サーバーワークス– Sales
• なかじままいこ(どんまいこ)
• Twitter– @mnakajima18
• 好きな食べ物– だし巻き玉子
• 料理blog「どんまいこの花嫁修業」– http://blog.livedoor.jp/mnakajima18/
Redshift girlsって??
事の発端
( ´_ゝ`)フーン
部長
「もちろんお前らがやるんだからちゃんと準備しとけよ」
(´-`).。oO(思いつきで言ったことを押し付けるとか人間としてどうk(ry)
「まかせてください。喜んでやりましょう」
体を張って
わかりやすく
やさしく
Redshiftのことお伝えします♡
でーたうぇあはうす?
ぐぐってみた
基幹系業務システム(オペレーショナル・システム)からトランザクション(取引)データなどを抽出・再構成して蓄積し、情報分析と意思決定を行うための大規模データベースのこと。
こうしたデータベースを中核とした意思決定支援システムのこと、あるいはこのようなシステムの構築概念のことを指す場合もある。
@IT情報マネジメント編集部
ちょっと何言ってるか
わかんない
身近なところに
落とします
たとえば
コンビニの売上データから
「木曜日にananを買う30代男性は一緒にプレミ○ムモルツを買うことが多い」
「雨の日はシーチキンマヨが売れる」
これまでの単純な集計では
わからなかった
各要素間の関連を洗い出す
データベース、システムのこと
ポイント
1.サブジェクト志向
2.結合すること
3.消さない・更新しない
4.時系列を持つ
1.サブジェクト志向→集めたデータを抽象化した項目ごとに分類
2.結合すること→様々なソースのデータを整理してまとめる
3.消さない・更新しない→変更履歴が重要。どんどん貯める
4.時系列を持つ→データを算出するサイクルが決まっている。どんどん貯まる
必要なものストレージの大きい専用ハードウェア
特殊な分析ソフトウェア
費用もかかる
場所もとる
→やろうと思ってもハードルが高い
Redshift
の役割とは
特徴
拡張
安い速い
データ量
数ギガバイト~1ペタバイト超
クラスタの拡張
2TBのハイストレージノード~16TBのハイストレージエクストララージ
シングルノード~100ノード
拡張
データベースの種類
カラムナ型(列指向)を使っている
同じカラムは繰り返しが多く起こりやすいので
圧縮して高速化
速い
id Name favorite
1 Don Egg
2 Gyo Beer
3 Hashi Ika
4 Reader Beer
5
id Name favorite
1 Don Egg
2 Gyo Beer
3 Hashi Ika
4 Reader Beer
5
AWSアカウントがあればすぐ立ち上げ
られる
通常のPostgreSQL用のドライバが
使える
→これまでの知識・資産が生かせる
早い
初期費用なし!
ライセンス費用なし!
従量課金
2TBストレージ(XLノード):$1.250/時間
1ヶ月東京リージョンで使用して約90万程度
安い
不得意なところ
大量データの集計処理
得意!
反面
通常のデータベースの利用方法は苦手
ある特定のユーザーの特定のデータを取得する
データベース内のデータ量が少ない場合
→数秒かかってしまう
BODY!!and
SOUL!!
刮目せよ!!
重大
発表
大阪常駐メンバージョイン!
• 11月より大阪常駐メンバがジョイン
• AWS認定ソリューションアーキテクトの資格取得済み
• JAWSUG大阪のメンバー
• 誰よりもイケメン!
桶谷 拓也
ご清聴ありがとうございました