treasure data demo.0517
DESCRIPTION
2013.05.17 SIOS BigData Seminar with Treasure Data inc.TRANSCRIPT
© SIOS Technology, Inc. All rights Reserved.
データの入力、確認、出力
Treasure Dataの利用方法の紹介
サイオステクノロジー株式会社
クラウドソリューション部
2013.05.17
大村 和子
サイオステクノロジー株式会社
© SIOS Technology, Inc. All rights Reserved.
自己紹介
名前 :大村和子
所属:サイオステクノロジー株式会社 クラウドソリューション部
ビッグデータ技術ブログ書いてます!!http://sstd-bigdata.blogspot.jp/
© SIOS Technology, Inc. All rights Reserved.
目次
全体図Treasure Dataへ td-agentでデータをインポート
Treasure Dataのデータの監視と確認Treasure Dataのデータを出力Treasure Dataと RESTTreasure Dataのその他の機能紹介Treasure Dataと BIツールの連携
© SIOS Technology, Inc. All rights Reserved.
全体図
© SIOS Technology, Inc. All rights Reserved.
Google Apps
全体図
Amazon Web Service
株価
Treasure Data
Database
GoogleSpreadshee
t
SiosWebSite
td-agent
Twitterデータ
Facebookデータ
HRForecast
PG
td-agent
MySQL
監視、確認
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataへ td-agentでデータをインポート
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataへデータをインポート
Treasure Data
Database
SiosWebSite
td-agent
© SIOS Technology, Inc. All rights Reserved.
td-agent.confの設定
#/etc/td-agent/td-agent.conf<source> type tail format apache path /var/log/httpd/access_log pos_file /var/log/td-agent/httpd-access.log.pos tag td.sios_web.www_access</source><match td.sios_web.www_access> type tdlog apikey XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX auto_create_table buffer_type file buffer_path /var/log/td-agent/buffer/td use_ssl true</match>
設定ファイルを記述し、td-agentを動作させる
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataのデータの監視と確認
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataの監視と確認
Treasure Data
Database
監視、確認
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataコンソール
ダッシュボードデータベースクエリインポートジョブ出力先スケジュール
© SIOS Technology, Inc. All rights Reserved.
tdコマンドでも監視できます
© SIOS Technology, Inc. All rights Reserved.
Wikiデータの検索
wikimedia.orgのオープンデータの約 11億レコードが
Treasure Dataに入ってます!!
検索してみましょう!!
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)
SQLに似ている Hiveの問い合わせ言語TreasureDataのデータもこれで検索できます。select TD_TIME_FORMAT(time, 'yyyy-MM-dd') as tm ,count(1) as cnt from wiki_tbl group by TD_TIME_FORMAT(time, 'yyyy-MM-dd')
↑日付別の件数を取得する HiveQL
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)の実行1
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)の実行2
実行中Job Id:2786765
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)の実行3
終了
© SIOS Technology, Inc. All rights Reserved.
HiveQL(はいぶきゅーえる)の実行4
結果
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataのデータを出力
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataのデータを出力
Google Apps
Amazon Web Service
Treasure Data
DatabaseGoogle
Spreadsheet
HRForecast
PG
MySQL BIツール
© SIOS Technology, Inc. All rights Reserved.
Googleスプレッドシートに Push 1
Result(出力先 )の登録(現在は tdコマンドからのみ)
$ td result:create my_gspreadsheet ‘gspreadsheet://<user>:<password>@gmail.com/<ブック名>’
© SIOS Technology, Inc. All rights Reserved.
Googleスプレッドシートに Push 2
先ほどのwikiのクエリを指定し、 Resultに先ほど作った名前とシート名を設定
{Result名 }:{シート名 }
my_gspreadsheet:wiki_list
© SIOS Technology, Inc. All rights Reserved.
Googleスプレッドシートに Push 3
結果
© SIOS Technology, Inc. All rights Reserved.
Googleスプレッドシートに Push 4
定期的に出力することも可能
© SIOS Technology, Inc. All rights Reserved.
MySQLに出力
Googleスプレッドシートとほぼ同じです
$ td result:create my_db ‘mysql://<user>:<password>@<host>/<db>’
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataと REST
© SIOS Technology, Inc. All rights Reserved.
現在、標準ライブラリが用意されている言語
•Ruby•Java•Node.js
© SIOS Technology, Inc. All rights Reserved.
こんなかんじです( Ruby)
#Treasure Dataクライアント作成cln = TreasureData::Client.new(ENV['TREASURE_DATA_API_KEY'])#過去 3日分のデータを取得sql = "select close ,date_time,low,high from stocks where code=3744 and date_time >= '" + str_startday + "'"#queryjob = cln.query("rps_db",sql)#waituntil job.finished? sleep 2 job.update_progress!end#get datajob.result_each{|row| #send data res = Net::HTTP.post_form(URI.parse('http://localhost:5127/api/stocks/sios/price'), {'number'=>row[0].to_i.to_s, 'datetime'=>row[1].to_s})}
© SIOS Technology, Inc. All rights Reserved.
HRForecastに書き込んでみました。
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataのその他の機能紹介
© SIOS Technology, Inc. All rights Reserved.
Bulk Import
すでに大量の過去ログがあるんだけど。。
大丈夫です!Bulk Importで確実にインポートできます!
© SIOS Technology, Inc. All rights Reserved.
手動インポート
ちょっとだけ手動でデータをインポートしたいんだけど。。
大丈夫です!ちょっともできます。
コンソールからも可能です。
© SIOS Technology, Inc. All rights Reserved.
データの分析
Treasure Data中のデータを分析したいんだけど。。
大丈夫です!各種 BIツールと連携できま
す!!
© SIOS Technology, Inc. All rights Reserved.
Treasure Dataと BIツールの連携
© SIOS Technology, Inc. All rights Reserved.
どのようなツールが利用できるの?
Treasure Dataはデータベース内のデータをさまざまな BIツールから直接利用することができます。
• JDBC接続• ODBC接続(準備中)• Treasure Data専用の設定
© SIOS Technology, Inc. All rights Reserved.
Metric Insightsと Treasure Data
© SIOS Technology, Inc. All rights Reserved.
Metric Insightsと Treasure Data
© SIOS Technology, Inc. All rights Reserved.
Metric Insightsと Treasure Data
© SIOS Technology, Inc. All rights Reserved.
最後に宣伝です
© SIOS Technology, Inc. All rights Reserved.
ビッグデータに関する技術支援もしています
• アトリビューション分析支援• マイニング用リソース構築
(RDB,NoSQL)• 形態素解析支援(MeCab等)• データ分析支援( R言語)• BIツール紹介
Treasure Dataの導入支援、サポート以外にもいろいろやってます!
© SIOS Technology, Inc. All rights Reserved.
ブログもやってます!
SIOSビッグデータ技術ブログhttp://sstd-bigdata.blogspot.jp/
「ビッグデータ ブログ」で検索!
ご清聴ありがとうございました。