icde2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作...

36
1 4回 先端的データベースとWeb技術動向講演会 (ACM SIGMOD 日本支部 第41回支部大会) ICDE2009国際会議報告 東京農工大学 工学府 品川 徳秀 <mailto:[email protected]> 開催情報 概要 – 2009/03/29-04/02 Galaxy Hotel, 上海 – http://i.cs.hku.hk/icde2009/ スケジュール 3/29 : 併設ワークショップ 全日 x 3, 半日 x 2 3/30-4/2 : 国際会議 キーノート •3 パラレルセッション + 23 セッション (セミナーなど) ポスター

Upload: others

Post on 12-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

1

第4回 先端的データベースとWeb技術動向講演会(ACM SIGMOD 日本支部 第41回支部大会)

ICDE2009国際会議報告

東京農工大学 工学府

品川 徳秀<mailto:[email protected]>

開催情報• 概要

– 2009/03/29-04/02– Galaxy Hotel, 上海

– http://i.cs.hku.hk/icde2009/

• スケジュール– 3/29 : 併設ワークショップ

• 全日 x 3, 半日 x 2– 3/30-4/2 : 国際会議

• キーノート• 3 パラレルセッション + 2~3 セッション (セミナーなど)• 同

• ポスター

Page 2: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

2

投稿数• 投稿: 665

– 研究論文: 555– 産業論文: 28– デモ: 92– プログラム委員: 200+ (平均 9本/人, 最大12本/人)

• 採択・発表– 研究論文: 93+55 (口頭発表: 93+3) → 24セッション

– 産業論文: 9+3 → 3セッション

– デモ: 25 → 3セッション

– ポスター: 全論文! → 3セッション

– 招待講演: 3, パネル: 1, セミナー: 7

投稿状況 (1/2)

4535近似・不確実・確率的 DB

5337ユビキタス・モバイル・分散・P2P DB

4242データ統合, メタデータ, 相互運用性

10647データプライバシ, データセキュリティ

4947データストリーム, センサネットワーク

61059時空間・マルチメディアDB

51165データマイニング, 知識発見

81786問合せ処理, 最適化, 自律DBショートロング投稿分野

Page 3: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

3

投稿状況 (2/2)

559.9%

9316.8%

555総計

125ユーザインタフェース, 情報可視化

119トランザクション, ワークフロー, アーキテクチャ

2316個人化, 社交情報管理, 注釈, キュレーション

1318データウェアハウス, OLAP, グリッド

2625科学・バイオメディカル・先端的アプリ

1632XMLデータ管理

1932ウェブデータ管理

ショートロング投稿分野

セッション構成MOUNDWISSSMDB3/29

S7

I3

S5

I2

S3

P

I1

S6

S4

S2

S1

D3

D2

D1

24: Mobility

18: Sci. & Adv.Applications

12: XML

6: Streams II

21: Data Integ. &Warehousing

15: SpatialQueries

9: Streams & I/F

3: Streams I

4/2AM

4/1

3/31

3/30

23: Query Proc. IV22: Data Mining III

20: Query Proc. III19: Data Mining II

17: Query Proc. II16: SocialNetworking

14: Query Proc. I13: SystemPerformance

11: Query Opt.10: Data Mining I

8: Transactions7: Data Uncertainty

5: Web II4: Data Security &Provenance

2: Web I1: Data Privacy

※ 3/30-4/1 : セッション前にキーノート, セッション後にポスター (2hrs)

M3SN, DBRank

Page 4: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

4

AwardInfluencial Paper Award• Efficient Time Series Matching by Wavelets

– K.-P. Chan, A. Wai-Chee, ICDE1999Best Paper Award• Histogram and Wavelets on Probablistic Data

– G. Cirnide (AT&T Lab Research), M. Garofalakis (Tech. Univ. of Crete)

Best Student Award• Double Index NEsted-loop Reactive

Join for Result Rate Optimization– M. Bornea, V. Vassalos, Y. Kotidis (Univ. of Athens),

A. Deligiannakis (Tech. Univ. of Crete)

Page 5: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

5

キーノート / パネルKeynote1. Search Computing

– Stefano Ceri (Politechnico di Milano)2. Why can’t I find my data the way I find my dinner?

– David Carlson (IPY Int’l Program Office, UK)3. Data Management in the Cloud

– Raghu Ramakrishnan (Yahoo! Research, CA)Panel• Social Network Mining and Search

– Irwin King (Chinese Univ. of Hong Kong)– Christos Faloutsos (CMU), Chin-Yew Lin (MSR Asia),

Cong Yu (Yahoo! Research), Phillip Yu (IBM)

セミナー1. Large graph mining: patterns, tools, and case

studies2. Distributed Object Bases: An Integrated Approach3. Efficient Approximate Search on String Collections4. Enumerating Large Query Results5. Preference Queries from OLAP and Data Mining

Perspective6. Mashups, SaaS, and Cloud Computing: Evolutions

and Revolutions in the integration Landscape7. Similarity Searching: Indexing, Nearest Neighbor

Finding, Dimensionality Reduction, and Embedding Methods for Applications in Multimedia Databases

Page 6: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

6

併催ワークショップ• DBRank’09 (キーノート 1, レギュラー 2, ショート 3)

– Ranking in Databases• WISS’09 (キーノート1, 論文6, ケーススタディ/パネル 3)

– Information & Software as Services• SMDB 2009 (キーノート 1, 論文 5, パネル 1)

– Self-Managing Database Systems• MOUND 2009 (キーノート 1, 論文 7, パネル 1)

– Management and Mining of UNcertain Data• M3SN (キーノート 2, 論文 4)

– Modeling, Managing, and Mining of Evolving Social Networks

SMDB

MOUND

DBRank

WISS

M3SN

Page 7: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

7

日本からの発表DBRank’09• Visualized Elucidations of Ranking by Exploiting

Object Relations– X. Zhang, Y. Asano, M. Yoshikawa

Session 15: Spatial Queries• Spatial Range Querying for

Gaussian-Based Imprecise Query Objects– Y. Ishikawa, Y. Iijima, J. Xu Yu

• Keyword Search in Spatial Databases: Towards Searching by Document– D. Zhang, Y. M. Chee, A. Mondal, A. K. H. Tung,

M. Kitsuregawa

報告の構成• 前半

– 会議全体の概要

– キーノート、パネル

• 後半– 研究論文セッション概観

– Best Paper Award– Student Best Paper Award– 時間があればそのほかの研究を紹介

Page 8: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

8

Keynote1:Search Computing

Stefano Ceri(Politechnico di Milano)

概要• Search Computing の黎明

– 2003 Lowell Workshop ~「ミラノに近いすばらしい場所にあるエスニックレストラン」

• 背景: 次世代サーチ (PRIN Project)– brick: 2検索サービスの結合

– framework: 多ドメイン問合せ最適化

– interface: マッシュアップベースのインタラクション

– optimality: ランク集約における Top-K 抽出

• Search Computing (SeCo) Project– プロジェクト組織

– 実験的アーキテクチャ

– 技術動向調査とビジネスプラン

Page 9: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

9

Research Chapter of SeCo Project• Foundational theories• Statistical models• Optimization methods• Software paradigms• Interaction paradigms• Semantic domain knowledge• Higher-order rankings• Personal and social aspects• Business models• Legal and privacy issues• Advanced computational architectures

ウェブの潮流との関係• 対 Semantic Web

– 少なくとも第一段階では、よりシンプルな問題を扱う– 情報源と意味はは既知なので、結合パターンはgiven– 動的選択は徐々に注意深く注入 (inject) していく

• 対 Social Web– 社交情報を利用– ただし、Social Web に限定的な研究は計画にない

Page 10: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

10

Search Computing Archtecture• プロトタイプ 1

– 基本機能

– 問合せ処理エンジン

– ドメインリポジトリ

– サービスリポジトリ

• プロトタイプ 2– 問合せ計画最適化

• プロトタイプ 3– ドメインへの対応付け

– 問合せ結果の表現

• プロトタイプ 4– 高水準問合せ

Registration Time Components• ドメインリポジトリ

– L1: キーワードとタグ

– L2: ビジネス領域のタキソノミ (RDF)– L3: フルオントロジ

• サービスリポジトリ– L1: WSDL2 サービス

– L2: 注釈付き WSDL2 サービス

– L3: セマンティックウェブサービス

Page 11: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

11

ビジネス・技術動向調査のアプローチ

ケーススタディの収集と分類キーケーススタディの特定

時流にあった解市場動向の発見

Keynote2:Why Can’t I Find IPY Data

the Way I Find Dinner?

David Carlson (IPY Int’l Program Office, UK)

Page 12: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

12

IPY• IPY: International Polar Year

– 国際協力のシミュレート

– 極地の理解

• IPYの意義

– 雪氷の縮小

– グローバルなつながり

様々な観測データと可視化• 非常に多数の観測データ可視化デモ

– 科学• 50,000人

USD 1.2 billion– データ

• 20人未満

• USD 2million

• データチャレンジ– リソース: データエンジニアとの共同提案

– 語彙: イノベイティブなデータエンジニアリング

– レガシサービス: student infection model

Page 13: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

13

Keynote3:Data Management in the Cloud

Raghu Ramakrishnan(Yahoo! Research, CA)

クラウドへの疑問• クラウドコンピューティングとは?

– 水平・機能サービス群

• チャレンジは何か?– ソフトウェアビジネスモデル, 科学, 生命

• どれだけのクラウドがありえるか?– 1, 2, 3, ..., 無限大

• クラウドコンピューティングの新しい点は?– HPC グリッド, ASP, ホステッドサービス, Multics(!)– データ集約的サービスを含む、広範なクラスのプログラムをサポートする「クラウドスタック」

Page 14: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

14

なぜクラウドか• OE曲線にシフトを引き起こすオンデマンド基盤

– できることをする

– 与えられた予算に対し• よりロバストに

• より効率的に

• よりグローバルに

• より完全に

• より素早く

• クラウドサービスは

– スケールと高可用性を引き上げるべき

– 現在はアプリレベルで対応し、非生産的

クラウドサービス• 要求

– マルチテナント, 弾力性 (elasticity), 資源共有,水平スケーリング, (使用量の) 計測性, セキュリティ, 可用性, 運用容易性

• サービスの種類– 水平 (プラットフォーム) クラウドサービス

• クラウド上へのアプリケーションサービスの構築テナント• 意味中立, 広範囲に適用可能, コモディティハードウェア上でのフォルトトレラント性

– 機能クラウドサービス• 様々な SaaS インスタンス

• エンドユーザ・小規模ビジネス向けサービス

※水平サービス上ないしスクラッチで作成されうる

Page 15: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

15

Yahoo! Cloud Stack

変化した世界• ウェブの求めるもの

– スケーラビリティ

– 柔軟なスキーマ

– 地理的な分散

– 高可用性

– 高信頼ストレージ

• ウェブの求めないもの

– 複雑な問合せ

– 強いトランザクション

Yahoo! Cloud Stack におけるデータ管理

Page 16: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

16

ストレージ&配信スタック

ストレージ上の問題• 小レコード : < 100KB• 構造化データ : 多くのフィールド, 進化 (evolution)• 極度のデータ規模 : 数十TB• 極度の要求規模 : 数万件

• グローバルな低遅延性 : 20以上のDC• 工可用性 : 停電による損失は $数百万

• 多様な利用パターン : アプリやユーザの変

• PNUTS/Sherpa

Page 17: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

17

PNUTS/Sherpa (1/2)

PNUTS/Sherpa (2/2)

Page 18: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

18

データ管理• 技術要素

• データ操作– レコード単位の操作: Get, Set, Delete– 複数レコードの操作: Multiget, Scan, Getrange– ウェブサービス (RESTful) API

Tablet• Tablet

– ハッシュ表

– 順序付き表• 範囲検索をサポート

• 柔軟なスキーマ

– 属性の追加・削除

• ストレージユニットにTablet を分散配置

– 分割してバランシング

バルクリード

Page 19: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

19

データストアの比較• 問合せ表現力

• データモデル

• 弾力性

単純 多機能S3 PNUTS Oracle

オブジェクト探索 オブジェクト/レコードの

単一表からの探索

SQL

柔軟 固定的PNUTS, CouchDB Oracle

オブジェクト中心的一貫性 consistency spans objects

硬直的 弾力的Oracle PNUTS, S3

限定的 (分散) 超大規模分散・複製 (VLSD)

データストアの比較• 一貫性

• 注) CAP定理 (Seth et al, 2002)– Consistency, Availability, tolerance to network

Partitions を同時に満たすことはできない

ベストエフォート

強い保障S3 PNUTS Oracle

EventualConsistency

TimelineConsistency ACID

オブジェクト中心一貫性

プログラム中心一貫性

Page 20: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

20

Panel:Social Networking Mining and Search

パネリストと提供トピック座長

• Microscopic Views of Social Computing– Irwin King (Chinese Univ. of Hong Kong)

パネリスト

• Social Computing at MSRA– Chin-Yew Lin (MSR Asia)

• Social Content Exploration– Cong Yu (Yahoo! Research)

• (影響力のあるブロガの検索)– Phillip Yu (IBM)

Page 21: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

21

Microscopic Views of Social Computing• ソーシャルサービスの普及 (Alexa as of Nov. 2008)

Yahoo! jpYoukuAOL10BloggerSokueBay9

WikipediaGoogleWikipedia8MySpaceYahoo!MSN7

MSN163Windows Live6FacebookTaobaoFacebook5

Windows LiveGoogle.cnYouTube4YouTubeSinaMySpace3GoogleQQYahoo!2Yahoo!BaiduGoogle1世界中国アメリカ

– Rich User Experience– Group/Collective Behavior– Producer (v.s. Consumer)– Relational

(v.s. Transactional)– Bottom-up

Microscopic Views of Social Computing• Web 2.0

– Web as a Platfome– Read-and-Write Web– Dynamic– Freedom and

Empowerment– User-centric

– People-to-People (v.s. People-to-Machine)– Publish and Subscribe (v.s. Search and Browse)– Service-oriented Services (v.s. Closed App.)– Utility (v.s. Functionality)– Value (v.s. Data)

Page 22: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

22

• Web 2.0 Revolution: 3C– Connectivity– Collaboration– Communities

• ソーシャルコンピューティングの課題

– 理論とモデル

– 検索とマイニング• 部分的・不完全な情報の扱い• e.g. 協調フィルタリング, ランキング, タギング, ...

– スケーラビリティとアルゴリズム

– セキュリティとプライバシ

– 社会的インタラクションの金銭化

Microscopic Views of Social Computing

Social Computing at MSRA• Social Computing

– Living : dynamictogether : more than one personin communities : same localityusing computers : via use of technology

• Social Web– People + Content + Network

• 人々へ価値を– 知識の同化 : systems to pull from data– 知識の異化 : systems to people– 知識の引き出し : systems pull from people– カーテンの裏の人に注目せよ

Page 23: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

23

Social Computing at MSRA• GeoLife 2.0

– 位置履歴ベースの GPSデータ駆動の SNS– ユーザ間の類似性や位置の相関性の探索

Social Computing at MSRA• GeoLife アプリケーションアーキテクチャ

Page 24: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

24

Social Content Exploration• メッセージは三つ

– ソーシャルコンテントサイト (SCS) の出現

– 推薦は有力な情報探索パラダイムの一つとして浮上

– 開発者は情報探索アプリ構築に助力を要している

• ソーシャルコンテントサイト (SCS) の出現

– ソーシャルコンテント統合の傾向 → 社交情報の統合要求

– 問題は、どのように統合するかでなく、何に統合するか– プライバシと利便性のバランス: 粒度とインタフェース

Social Content Exploration• 推薦は有力な情報探索パラダイムの一つとして浮上

– Y! Travel の問合せでは、特定のものについてよりも、

– 地理的・話題的制約下での推薦が求められている

– 情報探索パラダイムのランキング• 推薦 > ユーザベース > 検索 > 問合せ

– もはやキーワードでは不足、コミュニティ/話題解析が必要• 誰が、誰と関係し、誰を信頼している/すべき

5.34%22.52%

Category(e.g. family)

21.38%位置情報無し

8.37%32.36%位置情報あり

SpecificGeneral(e.g. to do thing)

10 Million Yahoo! Travel Queries

Page 25: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

25

Social Content Exploration• 開発者は情報探索アプリ構築に助力を要している

– スケーラビリティにおける挑戦• 大規模なグラフの解析

– 意味論における挑戦• 良い形式化・モデルでの検索において多数のトライ&エラー

• 素早く開発するための手法が必要

– データベース的アプローチ• 代数 SocialScope : グラフ上の論理代数系 [CIDR2009]

– SCS 上の情報発見のために設計

• 宣言的言語 Jelly : SCS上の問合せ言語– 入れ子関係上の SocialScope に基づく

– コミュニティ中心情報探索アプリに焦点

– 話題・コミュニティ生成のプリミティブを持つ

影響力のあるブロガの検索• ブログサイト

– 個人ブログ: 個人の記録・意見表明

– コミュニティブログ: 議論が多発, 集合知の醸成

• 問題: ブログスフィアで影響力があるのは誰か?– アクティブ != 影響力を持つ

– どのように定義するか• 影響力のある記事を書く• 主観的 (subjective)• 収集可能な統計量 (collectable statistics)

Page 26: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

26

影響力のあるブロガの検索• 影響力の要因

– Social Gestures• 認知度: 被参照数 (入リンク)• 活動量: 議論量 (コメント)• 新規性: 参照数 (出リンク)• 雄弁さ: 記事の”良さ” (長さ)

– 影響度 = f( Social Gestures )• 疑問

– 活動的なブロガは影響的なのか

– そうでないなら、何が違うのか

– 異なる種別の影響的なブロガが存在するか

– 他のパラメータはあるか

– 影響力のあるブロガに一時的なパターンはあるか

35131非--42327影響的

非--活動的

0/13非--717影響的

非--活動的

Digg上位20ブログ

TUAW 上位535ブログ

影響力のあるブロガの検索• 潜在的アプリケーション

– 信頼性 (trust)、相互評価 (reputation)• 直観的には、影響的なブロガは信頼性が高い

• 既存の研究は、信頼性の伝播に焦点

• ブログスフィアの知人関係網において重要かつセンシティブ

– 熟練者の特定• 特定の話題のブログスフィアにおいて影響的なブロガ

• 異なるブログサイトの影響的ブロガとの比較

Page 27: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

27

ロングペーパ

セキュリティ• Session 1: Data Privacy

– Modeling and Integrating Background Knowledge in Data Anonymization

– Deriving Private Information from Association Rule Mining Results

– Light-Weight, Runtime Verification of Query Sources– Auditing a Database under Retention Restrictions

• Session 4: Data Security and Provenance– Unified Declarative Platform for Secure Netwoked Information

Systems– An Architecture for Regulatory Compliant Database

Management– Perm: Processing Provenance and Data on the Same Data

Model through Query Rewriting– Join Optimization of Information Extraction Output: Quality

Matters!

Page 28: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

28

ウェブ• Session 2: Web I

– ApproxRank: Estimating Rank for a Subgraph– BinRank: Scaling Dynamic Authority-Based Search

Using Materialized SubGraphs– AJAX Crawl: Making AJAX Applications Searchable– A Data Structure for Sponsored Search

• Session 5: Web II– STAIRS: Towards Efficient Full-Text Filtering and

Dissemination in a DHT Environment– iVA-File: Efficiently Indexing Sparse Wide Tables in

Community Systems– SP2Bench: A SPARQL Performance Benchmark– Weighted Proximity Best-Joins for Information

Retrieval

グラフ系の話題が散見

ストリーム• Session 3: Streams I

– A Framework for Clustering Massive-Domain Data Streams

– Self-Tuning, Bandwidth-Aware Monitoring for Dynamic Data Streams

– Towards Efficient Processing of General-Purpose Joins in Sensor Networks

– Forward Decay: A Practical Time Decay Model for Streaming Systems

• Session 6: Streams II– Access Methods for Markovian Streams– Keyword Search over Dynamic Categorized

Information

Page 29: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

29

ストリーム• Session 6: Streams II (cont.)

– Shared Winner Determination in Sponsored Search Auctions

– Deductive Framework for Programming Sensor Networks

• Session 9: Streams and Interface– Sketching Sampled Data Streams– Continuous Subgraph Pattern Search over Graph

Streams– Top-k Exploration of Query Candidates for Efficient

Keyword Search on Graph-Shaped (RDF) Data– A Spreadsheet Algebra for a Direct

グラフ系の話題が散見

ストリーム (+他)• Session 24: Mobility

– Supporting Generic Cost Models for Wide-Area Stream Processing

– Probabilistic Inference over RFID Streams in Mobile Environments

– Recursive Computation of Regions and Connectivity in Networks

– Non-Exposure Location Anonymity

不確実・確率的データへの注目

Page 30: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

30

データマイニング• Session 10: Data Mining I

– Using Anonymized Data for Classification– Decision Trees for Uncertain Data– Finding Time-Lagged 3D Clusters– Contextual Ranking of Keywords Using Click Data

• Session 19: Data Mining II– GraphSig: A Scalable Approach to Mining Significant

Subgraphs in Large Graph Databases– Context-Aware Object Connection Discovery in

Large Graphs– STAR: Steiner-Tree

Approximation in Relationship Graphs– A Latent Topic Model for Complete Entity Resolution

データマイニング• Session 22: Data Mining III

– Another Outlier Bites the Dust: Computing Meaningful Aggregates in Sensor Networks

– Online Anomaly Prediction for Robust Cluster Systems

– Fa: A System for Automating Failure Diagnosis– Efficient Mining of Closed Repetitive Gapped

Subsequences from a Sequence Database

Page 31: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

31

ソーシャルネットワーク• Session 16: Social Networking

– Routing Questions to the Right Users in Online Communities

– On Efficient Recommendations for Online Exchange Markets

– Querying Communities in Relational Databases– Instant Advertising in Mobile Peer-to-Peer Networks

XML• Session 12: XML

– Effective XML Keyword Search with Relevance Oriented Ranking

– Distributed Structural Relaxation of XPath Queries– Sketch-Based Summarization of Ordered XML

Streams– Flexible XML Querying Using Skyline Semantics

スカイラインに関する論文も多数

Page 32: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

32

システムパフォーマンス• Session 13: System Performance

– Efficient Distribution of Full-Fledged XQuery– X-CSR: Dataflow Optimization for Distributed XML

Process Pipelines– Improving Transaction-Time DBMS Performance and

Functionality– Predicting Multiple Metrics for Queries: Better

Decisions Enabled by Machine Learning

トランザクション• Session 8: Transactions

– A Robust Technique to Ensure SerializableExecutions with Snapshot Isolation DBMS

– Transaction Support for Log-Based Middleware Server Recovery

– Adaptive Scheduling of Web Transactions– BP-Wrapper: A System Framework Making Any

Replacement Algorithms (Almost) Lock Contention Free

Page 33: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

33

問合せ処理• Session 11: Query Optimization

– Power Hints for Query Optimization– Double Index NEsted-Loop Reactive Join for Result

Rate Optimization– Join Reordering by Join Simulation– PSALM: Cardinality Estimation in the Presence of

Fine-Grained Access Controls• Session 14: Query Processing I

– Space-Constrained Gram-Based Indexing for Efficient Approximate String Search

– Exploring a Few Good Tuples from Text Databases– Confidence-Aware Join Algorithms

問合せ処理• Session 14: Query Processing I (cont.)

– SPROUT: Lazy vs. Eager Query Plans for Tuple-Independent Probabilistic Databases

• Session 17: Query Processing II– On Efficient Query Processing of Stream Counts on

the Cell Processor– Parallel Skyline Computation on Multicore

Architectures– Minimizing Communication Cost in Distributed Multi-

query Processing– Sequence Pattern Query Processing over Out-of-

Order Event Streams

Page 34: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

34

問合せ処理• Session 20: Query Processing III

– Distance-Based Representative Skyline– Similarity Group-By– Top-k Set Similarity Joins– Best-Effort Top-k Query Processing Under Budgetary

Constraints• Session 23: Query Processing IV

– Online Interval Skyline Queries on Time Series– Efficient Processing of Warping Time Series Join of

Motion Capture Data– Probabilistic Skyline Operator over Sliding Windows– Topologically Sorted Skylines for Partially Ordered

Domains

問合せ処理• Session 15: Spatial Queries

– Distance Oracles for Spatial Networks– Reverse Furthest Neighbors in Spatial Databases– Spatial Range Querying for Gaussian-Based

Imprecise Query Objects– Keyword Search in Spatial Databases: Towards

Searching by Document

Page 35: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

35

科学・先端応用• Session 18: Scientific and Advanced Applications

– Computing Distance Histograms Efficiently in Scientific Databases

– Differencing Provenance in Scientific Workflows– XOntoRank: Ontology-Aware Search of Electronic

Medical Records– Supporting Database Applications as a Service

データ統合・データウェアハウス• Session 21: Data Integration and Warehousing

– Aggregate Query Answering under Uncertain Schema Mappings

– Large-Scale Deduplication with Constraints Using Dedupalog

– Recommending Join Queries via Query Log Analysis– Resolution-Aware Query Answering for Business

Intelligence

Page 36: ICDE2009国際会議報告 - sigmodj.orgデータ管理 • 技術要素 • データ操作 –レコード単位の操作: Get, Set, Delete –複数レコードの操作: Multiget,

36

Best Paper:Histogram and Wavelets on

Probablistic Data

G. Cirnide (AT&T Labs Research)M. Garofalakis (Tech. Univ. of Crete)

スライド

Best Student Paper:Double Index NEsted-loop

Reactive Join for Result Rate Optimization

M. Bornea (Univ. of Athens)V. Vassalos (Univ. of Athens)Y. Kotidis (Univ. of Athens)

A. Deligiannakis (Tech. Univ. of Crete):

スライド