談 uber 從 postgresql 轉用 mysql 的技術爭議

談 Uber 從 PostgreSQL 轉用 MySQL 的技術爭議

Ant

[email protected]

2016-08-05

2/69

《 Why Uber Engineering Switched from Postgres to MySQL 》

https://eng.uber.com/mysql-migration/

今日的討論主角。

https://eng.uber.com/mysql-migration/

3/69

本次演講為了清楚傳達

會大量使用白板描述

4/69

議程

➀跳脫技術及政治鬥爭本位

➁架構先決

➂探嚢取物

5/69Ref: http://fortune.com/2016/02/25/uber-patent-just-in-time-rides/

跳脫技術及政治鬥爭本位

http://fortune.com/2016/02/25/uber-patent-just-in-time-rides/

6/69

架構先決

《業務需求是什麼》

7/692015

➊架構先決無視人員、流程只講技術，是耍白痴

架構會影響公司文化、商業擴展；思維更要超越程式碼層次

8/692015

➋沒有完美的架構，只有最適的架構無視場景只講架構，是耍流氓

若無法舉出架構的缺陷，代表你還無法掌握

盲目套用別人的架構，並不會讓你變得跟他一樣好

9/692015

➌架構是演進的，預想但不過早調優無視未來只求現有，是耍自閉

兵馬未動，糧草先行，預想下一步，下下一步，甚至下下下一步 ...

10/69

Orient Intensive Capacity

CPU intensive

Memory intensive

Storage/IO intensive

Bandwidth intensive

OLTP

OLAP

Data warehouse

Throughput

Latency

Memory footprint

Bond

Performance

Security

Cost reduction

架構先決

Service-level agreement

11/692015

千萬人同時在線電子商務、線上媒體

低延遲回應廣告平台 (30ms) 、高頻交易 (0.5~3ms) 、醫療等關鍵設備

12/69

Capacity

架構先決

13/69

Capacity

Optimal capacity

架構先決

14/69

Capacity

Optimal capacity

架構先決

15/69

探嚢取物

为 PostgreSQL 讨说法 – 浅析《 UBER ENGINEERING SWITCHED FROM POSTGRES TO MYSQL 》

https://yq.aliyun.com/articles/58421

將以這篇討論為主


16/69


➀更新頻繁 (UPDATE-heavy)

➁無模式 (Schemaless)

➂異地同步

探嚢取物

17/69


CPU intensive

Memory intensive


Bandwidth intensive

OLTP

OLAP

Data warehouse

Throughput

Latency

Memory footprint

Bond

Performance

Security

Cost reduction

探嚢取物


18/69




➂異地同步

探嚢取物

19/69


CPU intensive

Memory intensive


Bandwidth intensive

OLTP

OLAP

Data warehouse

Throughput

Latency

Memory footprint

Bond

Performance

Security

Cost reduction

探嚢取物


20/69




➂異地同步

探嚢取物

21/69


CPU intensive

Memory intensive


Bandwidth intensive

OLTP

OLAP

Data warehouse

Throughput

Latency

Memory footprint

Bond

Performance

Security

Cost reduction

探嚢取物


22/69




➂異地同步

探嚢取物

23/69


CPU intensive

Memory intensive


Bandwidth intensive

OLTP

OLAP

Data warehouse

Throughput

Latency

Memory footprint

Bond

Performance

Security

Cost reduction

探嚢取物


24/69


CPU intensive

Memory intensive


Bandwidth intensive

OLTP

OLAP

Data warehouse

Throughput

Latency

Memory footprint

Bond

Performance

Security

Cost reduction

探嚢取物


25/69

探嚢取物

MySQL – 回滾段

26/69

探嚢取物

PostgreSQL - MVCC

27/69

探嚢取物

PostgreSQL - MVCC

28/69

探嚢取物

Q ：一般操作時，誰的 UPDATE 較快？

29/692015

索引數據結構 : B+tree索引

資料表：

1 user1 pass1

2 user2 pass2

3 user3 pass3

4 user4 pass4

5 user5 pass5

13

4 7

1 2 3 4 5 6 7

30/69Ref: https://yq.aliyun.com/articles/58421


33/69

探嚢取物

Q ：一般操作時，誰的 UPDATE 較快？

InnoDB 需要把 Older row 搬到 Rollback Segment ，造成 UPDATE 比較慢。

PostgreSQL 是複製該 row 在同一 Page ，並改 Pointer 。

34/69




➂異地同步

35/69

探嚢取物

Q ： UPDATE-heavy ？

36/69

探嚢取物

Q ： UPDATE-heavy ？

PostgreSQL 是複製該 row 在同一 Page ，並改 Pointer 。

37/692015

索引頁分裂

觸發：頁剩餘空間 -保留空間<新增資料問題：頁分裂時會 Latch(小鎖 )

page

page page

latch

page

38/692015

索引頁分裂 : 亂序式新增資料

操作：新增 5(假設頁只能存三筆資料 )

20

6 12

2 4 6 8 10 12

5

20

4 6 12

2 4 5 6 8 10 12

p1 p1

p2 p2

p4p3 p3 p4p5

latch

fragmentation fragmentation

39/69

探嚢取物

Q ： PostgreSQL HOT-updated ？

40/69

探嚢取物


HOT-updated 是有條件的：

➀只有在所有索引屬性都沒有被更新時才能使用 HOT

➁只有在被更新記錄所在頁面能夠存儲新版本時才能用 HOT

41/69

探嚢取物


HOT-updated 是有條件的：

➀只有在所有索引屬性都沒有被更新時才能使用 HOT

為了目標的 Column 可支援 HOT-updated ，勢必就不行加上索引，損失 Read 效能。 ( 三個月沒登入的會員 ? )

➁只有在被更新記錄所在頁面能夠存儲新版本時才能用 HOT

UPDATE-heavy 下， fillfactor 要調更小，浪費的空間更多， I/O 開銷更大。PostgreSQL 預設 100% ，博主使用 80% ， 8K*20%=1.6K 為空，假設 Record Size 200 bytes ， 1.6K 約可放 8.2 個。

42/69

探嚢取物

Q ： MySQL 的 Primary Key 更新的開銷非常大？

43/69

探嚢取物


PostgreSQL 更新的 Column 為 Index 時，沒有 HOT-updated 效果，且全 Index 皆需要更新。

MySQL 雖然沒有這個問題，但若是 Primary Key 更新時，問題也是很嚴重。

44/69

探嚢取物


PostgreSQL 更新的 Column 為 Index 時，沒有 HOT-updated 效果，且全 Index 皆需要更新。

MySQL 雖然沒有這個問題，但若是 Primary Key 更新時，問題也是很嚴重。

但通常 Primary Key 是不會更新的。

45/69

探嚢取物

46/69




➂異地同步

47/69

探嚢取物

Q ：寫次數放大？

48/69

探嚢取物


➀場景一： Primary Key 更新時

➁場景二： N 個 Secondary Index中的 1 個更新時

➂場景三：更新的欄位不是 Index 時

49/69

探嚢取物


➀場景一： Primary Key 更新時

➊更新的 Row 在原長度內

(MySQL) ? I/O

(PostgreSQL) ? I/O

➋更新的 Row 不在原長度內，且發生 Page split

(MySQL) ? I/O

(PostgreSQL) ? I/O

50/69

探嚢取物


➁場景二： 1 個 Secondary Index中的 1 個更新時


(MySQL) ? I/O

(PostgreSQL) ? I/O


(MySQL) ? I/O

(PostgreSQL) ? I/O

51/69

探嚢取物


➁場景二： N 個 Secondary Index中的 1 個更新時


(MySQL) ? I/O

(PostgreSQL) ? I/O


(MySQL) ? I/O

(PostgreSQL) ? I/O

52/69

探嚢取物


➂場景三：更新的欄位不是 Index 時


(MySQL) ? I/O

(PostgreSQL HOT-updated) ? I/O


(MySQL) ? I/O

(PostgreSQL) ? I/O

53/69




➂異地同步

54/69

探嚢取物

Q ：長事務？

55/69

探嚢取物

Q ：長事務？

InnoDB 回滾 Rollback Segment 很昂貴。

尤其當長事務常發生時，可能常讀取 Older data ，效能很差。

56/69

探嚢取物

Q ：長事務？

InnoDB 回滾 Rollback Segment 很昂貴。

尤其當長事務常發生時，可能常讀取 Older data ，效能很差。

但通常事務 (transaction) 回滾的機率是低的。

57/69

探嚢取物

Q ：作者：看我文章中的測試嗎，每秒 13萬持續強力更新壓測

我的測試機AWS EC2 c4.xlarge (4 vCPU)

60/692015

High Concurrent Write?(Hotspot:UPDATE)

《MySQL》

直接 UPDATE在同一 Row，通常不會造成該 Page的大小變化。

《 PostgreSQL》

盡量在同一 Page寫入新的 Row，但若該 Page空間不足時，則會另新建一 Page寫入。

Fragmentation？ VACUUM？

61/692015


《 PostgreSQL》

PostgreSQL天生容易遇到 Index bloat的問題。

Ref: PostgreSQL 9.0 High Performance [PACKT] (2010) (p171)

62/692015


Ref: http://www.slideshare.net/denishpatel/deploying-maximum-ha-architecture-with-postgresql (p28)

http://www.slideshare.net/denishpatel/deploying-maximum-ha-architecture-with-postgresql

63/69




➂異地同步

64/69

異地同步

Q ： Physical replication vs. Logical replication?

MySQL 只有 Logical replication；

PostgreSQL 9.4之前只有 Physical replication 。

65/69

異地同步


PostgreSQL送出WAL ，而MySQL送出 commands 。

送出WAL 有一些問題，因為它是直接修改 disk 的資料，所以可能會造成一些問題。包括 data corruption導致整個資料庫下線。

它對於 versioning 版本號的問題非常敏感，並且如果無法確保我們能支持很多 versioning 版本號的replicating 到同一台機器時，這會變得非常困難。

66/69

異地同步


Physical replication 比 logical replication 快，因為它在 replication stream中含 index pointer ，允許 insert直接進到 index ，比需要先找到該 index位置再 insert 快。

這很有效率，但確實 replication bandwidth 需要比較多。

67/69

異地同步


statement-based replication對 bandwidth 較有效率。但對接收端的伺服器效能並不好。

且可能導致很多 replication 非預期的問題，導致需要排錯。

68/69

最後

PostgreSQL 開發團隊開始深入思考Uber遇到的問題，並著手改善，其中包括HOT 的寫入次數放大問題。

69/69

i

Ref: https://www.postgresql.org/message-id/CABOikdMop5Rb_RnS2xFdAXMZGSqcJ-P-BY2ruMd%2BbuUkJ4iDPw%40mail.gmail.com

https://www.postgresql.org/message-id/CABOikdMop5Rb_RnS2xFdAXMZGSqcJ-P-BY2ruMd%2BbuUkJ4iDPw%40mail.gmail.com

談 uber 從 postgresql 轉用 mysql 的技術爭議

Technology