談 uber 從 postgresql 轉用 mysql 的技術爭議
TRANSCRIPT
2/69
《 Why Uber Engineering Switched from Postgres to MySQL 》
https://eng.uber.com/mysql-migration/
今日的討論主角。
3/69
本次演講為了清楚傳達
會大量使用白板描述
4/69
議程
➀跳脫技術及政治鬥爭本位
➁架構先決
➂探嚢取物
5/69Ref: http://fortune.com/2016/02/25/uber-patent-just-in-time-rides/
跳脫技術及政治鬥爭本位
6/69
架構先決
《業務需求是什麼》
7/692015
➊架構先決 無視人員、流程只講技術,是耍白痴
架構會影響公司文化、商業擴展;思維更要超越程式碼層次
8/692015
➋沒有完美的架構,只有最適的架構無視場景只講架構,是耍流氓
若無法舉出架構的缺陷,代表你還無法掌握
盲目套用別人的架構,並不會讓你變得跟他一樣好
9/692015
➌架構是演進的,預想但不過早調優無視未來只求現有,是耍自閉
兵馬未動,糧草先行,預想下一步,下下一步,甚至下下下一步 ...
10/69
Orient Intensive Capacity
CPU intensive
Memory intensive
Storage/IO intensive
Bandwidth intensive
OLTP
OLAP
Data warehouse
Throughput
Latency
Memory footprint
Bond
Performance
Security
Cost reduction
架構先決
Service-level agreement
11/692015
千萬人同時在線電子商務、線上媒體
低延遲回應廣告平台 (30ms) 、高頻交易 (0.5~3ms) 、醫療等關鍵設備
12/69
Capacity
架構先決
13/69
Capacity
Optimal capacity
架構先決
14/69
Capacity
Optimal capacity
架構先決
15/69
探嚢取物
为 PostgreSQL 讨说法 – 浅析《 UBER ENGINEERING SWITCHED FROM POSTGRES TO MYSQL 》
https://yq.aliyun.com/articles/58421
將以這篇討論為主
16/69
《業務需求是什麼》
➀更新頻繁 (UPDATE-heavy)
➁無模式 (Schemaless)
➂異地同步
探嚢取物
17/69
Orient Intensive Capacity
CPU intensive
Memory intensive
Storage/IO intensive
Bandwidth intensive
OLTP
OLAP
Data warehouse
Throughput
Latency
Memory footprint
Bond
Performance
Security
Cost reduction
探嚢取物
Service-level agreement
18/69
《業務需求是什麼》
➀更新頻繁 (UPDATE-heavy)
➁無模式 (Schemaless)
➂異地同步
探嚢取物
19/69
Orient Intensive Capacity
CPU intensive
Memory intensive
Storage/IO intensive
Bandwidth intensive
OLTP
OLAP
Data warehouse
Throughput
Latency
Memory footprint
Bond
Performance
Security
Cost reduction
探嚢取物
Service-level agreement
20/69
《業務需求是什麼》
➀更新頻繁 (UPDATE-heavy)
➁無模式 (Schemaless)
➂異地同步
探嚢取物
21/69
Orient Intensive Capacity
CPU intensive
Memory intensive
Storage/IO intensive
Bandwidth intensive
OLTP
OLAP
Data warehouse
Throughput
Latency
Memory footprint
Bond
Performance
Security
Cost reduction
探嚢取物
Service-level agreement
22/69
《業務需求是什麼》
➀更新頻繁 (UPDATE-heavy)
➁無模式 (Schemaless)
➂異地同步
探嚢取物
23/69
Orient Intensive Capacity
CPU intensive
Memory intensive
Storage/IO intensive
Bandwidth intensive
OLTP
OLAP
Data warehouse
Throughput
Latency
Memory footprint
Bond
Performance
Security
Cost reduction
探嚢取物
Service-level agreement
24/69
Orient Intensive Capacity
CPU intensive
Memory intensive
Storage/IO intensive
Bandwidth intensive
OLTP
OLAP
Data warehouse
Throughput
Latency
Memory footprint
Bond
Performance
Security
Cost reduction
探嚢取物
Service-level agreement
25/69
探嚢取物
MySQL – 回滾段
26/69
探嚢取物
PostgreSQL - MVCC
27/69
探嚢取物
PostgreSQL - MVCC
28/69
探嚢取物
Q :一般操作時,誰的 UPDATE 較快?
29/692015
索引數據結構 : B+tree索引
資料表:
1 user1 pass1
2 user2 pass2
3 user3 pass3
4 user4 pass4
5 user5 pass5
13
4 7
1 2 3 4 5 6 7
30/69Ref: https://yq.aliyun.com/articles/58421
31/69Ref: https://yq.aliyun.com/articles/58421
32/69Ref: https://yq.aliyun.com/articles/58421
33/69
探嚢取物
Q :一般操作時,誰的 UPDATE 較快?
InnoDB 需要把 Older row 搬到 Rollback Segment ,造成 UPDATE 比較慢。
PostgreSQL 是複製該 row 在同一 Page ,並改 Pointer 。
34/69
《業務需求是什麼》
➀更新頻繁 (UPDATE-heavy)
➁無模式 (Schemaless)
➂異地同步
35/69
探嚢取物
Q : UPDATE-heavy ?
36/69
探嚢取物
Q : UPDATE-heavy ?
PostgreSQL 是複製該 row 在同一 Page ,並改 Pointer 。
37/692015
索引頁分裂
觸發:頁剩餘空間 -保留空間<新增資料問題:頁分裂時會 Latch(小鎖 )
page
page page
latch
page
38/692015
索引頁分裂 : 亂序式新增資料
操作:新增 5(假設頁只能存三筆資料 )
20
6 12
2 4 6 8 10 12
5
20
4 6 12
2 4 5 6 8 10 12
p1 p1
p2 p2
p4p3 p3 p4p5
latch
fragmentation fragmentation
39/69
探嚢取物
Q : PostgreSQL HOT-updated ?
40/69
探嚢取物
Q : PostgreSQL HOT-updated ?
HOT-updated 是有條件的:
➀只有在所有索引屬性都沒有被更新時才能使用 HOT
➁只有在被更新記錄所在頁面能夠存儲新版本時才能用 HOT
41/69
探嚢取物
Q : PostgreSQL HOT-updated ?
HOT-updated 是有條件的:
➀只有在所有索引屬性都沒有被更新時才能使用 HOT
為了目標的 Column 可支援 HOT-updated ,勢必就不行加上索引,損失 Read 效能。 ( 三個月沒登入的會員 ? )
➁只有在被更新記錄所在頁面能夠存儲新版本時才能用 HOT
UPDATE-heavy 下, fillfactor 要調更小,浪費的空間更多, I/O 開銷更大。PostgreSQL 預設 100% ,博主使用 80% , 8K*20%=1.6K 為空,假設 Record Size 200 bytes , 1.6K 約可放 8.2 個。
42/69
探嚢取物
Q : MySQL 的 Primary Key 更新的開銷非常大?
43/69
探嚢取物
Q : MySQL 的 Primary Key 更新的開銷非常大?
PostgreSQL 更新的 Column 為 Index 時,沒有 HOT-updated 效果,且全 Index 皆需要更新。
MySQL 雖然沒有這個問題,但若是 Primary Key 更新時,問題也是很嚴重。
44/69
探嚢取物
Q : MySQL 的 Primary Key 更新的開銷非常大?
PostgreSQL 更新的 Column 為 Index 時,沒有 HOT-updated 效果,且全 Index 皆需要更新。
MySQL 雖然沒有這個問題,但若是 Primary Key 更新時,問題也是很嚴重。
但通常 Primary Key 是不會更新的。
45/69
探嚢取物
46/69
《業務需求是什麼》
➀更新頻繁 (UPDATE-heavy)
➁無模式 (Schemaless)
➂異地同步
47/69
探嚢取物
Q :寫次數放大?
48/69
探嚢取物
Q :寫次數放大?
➀場景一: Primary Key 更新時
➁場景二: N 個 Secondary Index中的 1 個更新時
➂場景三:更新的欄位不是 Index 時
49/69
探嚢取物
Q :寫次數放大?
➀場景一: Primary Key 更新時
➊更新的 Row 在原長度內
(MySQL) ? I/O
(PostgreSQL) ? I/O
➋更新的 Row 不在原長度內,且發生 Page split
(MySQL) ? I/O
(PostgreSQL) ? I/O
50/69
探嚢取物
Q :寫次數放大?
➁場景二: 1 個 Secondary Index中的 1 個更新時
➊更新的 Row 在原長度內
(MySQL) ? I/O
(PostgreSQL) ? I/O
➋更新的 Row 不在原長度內,且發生 Page split
(MySQL) ? I/O
(PostgreSQL) ? I/O
51/69
探嚢取物
Q :寫次數放大?
➁場景二: N 個 Secondary Index中的 1 個更新時
➊更新的 Row 在原長度內
(MySQL) ? I/O
(PostgreSQL) ? I/O
➋更新的 Row 不在原長度內,且發生 Page split
(MySQL) ? I/O
(PostgreSQL) ? I/O
52/69
探嚢取物
Q :寫次數放大?
➂場景三:更新的欄位不是 Index 時
➊更新的 Row 在原長度內
(MySQL) ? I/O
(PostgreSQL HOT-updated) ? I/O
➋更新的 Row 不在原長度內,且發生 Page split
(MySQL) ? I/O
(PostgreSQL) ? I/O
53/69
《業務需求是什麼》
➀更新頻繁 (UPDATE-heavy)
➁無模式 (Schemaless)
➂異地同步
54/69
探嚢取物
Q :長事務?
55/69
探嚢取物
Q :長事務?
InnoDB 回滾 Rollback Segment 很昂貴。
尤其當長事務常發生時,可能常讀取 Older data ,效能很差。
56/69
探嚢取物
Q :長事務?
InnoDB 回滾 Rollback Segment 很昂貴。
尤其當長事務常發生時,可能常讀取 Older data ,效能很差。
但通常事務 (transaction) 回滾的機率是低的。
57/69
探嚢取物
Q :作者:看我文章中的測試嗎,每秒 13萬持續強力更新壓測
我的測試機AWS EC2 c4.xlarge (4 vCPU)
58/69
59/69
60/692015
High Concurrent Write?(Hotspot:UPDATE)
《MySQL》
直接 UPDATE在同一 Row,通常不會造成該 Page的大小變化。
《 PostgreSQL》
盡量在同一 Page寫入新的 Row,但若該 Page空間不足時,則會另新建一 Page寫入。
Fragmentation? VACUUM?
61/692015
High Concurrent Write?(Hotspot:UPDATE)
《 PostgreSQL》
PostgreSQL天生容易遇到 Index bloat的問題。
Ref: PostgreSQL 9.0 High Performance [PACKT] (2010) (p171)
62/692015
High Concurrent Write?(Hotspot:UPDATE)
Ref: http://www.slideshare.net/denishpatel/deploying-maximum-ha-architecture-with-postgresql (p28)
63/69
《業務需求是什麼》
➀更新頻繁 (UPDATE-heavy)
➁無模式 (Schemaless)
➂異地同步
64/69
異地同步
Q : Physical replication vs. Logical replication?
MySQL 只有 Logical replication;
PostgreSQL 9.4之前只有 Physical replication 。
65/69
異地同步
Q : Physical replication vs. Logical replication?
PostgreSQL送出WAL ,而MySQL送出 commands 。
送出WAL 有一些問題,因為它是直接修改 disk 的資料,所以可能會造成一些問題。包括 data corruption導致整個資料庫下線。
它對於 versioning 版本號的問題非常敏感,並且如果無法確保我們能支持很多 versioning 版本號的replicating 到同一台機器時,這會變得非常困難。
66/69
異地同步
Q : Physical replication vs. Logical replication?
Physical replication 比 logical replication 快,因為它在 replication stream中含 index pointer ,允許 insert直接進到 index ,比需要先找到該 index位置再 insert 快。
這很有效率,但確實 replication bandwidth 需要比較多。
67/69
異地同步
Q : Physical replication vs. Logical replication?
statement-based replication對 bandwidth 較有效率。但對接收端的伺服器效能並不好。
且可能導致很多 replication 非預期的問題,導致需要排錯。
68/69
最後
PostgreSQL 開發團隊開始深入思考Uber遇到的問題,並著手改善,其中包括HOT 的寫入次數放大問題。
69/69
i
Ref: https://www.postgresql.org/message-id/CABOikdMop5Rb_RnS2xFdAXMZGSqcJ-P-BY2ruMd%2BbuUkJ4iDPw%40mail.gmail.com