hiỆu suẤt cỦa hai bỘ mà hoÁ video h.265 vÀ...

14
ĐẠI HC QUC GIA HÀ NI TRƯỜNG ĐẠI HC CÔNG NGHTRẦN DUY XUYÊN ĐÁNH GIÁ, PHÂN TÍCH VÀ SO SÁNH HIU SUT CA HAI BMÃ HOÁ VIDEO H.265 VÀ H.264. LUẬN VĂN THẠC SĨ NGÀNH CNG NGHỆ THUẬT ĐIỆN T, TRUỀN THNG HÀ NI - 2016

Upload: others

Post on 25-Dec-2019

4 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRẦN DUY XUYÊN

ĐÁNH GIÁ, PHÂN TÍCH VÀ SO SÁNH

HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ

VIDEO H.265 VÀ H.264.

LUẬN VĂN THẠC SĨ

NGÀNH C NG NGHỆ THUẬT ĐIỆN T , TRU ỀN TH NG

HÀ NỘI - 2016

Page 2: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRẦN DUY XUYÊN

ĐÁNH GIÁ, PHÂN TÍCH VÀ SO SÁNH

HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ

VIDEO H.265 VÀ H.264.

Ngành: C ng ngh K thuật Đi n t , Truy n th ng

Chuyên ngành: K thuật Đi n t

Mã số: 60520203

LUẬN VĂN THẠC SĨ

NGÀNH C NG NGHỆ THUẬT ĐIỆN T , TRU ỀN TH NG

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. LÊ V HÀ

HÀ NỘI - 2016

Page 3: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

LỜI CAM ĐOAN

T i xin cam đoan luận văn tốt nghi p “Đánh giá, phân tích và so sánh hiệu suất

của hai bộ mã hoá video H.265 và H.264.” là công trình nghiên cứu khoa học của

riêng tôi được thực hi n dưới sự hướng dẫn của TS Lê Vũ Hà. Luận văn tốt nghi p là

kết quả của quá trình nghiên cứu độc lập, không sao chép công trình nghiên cứu của

bất kỳ ai khác. Các số li u trong luận văn được s dụng trung thực, trích dẫn từ những

nguồn hợp pháp và đáng tin cậy.

Hà Nội, ngày 19 tháng 07 năm 2016

Người thực hi n

Tr n Duy Xuyên

Page 4: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

1

MỤC LỤC

MỤC LỤC ....................................................................................................................... 1

DANH MỤC BẢNG BIỂU ............................................................................................. 3

DANH MỤC H NH V .................................................................................................. 4

DANH MỤC THUẬT NGỮ VIẾT TẮT ........................................................................ 5

TÓM TẮT ........................................................................................................................ 7

Chương 1. Giới thi u ....................................................................................................... 8

Chương 2. Tổng quan v H.265/HEVC ........................................................................ 11

2.1. Cấu trúc bậc cao của H.265/HEVC .................................................................... 11

2.1.1. NAL và các loại hình ảnh ............................................................................. 11

2.1.2. Các tập tham số ............................................................................................. 14

2.2. Cấu trúc mã hoá .................................................................................................. 15

2.3. Cấu trúc khối và k thuật song song ................................................................... 16

2.3.1. Phân vùng khối ............................................................................................. 16

2.3.2. Phân vùng hình ảnh....................................................................................... 21

2.3.3. X lý song song trong H.265/HEVC ............................................................ 22

2.4. Kết luận ............................................................................................................... 27

Chương 3. Dự đoán nội ảnh và dự đoán liên ảnh .......................................................... 28

3.1. Dự đoán nội ảnh .................................................................................................. 28

3.1.1. Thiết lập mẫu tham chiếu ............................................................................. 29

3.1.2. Dự đoán mẫu nội ảnh .................................................................................... 33

3.1.3. Chế độ mã hóa nội ảnh ................................................................................. 36

3.2. Dự đoán liên ảnh ................................................................................................. 38

3.2.1. Dự đoán vector chuyển động tiên tiến (AMVP) ........................................... 39

3.2.2. Nhập khối dự đoán liên ảnh .......................................................................... 40

3.2.3. Nội suy mẫu phân số ..................................................................................... 41

3.3. Bộ lọc vòng trong ................................................................................................ 43

3.4. Kết luận ............................................................................................................... 45

Chương 4. Những s a đổi đ xuất v dự đoán nội ảnh ................................................. 46

4.1. Chế độ dự đoán nội ảnh cơ bản trong H.265/HEVC .......................................... 46

4.2. Thuật toán chọn chế độ nội ảnh nhanh ............................................................... 48

Page 5: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

2

4.3. Quá trình dự đoán nội ảnh nhanh bằng k thuật song song ................................ 49

Chương 5. Tổng kết ....................................................................................................... 52

5.1. Kết luận ............................................................................................................... 52

5.3. Hướng phát triển tiếp theo .................................................................................. 53

DANH MỤC T I LI U THAM KHẢO ...................................................................... 54

Page 6: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

3

DANH MỤC BẢNG BIỂU

Bảng 2-1: Các loại gói Non-VCL NAL[1] ................................................................... 13

Bảng 2-2: Các loại gói VCL NAL[1] ............................................................................ 13

Bảng 2-3: Kích thước khối bù chuyển động đã được hỗ trợ trong H.265/HEVC và

trong k thuật trước đây[1] ............................................................................................ 20

Bảng 3-1: Sự khác nhau cơ bản của dự đoán nội ảnh giữa ........................................... 29

H.265/HEVC và H.264/AVC[1] ................................................................................... 29

Bảng 3-3: Giá trị của tham số B[1] ............................................................................... 34

Bảng 3-2: Giá trị của tham số A[1] ............................................................................... 34

Bảng 3-4: Chế độ dự đoán nội ảnh màu dựa theo chế độ dự đoán nội ảnh[1] ............. 38

Page 7: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

4

DANH MỤC H NH V

Hình 2-1: Cấu trúc tiêu đ gói NAL [1] ........................................................................ 12

Hình 2-2: Các tập tham số trong H.265/HEVC[1] ....................................................... 14

Hình 2-3: Cấu trúc mã hóa video của H.264/AVC ....................................................... 15

Hình 2-4: Cấu trúc mã hóa video Hybrid của phiên bản H.265/HEVC đ u tiên ......... 15

Hình 2-6: Ví dụ v phân vùng hình ảnh thành nhi u CTU 64x64[1] ........................... 17

Hình 2-5: Ví dụ phân vùng hình ảnh thành nhi u khối macro 16x16[1] ...................... 17

Hình 2-7: Ví dụ v phân vùng CTU theo thứ tự chi u sâu ........................................... 18

Hình 2-8: Tất cả các kích thước của PU trong H.265/HEVC[1] .................................. 19

Hình 2-9: Ví dụ v chia một CTB thành nhi u TBs ..................................................... 20

Hình 2-10: Mối quan h giữa CU, PU và TU trong H.265/HEVC .............................. 21

Hình 2-11: Cấu trúc các mảnh độc lập trong H.265/HEVC[1] .................................... 21

Hình 2-12: Ví dụ v s dụng tile chia hình ảnh thành 9 vùng, đường gạch thể hi n

ranh giới các vùng. [1] ................................................................................................... 25

Hình 2-13: Quy trình của tiles ...................................................................................... 25

Hình 2-14: X lý song song sóng trước ....................................................................... 26

Hình 3-1: Ví dụ v các chế độ dự đoán nội ảnh của H.265/HEVC[1] ........................ 29

Hình 3-2: Quá trình thay thế mẫu (a) Mẫu tham chiếu trước khi thực hi n quá trình,

các mẫu không có sẵn ký hi u bằng màu xám .............................................................. 30

(b) Mẫu tham chiếu sau khi thực hi n quá trình[1] ....................................................... 30

Hình 3-3: Quá trình lọc mịn (a) Bước thứ nhất (b) bước thứ hai[1] ............................. 32

Hình 3-4: Các chế độ góc trong dự đoán nội ảnh [1] ................................................... 33

Hình 3-5: Ví dụ v vi c đổi chỗ mấu tham chiếu bên trái đểm ở rộng hàng tham chiếu

dọc ở chế độ nội ảnh 23[1] ............................................................................................ 35

Hình 3-6: Ví dụ v vi c s dụng chế độ dự đoán planar nội ảnh ................................. 36

(a) Tính thành ph n ngang (b) Tính thành ph n dọc ..................................................... 36

(c) giá trị trung bình của (a) và (b) [1] ........................................................................... 36

Hình 3-7: Khái ni m cơ bản v dự đoán liên ảnh[1] .................................................... 38

Hình 3-8: Quá trình dự đoán liên ảnh trong H.265/HEVC[1] ...................................... 39

Hình 3-9: Các khối có các ứng viên vector chuyển động[1]. ....................................... 40

Hình 3-10: (a) Các ứng viên có thể chọn trong danh sách sát nhập của khối X, chúng

sáp nhập thành cùng dòng đậm, (b) Các bước kiểm tra dư để thêm ứng viên vào danh

sách. [1] ......................................................................................................................... 41

Hình 3-11: Vị trí mẫu và phân số để nội suy [1] ......................................................... 42

Hình 3-12: De-blocking filter và SAO trong H.265/HEVC[1] .................................... 43

Hình 3-13: 4 mẫu và vị trí của chúng giữa vùng ranh giới của 2 khối P và Q[1] ........ 44

Hình 4-1: Quá trình quyết định chế độ dự đoán nội ảnh trong H.265/HEVC[5] ......... 46

Hình 4-2: Quá trình lựa chọn chế độ nội ảnh đã được s a đổi ..................................... 49

Hình 4-3: WPP bước thứ nhất ...................................................................................... 50

Hình 4-4: Luồng 4 bắt đ u quá trình đồng thời với bước đ u tiên ............................... 50

Hình 4-5: Luồng 4, mã hóa entropy đang chạy theo thứ tự quét .................................. 51

Page 8: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

5

DANH MỤC THUẬT NGỮ VIẾT TẮT

A

AMVP: Advance Motion Vector

Prediction Dự đoán vector chuyển động tiên tiến

AVC: Advance Video Coding

(H.264/AVC) Nén video tiên tiến

C

CTU: Coding Tree Unit Đơn vị mã hóa cây

CTB: Coding Tree Block Khối mã hóa cây

CU: Coding Unit Đơn vị mã hóa

CB: Coding Block Khối mã hoá

CRA: Clean Random Access Truy cập ngẫu nhiên

H

HEVC: High Efficiency Video Coding Mã hóa video hi u suất cao

IDR: Instantaneous Decoding Refresh Giải mã tức thời

IRAP: Intra Random Access Point Điểm truy cập ngẫu nhiên nội ảnh

N

NAL: Network Abstract Layer Lớp trừu tượng mã hóa mạng

M

MPM: Most Probable Mode Chế độ dự đoán đúng nhất

Page 9: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

6

P

PB: Prediction Block Khối dự đoán

PU: Prediction Unit Đơn vị dự đoán

S

STSA: Step-wise Temporal Sublayer

Access Truy cập t ng phụ tạm thời

T

TB: Transform Block Khối biến đổi

TU: Transform Unit Đơn vị biến đổi

V

VCL: Video Coding Layer Lớp mã hóa video

W

WPP: Wave-front Parallel Processing K thuật x lý song song sóng trước

Page 10: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

7

TÓM TẮT

Video nếu kh ng được nén sẽ có độ phân giải và chất lượng cao nhưng kh ng thể

chuyển tín hi u qua mạng truy n th ng bởi vì dung lượng quá lớn, trong khi nhu c u

xem, s dụng video ngày càng cao. Do đó, các k thuật mã hóa nén video đã được

phát triển và cải thi n trong nhi u thập kỷ để khắc phục vấn đ này, giảm thiểu dung

lượng video, giúp cho vi c truy n dẫn video qua mạng đơn giản hơn. Hi n nay,

H.264/AVC (Advance Video Coding - Nén video tiên tiến) là tiêu chuẩn nén mã hóa

video được s dụng phổ biến trên toàn thế giới. Tuy nhiên, nhu c u v video chất

lượng cao hơn, tốc độ khung hình cao hơn, chẳng hạn như video HD, UltraH, 4K và

8K, thì H.264/AVC vẫn chưa có khả năng nén tốt nhất. Vì vậy, một chuẩn nén video

mới đã được phát triển, phiên bản đ u tiên của H.265/HEVC đã được c ng bố vào

tháng 1 năm 2013, kh ng chỉ có khả năng mã hoá tốt những video có độ phân giải cao

mà còn giảm được dung lượng video mã hoá một n a so với chuẩn nén H.264/AVC.

Mục tiêu của luận án là tìm hiểu k thuật nén video mới nhất hi n nay, đó là

H.265/HEVC (High Efficiency Video Coding - Mã hóa video hi u suất cao). Luận án

sẽ đưa ra những so sánh v k thuật nén H.265/HEVC và H.264/AVC, để biết lý do tại

sao hi u quả nén của H.265/HEVC tốt hơn 50% so với chuẩn nén trước đó

(H.264/AVC). Ngoài ra, H.265/HEVC là một chuẩn nén mới và còn rất nhi u k thuật

có thể cải tiến tốt hơn, nên th ng qua quá trình tìm hiểu so sánh, t i sẽ tìm một số

phương pháp để cải thi n hi u suất hoặc giảm độ phức tạp, đặc bi t là trong k thuật

dự đoán nội ảnh của H.265/HEVC.

Page 11: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

8

Chương 1

Giới thiệu

Ngày nay, nhu c u s dụng những dịch vụ truy n th ng đa phương ti n ngày càng

cao, đặc bi t là video. Cùng với đó, những yêu c u v chất lượng, tốc độ truy n tải của

video cũng ngày một khắt khe hơn. Từ đó, một vấn đ phát sinh, đó là vấn đ v dung

lượng của một video. Video càng có độ phân giải cao, chất lượng cao thì đi kèm với nó

là dung lượng cao. Một video chưa qua x lý nén có dung lượng rất lớn. Ví dụ chỉ với

video có độ phân giải là 720x576, 25 fps, độ sâu màu 8 bit c n tốc độ bit:

Hay, với HDTV, một video có độ phân giải cao là 1920x1080, độ sâu ảnh 8 vẫn

25fps, thì tốc độ bit là:

Vậy nên cho dù là những h thống máy tính mạnh nhất, nếu kh ng phải vấn đ

băng th ng thì quản lý lượng dữ li u video lớn cũng là một vấn đ khó khăn. Tuy

nhiên, video là một chuỗi ảnh mà sự khác nhau giữa các ảnh là rất nhỏ, do đó tồn tại

một lượng th ng tin thừa rất lớn nếu video được truy n tải toàn bộ. Thay vì truy n hai

ảnh độc lập, ta có thể truy n chỉ một ảnh và sự khác nhau của nó với ảnh còn lại, qua

đó giảm lượng dữ li u c n truy n, giảm tốc độ bit. Nén video ra đời nhằm giải quyết

vấn đ dung lượng và truy n tải video trên. Phát triển qua nhi u thập kỉ, nhi u chuẩn

Page 12: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

9

nén video đã được c ng bố và s dụng. Một số chuẩn nén video là H.261,

H.262/MPEG-1, H.263, MPEG-4, và H.264/AVC.

Nén video đã phát triển được trong một thời gian dài, giúp giảm đáng kể dung

lượng của một video, tăng khả năng truy n video qua các kênh truy n có băng th ng

khác nhau. Đến nay, H.264/AVC (Advance Video Coding), có tên đ y đủ là MPEG-4

Part 10, Advanced Video Coding (MPEG-4 AVC) và là k thuật nén phổ biến nhất.

Mục tiêu của H.264/AVC là tập trung vào sự cải tiến trong mã hóa, kiến trúc dữ

li u và sự linh hoạt. H.264/AVC đã đạt được khả năng mã hóa tốt hơn so với chuẩn

nén trước đó là H.263 và MPEG-2, giảm một n a lượng bit-rate c n thiết để hiển thị

một video trong khi người dùng cảm nhận v chất lượng video vẫn được đảm bảo.

Hiểu theo một cách khác, đó là khả năng tăng gấp đ i số lượng kênh truy n video

trong một mạng truy n video quảng bá. Video được nén qua H.264/AVC có thể truy n

trong các kênh truy n khác nhau v các độ trễ cũng như khả năng mất dữ li u. Ngoài

ra, những video đó có khả năng truy n real-time (thời gian thực) qua mạng và người

xem có thể truy cập ngẫu nhiên mà kh ng c n phải truy cập từ đ u video.

Nhu c u v xem, thưởng thức các video có chất lượng cao ngày càng lớn, chẳng

hạn như độ phân giải cao (HD, ULTRA HD, 4K, 8K), tốc độ khung hình cao hơn và

độ trung thực cao hơn, trong khi kh ng có gì thay đổi v khả năng truy n tín hi u qua

mạng. Bên cạnh đó, video hi n nay ngày càng được s dụng trong nhi u ứng dụng

khác nhau, như ứng dụng di động, chat video theo thời gian thực, camera di động. Do

đó, video có lượng truy n tải lớn nhất trên các mạng truy n th ng, vì vậy chúng ta c n

một chuẩn nén mới tốt hơn.

Mã hóa video hi u suất cao (H.265/HEVC) là tiêu chuẩn nén mới nhất, nhằm mục

đích cải thi n đáng kể hi u suất nén, độ phân giải của tất cả các loại video, và các ứng

dụng đa phương ti n. Chính thức ra phát triển từ tháng 1 năm 2010 với tên gọi là

HEVC - High Efficiency Video Coding (Mã hóa video hi u suất cao), phiên bản đ u

tiên đã được hoàn thành, quy chuẩn H.265 và c ng bố vào tháng 1 năm 2013, bởi

Nhóm các chuyên gia hình ảnh động ISO/IEC (MPEG) và Nhóm các chuyên gia mã

Page 13: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

54

ANH MỤC TÀI IỆU THAM HẢO

[1] . Vivienne Sze, Madhukar Budagavi, Gary J.Sullivan, “High Efficiency Video

Coding (HEVC) Algorithms and Architectures”, USA.

[2] . Gary J.Sullivan, Jens-Rainer Ohm, Woo-Jin Han, Thomas Weigand, “Overview

of the High Efficiency Video Coding (HEVC) standard”, IEEE Transactions of

recruiting.

[3] . Marta Merlo Serrano, “Improved Intra-Prediction for Video Coding”, Master

Thesis, Queen Mary University of London, July 2014.

[4] . Frank Bossen, Benjamin Bross, Karsten Suhring, “HEVC Complexity and

Implementation Analysis”, Circuits and Systems For Video Technology, Dec.

2012.

[5] . Liang Zhao, Li Zang, Siwei Ma, Debin Zhao, “Fast Mode Decision Algorithm

for Intra Prediction in HEVC”.

[6] . Do Kyung Lee, Je-Chang Jeong, “Fast Intra Coding by using RD Cost

Candidate Elimination for High Efficiency Video Coding”, the World Congress

on Engineering and Computer science 2014, Vol. I, San Francisco, USA.

[7] . Yanan Zhao, Li Song, Xiangwen Wang, Min Chen, Jia Wang, “Efficient

realization of parallel HEVC intra coding”.

[8] . Qin Yu, Liang Zhao, Siwei Ma, “Parallel AMVP Candidate list construction

for HEVC”.

[9] . Mauricio Alvarez Mesa, Chi Ching Chi, Thomas Schierl and Ben Juurlink,

“Evaluation of parallelization strategies for the emerging HEVC standard”,

Heinrich Hertz Institute, Berlin, Germany.

[10] . H. Brahmasury Jain and K.R. Rao, “Fast intra mode decision in High

Efficiency Video Coding”

[11] . Heming Sun, Dajiang Zhou, Satoshi Goto, “A low-complexity HEVC intra

prediction algorithm based on level and mode filtering”, IEEE International

Conference on Multimedia and Expo, 2012.

[12] . Roman I. Chernyak, “Analysis of the intra prediction in H.265/HEVC”,

Mathematical Sciences, Vol. 8, 2014.

[13] . Xu X., Cohen R., Vetro, Sun H., “Predictive coding of intra prediction modes

for High Efficiency Video Coding”, Mistubishi electric research laboratories,

May 2012.

[14] . Haijun Lei, Zhongwang Yang, “Fast intra prediction mode decision for High

Efficiency Video Coding”, 2nd

International Symposium on Computer,

Communication, Control and Automation, 2013.

Page 14: HIỆU SUẤT CỦA HAI BỘ MÃ HOÁ VIDEO H.265 VÀ H.264.repository.vnu.edu.vn/bitstream/VNU_123/16736/1/00050007369.pdfLỜI CA: Đ

55

[15] . Shohei Matsuo, Seishi Takamura and Atsushi Shimizu, “Modification of intra

angular prediction in HEVC”, NTT Media Intelligence Laboratories, NTT

Corporation, Yokosuka, Japan.

[16] . Younhee Kim, DongSan Jun, Soon-heung Jung, Jin Soo Choi, and Jinwoong

Kim, “A fast intra-prediction method in HEVC using rate-distortion estimation

based on hadamard transform”, ETRI Journal, Vol. 35, Num. 2, April 2013.

[17] Thomas Wiegand, Gary J. Sullivan, “The H.264/AVC Video Coding Standard”,

IEEE Signal processing magazine, 03/2007.