hỌc viỆn khoa hỌc vÀ cÔng nghỆ -...

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

NGUYỄN VĂN QUYỀN

NGHIÊN CỨU NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH

THEO TIẾP CẬN ĐẠI SỐ GIA TỬ

LUẬN ÁN TIẾN SĨ TOÁN HỌC

Hà Nội – 2018

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA VÀ CÔNG NGHỆ

NGUYỄN VĂN QUYỀN

NGHIÊN CỨU NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH

THEO TIẾP CẬN ĐẠI SỐ GIA TỬ

Chuyên ngành: Cơ sở Toán học cho Tin học

Mã số : 9 46 01 10

LUẬN ÁN TIẾN SĨ TOÁN HỌC

NGƢỜI HƢỚNG DẪN KHOA HỌC:

1. TS. TRẦN THÁI SƠN

2. PGS.TS. NGUYỄN TÂN ÂN

Hà Nội – 2018

i

LỜI CAM ĐOAN

Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả.

Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không

sao chép từ bất kỳ một nguồn nào và dƣới bất kỳ hình thức nào. Việc tham

khảo các nguồn tài liệu đã đƣợc thực hiện trích dẫn và ghi nguồn tài liệu tham

khảo đúng quy định.

Tác giả luận án

Nguyễn Văn Quyền

ii

LỜI CẢM ƠN

Luận án đƣợc hoàn thành dƣới sự hƣớng dẫn tận tình của TS. Trần Thái

Sơn và PGS.TS. Nguyễn Tân Ân. Lời đầu tiên, xin bày tỏ lòng kính trọng và

biết ơn sâu sắc tới hai Thầy.

Tôi xin chân thành cảm ơn PGS.TSKH. Nguyễn Cát Hồ, TS. Ngô

Hoàng Huy đã đóng góp những ý kiến quý báu cả về học thuật và kinh

nghiệm nghiên cứu giúp đỡ tôi trong suốt quá trình thực hiện luận án.

Tôi xin chân thành cảm ơn Ban lãnh đạo Học viện Khoa học và Công

nghệ, Bộ phận quản lý nghiên cứu sinh - Học viện Khoa học và Công nghệ đã

tạo mọi điều kiện thuận lợi trong quá trình hoàn thành và bảo vệ luận án.

Xin cảm ơn các đồng nghiệp tại Phòng Nhận dạng và Công nghệ tri

thức, Viện Công nghệ Thông tin đã đóng góp những ý kiến thiết thực để tôi

hiệu chỉnh lại các tiếp cận nghiên cứu của mình.

Xin cảm ơn Ban Giám hiệu Trƣờng Đại học Hải Phòng, các đồng

nghiệp tại Phòng Quản lý sau đại học – Trƣờng Đại học Hải Phòng đã luôn

động viên giúp đỡ tôi trong công tác để tôi có thời gian tập trung nghiên cứu

và thực hiện luận án.

Đặc biệt tôi xin bày tỏ lòng biết ơn sâu sắc tới Cha, Mẹ, Vợ và các anh,

chị em trong gia đình, những ngƣời luôn dành cho những tình cảm nồng ấm

và sẻ chia những lúc khó khăn trong cuộc sống, luôn động viên giúp đỡ tôi

trong quá trình nghiên cứu. Luận án cũng là món quà tinh thần mà tôi trân

trọng gửi tặng đến các thành viên trong Gia đình.

Tôi xin trân trọng cảm ơn!

iii

MỤC LỤC

LỜI CAM ĐOAN .............................................................................................. I

LỜI CẢM ƠN ................................................................................................... II

MỤC LỤC ....................................................................................................... III

DANH MỤC CÁC TỪ VIẾT TẮT VÀ KÝ HIỆU ........................................ VI

DANH MỤC CÁC BẢNG.............................................................................. IX

DANH MỤC HÌNH VẼ ................................................................................... X

MỞ ĐẦU ........................................................................................................... 1

1. Tính cấp thiết của đề tài ................................................................................ 1

2. Mục tiêu, phạm vi nghiên cứu của luận án ................................................. 10

3. Phƣơng pháp và nội dung nghiên cứu ......................................................... 10

4. Cấu trúc luận án .......................................................................................... 11

5. Kết quả đạt đƣợc của luận án ...................................................................... 12

CHƢƠNG 1. TỔNG QUAN VỀ NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH VÀ

TIẾP CẬN ĐẠI SỐ GIA TỬ GIẢI HỆ LUẬT MỜ ....................................... 13

1.1. Đại số gia tử: một số vấn đề cơ bản ......................................................... 13

1.1.1. Các khái niệm cơ bản về đại số gia tử .................................................. 13

1.1.2. Vấn đề định lƣợng ngữ nghĩa trong đại số gia tử ................................. 15

1.1.3. Phƣơng pháp lập luận xấp xỉ dựa trên ĐSGT ....................................... 23

1.2. Khả năng xấp xỉ hàm của phƣơng pháp HA-IRMd và ứng dụng ............ 24

1.2.1. Khả năng xấp xỉ hàm............................................................................. 24

1.2.2. Ứng dụng việc xấp xỉ hàm trong xây dựng luật .................................... 26

1.2.3. Phƣơng pháp lập luận tối ƣu dựa trên ĐSGT ....................................... 27

1.2.4. Hệ tham số của phƣơng pháp nội suy gia tử ......................................... 28

1.3. Tổng quan về nâng cao độ tƣơng phản ảnh ............................................. 30

1.3.1. Tăng cƣờng độ tƣơng phản ảnh dựa trên logic mờ ............................... 30

1.3.2. Một số thuật toán tăng cƣờng theo tiếp cận mờ .................................... 30

iv

1.4. Một số thuật toán nâng độ sáng tối của điểm ảnh .................................... 35

1.4.1. Toán tử tăng cƣờng ............................................................................... 35

1.4.2. Tăng cƣờng với toán tử Hyperbol ......................................................... 36

1.4.3. Tăng cƣờng dựa trên suy diễn hệ luật mờ (Fuzzy rule) ........................ 37

1.4.4. Một số độ đo chất lƣợng tăng cƣờng ảnh .............................................. 38

1.5. Thuật toán nâng cao độ tƣơng phản ảnh của Cheng ................................ 38

1.6. Các chỉ số đánh giá .................................................................................. 41

1.7. Tập dữ liệu thực nghiệm .......................................................................... 43

CHƢƠNG 2. BIẾN ĐỔI ẢNH ĐA KÊNH VÀ XÂY DỰNG HÀM BIẾN

ĐỔI CHỮ S THEO TIẾP CẬN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG

CAO ĐỘ TƢƠNG PHẢN ẢNH ĐA KÊNH .................................................. 44

2.1. Biến đổi ảnh đa kênh ................................................................................ 45

2.1.1. Ƣớc lƣợng nhiều dải động mức xám dựa vào phân cụm mờ FCM ...... 45

2.1.2. Lƣợc đồ xám mờ với phân cụm FCM ................................................... 46

2.1.3. Ƣớc lƣợng nhiều dải động mức xám dựa vào lƣợc đồ xám mờ ........... 48

2.1.4. Biến đổi kênh ảnh .................................................................................. 50

2.1.5. Nâng cao độ tƣơng phản ảnh kết hợp với biến đổi ảnh ........................ 51

2.1.6. Thử nghiệm phép biến đổi mờ hóa ảnh sử dụng thuật toán 2.2. ........... 53

2.2. Thiết kế hàm biến đổi độ xám dạng chữ S với tiếp cận mờ .................... 57

2.2.1. Đánh giá việc xây dựng hàm biến đổi mức xám dạng chữ S ............... 58

2.2.2. Xây dựng toán tử tăng cƣờng dựa trên đại số gia tử ............................. 61

2.2.3. Thực nghiệm ......................................................................................... 67

2.2.4. So sánh với kết quả của các phƣơng pháp gián tiếp ............................. 70

2.3. Kết quả khác ............................................................................................. 75

CHƢƠNG 3. XÂY DỰNG ĐỘ ĐO THUẦN NHẤT MỚI THEO TIẾP CẬN

ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH

ĐA KÊNH ....................................................................................................... 78

3.1. Xây dựng độ đo thuần nhất ...................................................................... 78

v

3.1.1. Độ thuần nhất của Cheng ...................................................................... 78

3.1.2. Độ đo thuần nhất với toán tử t-norm ..................................................... 80

3.1.3. Xây dựng độ đo thuần nhất với tiếp cận ĐSGT .................................... 82

3.2. Nâng cao độ tƣơng phản ảnh mầu với độ đo thuần nhất đề xuất ............. 89

3.3. Thực nghiệm ............................................................................................ 93

3.3.1. Tính độ thuần nhất kênh ảnh ................................................................. 93

3.3.2. Đánh giá độ đo HA-HRM ..................................................................... 94

3.4. Các kết quả và luận giải ........................................................................... 94

KẾT LUẬN ................................................................................................... 101

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ .............................................. 102

TÀI LIỆU THAM KHẢO ............................................................................. 103

PHỤ LỤC ...................................................................................................... 112

vi

DANH MỤC CÁC TỪ VIẾT TẮT VÀ KÝ HIỆU

Từ viết tắt Tên đầy đủ (và tạm dịch)

ĐLNN Định lƣợng ngữ nghĩa

ĐSGT ĐSGT

ĐTP Độ tƣơng phản

NCĐTP Nâng cao độ tƣơng phản

LLXX Lập luận xấp xỉ

ACO Ant Colony Optimization

Tối ƣu đàn kiến

AS hoặc

ACS

Ant Colony System

(Hệ kiến)

AIVHE Adaptively Increasing the Value of lƣợc đồ xám

(Tăng giá trị lƣợc đồ xám thích ứng)

FAM Fuzzy Associative Memory

(Bộ nhớ kết hợp mờ)

FCM Fuzzy C-mean

(Thuật toán phân cụm mờ C-mean)

FMCR Fuzzy multiple conditional reasoning

(Hệ mờ đa điều kiện)

HA Hedge algebra

(Đại số gia tử)

HA-IRMd Hedge Algebras-based Interpolative Reasoning Method

(Phƣơng pháp lập luận nội suy dựa trên đại số gia tử)

HA-HRM Hedge Algebras – Homogeneity Measure

HE Histogram equalization

(Cân bằng lƣợc đồ xám)

HIS Hệ biểu diễn mầu HIS

HSV Hệ biểu diễn mầu HSV (Hue, Saturation, Value)

NINT New Intensifycation

RGB Hệ biểu diễn mầu RGB (Red, Green, Blue)

SAM Semantic Associative Memory

(Bộ nhớ kết hợp ngữ nghĩa)

SQMs Ánh xạ định lƣợng ngữ nghĩa

YIQ Hệ biểu diễn mầu YIQ

vii

Ký hiệu

Ký hiệu Tên đầy đủ

I Ảnh đa kênh nói chung

M, N MxN là kích thƣớc theo pixel của ảnh đầu vào.

1, KI K kênh ảnh {I1,I2,…,IK} của ảnh I

IR,IG,IB Kênh ảnh R, G và B của ảnh mầu trong biểu diễn mầu RGB

IS,IH,IV Kênh ảnh H, S và V của ảnh mầu trong biểu diễn mầu HSV

Lk,min, Lk,max Miền giá trị mức xám của kênh ảnh thứ k của ảnh đầu vào

Lk,min

Giá trị mức xám nhỏ nhất theo kênh Ik của ảnh I, thông thƣờng

Lk,min = 0

Lk,max

Giá trị mức xám lớn nhất theo kênh Ik của ảnh I, thông thƣờng

Lk,max = 255

H isk

I Lƣợc đồ xám của một kênh ảnh Ik H is (g )= # { ( i ,j ) :I ( i ,j )= g }

kI k

D dxd là kích thƣớc cửa sổ lân cận có tâm là điểm ảnh (i, j).

f1,f2 f1, f2 (0, 1): Tham số xác định dải động mức xám

K Số kênh ảnh cần xử lý của ảnh đầu vào

fcut fcut (0, 1): Tham số xác định C dải động mức xám của một

kênh ảnh

ij Giá trị trung bình mức xám tại điểm ảnh (i, j)

Giá trị mức xám không thuần nhất tại điểm ảnh (i, j)

Độ xám tại điểm ảnh (i, j)

Độ tƣơng phản tại điểm ảnh (i, j)

eij Giá trị cƣờng độ biên tại điểm ảnh (i, j)

vij Độ lệch chuẩn mức xám lấy tại lân cận điểm ảnh gij

R4,ij Moment bậc 4 tại điểm ảnh (i, j)

Hij Giá trị entropy đại điểm ảnh (i, j)

viii

i j Đo độ thuần nhất tại điểm ảnh (i, j)

i jH O Giá trị kết nhập dạng f(Eij, Hij, Vij, R4,ij) tại điểm ảnh (i, j)

i j Số mũ khuếch đại tại điểm ảnh (i, j)

CM Chỉ số độ tƣơng phản ảnh trực tiếp

AX ĐSGT tuyến tính

AX ĐSGT tuyến tính đầy đủ

(h), fm(x) Độ đo tính mờ gia tử h và của hạng từ x

Giá trị định lƣợng theo điểm của giá trị ngôn ngữ

Khoảng tính mờ của giá trị ngôn ngữ

T t(0, 1): Tham số của phép nâng độ khuếch đại

K Số kênh ảnh cần xử lý của ảnh đầu vào

C Số cụm cần phân cụm của tổ hợp kênh ảnh đầu vào.

i,j,c Giá trị độ thuộc cụm thứ c của điểm ảnh (i, j), đầu ra của thủ

tục phân cụm FCM

fcut fcut (0, 1): Tham số xác định C dải động mức xám của một

kênh ảnh

ix

DANH MỤC CÁC BẢNG

Số hiệu

bảng

Tên bảng Trang

2.1 So sánh giá trị Havg trên kênh R, G và B của các ảnh là kết

quả của phép mờ hóa – biến đổi ảnh

54

2.2 Bảng kết quả so sánh các chỉ số khách quan giữa thuật

toán trong [17] và thuật toán đề xuất

67

2.3 So sánh kết quả phép nâng cao ĐTP ảnh mở rộng của Hint

(%) và của Cheng áp dụng cho ảnh mầu RGB và HSV

69

2.4 Giá trị chỉ số Eavg và Havg của ảnh đầu ra khi áp dụng Hint

và bốn phƣơng pháp gián tiếp của 27 ảnh trong biểu diễn

mầu HSV, trong đó các giá trị tốt nhất đƣợc in đậm

70

3.1. Các phép kết nhập giá trị địa phƣơng khác nhau 82

3.2 Mối quan hệ dấu của các gia tử 84

3.3 Bảng giá trị độ đo tính mờ và SQM tƣơng ứng với AG,

AE, AT

84

3.4 Bảng giá trị tính toán minh họa độ đo tính mờ và SQM

tƣơng ứng với AG, AE, AT

86

3.5 Bảng giá trị các mốc nội suy dựa trên toán tử AND của hệ

luật (3.5)

87

3.6 Các tham số cơ sở của ĐSGT Agr, Aep và Aho 93

3.7 Giá trị chỉ số CMR cho từng ảnh và các phƣơng pháp kết

nhập để tạo giá trị thuần nhất

95

3.8 Giá trị chỉ số CMG cho từng ảnh và các phƣơng pháp kết


95

3.9 Giá trị chỉ số CMB cho từng ảnh và các phƣơng pháp kết


96

3.10 Giá trị chỉ số Eavg cho từng ảnh và các phƣơng pháp kết


96

3.11 Giá trị chỉ số Havg cho từng ảnh và các phƣơng pháp kết


97

x

DANH MỤC HÌNH VẼ

Số hiệu

hình vẽ

Tên hình vẽ Trang

1 Dạng hàm biến mức xám chữ S trong các phép nâng cao

ĐTP

4

2 Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử

dụng toán tử tăng cƣờng mờ [72]

5

1.1 Độ đo tính mờ của biến TRUTH 17

1.2 Khoảng tính mờ của các hạng từ của biến TRUTH 20

1.3 Đồ thị toán tử INT 32

1.4 (a) Ảnh gốc, (b), (d) biểu diễn mờ với toán tử INT của kênh

R,G và B tƣơng ứng

32

1.5 Phân cụm FCM với C = 5 cụm, (a) ảnh gốc, (b)-(g) ảnh ma trận

độ thuộc cụm số 1 {µi,j,1} -5 {µi,j,5}

35

1.6 Nguyên tắc chính của tăng cƣờng ảnh mờ [29]. 35

1.7 Một số thử nghiệm nâng cao ĐTP sử dụng toán tử tăng

cƣờng

36

1.8 Ảnh kết quả sử dụng suy diễn luật if-then [31] cho ảnh ở

hình 1.4.a

37

2.1 Ảnh gốc #3(a) lƣợc đồ xám kênh R (b), giá trị độ thuộc

{i,j,4}-cụm số 4/5 (c). Lƣợc đồ xám mờ kênh R, cụm số

4/5 (d)

48

2.2 Lƣợc đồ xám của kênh V, cụm số 1 ảnh #4 (C = 5), trục

hoành biểu diễn giá trị xám, trục tung biểu thị tần suất

49

2.3 Lƣu đồ xử lý của thuật toán đề xuất 53

2.4 Ảnh mờ hóa của #1 sử dụng [16] (a), sử dụng thuật toán 2.2

(b)

54

xi

2.5 Kênh B của ảnh biến đổi sử dụng [16] (a), sử dụng thuật

toán (b).

55

2.6 Sử dụng biến đổi ảnh [16] cho ảnh #3(a), #5 (b 55

2.7 Phép mờ hóa, cột bên trái [16], cột bên phải sử dụng thuật

toán 2.2

56

2.8 Dạng hàm biến mức xám chữ S trong các phép NCĐTP 57

2.9 Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử

dụng toán tử tăng cƣờng mờ [68]

58

2.10 Hàm thuộc của 3 tập mờ dark, bright, gray (a) và của tập

mờ darker, brighter (b).

59

2.11 Nâng cao ĐTP với suy diễn luật mờ if-then (a), luật mờ

nâng cao ĐTP (b)

59

2.12 (a) Hàm thuộc của tập mờ dark, bright, gray và (b) hàm

thuộc của tập mờ darker, brighter.

60

2.13 Các hàm thuộc đƣợc thiết kế đã tạo ra hàm biến đổi hình

chữ S.

60

2.14 Phép NCĐTP sử dụng HA-IRMd cho hệ luật {R1 -R5} 64

2.15 Trƣờng hợp = 0.6; x = 0.6 > m = 0.4. 65

2.16 Trƣờng hợp = 0.6; x = 0.5 < m = 0.8. 65

2.17 So sánh đồ thị của hàm biến đổi Cheng và Hint giữa mức

xám đầu vào-đầu ra đã chuẩn hóa về đoạn [0, 1], độ sáng

xung quanh = 0.6, βX = 0.6, = 0.5, t = 0.5

65

2.18 Kết quả của [17] cho ảnh #2 68

2.19 Kết quả của Hint sử dụng FCM 5 cụm 68

2.20 Kết quả sử dụng Curvelet [66] 68

2.21 Kết quả sử dụng Hint với FCM 5 cụm 68

2.22 Ảnh đầu ra của ảnh gốc I02 trong tập dữ liệu ảnh TID2013

là kết quả của các toán tử đƣợc quan sát bằng mắt ngƣời

72

xii



73



73

2.25 Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc

Định sử dụng các thuật toán gián tiếp và Hint

74



75



75

3.1 Độ thuần nhất tính theo công thức gốc (3.1) (a) [9] Ảnh

nâng cao độ tƣơng phản kênh R,G và B sử dụng công thức

(3.1) (b)

79

3.2 {Hij}(a) {Vij} (b) 3 kênh R, G và B với ảnh #5 79

3.3 Độ thuần nhất tính theo công thức (3.2) (a) Ảnh nâng cao

sử dụng công thức (3.2)(b)

80

3.4 Các giá trị nhất của kênh V của ảnh #5 sử dụng [10] (a), giá

trị thuần nhất sử dụng ĐSGT (b)

89

3.5 Lƣu đồ xử lý của thuật toán đề xuất 93

3.6 Thử nghiệm cho ảnh #1 - #6. Ảnh kết quả (cột bên trái ) khi

sử dụng [17], (cột bên phải) sử dụng thuật toán 3.2 với HO7

đề xuất

99

3.7 Ảnh kết quả sử dụng thuật toán 2 với phép kết nhập gốc

[17] ij 4 ,

* * *ij ij ij ij

H O E V H R cho ảnh #1 và ảnh kết quả

không trơn

99

1

MỞ ĐẦU

1. Tính cấp thiết của đề tài

Nâng cao độ tƣơng phản (ĐTP) ảnh là một vấn đề quan trọng trong xử

lý và phân tích hình ảnh, là một bƣớc cơ bản trong phân tích, phân đoạn ảnh.

Mục đích của việc nâng cao ĐTP ảnh là làm nổi rõ chi tiết của ảnh và tăng độ

sáng của ảnh.

Các kỹ thuật thông dụng để nâng cao ĐTP ảnh đƣợc phân thành hai

tiếp cận chính: (1) Các phƣơng pháp gián tiếp và (2) các phƣơng pháp trực

tiếp [12, 19, 20].

a) Đối với các phƣơng pháp gián tiếp

Phƣơng pháp tăng cƣờng ĐTP gián tiếp chỉ biến đổi lƣợc đồ xám mà

không sử dụng bất kỳ một độ đo tƣơng phản nào. Biến đổi lƣợc đồ xám của

ảnh là phƣơng pháp làm cho lƣợc đồ xám của ảnh kết quả đều hơn, khi đó

ĐTP của ảnh đầu ra đƣợc nâng cao, độ sáng của ảnh đƣợc nâng nên. Trong

phƣơng pháp này những điểm ảnh đầu vào có cùng giá trị mức xám thì ở ảnh

kết quả, giá trị mức xám của những điểm ảnh này cũng bằng nhau, vì thế có

thể làm mất chi tiết ảnh so với ảnh đầu vào.

Có nhiều kỹ thuật đã đề xuất đƣợc tìm thấy trong tài liệu tham khảo [9,

10, 12, 15, 23, 26, 39, 51, 57, 61, 63, 68, 72].

Trong vài năm gần đây, nhiều nhà nghiên cứu đã áp dụng lý thuyết tập

mờ để phát triển các kĩ thuật mới nhằm nâng cao ĐTP của ảnh:

Tăng cƣờng ảnh mờ dựa trên việc ánh xạ mức xám vào miền mờ, sử

dụng hàm biến đổi thành viên [26]. Mục tiêu là sinh một ảnh có ĐTP cao hơn

ảnh gốc bằng việc gán các giá trị mức xám bằng một giá trị mới lớn hơn, gần

hơn với mức xám trung bình của ảnh [26].

2

Manglesh đã đề xuất thuật toán mới sử dụng logic mờ để tăng cƣờng

ảnh màu với chất lƣợng bị suy giảm bởi nhiễu Gaussian. Đầu tiên luật logic

mờ đƣợc sinh, sau đó giá trị RGB của ảnh đƣợc đƣa vào tiếp cận logic mờ.

Ảnh mờ đầu ra sẽ phân biệt giữa các màu mơ hồ [51] Sarode đã giới thiệu

thuật toán NCĐTP ở đó kênh sắc độ mầu đƣợc bảo tồn, chỉ thay đổi các kênh

cƣờng độ mầu sắc và kênh độ bão hoà, sau đó luật logic mờ đƣợc áp dụng.

Dựa trên điều này những quyết định liên quan đến việc phân lớp màu sẽ đƣợc

thực hiện. Ảnh đầu ra sẽ chỉ bao gồm những vùng ảnh rõ, những điểm ảnh

nhiễu bị loại bỏ [63]. Các nghiên cứu này đã đề xuất một phƣơng pháp tăng

cƣờng ĐTP mờ trực tiếp thích ứng mới dựa trên hàm thành viên Sigma để ánh

xạ ảnh từ miền không gian vào miền mờ. Khi chuyển ảnh từ một không gian

màu (RGB) vào không gian màu khác (HSV, HIS, YIQ) sắc độ không bị thay

đổi, chỉ những thành phần cƣờng độ màu và độ bão hoà bị thay đổi. Tuy

nhiên, ảnh sau tăng cƣờng có thể không còn giữ đƣợc chi tiết ảnh. Để khắc

phục vấn đề này, trong [63], Naik đã đƣa ra phƣơng pháp giữ các giá trị mức

xám đƣợc biến đổi trong phạm vi của miền mức xám.

Trong [72], hai kĩ thuật tăng cƣờng ĐTP là tăng cƣờng dựa trên luật mờ

và tăng cƣờng sử dụng toán tử tăng cƣờng áp dụng với ảnh xám ĐTP thấp

đƣợc đề xuất. Kĩ thuật đầu tiên sử dụng hàm ứng với hệ mờ luật if-then, kĩ

thuật thứ hai sử dụng toán tử tăng cƣờng ĐTP mờ để biến đổi mức xám trong

miền mờ. Kết quả thực nghiệm cho thấy, lƣợc đồ xám của ảnh gốc và các ảnh

tăng cƣờng có các đặc trƣng cơ bản giống nhau, điều này không làm đƣợc

trong cân bằng lƣợc đồ xám [72]. Ngoài ra, tăng cƣờng ĐTP sử dụng kĩ thuật

toán tử tăng cƣờng có các giá trị chỉ số đánh giá khách quan mờ thấp hơn so

với kĩ thuật tăng cƣờng ĐTP sử dụng luật mờ. Tuy nhiên, về thời gian xử lý,

kĩ thuật tăng cƣờng ĐTP dựa trên luật mờ yêu cầu thời gian ít hơn kĩ thuật

tăng cƣờng sử dụng toán tử tăng cƣờng.

3

Phƣơng pháp tăng cƣờng mờ đƣợc đề xuất bởi Hanmandlu trong đó

một toán tử tăng cƣờng ĐTP đƣợc giới thiệu. Bằng việc bảo tồn kênh H, chỉ

thay đổi kênh S, kênh V và cực tiểu entropy mờ, chất lƣợng của ảnh đƣợc cải

thiện về mặt trực quan [23]. Hanmandlu cũng đã giới thiệu một hàm thành

viên Gaussian để mờ hoá ảnh màu, cùng với việc tối ƣu entropy mờ của ảnh

thì các tham số đƣợc tối ƣu, ĐTP và độ sáng các ảnh tối đầu vào đã đƣợc cải

thiện [24].

John See đã đề xuất bộ dò tìm cạnh Gaussian dựa trên tập mờ sử dụng

cả thuộc tính toàn cục và cục bộ [38]. Trong giai đoạn tăng cƣờng ĐTP toàn

cục, hàm thành viên Gaussian đƣợc sử dụng. Một hàm tăng cƣờng ĐTP phi

tuyến bao gồm ba tham số đƣợc sử dụng để tăng cƣờng ảnh. Trong giai đoạn

tăng cƣờng ĐTP cục bộ, mặt nạ dò tìm cạnh kiểu Gaussian chứa hai tham số

mờ đƣợc tối ƣu bằng việc sử dụng hàm entropy ảnh mờ. Thuật toán này đã

thể hiện một cải tiến trực quan tƣơng đối hiệu quả.

Palanikumar đã giới thiệu một thuật toán mới dựa trên cân bằng lƣợc

đồ xám (HE) và HE tăng giá trị thích ứng (AIVHE) [60]. Bằng việc sử dụng

phƣơng pháp AIVHE, phép tăng cƣờng ĐTP đƣợc điều khiển bởi hai tham số

beta và gamma, nhƣng xuất hiện vấn đề là thông tin chi tiết ảnh không phải

lúc nào cũng đƣợc bảo tồn. Để khắc phục vấn đề này thuật toán di truyền

đƣợc dùng để tối ƣu giá trị beta và gamma thông qua việc tối ƣu giá trị

entropy [27].

Một ảnh có thể đƣợc nhóm thành các vùng tối, vùng hỗn tạp và vùng

sáng [59]. Ảnh RGB đƣợc chuyển đổi thành ảnh HSV. Sắc độ ảnh đƣợc bảo

tồn còn thành phần độ sáng của ảnh bị thay đổi. Việc mờ hoá đƣợc thực hiện

trên các vùng tối và vùng sáng bằng việc sử dụng hàm thành viên Gaussian

dựa trên điểm giao và tham số tăng cƣờng. Giá trị tối ƣu của các tham số này

đạt đƣợc bởi kĩ thuật lặp tối ƣu hệ kiến [59].

4

Trong [11], Aman Tusia và cộng sự đã thực hiện một phân tích hiệu

năng của hệ thống mờ loại 2 cho việc tăng cƣờng ảnh. Trƣớc khi xử lý, ảnh

đầu vào đƣợc chuyển từ không gian màu RGB về không gian HSV để bảo tồn

thông tin màu sắc. Hai ngƣỡng dƣới và trên đƣợc định nghĩa để cung cấp ƣớc

lƣợng của các vùng tối và vùng sáng trong ảnh. Ảnh đƣợc mờ hoá (loại 2) sử

dụng hàm thành viên Gausian.

Những tiếp cận sử dụng logic mờ để nâng cao ĐTP ảnh nói chung đều

dẫn đến tạo ra một hàm biến đổi mức xám dạng chữ S (Hàm liên tục đơn điệu

tăng, giảm giá trị đầu vào khi đầu vào dƣới ngƣỡng, và ngƣợc lại tăng giá trị

đầu vào khi đầu vào ở trên ngƣỡng).

(a) Toán tử NINT [23]

(b) Dạng đồ thị của hàm

biến đổi mức xám sinh bởi

hệ luật mờ if-then [72]

(c)Dạng đồ thị biến đổi

mức xám của [17]

(d) Ảnh kết quả sử dụng suy diễn luật if-then [72] cho ảnh #5 (Phụ lục C)

Hình 1. Dạng hàm biến mức xám chữ S trong các phép nâng cao ĐTP.

5

(a) Ảnh gốc

(b) Ảnh kết quả sinh bởi

toán tử tăng cƣờng mờ [72] (c) Dạng hàm biến đổi

(d) Ảnh gốc

(e) Kết quả sinh bởi toán tử

tăng cƣờng mờ [72]

(g) Dạng hàm biến đổi

Hình 2. Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử dụng toán

tử tăng cƣờng mờ [72]

b) Về phƣơng pháp nâng cao ĐTP trực tiếp

Nâng cao ĐTP ảnh theo phƣơng pháp trực tiếp là xây dựng một phƣơng

pháp biến đổi ĐTP tại một điểm ảnh dựa trên định nghĩa độ đo tƣơng phản

giữa độ sáng điểm ảnh và lân cận xung quanh nó. Bài toán đƣợc phát biểu

nhƣ sau:

Nâng cao ĐTP theo phƣơng pháp trực tiếp là quy trình thực hiện một

dãy biến đổi: ' ' '

, , ,, , 0 1

f b f b f bf b C C f C C , cụ thể:

Bƣớc 1: Tính ĐTP tại từng điểm ảnh:

,f b

C C f bf b

Bƣớc 2: Nâng ĐTP: '

,1C C C E C C

Bƣớc 3: Xác định f sao cho ' ',C f b C và:

- Nếu 0 f b thì '0 f f (do 'C C )

- Nếu b f thì 'f f (do 'C C )

6

Nhƣ vậy, quy trình biến đổi 'f f tăng cƣờng tại ngƣỡng b.

Trong một thời gian dài cho đến nay, có rất ít các nghiên cứu theo

phƣơng pháp trực tiếp trong đó biến đổi độ tƣơng phản ảnh dựa trên một độ

đo tƣơng phản xác định tại mỗi điểm ảnh, chẳng hạn các nghiên cứu [16, 17,

18, 19]. Hầu nhƣ chỉ có các nghiên cứu của Cheng và cộng sự là theo hƣớng

tiếp cận này [16, 17].

Các thuật toán của Cheng là cơ sở của phép nâng cao ĐTP ảnh đa cấp

xám. Tuy vậy các thuật toán này vẫn còn tồn tại một số hạn chế sau khi áp

dụng cho ảnh mầu, ảnh đa kênh:

(i) Ảnh nâng cao ĐTP có thể không thay đổi mức độ sáng của mầu so

với ảnh gốc.

(ii) Sử dụng các ảnh đã đƣợc biến đổi theo phƣơng pháp biến đổi ảnh

của Cheng để nâng cao ĐTP ảnh có thể làm mất chi tiết của ảnh gốc.

Về độ đo thuần nhất cho điểm ảnh, Cheng đề xuất cách ƣớc lƣợng giá

trị thuần nhất của điểm ảnh đƣợc kết nhập từ các giá trị địa phƣơng Eij, Hij,

Vij, R4,ij. Khi thử nghiệm với ảnh mầu, tác giả nhận thấy với phép kết nhập này

ảnh kết quả có thể không trơn.

Thực tế giá trị độ thuần nhất của điểm ảnh là một giá trị mờ và chúng ta

có thể áp dụng lập luận mờ để thu nhận giá trị này.

Nếu các đặc trƣng địa phƣơng đƣợc i j i j,E H chuyển cho một tiếp cận

tính toán với từ thì công thức kết nhập dạng i j i j,eh

T E H cần phản ánh luật mờ

nhƣ sau:

Nếu g r a d ie n t là cao và e n tr o p y là cao thì độ thuần nhất là cao

Nếu g r a d ie n t là thấp và e n tr o p y là thấp thì độ thuần nhất là thấp

Ở đây ký hiệu g r a d ie n t là phần bù của gradient và e n tr o p y là phần bù

của entropy tƣơng ứng.

7

Nếu chúng ta bổ sung thêm các luật với từ các gia tử nhƣ “rất”, “ít”,

“vừa” v.v .. với các biến ngôn ngữ nhƣ “homogeneity”, “entropy”, “gradient”

v.v... thì các giá trị thuần nhất có thể đƣợc ƣớc lƣợng bằng suy diễn của con

ngƣời và vì thế sẽ mịn hơn.

Do lý thuyết tập mờ ít quan tâm đến cơ sở hình thức giữa quan hệ của

các biến ngôn ngữ và các tập mờ, cũng nhƣ quan hệ thứ tự giữa các từ nên

cần xem xét sử dụng một phƣơng pháp lập luận luôn đảm bảo thứ tự hoặc yêu

cầu cao hơn là tạo ra một hàm biến đổi mức xám dạng chữ S dựa trên hệ luật

ngôn ngữ.

Hơn nữa, bản thân lý thuyết tập mờ rất khó để mô phỏng hoàn chỉnh

cấu trúc ngôn ngữ mà con ngƣời vẫn sử dụng để suy luận, cho dù cách tiếp

cận này đã đƣợc ứng dụng thành công trên rất nhiều lĩnh vực của cuộc sống.

Vì cấu trúc thứ tự cảm sinh trên các khái niệm mờ biểu thị bằng các giá trị

ngôn ngữ không đƣợc thể hiện trên các tập mờ. Chẳng hạn, về mặt ngữ nghĩa

chúng ta luôn cảm nhận đƣợc “yếu” nhỏ hơn “khỏe”, “cao” lớn hơn “thấp”

nhƣng hàm thuộc của chúng lại không so sánh đƣợc với nhau. Mặt khác, tập

các khái niệm mờ không đóng đối với một số các phép toán trên các tập mờ

[80]. Vì vậy trong quá trình lập luận nhiều khi ngƣời ta cần phải xấp xỉ ngôn

ngữ, tức là phải tìm một giá trị ngôn ngữ mà ý nghĩa của nó xấp xỉ với một

tập mờ cho trƣớc, điều này làm tăng độ phức tạp của thuật toán và sai số cho

quá trình tính toán. Hơn nữa, chúng ta biết rằng một hệ suy diễn xây dựng

trên một ngôn ngữ hình thức đều xác định trên tập các lớp công thức tƣơng

đƣơng một cấu trúc đại số thuộc lớp các đại số trừu tƣợng [6], trong khi lôgíc

mờ giá trị ngôn ngữ (hay lôgíc mờ theo nghĩa Zadeh) còn thiếu một cơ sở đại

số làm nền tảng.

Vì vậy, nhằm khắc khắc phục phần nào những nhƣợc điểm trên, năm

1990, N.C. Ho & W. Wechler trong [29] đã khởi xƣớng phƣơng pháp tiếp cận

đại số đến cấu trúc tự nhiên của miền giá trị của các biến ngôn ngữ. Theo

8

cách tiếp cận này, mỗi giá trị ngôn ngữ của một biến ngôn ngữ nằm trong một

cấu trúc đại số gọi là đại số gia tử (ĐSGT). Dựa trên những tính chất ngữ

nghĩa của ngôn ngữ đƣợc phát hiện, bằng phƣơng pháp tiên đề hóa nhiều tác

giả đã tập trung phát triển lý thuyết ĐSGT với các kết quả nhƣ ĐSGT mở

rộng [29], ĐSGT mịn hóa [32], ĐSGT mở rộng đầy đủ [1], ĐSGT PN-không

thuần nhất [6]. Trong đó, tiêu biểu là ĐSGT mịn hóa cùng với việc trang bị

khái niệm độ đo tính mờ của các giá trị ngôn ngữ và phƣơng pháp định lƣợng

ngữ nghĩa [35]. Trên cơ sở đó, các phƣơng pháp lập luận xấp xỉ dựa trên

ĐSGT và ứng dụng trong một số lĩnh vực đƣợc các tác giả phát triển, có thể

kể đến nhƣ phƣơng pháp lập luận sử dụng mạng nơron trong điều khiển mờ

[4], ứng dụng trong cơ sở dữ liệu mờ [3], lập luận bằng nội suy gia tử có tối

ƣu tham số và ứng dụng trong điều khiển mờ [7], [30], [33] v.v... Tuy nhiên,

việc ứng dụng đại số gia tử vào lĩnh vực xử lý ảnh nói chung và bài toán nâng

cao ĐTP ảnh nói riêng chƣa đƣợc thực hiện.

Qua khảo sát, phân tích và thực nghiệm tác giả đã rút ra kết luận:

Thứ nhất, phép lập luận if-then dựa trên tập mờ rất khó đảm bảo hình

dạng chữ S của hàm biến đổi mức xám. Phép nâng cao ĐTP theo hƣớng tiếp

cận trực tiếp của Cheng sử dụng một hàm biến đổi mức xám dạng chữ S

không đối xứng, giá trị mức xám biến đổi có thể rơi ra ngoài miền giá trị của

độ xám.

Thứ hai, độ đo thuần nhất của Cheng vẫn còn một vài hạn chế, chẳng

hạn ảnh kết quả có thể không trơn.

Thứ ba, sử dụng trực tiếp thuật toán của Cheng trên kênh ảnh gốc thì

độ sáng của ảnh kết quả có thể không thay đổi đáng kể. Để thay đổi đƣợc độ

sáng của ảnh cần phải biến đổi ảnh gốc trƣớc khi áp dụng phép nâng cao ĐTP

của Cheng. Tuy nhiên, phép biến đổi ảnh của Cheng có thể làm mất chi tiết

của ảnh gốc.

Vấn đề nghiên cứu của luận án là:

9

Vấn đề 1: Xây dựng phép mờ hóa ảnh không đánh mất chi tiết ảnh gốc.

Vấn đề 2: Thiết kế hàm biến đổi mức xám dạng chữ S và đối xứng;

Vấn đề 3:Xây dựng độ đo thuần nhất địa phƣơng của ảnh;

Ba vấn đề nghiên cứu của luận án có thể đƣợc khái quát lại theo hình

nhƣ sau:

Phƣơng pháp của Cheng Phƣơng pháp đề xuất

Ảnh đầu vào:

Ảnh đa cấp xám (Một kênh)

Biến đổi ảnh:

- Sử dụng một DĐMX

- Sử dụng lƣợc đồ xám thƣờng

Tính các giá trị địa phƣơng:

Eij, Hij, Vij, R4ij

Tính giá trị mức xám không thuần

nhất:ij

Tính ĐTP:Cij

Nâng ĐTP:

Tính giá trị mức xám của điểm

ảnh mới

Ảnh nâng cao

Tính giá trị thuần nhất:

HO = (1-Eij)*(1- Hij)*(1-Vij)*(1- R4ij)

Tính số mũ khuếch đại:

Ảnh đầu vào:

Ảnh mầu (đa kênh)

Biến đổi ảnh:

- Sử dụng phân cụm FCM

- Sử dụng nhiều DĐMX

- Sử dụng lƣợc đồ xám mờ

Tính các giá trị địa phƣơng:

Eij, Hij, Vij, R4ij

Tính giá trị mức xám không thuần

nhất:ij

Tính ĐTP:Cij

Tính số mũ khuếch đại:

Dùng hệ luật NN và ĐSGT (Toán tử Hint)

Nâng ĐTP:

Tính giá trị mức xám của điểm

ảnh mới

Ảnh nâng cao

Tính giá trị thuần nhất:

Dùng hệ luật NN và ĐSGT

10

2. Mục tiêu, phạm vi nghiên cứu của luận án

2.1. Mục tiêu chính của đề tài là tập trung chủ yếu ở vấn đề:

Nghiên cứu các vấn đề của xử lý ảnh dƣới tiếp cận của lý thuyết ĐSGT,

cụ thể nhƣ:

- Xây dựng hàm biến đổi mức xám dạng chữ S nâng cao ĐTP cho ảnh

mầu áp dụng ĐSGT.

- Xây dựng độ đo thuần nhất mới bằng đại số gia tử áp dụng nâng cao

ĐTP cho ảnh mầu.

- Xây dựng phép biến đổi mờ hóa ảnh áp dụng cho ảnh đa kênh không

làm mất chi tiết ảnh.

Theo hiểu biết của chúng tôi đây là vấn đề nghiên cứu có tính liên

ngành, hoàn toàn mới trong xử lý ảnh và ĐSGT.

2.2. Phạm vi nghiên cứu

Xuất phát từ mục tiêu trên, phạm vi nghiên cứu của đề tài tập trung vào

các vấn đề sau:

- Biến đổi ảnh mầu, ảnh đa kênh.

- Xây dựng hàm biến đổi mức xám dạng chữ S dựa trên ĐSGT.

- Xây dựng độ đo thuần nhất địa phƣơng cho ảnh dựa trên ĐSGT.

2.3. Đối tƣợng nghiên cứu của luận án:

- Ảnh đa kênh: ảnh mầu RGB (24 bit), kênh ảnh mầu của ảnh viễn

thám.

- Lập luận hệ luật mờ bằng ĐSGT.

- Độ đo tƣơng phản của ảnh mầu RGB (24 bit), kênh ảnh mầu của ảnh

viễn thám.

3. Phƣơng pháp và nội dung nghiên cứu

Phƣơng pháp luận trong nghiên cứu của luận án là kết hợp giữa nghiên

cứu lý thuyết và thực nghiệm. Các tƣ liệu và thông tin liên quan chủ yếu đƣợc

11

thu thập, tổng hợp từ các nguồn tạp chí khoa học chuyên ngành trong và

ngoài nƣớc, qua các buổi seminar hoặc tham gia báo cáo tại các hội thảo khoa

học, qua trao đổi với thầy hƣớng dẫn và các đồng nghiệp cùng lĩnh vực

nghiên cứu v.v…Tổng hợp các thông tin liên quan, lựa chọn các cách tiếp cận

đã đƣợc áp dụng thành công, tiến hành thử nghiệm với tiếng Việt, đánh giá

kết quả, từ đó sẽ tiến hành nghiên cứu sâu hơn về giải pháp cải tiến có thể xây

dựng đƣợc biến đổi ảnh đa kênh, xây dựng đƣợc hàm biến đổi dạng chữ S và

xây dựng độ đo thuần nhất dựa trên ĐSGT.

4. Cấu trúc luận án

Cấu trúc luận án gồm: phần mở đầu, 3 chƣơng nội dung, kết luận, danh

mục tài liệu tham khảo và phụ lục.

Chƣơng 1: Tổng quan về nâng cao ĐTP ảnh và tiếp cận đại số gia tử

giải hệ luật mờ.

Chƣơng này trình bày khái quát kiến thức về ĐSGT, phƣơng pháp giải

hệ luật mờ bằng ĐSGT. Cũng trong chƣơng này trình bày thuật toán nâng cao

ĐTP trực tiếp của Cheng, phân tích những điểm mạnh và điểm hạn chế của

phƣơng pháp làm căn cứ cho các nghiên cứu, đề xuất trong chƣơng 2 và

chƣơng 3.

Chƣơng 2: Biến đổi ảnh đa kênh và xây dựng hàm biến đổi chữ S theo

tiếp cận ĐSGT và ứng dụng nâng cao ĐTP ảnh đa kênh.

Chƣơng này trình bày đề xuất của NCS về xây dựng phép biến đổi mờ

hóa ảnh cho ảnh đa kênh nhƣ ảnh mầu, kênh ảnh mầu của ảnh viễn thám... .

Cũng trong chƣơng này trình bày phƣơng pháp xây dựng hàm biến đổi mức

xám dạng chữ S sử dụng ĐSGT ứng dụng nâng cao ĐTP ảnh đa kênh.

Chƣơng 3. Xây dựng độ đo thuần nhất mới theo tiếp cận ĐSGT và ứng

dụng nâng cao ĐTP ảnh đa kênh

12

Chƣơng này trình bày đề xuất của NCS về đo thuần nhất, các phƣơng

pháp xây dựng độ đo thuần nhất, xây dựng độ đo thuần nhất sử dụng ĐSGT

và ứng dụng độ đo thuần nhất mới nâng cao ĐTP ảnh đa kênh.

5. Kết quả đạt đƣợc của luận án

Các kết quả đạt đƣợc của luận án đã đƣợc công bố trong 2 bài tạp chí

chuyên ngành Quốc gia năm 2017, 02 bài tạp chí chuyên ngành có tính điểm

năm 2017, 01 bài báo cáo đăng tại kỷ yếu hội nghị Quốc gia năm 2017.

Những kết quả đạt đƣợc của luận án:

1) Đề xuất phƣơng pháp xây dựng phép biến đổi mờ hóa ảnh đa kênh

sử dụng nhiều dải động mức xám, các dải động đƣợc ƣớc lƣợng tự động dựa

trên thuật toán phân cụm FCM [CT 4] làm bƣớc tiền đề cho quy trình nâng

cao ĐTP ảnh [CT 1];

2) Đề xuất phƣơng pháp xây dựng hàm biến đổi độ xám dạng chữ S

dựa trên một toán tử HA, cụ thể là toán tử Hint (toán tử tăng cƣờng của

ĐSGT) để cải tiến thuật toán của Cheng, ứng dụng nâng cao ĐTP ảnh đa kênh

[CT 5].

3) Đề xuất phƣơng pháp xây dựng độ thuần nhất dựa trên một hệ luật

ngôn ngữ, sau đó nhúng phép lập luận sử dụng ĐSGT mà cụ thể là phép nội

suy giải hệ luật mờ của đại số gia tử. Ứng dụng độ thuần nhất mới vào quy

trình nâng cao ĐTP ảnh đa kênh [CT 2] và so sánh với phƣơng pháp xây dựng

độ thuần nhất dựa trên các toán tử t-norm [CT 3].

13

CHƢƠNG 1. TỔNG QUAN VỀ NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH

VÀ TIẾP CẬN ĐẠI SỐ GIA TỬ GIẢI HỆ LUẬT MỜ

Trong chƣơng này luận án hệ thống lại một số kiến thức cơ bản về đại

số gia tử (ĐSGT) và phƣơng pháp lập luận xấp xỉ dựa trên ĐSGT. Trình bày

tổng quan về nâng cao ĐTP ảnh, hệ thống một số thuật toán nâng cao độ sáng

tối của điểm ảnh, phân tích thuật toán nâng cao ĐTP ảnh theo hƣớng tiếp cận

trực tiếp của Cheng làm tiền đề cho những nội dung nghiên cứu trong chƣơng

2 và chƣơng 3. Cũng trong chƣơng này, luận án trình bày các phƣơng pháp

đƣợc sử dụng để đánh giá tính hiệu quả của các kết quả đề xuất và tập dữ liệu

dùng để thử nghiệm.

1.1. Đại số gia tử: một số vấn đề cơ bản

1.1.1. Các khái niệm cơ bản về đại số gia tử

Phƣơng pháp lập luận tính toán nhằm giải quyết vấn đề mô phỏng tƣ

duy, lập luận của con ngƣời chính là việc chúng ta mƣợn cấu trúc tính toán rất

phong phú của tập tất cả các hàm F(U, [0,1]) để mô phỏng các cách lập luận

của con ngƣời mà chúng ta thƣờng đƣợc thực hiện trên nền ngôn ngữ tự

nhiên. Tuy nhiên, trong [5], các tác giả đã chỉ ra rằng tập các giá trị ngôn ngữ

của một biến ngôn ngữ sẽ là một cấu trúc đại số đủ giàu để tính toán và

nghiên cứu các phƣơng pháp lập luận. Nhƣ vậy thay vì mƣợn cấu trúc của

F(U,[0,1]), chúng ta có một khả năng lựa chọn khác là sử dụng cấu trúc đại số

của chính các tập các giá trị ngôn ngữ.

Đại số gia tử (ĐSGT) đƣợc ra đời do đề xuất của N.C. Ho và W.

Wechler vào năm 1990 [28], đến nay đã có nhiều nghiên cứu phát triển và

ứng dụng thành công của các tác giả [1]-[4], [6]-[8], [28], [29], [32].

Trong [28], các tác giả đã chứng minh miền ngôn ngữ X = Dom(X) của

một biến ngôn ngữ X có thể đƣợc tiên đề hóa và đƣợc gọi là đại số gia tử và

đƣợc ký hiệu là AX = (X, G, H, ) trong đó G là tập các phần tử sinh, H là tập

14

các gia tử (hedge) còn “” là quan hệ cảm sinh ngữ nghĩa trên X. Giả thiết

trong G có chứa các phần tử hằng 0, 1, W với ý nghĩa là phần tử bé nhất, phần

tử lớn nhất và phần tử trung hòa (neutral) trong X. Ta gọi mỗi giá trị ngôn

ngữ x X là một hạng từ (term) trong ĐSGT.

Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H,

) là ĐSGT tuyến tính. Hơn nữa, nếu đƣợc trang bị thêm hai gia tử tới hạn là

và với ngữ nghĩa là cận trên đúng và cận dƣới đúng của tập H(x) khi tác

động lên x, thì ta đƣợc ĐSGT truyến tính đầy đủ, ký hiệu AX = (X, G, H, ,

, ). Vì trong luận án chỉ quan tâm đến ĐSGT tuyến tính, kể từ đây nói

ĐSGT cũng có nghĩa là ĐSGT tuyến tính.

Khi tác động gia tử h H vào phần tử x X, thì thu đƣợc phần tử ký

hiệu hx. Với mỗi x X, ký hiệu H(x) là tập tất cả các hạng từ u X sinh từ x

bằng cách áp dụng các gia tử trong H và viết u = hn…h1x, với hn, …, h1 H.

Tập H gồm các gia tử dƣơng H+ và gia tử âm H

-. Các gia tử dƣơng làm

tăng ngữ nghĩa của một hạng từ mà nó tác động, còn gia tử âm làm giảm ngữ

nghĩa của hạng từ. Không mất tính tổng quát, ta luôn giả thiết rằng H- = {h-1 <

h-2 < ... < h-q} và H+ = {h1 < h2 < ... < hp}.

Để ý rằng biểu thức hn...h1u đƣợc gọi là một biểu diễn chính tắc của

một hạng từ x đối với u nếu x = hn...h1u và hi...h1u hi-1...h1u với i nguyên và i

n. Ta gọi độ dài của một hạng từ x là số gia tử trong biểu diễn chính tắc của

nó đối với phần tử sinh cộng thêm 1, ký hiệu l(x).

Ví dụ 1.1. Cho biến ngôn ngữ TRUTH, có G = {0, FALSE, W, TRUE,

1}, H- = { Possible < Little } và H

+ = { More < Very }. Khi đó TRUE < More

TRUE < Very TRUE, Little TRUE < TRUE,...

Bây giờ chúng ta xét một số tính chất của đại số gia tử tuyến tính. Định

lý sau cho thấy tính thứ tự ngữ nghĩa của các hạng từ trong ĐSGT.

15

Định lý 1.1. [28] Cho tập H- và H

+ là các tập sắp thứ tự tuyến tính của

ĐSGT AX = (X, G, H, ). Khi đó ta có các khẳng định sau:

(1) Với mỗi u X thì H(u) là tập sắp thứ tự tuyến tính.

(2) Nếu X đƣợc sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến

tính thì X cũng là tập sắp thứ tự tuyến tính. Hơn nữa nếu u < v, và u, v là độc

lập với nhau, tức là u H(v) và v H(u), thì H(u) H(v).

Định lý tiếp theo xem xét sự so sánh của hai hạng từ trong miền ngôn

ngữ của biến X.

Định lý 1.2. [29] Cho x = hn…h1u và y = km…k1u là hai biểu diễn chính

tắc của x và y đối với u. Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho hj' =

kj' với mọi j' < j (ở đây nếu j = min {n, m} + 1 thì hoặc hj là toán tử đơn vị I, hj

= I, j = n + 1 ≤ m hoặc kj = I, j = m + 1 ≤ n) và

(1) x < y khi và chỉ khi hjxj < kjxj, trong đó xj = hj-1...h1u.

(2) x = y khi và chỉ khi m = n và hjxj = kjxj.

(3) x và y là không so sánh đƣợc với nhau khi và chỉ khi hjxj và kjxj là

không so sánh đƣợc với nhau.

Trong phần tiếp theo, chúng ta trình bày một số vấn đề của đại số gia tử

làm cơ sở cho việc nghiên cứu và phát triển một số mô hình lập luận và ứng

dụng về sau.

1.1.2. Vấn đề định lƣợng ngữ nghĩa trong đại số gia tử

Trong phần này chúng ta xem xét ba vấn đề cơ bản đó là độ đo tính mờ

của các giá trị ngôn ngữ (hạng từ), phƣơng pháp định lƣợng ngữ nghĩa và

khoảng tính mờ của các khái niệm mờ.

Tính mờ của các giá trị ngôn ngữ xuất phát từ thực tế rằng một giá trị

ngôn ngữ mang ý nghĩa mô tả cho nhiều sự vật và hiện tƣợng trong thế giới

thực, với lý do tập hữu hạn các giá trị ngôn ngữ không đủ để phản ánh thế

16

giới vô hạn các sự vật hiện tƣợng [34]. Nhƣ vậy khái niệm tính mờ và độ đo

tính mờ của một giá trị ngôn ngữ đƣợc hình thành và nó là một khái niệm rất

khó xác định, đặc biệt trong lý thuyết tập mờ [7]. Tuy nhiên, trong ĐSGT các

tác giả đã cho thấy độ đo tính mờ đƣợc xác định một cách hợp lý: “tính mờ

của một hạng từ x được hiểu như là ngữ nghĩa của nó vẫn có thể được thay

đổi khi tác động vào nó bằng các gia tử” [34], [35]. Do đó, tập các hạng từ

sinh từ x bằng các gia tử sẽ thể hiện cho tính mờ của x và do đó, H(x) có thể

sử dụng nhƣ là một mô hình biểu thị tính mờ của x và kích thƣớc tập H(x)

đƣợc xem nhƣ độ đo tính mờ của x. Ta có định nghĩa sau về độ đo tính mờ.

Định nghĩa 1.1. [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến

tính đầy đủ. Ánh xạ fm: X [0,1] đƣợc gọi là một đo tính mờ của các hạng

từ trong X nếu:

(1) fm là đầy đủ, tức là fm(c-) + fm(c

+) =1 và hH fm(hu) = fm(u),

uX;

(2) fm(x) = 0, với các x thỏa H(x) = {x}. Đặc biệt, fm(0) = fm(W) =

fm(1) = 0;

(3) x,y X, h H, )(

)(

)(

)(

yfm

hyfm

xfm

hxfm , tỷ số này không phụ thuộc vào x

và y, vì vậy nó đƣợc gọi là độ đo tính mờ của các gia tử và đƣợc ký hiệu bởi

(h).

Trong đó, điều kiện (1) thể hiện tính đầy đủ của các phần tử sinh và các

gia tử cho việc biểu diễn ngữ nghĩa của miền thực đối với các biến. (2) thể

hiện tính rõ của các hạng từ và (3) có thể đƣợc chấp nhận vì chúng ta đã chấp

nhận giả thiết rằng các gia tử là độc lập với ngữ cảnh và, do vậy, khi áp dụng

một gia tử h lên các hạng từ thì hiệu quả tác động tƣơng đối làm thay đổi ngữ

nghĩa của các hạng từ đó là nhƣ nhau. Hình vẽ sau (Hình 1.1) minh họa rõ

17

hơn cho khái niệm độ đo tính mờ của biến ngôn ngữ TRUTH (đã xét trong Ví

dụ 1.1).

Các tính chất của độ đo tính mờ của các hạng từ và gia tử đƣợc thể hiện

qua mệnh đề sau:

Mệnh đề 1.1. [35] Với độ đo tính mờ fm và đã đƣợc định nghĩa trong

Định nghĩa 1.1, ta có:

(1) fm(c-) + fm(c

+) = 1 và ( ) ( )

h Hfm hx fm x

;

(2)

1

)(qj j

h ,

p

j jh

1)( , với , > 0 và + = 1;

(3)

kXx

xfm 1)( , trong đó Xk là tập các hạng từ có độ dài đúng k;

(4) fm(hx) = (h).fm(x), và xX, fm(x) = fm(x) = 0;

(5) Cho fm(c-), fm(c

+) và (h) với hH, khi đó với x = hn...h1c

, {-

,+}, dễ dàng tính đƣợc độ đo tính mờ của x nhƣ sau:

fm(x) = (hn)...(h1)fm(c).

Thông thƣờng, ngữ nghĩa của các hạng từ thuần túy mang tính định

tính. Tuy nhiên, trong nhiều ứng dụng, chúng ta cần giá trị định lƣợng của các

hạng từ này cho việc tính toán và xử lý. Theo tiếp cận của tập mờ, việc định

fm(True)

fm(VeryTrue) fm(LittleTr) fm(PossTr))

fm(MTr)

True

Very True Little True Poss True MoreTrue

W 1

Hình 1.1: Độ đo tính mờ của biến TRUTH

fm(VLTr)

fm(MLTr)

fm(PLTr)

fm(LLTr) fm(VVTr)

fm(MVTr)

fm(PVTr)

fm(LVTr)

18

lƣợng hóa các khái niệm mờ đƣợc thực hiện qua các phƣơng pháp khử mờ

(defuzzification). Đối với ĐSGT, giá trị định lƣợng của các hạng từ đƣợc định

nghĩa dựa trên cấu trúc thứ tự ngữ nghĩa của miền giá trị của các biến ngôn

ngữ, cụ thể là độ đo tính mờ của các hạng từ và gia tử. Tuy có nhiều phƣơng

pháp xác định giá trị định lƣợng của các hạng từ dựa trên các tham số này

nhƣng phải thỏa mãn một số ràng buộc nhất định và đƣợc thể hiện trong định

nghĩa sau.

Định nghĩa 1.2. [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến

tính đầy đủ. Ánh xạ : X [0,1] đƣợc gọi là một hàm định lƣợng ngữ nghĩa

(SQM) của AX nếu:

(1) là ánh xạ 1-1 từ tập X vào đoạn [0,1] và đảm bảo thứ tự trên X,

tức là x,y X, x < y (x) < (y) và (0) = 0, (1) = 1.

(2) liên tục: x X, (x) = infimum (H(x)) và (x) = supremum

(H(x)).

Điều kiện (1) là bắt buộc tối thiểu đối với bất kỳ phƣơng pháp định

lƣợng nào, còn điều kiện (2) đảm bảo tính trù mật của H(G) trong X. Dựa trên

những ràng buộc này, các tác giả trong [35] đã xây dựng một phƣơng pháp

định lƣợng ngữ nghĩa của các hạng từ trong ĐSGT. Trƣớc hết chúng ta xét

định nghĩa về dấu của các hạng từ nhƣ sau.

Định nghĩa 1.3. [35] Một hàm dấu Sign : X {-1, 0, 1} là một ánh xạ

đƣợc định nghĩa đệ qui nhƣ sau, trong đó h, h' H và c {c-, c

+}:

(1) Sign(c-) = -1, Sign(c

+) = 1;

(2) Sign(hc) = -Sign(c) nếu h âm đối với c; Sign(hc) = Sign(c) nếu h

dƣơng đối với c;

(3) Sign(h'hx) = -Sign(hx), nếu h'hx hx và h' âm đối với h; Sign(h'hx)

= Sign(hx), nếu h'hx hx và h' dƣơng đối với h;

19

(4) Sign(h'hx) = 0, nếu h'hx = hx.

Dựa trên hàm dấu này, chúng ta có tiêu chuẩn để so sánh hx và x.

Mệnh đề 1.2. [35] Với bất kỳ h và x, nếu Sign(hx) = 1 thì hx > x; nếu

Sign(hx) = -1 thì hx < x và nếu Sign(hx) = 0 thì hx = x.

Định nghĩa 1.4. [35] Cho AX là một ĐSGT tuyến tính đầy đủ và fm là

một độ đo tính mờ trên X. Ta nói ánh xạ : X [0,1] đƣợc cảm sinh bởi độ

đo tính mờ fm nếu đƣợc định nghĩa bằng đệ qui nhƣ sau:

(1) (W) = = fm(c-), (c

-) = – .fm(c

-) = .fm(c

-), (c

+) =

+.fm(c+);

(2)

)()(

)()()()()()()()( jSignjjSigni

xfmxj

hxj

hxfmi

hxj

hSignxxj

h ,

với mọi j, –q j p và j 0, trong đó:

,))(()(12

1)( xhhSignxhSignxh

jpjj;

(3) (c-) = 0, (c

-) = = (c

+), (c

+) = 1, và với mọi j thỏa –q

j p, j 0, ta có:

(hjx) = (x) +

),()()(12

1)()()(

)(

)(xfmhxhSignxfmhxhSign

jj

jSignj

jSigni ij

(hjx) = (x) +

).()()(1

2

1)()()(

)(

)(xfmhxhSignxfmhxhSign

jj

jSignj

jSigni ij

Với định nghĩa này, các tác giả trong [31] đã chứng minh nó thỏa mãn

các yêu cầu của một hàm định lƣợng ngữ nghĩa và đảm bảo tính trù mật của

nó đối với các hạng từ của AX trong đoạn [0,1] (xem Định lý 1.3).

Một khái niệm rất quan trọng làm cơ sở cho việc nghiên cứu và xây

dựng các mô hình ứng dụng về sau đó là khoảng tính mờ (fuzziness interval)

20

của các khái niệm mờ. Trong ĐSGT, dựa trên độ đo tính mờ fm, chúng ta sẽ

định nghĩa khoảng tính mờ của các hạng từ. Gọi Itv([0,1]) là họ các đoạn con

của đoạn [0,1], ký hiệu || là độ dài của đoạn “”.

Định nghĩa 1.5 [35]. Khoảng tính mờ của các hạng từ x X, ký hiệu

fm(x), là một đoạn con của [0,1], fm(x) Itv([0,1]), nếu nó có độ dài bằng

độ đo tính mờ, |fm(x)| = fm(x), và đƣợc xác định bằng qui nạp theo độ dài của

x nhƣ sau:

(1) Với độ dài của x bằng 1 (l(x)=1), tức là x {c-, c

+}, khi đó |fm(c

-)|

= fm(c-), |fm(c

+)| = fm(c

+) và fm(c

-) fm(c

+);

(2) Giả sử x có độ dài n (l(x)=n) và khoảng tính mờ fm(x) đã đƣợc định

nghĩa với |fm(x)| = fm(x). Khi đó tập các khoảng tính mờ {fm(hjx): -q j p

và j 0} Itv([0,1]) đƣợc xây dựng sao cho nó là một phân hoạch của fm(x),

và thỏa mãn |fm(hjx)| = fm(hjx) và có thứ tự tuyến tính tƣơng ứng với thứ tự

của tập {h-qx, h-q+1x, ..., hpx}, tức là nếu h-qx > h-q+1x > ... > hpx thì fm(h-qx) >

fm(h-q+1x) > ... > fm(hpx) và ngƣợc lại (xem Hình 1.2). Dễ dàng thấy rằng hệ

phân hoạch nhƣ vậy luôn tồn tại dựa vào tính chất (1) trong Mệnh đề 1.1.

Trƣờng hợp độ dài của x bằng k, l(x) = k, ta ký hiệu k(x) thay cho

fm(x), khi đó ta nói khoảng tính mờ của x có độ sâu k (hay khoảng tính mờ

mức k). Để thuận tiện về sau, ta ký hiệu:

Hình 1.2: Khoảng tính mờ của các hạng từ của biến TRUTH

(True) (LTr) (PTr) (MTr) (VTr)

2(LTr) 2(PTr) 2(MTr) 2(VTr)

3(VLTr)

3(MLTr)

3(PLTr)

3(LLTr)

3(LPTr) 3(MPTr

)

3(LMTr) 3(MMTr

)

3(LVTr) 3(MVTr

)

3(PPTr) 3(VPTr) 3(PMTr

)

3(VMTr

)

3(PVTr) 3(VVTr)

21

Xk là tập các hạng từ có độ dài đúng k,

X(k) = l=1,...,k Xl là tập tất cả các hạng từ có độ dài từ 1 đến k.

Rõ ràng X =

1k Xk, và

Ik = {k(x): x Xk} là tập tất cả các khoảng tính mờ độ sâu k,

I = {(x): x X} =

1k Ik.

Tƣơng tự ta cũng có tập I(k) = l=1,...,k Il.

Tiếp theo chúng ta xem xét một số tính chất của khoảng tính mờ cũng

nhƣ cấu trúc của họ tất cả các khoảng tính mờ trong mệnh đề sau. Họ các

khoảng tính mờ đóng một vai trò quan trọng trong việc xem xét quan hệ

tƣơng tự đối với dữ liệu trong miền tham chiếu của các biến. Ở đây, ta sử

dụng khái niệm tựa phân hoạch tức là phân hoạch mà hai tập bất kỳ của nó có

nhiều nhất một điểm chung.

Mệnh đề 1.3 [35]. Cho AX = (X, G, H, , , ) là một ĐSGT tuyến

tính đầy đủ:

(1) Nếu Sign(hpx) = 1, thì ta có (h-qx) (h-q+1x) ... (h-1x)

(h1x) (h2x) ... (hpx), và nếu Sign(hpx) = -1, thì ta có (hpx)

(hp-1x) ... (h1x) (h-1x) (h-2x) ... (h-qx);

(2) Tập Ik = {(x): x Xk} là một tựa phân hoạch của đoạn [0,1];

(3) Cho một số m, tập {(y): y = km... k1x, km,... , k1 H} là một tựa

phân hoạch của khoảng tính mờ (x);

(4) Tập Ik = {(x): x Xk} “mịn” hơn tập Ik-1 = {(x): x Xk-1}, tức là

bất kỳ một khoảng tính mờ trong Ik chắc chắn đƣợc chứa bên trong một

khoảng của Ik-1;

(5) Với x < y và l(x) = l(y), thì (x) ≤ (y) và (x) (y).

22

Chứng minh. Các tính chất (2) đến (5) đã đƣợc chứng minh trong [31],

ở đây ta chứng minh (1). Theo Mệnh đề 1.2, nếu Sign(hpx) = 1 thì ta có x

hpx. Vì các gia tử trong H+ là so sánh đƣợc và H

+ và H

- là đối ngƣợc nhau,

nên h-qx h-q+1x ... h-1x x h1x h2x ... hpx. Từ Định nghĩa 1.5

của khoảng tính mờ ta suy ra (h-qx) (h-q+1x) ... (h-1x) (h1x)

(h2x) ... (hpx). Chứng minh tƣơng tự với trƣờng hợp Sign(hpx) = -1.

Dễ dàng suy ra từ mệnh đề trên trong trƣờng hợp các khoảng tính mờ

đƣợc xét ở dạng nửa đóng, tức là (x) = (lmp( (x)), rmp((x))], và khoảng

tính mờ của hạng từ bé nhất trong phân hoạch ở dạng đóng thì các tựa phân

hoạch trong (2), (3) trở thành các phân hoạch thực sự. Trong đó, lmp và rmp

là điểm mút trái và điểm mút phải của khoảng tính mờ.

Để ý rằng dựa trên cấu trúc thứ tự của X, phần tử x nằm ở giữa hai tập

{h-ix: -q i -1} và {hjx: 1 j p}, hơn nữa ta có

i[-q,-1] |(hix)| = fm(x). i[-q,-1] (hi) = .fm(x) = .|(x)|

Điều này cho thấy điểm cuối chung của hai khoảng tính mờ (h-1x) và

(h1x) chính là giá trị định lƣợng ngữ nghĩa (x) (xem [31]) của hạng từ x.

Giá trị này chia đôi khoảng tính mờ (x) theo tỷ lệ : nếu Sign(hpx) = 1,

hoặc tỷ lệ : nếu Sign(hpx) = -1 (xem (1) của Mệnh đề 1.3).

Theo Định nghĩa 1.4 và 1.5, có một mối liên hệ giữa ánh xạ định lƣợng

ngữ nghĩa và khoảng tính mờ của của hạng từ trong một ĐSGT, đƣợc thể hiện

bằng định lý sau.

Định lý 1.3. [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến tính

đầy đủ và hàm đƣợc định nghĩa trong Định nghĩa 1.4. Khi đó là một ánh

xạ định lƣợng ngữ nghĩa và tập các giá trị của đối với H(x), viết là (H(x)),

trù mật trong đoạn [(x), (x)], x X. Hơn nữa,

(x) = infimum (H(x)), (x) = supremum (H(x)) và

23

fm(x) = (x) - (x),

và nhƣ vậy fm(x) = d((H(x))), trong đó d(A) là đƣờng kính của A [0,1].

Kết quả, (H(G)) trù mật trong đoạn [0,1].

Định lý này cũng khẳng định rằng ĐSGT AX cùng với hàm định lƣợng

ngữ nghĩa có thể ứng dụng trong mọi quá trình thực.

Từ những kết quả trên cho thấy giá trị định lƣợng ngữ nghĩa (x) của

một hạng từ x cũng nhƣ khoảng tính mờ (x), x X, phụ thuộc đầy đủ vào

các tham số mờ gia tử fm(c-), fm(c

+), (h) h H.

1.1.3. Phƣơng pháp lập luận xấp xỉ dựa trên ĐSGT

Phần này trình bày cách giải hệ luật mờ bằng phƣơng pháp lập luận xấp

xỉ dựa trên ĐSGT. Trƣớc hết xét mô hình mờ:

If X1 = A11 and ... and Xm = A1m then Y = B1

If X1 = A21 and ... and Xm = A2m then Y = B2

. . . . . . . . . .

If X1 = An1 and ... and Xm = Anm then Y = Bn

(1.1)

ở đây X1, X2, …, Xm và Y là các biến ngôn ngữ, Aij, Bi (i = 1,…, n; j = 1,…, m)

là các giá trị ngôn ngữ tƣơng ứng (xem [79]).

Bài toán đặt ra là: với các giá trị ngôn ngữ A11, A12, …, A1m tƣơng ứng

với các biến ngôn ngữ X1, X2, …, Xm . Hãy tính giá trị của Y.

Tƣ tƣởng chính của phƣơng pháp là từ mỗi mệnh đề “If ...then...” sẽ

xác định một điểm trong không gian tích Đề các Dom(X1) .. Dom(Xm)

Dom(Y), ở đây Dom(Xi), Dom(Y) là các miền ngôn ngữ tƣơng ứng của các

biến ngôn ngữ Xi và Y và chúng đƣợc xem nhƣ các ĐSGT. Vì vậy, các giả

thiết của bài toán xác định một siêu mặt Cf trong không gian tích Đề các này

cho nên giải bài toán mô hình mờ đa điều kiện có nghĩa là chúng ta đi tìm giá

24

trị B ứng với giá trị A = (A11, ..., A1m) bằng cách nội suy trên siêu mặt Cf.

Cụ thể chúng ta phải thực hiện các bƣớc sau đây (xem [6]):

1) Xây dựng các ánh xạ định lƣợng ngữ nghĩa Xi và Y, tức là các ánh

xạ từ các ĐSGT Xi, Y vào [0,1]. Các ánh xạ này đƣợc xác định bởi độ đo mờ

của các phần tử sinh nguyên thủy và của các gia tử, chúng đóng vai trò các

tham số của phƣơng pháp. Kết quả nội suy sẽ chịu ảnh hƣởng từ cách chọn

các tham số này.

2) Các ánh xạ định lƣợng ngữ nghĩa trên sẽ chuyển siêu mặt Cf trong

Dom(X1) ... Dom(Xm) Dom(Y) thành siêu mặt Cr,m+1 trong không gian

thực [0, d1] ... [0, dm] [0, b] với [0, di], [0, b] là miền giá trị của các biến

cơ sở của Xi và Y một cách tƣơng ứng.

3) Sử dụng một phép kết nhập Agg ta sẽ chuyển đƣợc siêu mặt thực

Cr,m+1 trong bƣớc 2 thành đƣờng cong thực Cr,2 trong [0, a][0, b] với a =

Agg(d1, ..., dm) bằng cách: với mỗi i cố định, i = 1, ..., n.

a) Tính các giá trị aij = Xj(Aij), j = 1, ..., m.

b) Kết nhập ai = Agg(ai1, ..., aim),

c) Tính bi = Y(Bi).

Từ các giá trị ai, bi dễ dàng xác định đƣờng cong Cr,2. Cuối cùng, với

các giá trị đầu vào A11, ..., A1m cho trƣớc của các biến X1, ..., Xm, chúng ta sử

dụng phƣơng pháp nội suy tuyến tính thông thƣờng để tính giá trị đầu ra b0

tƣơng ứng với giá trị đầu vào a0 = Agg(X1(A11), ..., Xm(A1m)). Khi có giá trị

b0 chúng ta sẽ xác định lại giá trị ngôn ngữ.

1.2. Khả năng xấp xỉ hàm của phƣơng pháp HA-IRMd và ứng dụng

1.2.1. Khả năng xấp xỉ hàm

Với phƣơng pháp HA-IRMd vừa nêu, chúng ta thấy rằng việc giải bài

toán LLXX sẽ đƣợc chuyển về bài toán nội suy trên đƣờng cong thực. Trong

25

trƣờng hợp mô hình mờ gồm hai biến, sự phụ thuộc giữa chúng đƣợc xác định

bởi một hàm f cho trƣớc, liệu có tồn tại mô hình mờ gồm các luật sao cho

đƣờng cong ngữ nghĩa thu đƣợc bởi phƣơng pháp HA-IRMd trên mô hình này

là xấp xỉ f hay không?

Để trả lời câu hỏi trên, đầu tiên chúng ta xét mô hình mờ một đầu vào,

một đầu ra sau [5]:

If X = A1 then Y = B1

If X = A2 then Y = B2

. . . . . . . . . . . . . . . .

If X = An then Y = Bn

, trong đó X, Y là các biến ngôn ngữ, Ai, Bi (i = 1,…, n) là các nhãn ngôn ngữ.

Giả sử biến ngôn ngữ X xác định trên vũ trụ U = [u1, u2], biến ngôn ngữ

Y xác định trên vũ trụ V = [v1, v2], hàm g: U → V là hàm phi tuyến, liên tục,

thể hiện sự phụ thuộc của biến Y vào biến X và giả sử rằng AX = (X, GX, HX,

, , ), AY = (Y, GY, HY, , , ) là các ĐSGT tƣơng ứng của hai biến X,

Y. Bằng việc chuẩn hóa, chúng ta đƣa các miền U, V về đoạn [0,1], khi đó

đƣờng cong g đƣợc chuyển thành đƣờng cong f với f: [0,1] → [0,1]. Bây giờ

chúng ta cần xây dựng mô hình mờ M thể hiện sự phụ thuộc của biến ngôn

ngữ Y vào biến ngôn ngữ X sao cho đƣờng cong ngữ nghĩa tƣơng ứng với mô

hình M là xấp xỉ với đƣờng cong f.

Ta có định lý sau:

Định lý 1.5 [7]. Với bất kỳ đƣờng cong liên tục f: [0,1]→[0,1] và một

số ε > 0 bé tùy ý, bao giờ cũng xác định đƣợc mô hình mờ M sao cho nếu Cr

là đƣờng cong ngữ nghĩa tƣơng ứng với M đƣợc xác bởi hàm định lƣợng ,

thì ta có

)()(sup1,0

zfzCr

z

.

26

1.2.2. Ứng dụng việc xấp xỉ hàm trong xây dựng luật

Trong thực tế cuộc sống có rất nhiều quan hệ phụ thuộc lẫn nhau giữa

các đại lƣợng. Ví dụ nhƣ hệ số lƣơng phụ thuộc vào số năm công tác hay

năng suất cây trồng phụ thuộc vào điều kiện chăm sóc,…Sự phụ thuộc này có

thể ngầm hiểu nhƣ một quan hệ hàm. Tuy nhiên rất khó có thể xác định công

thức của các hàm đó. Chúng ta chỉ có thể biểu thị sự phụ thuộc này bởi các

câu hoặc các mệnh đề If-then. Ngƣợc lại, nếu sự phụ thuộc giữa các yếu tố

đƣợc biểu diễn dƣới dạng hàm hoặc từ các dữ liệu đo đạc thực nghiệm, chúng

ta lại hoàn toàn có thể xây dựng các luật để diễn đạt nó. Dƣới đây tác giả sẽ

trình bày phƣơng pháp xây dựng hệ luật từ tập các dữ liệu phụ thuộc giữa hai

đại lƣợng ở dạng một hàm cho trƣớc.

Bài toán xây dựng luật [5]: Cho đƣờng cong liên tục f: [0,1] → [0,1]

biểu thị sự phụ thuộc giữa hai biến ngôn ngữ X, Y và số ε > 0 bé tùy ý. Cần

xây dựng mô hình mờ M sao cho đƣờng cong ngữ nghĩa tƣơng ứng là xấp xỉ

với f.

Chúng ta thực hiện theo các bƣớc sau:

Bước 1. Xác định các ĐSGT AX = (X, GX, HX, , , ), AY = (Y, GY,

HY, , , ) cho biến X, Y, tức là xác định các tập GX, HX, GY, HY và độ đo

tính mờ của các phần tử trong các tập đó.

Bước 2. Chia đoạn [0,1] thành m phần bằng nhau (m phụ thuộc vào ε)

và xác định các điểm chia z0, z1,…, zm, z0 = 0, zm = 1. Tính giá trị hàm f tại các

điểm chia zi.

Bước 3. Gọi X1

, Y1

là hàm ngƣợc của X và Y một cách tƣơng ứng.

Với mỗi cặp giá trị (zi, f(zi)), i = 0,…, m, ta lần lƣợt bổ sung luật IF X =

X1

(zi) THEN Y = Y1

(f(zi)) vào mô hình mờ M. Cuối cùng ta thu đƣợc mô

hình mờ gồm (m +1) luật.

Dễ thấy, đƣờng cong ngữ nghĩa của mô hình mờ đƣợc xác định theo

27

các bƣớc trên là xấp xỉ với f (theo Định lý 1.5).

Một số lưu ý:

i) Rõ ràng với m càng lớn thì đƣờng cong ngữ nghĩa càng gần với

đƣờng cong f. Vì thế việc chọn giá trị m cho từng bài toán sẽ tùy thuộc độ

chính xác mà bài toán đó yêu cầu. Trong thực tế chúng ta chỉ dùng một số ít

các luật, tƣơng ứng với m tƣơng đối nhỏ và chấp nhận sai số xấp xỉ lớn. Hơn

nữa, để đơn giản chúng ta dùng các điểm chia xi ban đầu (trong phần chứng

minh Định lý 1.5) thay cho các mốc zi.

ii) Trong trƣờng hợp f là đƣờng cong tuyến tính từng khúc chúng ta có

thể chọn m tƣơng đối lớn, sau đó giản lƣợc bớt các luật bằng cách loại thứ i ra

khỏi cơ sở luật M nếu )()(

)()(

11

1

11

1

ii

ii

ii

ii

zfzf

zfzf

zz

zz, i = 1,…, m −1. Hay cách

tốt nhất để xây dựng cơ sở luật đối với đƣờng cong dạng này là các luật tƣơng

ứng với các điểm gấp khúc của đƣờng cong đó.

1.2.3. Phƣơng pháp lập luận tối ƣu dựa trên ĐSGT

Thay vì sử dụng các phƣơng pháp lập luận mờ nhƣ trong [40, 41, 54,

55, 69, 70] tác giả sử dụng hàm ĐLNN của ĐSGT để giải bài toán lập luận

xấp xỉ mờ đa điều kiện. Phƣơng pháp hiện tại sẽ khác với phƣơng pháp trong

[32] ở bƣớc chọn các tham số cho hàm ĐLNN. Lƣu ý rằng, trong phƣơng

pháp nội suy gia tử đã sử dụng trƣớc đây, các tham số của các ĐSGT đƣợc

chọn bởi trực giác. Bây giờ chúng ta sử dụng lại phƣơng pháp này nhƣng với

các tham số tối ƣu, tức là các tham số của hàm ĐLNN sẽ đƣợc chọn bằng giải

thuật di truyền và ta gọi ĐSGT với các tham số tối ƣu là ĐSGT tối ưu.

Tóm lại, độ đo tính mờ của các gia tử và các phần tử sinh, số lƣợng gia

tử trong ĐSGT sẽ quyết định giá trị ngữ nghĩa còn miền tham chiếu của các

biến sẽ quyết định các giá trị trong miền thực.

28

1.2.4. Hệ tham số của phƣơng pháp nội suy gia tử

Với mô hình mờ (1.1), ý tƣởng xây dựng phƣơng pháp giải bài toán lập

luận đa điều kiện nhƣ sau [6]:

Từ mô hình (1.1) mô tả sự phụ thuộc của Y vào X, chúng ta xem mệnh

đề if-then thứ i nhƣ là một điểm (Ai1, …, Aim, Bi) và do đó mô hình mờ đã cho

mô tả một siêu mặt ngôn ngữ CL trong X1…XmY, trong đó Xj = Dom(Xj)

và Y = Dom(Y) đƣợc xem nhƣ các ĐSGT. Vì vậy, bài toán lập luận đa điều

kiện trên trở thành bài toán “bài toán nội suy ngôn ngữ” tƣơng ứng với CL.

Phƣơng pháp nội suy gia tử bao gồm các bƣớc sau:

1) Định lượng ngữ nghĩa, ngữ nghĩa hóa và giải nghĩa: Xây dựng các

ánh xạ ĐLNN Xj và Y, để ánh xạ các giá trị ngôn ngữ trong Xj và Y vào

đoạn [0,1], một cách tƣơng ứng, với j = 1, .., m. Trong lý thuyết ĐSGT, chúng

ta sử dụng miền ngữ nghĩa là miền [0,1], nhƣng trong thực tế các ánh xạ này

có thể hình dung nhƣ sau:

X f

[a, b] g

[0,1]

trong đó X là miền ngôn ngữ của biến ngôn ngữ X, [a, b] là miền tham chiếu

của biến X, f đƣợc gọi là ánh xạ định lƣợng thực và g là ánh xạ 1–1 dùng để

ngữ nghĩa hóa. Khi đó, ta có thể xem hàm ĐLNN X = g o f, với phép toán

“o” là phép hợp thành hai ánh xạ. Ánh xạ g–1

đi từ đoạn [0,1] vào đoạn [a, b]

đƣợc gọi là ánh xạ giải nghĩa.

Quan trọng nhất trong các bƣớc là việc xác định các tham số của hàm

ĐLNN, cụ thể là độ đo tính mờ của các phần tử sinh và các gia tử ngôn ngữ

của các biến ngôn ngữ Xj và Y. Giả sử rằng ĐSGT của biến Xj là AXj = (Xj,

Gj, Hj, j) và AXj có kj gia tử, tức là |Hj| = kj, j = 1, 2, … m, ĐSGT của biến Y

là AY = (Y, G, H, ) với số gia tử trong tập H bằng k: |H| = k.

Hệ các tham số bao gồm:

29

– (m + 1) tham số của độ đo tính mờ của các phần tử sinh trong các

ĐSGT: j = fm(cj), với j = 1, 2, … m, và = fm(c

).

– kj tham số độ đo tính mờ của các gia tử trong Hj: j1, j2, …, j

jk , thứ

tự của chúng trong dãy là (hj,q, ..., hj,1, hj1,..., hjp) cho AXj, trong đó hj,1 <

hj,2 < ... < hj,q và hj1 < ...< hjp.

– k tham số độ đo tính mờ của các gia tử trong H: 1, 2, …, k, thứ tự

các gia tử đƣợc sắp theo dãy (hq, ..., h1, h1,..., hp) cho đại số AY, trong đó h1

< ... < hq và h1 < ...< hp.

2) Bộ nhớ kết hợp ngữ nghĩa (SAM – Semantic Associative Memory):

Sử dụng các ánh xạ Xj và Y, chuyển mô hình (1.2) (còn gọi là bộ nhớ kết

hợp mờ FAM – Fuzzy Associative Memory) sang bảng SAM, và nhƣ vậy

chúng ta xác định đƣợc một siêu mặt Cr,m+1 trong không gian [0,1]m+1

của

không gian thực (m + 1) chiều.

3) Phương pháp lập luận nội suy: Bài toán nội suy ngôn ngữ bây giờ

trở thành bài toán nội suy kinh điển trên siêu mặt số thực Cr,m+1, tức là với dữ

liệu đầu vào (X1(A1,1), …, Xm(A1,m)) trong không gian Rm, tính giá trị đầu ra

Y(B0) dựa vào lƣới điểm đƣợc xác định bởi n điểm (X1(Ai,1), …, Xm(Ai,m)), i

= 1, 2, …, n, vì thế, điểm (X1(A1,1), …, Xm(A1,m), Y(B1)) sẽ là điểm trong

không gian thực (m + 1) chiều nằm gần nhất có thể có đối với siêu mặt Cr,m+1.

Tại bƣớc này, chúng ta sử dụng:

– Chọn phép toán kết nhập trung bình có trọng số Agg với các trọng số

w1, …, wm [77] để kết nhập m thành phần đầu tiên của các điểm trong không

gian Cr,m+1 và thu đƣợc đƣờng cong Cr,2 trong không gian [0,1][0,1].

– Dùng phƣơng pháp nội suy cổ điển trên đƣờng cong Cr,2 để tính giá

trị đầu ra Y(B0) tƣơng ứng với giá trị đầu vào cho trƣớc.

30

1.3. Tổng quan về nâng cao độ tƣơng phản ảnh

1.3.1. Tăng cƣờng độ tƣơng phản ảnh dựa trên logic mờ

Trong [17], Cheng đã đề xuất một phƣơng pháp tăng cƣờng ĐTP mờ

trực tiếp thích ứng mới. Trong phƣơng pháp này hàm thành viên Sigma đƣợc

sử dụng để ánh xạ ảnh đầu vào từ miền không gian vào miền mờ. Trong khi

chuyển ảnh từ một không gian màu (RGB) vào không gian màu khác nhƣ

(HSV, HIS, YIQ) sắc độ không bị thay đổi chỉ thành phần cƣờng độ và độ

bão hoà bị thay đổi. Tuy nhiên, ảnh sau tăng cƣờng có thể không còn giữ

đƣợc sự trong trẻo. Để khắc phục vấn đề này, trong [63], Naik đã cố gắng giữ

các giá trị đƣợc biến đổi trong phạm vi của không gian mầu RGB.

Trong [71], hai kĩ thuật tăng cƣờng là tăng cƣờng ĐTP dựa trên luật mờ

và tăng cƣờng ĐTP sử dụng toán tử tăng cƣờng đƣợc trình bày với ảnh xám

ĐTP thấp. Trong kĩ thuật đầu tiên, hàm ứng với hệ mờ thu đƣợc bởi các luật

if-then đơn giản, và trong kĩ thuật thứ hai toán tử tăng cƣờng ĐTP mờ đóng

vai trò nhƣ công cụ cho việc tăng cƣờng ĐTP trong miền mờ. Sự phân tích so

sánh của các kĩ thuật này đƣợc thực hiện bởi việc tính chỉ số mờ và thời gian

xử lý. Giá trị thấp hơn của chỉ số mờ biểu thị ảnh tăng cƣờng tốt hơn.

Kết quả thực nghiệm cho thấy, lƣợc đồ xám của ảnh gốc và các ảnh

tăng cƣờng có các đặc trƣng cơ bản giống nhau, điều này không làm đƣợc

trong cân bằng lƣợc đồ xám [72]. Ngoài ra, tăng cƣờng ĐTP sử dụng kĩ thuật

toán tử tăng cƣờng có các giá trị chỉ số mờ thấp hơn khi so với kĩ thuật tăng

cƣờng ĐTP sử dụng luật mờ. Tuy nhiên, về thời gian xử lý, kĩ thuật tăng

cƣờng ĐTP dựa trên luật mờ yêu cầu thời gian ít hơn kĩ thuật tăng cƣờng sử

dụng toán tử tăng cƣờng.

1.3.2. Một số thuật toán tăng cƣờng theo tiếp cận mờ

1.3.2.1. Biểu diễn mờ của ảnh đơn kênh

31

Lý thuyết tập mờ đƣợc giới thiệu bởi Zadeh đề cập đến mô hình toán

học cho việc nghiên cứu về ảnh mới. Theo đó một ảnh I kích thƣớc M x N và

L lớp màu xám có thể đƣợc định nghĩa dƣới dạng một ma trận mờ, trong đó

mỗi một giá trị hàm biểu diễn mức độ của lớp màu, với l = 0, 1, … L-1. Với

ảnh I chúng ta có thể biểu diễn dƣới dạng tập mờ [28][31] nhƣ sau:

⋃ m = 1, 2, …, M và n = 1, 2, …, N (1.2)

Trong đó gmn là cƣờng độ của điểm ảnh (m, n) và giá trị thành viên của

nó μmn. Hàm thành viên đặc trƣng cho thuộc tính thích nghi của ảnh (ví dụ

thuộc tính biên, tối, kết cấu). Trong những năm gần đây, một số nhà nghiên

cứu đã áp dụng khái niệm mờ để phát triển các thuật toán mới cho việc tăng

cƣờng ảnh.

Ví dụ: Biểu diễn mờ ảnh RGB với toán tử INT.

: [0 ,1] [0 ,1]IN T

2

2

2 , 0 0 .5( ) ( )

1 2 (1 ) , 0 .5 1

x xx IN T x

x x

Khi đó hàm INT trên một tập mờ A và sinh ra một tập mờ A’ = INT(A),

hàm thành viên của A’ đƣợc định nghĩa nhƣ sau:

( ) ( )( )

2

' 2

2 ( ( )) , 0 ( ) 0 .5( )

1 2 (1 ( )) , 0 .5 ( ) 1

A A

A

A A

x xx

x x

Toán tử này làm giảm tính mờ của tập mờ A bằng việc tăng giá trị của

hàm ( ) nếu giá trị hàm ( ) lớn hơn 0.5 và ngƣợc lại, làm giảm tính mờ

của tập mờ A bằng việc giảm giá trị của hàm ( ) xuống nếu giá trị hàm

( ) nhở hơn 0.5.

32

Hình 1.3. Đồ thị toán tử INT

Trong biểu diễn mầu RGB, I={IR, IG, IB}, biểu diễn mờ của ảnh I là ma

trận độ thuộc I’={IR, IG, IB}

'

ij ij( , , ) ( IN T (r/255 .0 ),IN T (g /255 .0 ),IN T (b /255 .0 ))p r g b I p

(a)

(b)

(c)

(d)

Hình 1.4. (a) Ảnh gốc, (b), (d) biểu diễn mờ với toán tử INT của kênh R, G và B

tƣơng ứng

33

1.3.2.2. Biểu diễn mờ hóa ảnh với phân cụm mờ FCM

Trong thuật toán phân cụm mờ c-Means, mỗi điểm ảnh có thể là thành

viên của nhiều cụm với mức độ thuộc không nhƣ nhau. Thuật toán phân cụm

c-Means tiến hành với quá trình tối ƣu hoá lặp của sự cực tiểu hoá một hàm

mục tiêu mờ đƣợc định nghĩa tại công thức sau đây:

2

m

1 1

J ( ) d ( , ) m in

c n

m

ik k i

i k

x V

trong đó:

c: số cụm, n: số điểm ảnh,

µik: giá trị liên thuộc của điểm ảnh thứ k với tập thứ i

m: độ mờ của mỗi liên thuộc mờ, khi m tiệm cận đến 1 thì thuật toán

này tƣơng tự nhƣ phân cụm k-means mô tả trên đây.

xk: vector của điểm ảnh k, Vi: vector tâm của cụm i

d2(xk, Vi): khoảng cách Euclide giữa xk và Vi

Giá trị độ thuộc µik đƣợc ƣớc lƣợng bởi khoảng cách giữa điểm ảnh k

và trung tâm của cụm i, ràng buộc theo công thức sau:

1

1

0 1, i ,k

1, k

0 , i

ik

c

ik

i

n

ik

k

trong đó, µik: giá trị độ thuộc của điểm ảnh thứ k với tập thứ I, c: số cụm, n: số

điểm ảnh

Tâm của cụm Vi và giá trị độ thuộc µik có thể đƣợc tính theo các công

thức sau:

1

1

( )

V ,1

( )

n

m

ik k

k

i n

m

ik

k

x

i c

34

12

1

1 ,

( , ), 1 i c ,1 k n

( )

mc

k i

ik

j k j

d x V

d x V

Do đó, Jm đƣợc cực tiểu hoá bằng việc tính toán lặp qua hai công đoạn

trên đây. Bƣớc đầu tiên của quá trình lặp là khởi tạo giá trị cố định c, tham số

mờ m, ngƣỡng hội tụ ε và một tâm khởi tạo của mỗi cụm, sau đó tính µik và Vi

bằng việc sử dụng hai công thức trên. Quá trình lặp kết thúc khi sự thay đổi

của Vi giữa hai bƣớc lặp nhỏ hơn ε. Kết quả thu đƣợc là mỗi điểm ảnh đƣợc

phân vào một tập các liên thuộc của các cụm.

Khi sử dụng phân cụm mờ FCM với số cụm C, ta thu đƣợc C “ảnh độ

thuộc” cùng kích thƣớc với ảnh gốc.

(a)

(b)

(c)

(d)

35

(e)

(g)

Hình 1.5. Phân cụm FCM với C = 5 cụm, (a) ảnh gốc, (b)-(g) ảnh ma trận độ

thuộc cum số 1 {µi,j,1} -5 {µi,j,5}.

1.4. Một số thuật toán nâng độ sáng tối của điểm ảnh

Nguyên tắc của lƣợc đồ tăng cƣờng mờ đƣợc minh họa trong hình sau:

Hình 1.6. Nguyên tắc chính của tăng cƣờng ảnh mờ [29].

1.4.1. Toán tử tăng cƣờng

Phƣơng pháp này sử dụng toán tử tăng cƣờng để giảm tính mờ của ảnh

mà đƣa ra trong một sự tăng cƣờng ĐTP ảnh [68]. Thuật toán có thể đƣợc

phát biểu nhƣ sau:

Bước 1: Đặt các tham số Fe (Exponential fuzzifiers), Fd

(Denomination fuzzifiers), gmax (Maximum gray level) của hàm thành viên

Fe= 2 và

(1.3)

Bước 2: Định nghĩa hàm thành viên

( ) [

]

(1.4)

Bước 3: Thay đổi giá trị thành viên

{

[ ]

[ ]

(1.5)

36

Bước 4: Sinh mức xám mới

(

) ((( )

)) (1.6)

(a) Ảnh gốc

(b) Ảnh kết quả sinh bởi toán tử tăng

cƣờng [31]

(c) Dạng hàm biến đổi

(d) Ảnh gốc

(e) Kết quả sinh bởi toán tử tăng cƣờng

[31]


Hình 1.7. Một số thử nghiệm nâng cao ĐTP sử dụng toán tử tăng cƣờng.

1.4.2. Tăng cƣờng với toán tử Hyperbol

Ý tƣởng của lƣợc đồ xám với toán tử hyperbol, và lƣợc đồ xám với

toán tử hyperbol mờ đƣợc mô tả tƣơng ứng trong [75]. Do nhận thức độ sáng

37

của con ngƣời phi tuyến, thuật toán này thay đổi giá trị thành viên của các

mức xám bởi hàm logarit. Thuật toán có thể đƣợc phát biểu nhƣ sau:

Bước 1: Thiết lập dạng hàm thành viên.

Bước 2: Đặt giá trị của tham số mờ β.

Bước 3: Tính các giá trị thành viên μmn.

Bước 4: Thay đổi các giá trị thành viên bởi β.

Bước 5: Sinh mức xám mới, nhƣ mô tả ở dƣới.

Trong thuật toán này, dạng của hàm thành viên đƣợc thiết lập nhƣ tam

giác để đặc trƣng cho ranh giới, và giá trị của tham số mờ β nhƣ một ranh

giới. Sau đó, bằng việc tính giá trị thành viên μmn và thay đổi giá trị thành

viên bởi β, sinh giá trị mức xám mới g’mn bởi đẳng thức sau:

'

1

11 1

1

m ng

m ng L e

e

(1.7)

1.4.3. Tăng cƣờng dựa trên suy diễn hệ luật mờ (Fuzzy rule)

Dựa trên các luật cơ bản sau, thuật toán nâng cao ĐTP ảnh đã đƣợc

phát triển và thực hiện:

Nếu cƣờng độ điểm ảnh là tối thì kết quả tối hơn.

Nếu cƣờng độ điểm ảnh là xám thì kết quả là xám.

Nếu cƣờng độ điểm ảnh là sáng thì kết quả sáng hơn.

Hình 1.8. Ảnh kết quả sử dụng suy diễn luật if-then [31] cho ảnh ở hình 1.4.a

38

1.4.4. Một số độ đo chất lƣợng tăng cƣờng ảnh

Để đánh giá chất lƣợng ảnh, chúng ta có thể sử dụng phƣơng pháp trực

quan hay các chỉ số độ đo chất lƣợng. Để đo ĐTP của ảnh, chúng ta có thể sử

dụng một số độ đo nhƣ sau: Shannon Entropy H [65], Entropy mờ FH [26],

chỉ số tuyến tính mờ γ [71], độ đo chất lƣợng ảnh IQM v.v…

1.5. Thuật toán nâng cao độ tƣơng phản ảnh của Cheng

Trong [16] Cheng và cộng sự đã sử dụng hàm S-function để chuyển

một ảnh xám sang miền fuzzy, sau đó nghiên cứu nâng cao ĐTP của ảnh

trong miền fuzzy. ĐTP của điểm ảnh Cij với (i,j) là tâm của cửa sổ Wij đƣợc

xác định dựa trên giá trị trung bình mức xám không thuần nhất của điểm

ảnh (i, j) [17].

|

|

Phép nâng cao ĐTP trực tiếp của một ảnh xám đƣợc công bố trong [17]

có thể đƣợc tóm tắt nhƣ sau:

Giả sử gij là mức xám của một điểm ảnh I(i,j) của ảnh đa cấp xám I

kích thƣớc M × N, và Wij cửa sổ lân cận tại (i,j) kích thƣớc d × d. Thực hiện

tuần tự các bƣớc sau:

Đầu vào: Ảnh đa cấp xám I, kích thƣớc M x N, kích thƣớc cửa sổ d.

Bƣớc 1: Tính các tham số địa phƣơng, chuẩn hóa giá trị về đoạn [0,1],

gradient Eij, entropy Hij, trung bình độ lệch chuẩn Vij, và moment bậc 4 R4,ij:

1.1: Tính cƣờng độ biên ảnh:

e={eij} là giá trị cƣờng độ biên ảnh xám đầu vào bằng một toán tử xác

định ảnh biên nhƣ toán tử Sobel.

1.2: Giá trị trung bình, độ lệch chuẩn

= {ij}, v = {vij}, trong đó ij là giá trị trung bình mức xám, vij là độ

lệch chuẩn mức xám lấy tại lân cận điểm ảnh gij

39

ij( , ) W

ij 2

p q

p q

g

d

,

i j

2

ij

( , ) W

ij 2

p q

p q

g

vd

(1.8)

1.3: Tính giá trị entropy địa phƣơng

1

ij

lo g

2 lo g

L

k k

k

p p

hd

,

ij

2

# ( , ) W :p q

k

p q g kp

d

(1.9)

1.4: Tính moment bậc 4

i j

4

ij

( , ) W

4 ,ij 21

p q

p q

g

d

(1.10)

1.5: Chuẩn hóa về miền giá trị là đoạn [0,1]

i j

i j

i jm a x

eE

e ,

i j

i j

i j

,m a x

vV

v

i j

i jm a x

i j

hH

h ,

4 ,ij

4 ,

4 ,i jm a x

i jR

(1.11)

Bƣớc 2: Tính giá trị độ thuần nhất của điểm ảnh và giá trị mức xám

không thuần nhất

2.1: Tính giá trị đo độ thuần nhất tại điểm ảnh

i j

i j

i jm ax

H O

H O , trong đó

(1.12)

ij 4 ij ij 4 ,* * * 1 * 1 * 1 * 1

ij ij ij ij ij ijH O E V H R E V H R (1.13)

2.2: Tính giá trị mức xám không thuần nhất (non-homogeneity gray

value [17])

i j

i j

( , ) W

ij

( , ) W

(1 )

(1 )

p q p q

p q

p q

p q

g

(1.14)

Bƣớc 3: Tính giá trị ĐTP tại từng điểm ảnh và số mũ khuếch đại

3.1: Giá trị ĐTP

i j i j

i j

i j i j

gC

g

(1.15)

3.2: Số mũ khuếch đại

40

a x m in ij m in

ij m in

a x m in

*m

m

, trong đó

(1.16)

1

m in

a x 1

k

m

g g

g g

, m a x

1 , gk, g1 là các đỉnh của lƣợc đồ xám đƣợc

xác định theo [13]

(1.17)

3.3: Nâng ĐTP

i j'

i j i j

t

C C

, trong đó t{0.25, 0.5} là tham số [6] (1.18)

3.4: Tính giá trị mức xám mới tại từng điểm ảnh

i j

i j

i j

i j

'

i j i j

i j i j i j i j'

i ji j'

i j'

i j i j

i j i j i j i j'

i ji j

1 1,

1 1

1 1,

1 1

t

t

t

t

C Cg

C C

g

C Cg

C C

(1.19)

Đầu ra: Ảnh xám đã đƣợc nâng cao ĐTP I’.

Cũng trong [17] Cheng và cộng sự Dải động của mức xám:

Dựa trên lƣợc đồ xám của ảnh, trong [16, 17] nhận thấy đỉnh đầu tiên

của lƣợc đồ xám của ảnh liên quan đến vùng nền và mức xám lớn hơn đỉnh

sau cùng có thể là nhiễu. Vì vậy các đã đề xuất cách xác định dải động của

mức xám nhƣ sau:

Dải động mức xám là đoạn [a,c] ở đó:

a = min{(1 - f2)(g1 - Lmin) + Lmin,B1},

c = max{f2(Lmax - gk) + gk, B2} (1.20)

Trong đó B1, B2 đƣợc xác định:

a x1

m in m in

1is ( ) is ( )

mLB

i L i L

H i f H i

,

ax ax

2 m in

1is ( ) is ( )

m mL L

i B i L

H i f H i

(1.21)

Lmin, Lmax là giá trị mức xám nhỏ nhất và lớn nhất của ảnh, các hằng số

41

f1 = 0.01, f2 = 0.5 đƣợc xác định bằng thực nghiệm.

a x

1

a x

is ( )

is ( )

k

m i

i

m

H g

H gk

, k là số điểm cực đại địa phƣơng của lƣợc đồ xám,

Một đặc tính cơ bản của thuật toán trên [17] là luật sau đƣợc thỏa mãn

bởi phép nâng cao ĐTP:

Đặc tính của thuật toán [17]: Tại từng điểm ảnh, độ thuần nhất càng cao

thì mức độ nâng tƣơng phản càng thấp.

Phép nâng cao ĐTP của Cheng thỏa mãn luật: Tại từng điểm ảnh trên

đó tác động bƣớc 1-3, độ thuần nhất điểm ảnh càng cao thì mức độ nâng

tƣơng phản tại điểm ảnh đó càng thấp. (tạm ký hiệu là: RCE-rule of

contrast enhancement).

Do một biến đổi ảnh là đơn điệu tăng, thƣờng bảo toàn cƣờng độ biên

ảnh và giá trị entropy địa phƣơng nên luật RCE nói chung cũng thỏa mãn với

ảnh gốc ngay cả khi trong phép nâng cao ĐTP trực tiếp có sử dụng một biến

đổi ảnh.

1.6. Các chỉ số đánh giá

Để đảm bảo tính khách quan, khi đánh giá hiệu quả của các thuật toán

nâng cao ĐTP ngoài đánh giá bằng trực quan, các nghiên cứu thƣờng sử dụng

các chỉ số đánh giá khách quan ĐTP ảnh, cụ thể là:

(i) Chỉ số entropy [65] đƣợc lấy trung bình trên toàn bộ các điểm ảnh và

các kênh ảnh, chúng đƣợc cho nhƣ sau:

m ax

2

m in

( ) ( ) lo g ( ( ))

k

k

L

k k k

g L

E I p g p g

1

1 ,

( )

( )

K

k

k

a vg K

E I

E IK

, trong đó

(1.22)

# ( , )( )

d e f

k

k

I i j gp g

M N

và quy ƣớc 0*log2(0)=0.

42

Giá trị của chỉ số entropy cao thì có thể xem ảnh là giầu tính chi tiết. Chỉ

số entropy của ảnh kết quả càng cao thì khả năng là ảnh kết quả bảo toàn tốt

tính chi tiết của ảnh gốc.

(ii) Chỉ số đánh giá khách quan fuzzy-entropy [26] đƣợc lấy trung bình

trên toàn bộ các điểm ảnh và các kênh ảnh, chúng đƣợc cho nhƣ sau:

Giả sử k ,m in k ,m a x

[L , L ] ( ) [0 ,1]k k

g g là một phép mờ hóa nào đó

, ax

,m in

2 2( ) ( ( ) lo g ( ) (1 ( )) lo g (1 ( ))) * ( )

k m

k

L

k k

g L

H I g g g g p g

(1.23)

Dƣới đây chúng ta sẽ dùng phép mờ hóa tự nhiên:

, m in

, m ax , m in

( )

d e fk

k k

g Lg g

L L

(1.24)

Khi đó ta viết gọn H thay cho H, và ta có một độ đo fuzzy-entropy

trung bình của K kênh ảnh nhƣ sau:

1

1 ,

( )

( )

K

k

k

a v g K

H I

H IK

(1.25)

(iii) Chỉ số ĐTP trực tiếp

Chỉ số ĐTP trực tiếp đƣợc lấy trung bình trên toàn bộ các điểm ảnh của

một kênh ảnh Ik’ so với một kênh ảnh gốc Ik (Ik’ và Ik có cùng kích thƣớc M x

N), chúng đƣợc cho nhƣ sau:

'

, i j

'

i ,j , i j'

( , )

( , )( , ) ,

k k

k k

k k

I i j

I i jC M I I

M N

(1.26)

ở đây δk,ij là giá trị mức xám không thuần nhất tại điểm ảnh (i, j) của Ik. δk,ij

đƣợc tính trong lân cận d x d, tham số d thƣờng cố định (d = 3) nên trong định

nghĩa CM, tác giả bỏ qua không đề cập đến d nhƣ là một tham số của CM.

Nhận xét: Nói chung ta có,

' '

( , ) ( , )k k k k

C M I I C M I I

43

" ' " '( , ) ( , ) ( , ) ( , )

k k k k k k k kC M J I C M J I C M I I C M I I ở đây Ik, Jk, Ik’ và

Ik” là các kênh ảnh có cùng kích thƣớc. Nhận xét nhấn mạnh là phép nâng cao

ĐTP của ảnh biến đổi từ ảnh gốc thì chƣa chắc đã là phép nâng cao ĐTP của

ảnh gốc.

1.7. Tập dữ liệu thực nghiệm

Trong thực nghiệm chúng tôi đã sử dụng đa dạng các kiểu ảnh mầu, các

kênh mầu của ảnh vệ tinh. Các ảnh đa mầu đƣợc chọn điển hình từ loại ảnh

tối, ảnh sáng, ảnh có ĐTP các kênh là thấp, ảnh có ĐTP các kênh là cao

v.v... Các ảnh có thể có độ sáng thấp và chi tiết ảnh là không quan sát đƣợc rõ

bằng mắt.

Tập ảnh mầu đƣợc dùng để thể hiện trong khuôn khổ luận án này gồm

một số ảnh mầu thƣờng đƣợc sử dụng trong các bài báo khoa học về nâng cao

ĐTP ảnh, một ảnh viễn thám 3 kênh mầu Chàm, Lục, Đỏ của ảnh vệ tinh

LANDSAT ETM+ chụp khu vực huyện Lạc Thủy Hòa Bình ngày 15/02/2001

của Việt Nam, bộ dữ liệu ảnh TID2013 thông dụng (24 ảnh tự nhiên) đƣợc

thu thập từ [61] và 03 ảnh nghệ thuật của họa sỹ Dƣơng Quốc Định (xem

phần mục lục).

Kết luận chƣơng 1

Chƣơng này trình bày tổng quan về ĐSGT, phƣơng pháp lập luận dựa

trên ĐSGT, khả năng xấp xỉ hàm của phƣơng pháp HA-IRMd, ứng dụng xấp

xỉ hàm trong xây dựng hệ luật và phƣơng pháp lập luận tối ƣu dựa trên ĐSGT

cũng nhƣ hệ tham số của phƣơng pháp lập luận tối ƣu. Cũng trong chƣơng

này trình bày tổng quan về nâng cao ĐTP ảnh, một số thuật toán tăng cƣờng

theo tiếp cận mờ, biểu diễn mờ hóa ảnh, một số thuật toán nâng cao ĐTP của

điểm ảnh cũng nhƣ toán tử tăng cƣờng. Phần tiếp theo của chƣơng này, luận

án trình bày và phân tích thuật toán nâng cao ĐTP ảnh của Cheng.

44

CHƢƠNG 2.

BIẾN ĐỔI ẢNH ĐA KÊNH VÀ XÂY DỰNG HÀM BIẾN ĐỔI CHỮ S

THEO TIẾP CẬN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO

ĐỘ TƢƠNG PHẢN ẢNH ĐA KÊNH

Trong [17] theo tiếp cận thuật toán của Cheng, thực nghiệm lại cho

thấy nếu không thực hiện biến đổi mờ hóa ảnh trƣớc khi nâng cao ĐTP ảnh

thì độ sáng của ảnh kết quả ít thay đổi. Phép biến đổi ảnh trong [16] chỉ sử

dụng một dải động mức xám dựa trên việc khảo sát tất cả các đỉnh của lƣợc

đồ xám. Việc chỉ sử dụng một dải động mức xám sẽ không bao quát hết đƣợc

sự biến đổi của lƣợc đồ xám nên trong nhiều trƣờng hợp ảnh bị mất chi tiết.

Hơn nữa, nâng cao ĐTP ảnh nói chung đều dẫn đến thiết kế một hàm

biến đổi mức xám dạng chữ S. Trong suy diễn hệ luật mờ, việc lựa chọn hàm

thuộc để tạo ra hàm biến đổi mức xám có dạng chữ S không phải là việc dễ

dàng. Thậm chí, khi đạt đƣợc hàm biến đổi mức xám dạng chữ S thì kết quả

có thể chƣa hợp lý. Trong [17], hàm chữ S đƣợc tạo ra không cân xứng và giá

trị độ xám của điểm ảnh đầu ra có thể nằm ngoài miền giá trị độ xám, ảnh kết

quả có thể mất chi tiết.

Trong chƣơng này luận án trình bày phƣơng pháp xây dựng phép biến

đổi mờ hóa ảnh đa kênh [CT 1], [CT 4] làm bƣớc tiền đề cho quy trình nâng

cao ĐTP ảnh, để thay đổi độ sáng của ảnh và khắc phục nhƣợc điểm làm mất

chi tiết ảnh trong phƣơng pháp biến đổi ảnh của [16].

Cũng trong chƣơng này luận án trình bày phƣơng pháp xây dựng hàm

biến đổi độ xám dạng chữ S dựa trên ĐSGT [CT 5] để cải tiến thuật toán của

Cheng, ứng dụng nâng cao ĐTP ảnh đa kênh.

Để xây dựng phƣơng pháp biến đổi mờ hóa ảnh đa kênh mới, trƣớc hết

tác giả đề xuất thay thế tiếp cận của Cheng sử dụng một dải động mức xám

dựa trên lƣợc đồ xám của kênh ảnh bằng nhiều dải động mức xám ứng với

45

từng kênh ảnh dựa trên lƣợc đồ xám mờ để thiết lập tham số của phép biến

đổi mờ hóa cho từng kênh ảnh. Các tham số này thiết lập một ràng buộc tự

nhiên của các phép biến đổi mờ hóa giữa các kênh ảnh.

Sau khi biến đổi ảnh cho mỗi kênh ảnh, tác giả xây dựng một toán tử

Hint để nâng cao ĐTP của từng điểm ảnh (của kênh ảnh đã đƣợc biến đổi) so

với mức xám “trung bình” xung quanh lân cận điểm ảnh. Toán tử Hint đƣợc

xây dựng dựa trên hệ luật ngôn ngữ khá tự nhiên. Lập luận ngôn ngữ đƣợc

nhúng vào ĐSGT với phép nội suy đƣờng cong dạng hàm mũ để tạo ra giá trị

biến đổi mức xám của điểm ảnh ứng với từng kênh ảnh (kênh ảnh đã đƣợc

biến đổi bằng một biến đổi ảnh). Toán tử tăng cƣờng Hint tạo ra từ một hàm

biến đổi mức xám dạng chữ S, đối xứng thỏa mãn luật nâng cao ĐTP RCE

của Cheng và có độ nâng cao tƣơng phản tốt hơn phƣơng pháp của Cheng.

2.1. Biến đổi ảnh đa kênh

2.1.1. Ƣớc lƣợng nhiều dải động mức xám dựa vào phân cụm mờ FCM

Phân cụm mờ FCM [14] đƣợc sử dụng hiệu quả trong một số nghiên cứu

về nâng cao ĐTP của ảnh một kênh.

Trong [68] đã trình bày một cách xác định dải động của miền giá trị mức

xám bằng cách sử dụng thuật toán phân cụm mờ FCM, khi đó các cụm ảnh có

tính chất đều hơn, và do đó việc xác định dải động mức xám là tƣơng đối dễ

dàng. Ngoài ra trong [56] cũng sử dụng FCM để phân đoạn lƣợc đồ xám và

nâng cao ĐTP theo bộ phận của lƣợc đồ xám.

Để có thể ƣớc lƣợng tự động dải động mức xám cho nhiều loại ảnh khác

nhau nhƣ ảnh tối, ảnh sáng, ảnh có ĐTP thấp và ảnh có ĐTP cao, chúng tôi đề

xuất sử dụng phân cụm mờ để ƣớc lƣợng dải động của mức xám của từng

kênh ảnh của ảnh đa kênh. Lƣu ý rằng trong một số biểu diễn màu nhƣ biểu

diễn màu RGB, các kênh ảnh là không độc lập mà có độ tƣơng quan cao, vì

thế cách làm ƣớc lƣợng dải động của từng kênh ảnh độc lập là không hoàn

46

toàn phù hợp trong trƣờng hợp tổng quát. Trong kỹ thuật của tác giả, do đặc

tính của thuật toán phân cụm mờ là thích hợp cho dữ liệu đầu vào dạng vector

số nên kỹ thuật sử dụng FCM sẽ có tính khái quát cao khi áp dụng cho các

kênh ảnh có sự tƣơng quan.

Sau khi phân cụm, việc ƣớc lƣợng dải động mức xám của từng cụm sẽ

dễ dàng hơn do tính đồng nhất cao của giá trị mức xám trong một cụm.

Với một tổ hợp K kênh ảnh của ảnh I (trong một biểu diễn màu), để

thuận tiện chúng ta ký hiệu 1 2 K1,

{I , I , ..., I }K

I , sử dụng thuật toán phân cụm

mờ FCM phân cụm 1, K

I thành C cụm, C ≥ 2. Thuật toán lặp FCM cực tiểu

hóa hàm mục tiêu:

( , )J V 2

2

, ,

, 1

1,( , ) m in

C

i j c c

i j c

KI i j V

(2.1)

với độ đo khoảng cách Ơcơlit, 2

1,

1

( , ) ( ( , ) ( ))

K

c k cK

k

I i j V I i j V k

và các ràng

buộc biến nhƣ sau:

(i) i , j, c[0 ,1] ,1 c C

(ii) C

i , j, c

c 1

1, 1 i M , 1 j N

(iii) i , j , c

i , j

, 1 c C0

(2.2)

Nhƣ vậy với FCM chúng ta nhận đƣợc bảng các giá trị độ thuộc từng

cụm cho từng điểm ảnh là , ,i j c , trong đó 1≤ c ≤ C, 1 ≤ i ≤ M và 1 ≤ j ≤ N.

2.1.2. Lƣợc đồ xám mờ với phân cụm FCM

Lƣợc đồ xám của kênh ảnh đã đƣợc sử dụng để ƣớc lƣợng một dải

động mức xám [64]. Do lƣợc đồ xám của kênh ảnh có sự thay đổi hình dạng

khá phức tạp nên công việc ƣớc lƣợng dải động mức xám dựa trên lƣợc đồ

xám là không dễ dàng. Trong mục này, luận án đề xuất việc xây dựng một

công cụ, gọi là lƣợc đồ xám mờ nhằm mục đích ƣớc lƣợng các dải động mức

47

xám hiệu quả hơn sau khi đã phân cụm tổ hợp kênh ảnh đầu vào bằng thuật

toán FCM. Chi tiết của phƣơng pháp đề xuất đƣợc trình bày dƣới đây.

Định nghĩa 2.1. Lƣợc đồ xám mờ.

Giả sử , ,i j c là bảng độ thuộc thỏa mãn ở công thức (2.2), lƣợc đồ

xám mờ theo từng cụm c chiếu lên kênh Ik của ảnh I (trong một biểu diễn

màu), 1 c C, 1 k K, ký hiệu là k

ch đƣợc xác định nhƣ sau:

1 2

i,j i ,j i ,j i ,j i ,j

, , , m in , m a x

( , ) , ,. . , :

, . . .K k

k

c i j c k k

i j g g g g g g

h g g L L

(2.3)

Nhận xét:

Khi K = 1, C = L1,max – L1,min + 1 và 1 1, m in

1, m a x 1, m in , ,

1, ( , ) 11, 1,

0i j c

I i j L cc L L

Thì 1 ,m in 1

1

1 1, m in 1, m ax(g ) ( ) ,

g L Ih H is g g L L

.

Mệnh đề 2.1. Tính chất của lƣợc đồ xám mờ:

(i) k ,m in k ,m ax

1, , 1, , [L ,L ] : 0 ( ) *k

ck K c C g h g M N

(ii) k ,m in k ,m ax

1

1, , L L : ( ) is ( )k

k

c I

c C

k K g h g H g

(iii) k ,m in k ,m ax

1 , L L

1, : ( ) *k

c

c C g

k K h g M N

Chứng minh:

(i) 1 2

, , i j i j i j i j i j1 ,11 ( , ) , ,. . , :

1 1 *K k

i j c

k

c

i M j Ni j g g g g g g

h g M N

(ii)

1 2

ij ij i j i j i j

1 2 1 2

ij ij i j i j i j i j i j i j i j i j

, ,

1 1 ( , ) , ,.., :

, ,

1( , ) , ,.., : ( , ) , ,.., :

( )

1 ( )

K k

k

K k K k

C

k

c i j c

c C c i j g g g g g g

C

i j c I

ci j g g g g g g i j g g g g g g

h g

H is g

(iii) k ,m ax

k ,m in k ,m ax k ,m in

L

1 , L L L

( ) H is ( ) *k

k

c I

c C g

h g g M N

48

Nhận xét: Tính chất (ii) của mệnh đề 2.1 đã chứng tỏ lƣợc đồ xám

thông thƣờng của kênh ảnh đã đƣợc khai triển thành tổng các lƣợc đồ xám mờ

trên một kênh ảnh. Vì vậy dù mỗi lƣợc đồ xám thông thƣờng có thể có hình

dạng phức tạp, nhiều đỉnh và thung lũng (valey), nhƣng lƣợc đồ xám mờ của

một cụm chiếu trên một kênh ảnh thì có hình dạng đơn giản hơn, tập trung

quanh một đỉnh (là thành phần của tâm cụm theo mỗi kênh ảnh).

(a)

(b)

(c)

(d)

Hình 2.1 . Ảnh gốc #3(a) lƣợc đồ xám kênh R (b), giá trị độ thuộc

{i,j,4}-cụm số 4/5 (c). lƣợc đồ xám mờ kênh R, cụm số 4/5 (d).

Sau khi xác định đƣợc lƣợc đồ xám mờ bằng FCM chúng ta có thể xác

định nhiều dải động và biến đổi mờ hóa từng kênh ảnh của ảnh đa kênh.

2.1.3. Ƣớc lƣợng nhiều dải động mức xám dựa vào lƣợc đồ xám mờ

Ƣớc lƣợng từng vùng mức xám tập trung của lƣợc đồ xám mờ. Đây là

nguyên lý để xác định đƣợc nhiều dải động mức xám của một kênh ảnh của

ảnh đa kênh.

49

Thuật toán 2.1. Ƣớc lƣợng C dải động mức xám của một cụm trong

một tổ hợp kênh ảnh sử dụng lƣợc đồ xám mờ.

Đầu vào: K kênh của ảnh I (trong một biểu diễn màu), 1 K1,

{ I ,...,I }K

I ,

tham số C , 2N C

, ngƣỡng fcut (fcut > 0, đủ nhỏ), M x N là kích thƣớc của

ảnh I.

Đầu ra: 1, , 1 ,

,1 , , 2 ,,

k c k ck K c C

B B

, trong đó ,m in ,1, ,2 , ,m ax

, 1, , 1,k k c k c k

L B B L c C k K

Bƣớc 1: Phân C cụm tập vector dữ liệu 1, , 1, , 1,

( , )i M j N kk K

I i j

bằng

thuật toán FCM chuẩn ta đƣợc 1

C

c cV

,

1 , , 1 , , 1 ,, ,

i M j N c Ci j c

, theo công thức (2.2).

Bƣớc 2: Xác định lƣợc đồ xám mờ 1, , 1 ,

k

cc C k K

h

theo công thức (2.3).

Bƣớc 3: 1, , 1,k K c C

, a x

,m in ,m in

,1 , k ,m in k ,m a xm in : [L ,L ] ( ) ( )

k m

k k

LB

k k

k c c c u t c

g L g L

B B B h g f h g

,m a x , a x

,m in

, 2 , ,1 , k ,m a xm in : [B + 1 ,L ] ( ) ( )

k k m

k

L L

k k

k c k c c cu t c

g B g L

B B B h g f h g

(2.4)

Trả về: 1, , 1 ,

,1 , , 2 ,,

k c k ck K c C

B B

Thuật toán 2.1 có độ phức tạp tồi nhất là O(M*N*L), trong đó L là tham

số số lần lặp tối đa của thuật toán FCM chuẩn.

Hình 2.2. lƣợc đồ xám của kênh V, cụm số 1 ảnh #4 (C = 5), trục hoành

biểu diễn giá trị xám, trục tung biểu thị tần suất

50

2.1.4. Biến đổi kênh ảnh

Sau khi đã xác định đƣợc nhiều dải động mức xám, chúng ta có thể xây

dựng cho mỗi kênh ảnh một phép biến đổi mức xám. Các phép biến đổi giữa

các kênh có sự ràng buộc với nhau do cùng đƣợc xây dựng trên bảng ma trận

3 chiều độ thuộc đầu ra của thuật toán FCM. Chi tiết việc xây dựng các phép

biến đổi ảnh đƣợc trình bày dƣới đây.

Định nghĩa 2.2. Phép biến đổi kênh ảnh của một tổ hợp kênh trong một

biểu diễn màu của ảnh đầu vào:

Xét K kênh của ảnh I, 1 K1,

{ I ,...,I }K

I trong một biểu diễn màu, C

, 2N C

là số cụm, 1, , 1 ,

,1 , , 2 ,,

k c k ck K c C

B B

là các dải động mức xám đƣợc

xác định nhờ thuật toán 2.1.

Với mỗi 1,k K , chúng ta xác định một biến đổi Fk cho kênh ảnh Ik:

,1 ,

, m a x , m in

1 , 2 , ,1 ,

, m in

( , )

( , )

C

k k c

k k

c k c k c

k k

I i j BL L c lip

B BF i j L

C

(2.5)

, trong đó 1, , 1, , 1,k K i M j N , clip(x) = min{max{x, 0}, 1} và [x] chỉ phần

nguyên của số thực x.

Nhận xét: Biến đổi ảnh Fk bảo toàn thứ tự, nghĩa là

, m in , m a x( , ) ( ', ') ( , ) ( ', ')

k k k k k kI i j I i j L F i j F i j L

Mệnh đề 2.2. Biến đổi ảnh Fk bảo toàn thứ tự, nghĩa là

, m in , m a x( , ) ( ', ') ( , ) ( ', ')

k k k k k kI i j I i j L F i j F i j L

Chứng minh:

Clip là hàm không giảm trên đoạn [0,1] do x1 ≤ x2 0 ≤ clip(x1) ≤

clip(x2) ≤ 1, nên nếu , m in , m a x( , ) ( ', ') ( , ) ( ', ')

k k k k k kI i j I i j L F i j F i j L (đpcm).

Nhận xét: Mệnh đề 2.2 nói lên tính chất ảnh kết quả sau khi biến đổi

bảo toàn chi tiết của kênh ảnh đầu vào trong miền giá trị mức xám, không xảy

51

ra trƣờng hợp các điểm ảnh có giá trị mức xám nhỏ sau khi biến đổi ảnh lại

biến thành các điểm ảnh có giá trị mức xám lớn.

2.1.5. Nâng cao độ tƣơng phản ảnh kết hợp với biến đổi ảnh

Kỹ thuật nâng cao ĐTP ảnh màu trong biểu diễn màu HSV đƣợc thực

hiện nhƣ sau:

Đầu tiên, ảnh RGB đầu vào đƣợc chuyển sang biểu diễn HSV.

Tiếp theo, thuật toán sẽ sử dụng ảnh 2 kênh {S, V} nhƣ một ảnh 2 kênh

đầu vào để thực hiện phép nâng cao ĐTP đƣợc thực hiện theo thuật toán 2.2

nhƣ dƣới đây.

Cuối cùng, hai kênh ảnh {S, V} mới là đầu ra thu nhận đƣợc sẽ kết hợp

với kênh H gốc của ảnh đầu vào để biến đổi ngƣợc từ biểu diễn màu HSV trở

về biểu diễn màu RGB. Đầu ra của biến đổi ngƣợc HSV sang RGB là ảnh kết

quả cuối cùng đƣợc trả về.

Thuật toán 2.2 đƣợc thể hiện bằng giả mã nhƣ sau:

Thuật toán 2.2. Nâng cao ĐTP ảnh màu trong biểu diễn mầu HSV sử dụng C

dải động mức xám

Đầu vào: Ảnh màu I trong biểu diễn màu RGB, kích thƣớc MxN. Tham

số C , 2N C

, ngƣỡng fcut (fcut > 0, đủ nhỏ), d (d x d là kích thƣớc cửa sổ).

Đầu ra: Ảnh màu RGB Inew, tùy chọn trả về: CMR, CMG, CMB, Eavg, Havg

Bƣớc 1: Gọi (IH, IS, IV) là biểu diễn màu của I trong không gian màu

HSV. Lƣợng hóa để coi các kênh IS, IV nhƣ là các ảnh đa cấp xám.

Bƣớc 2: Với dữ liệu đầu vào là tổ hợp kênh (IS, IV), tham số số cụm là C

và ngƣỡng fcut, gọi thuật toán 2.1 để ƣớc lƣợng các dải động mức xám theo

kênh IS, IV. (xem công thức (2.3), (2.4) và (2.1)).

Bƣớc 3: Xác định ảnh biến đổi FS, FV của kênh IS, IV tƣơng ứng theo

công thức (2.5), định nghĩa 2.2 với các dải động mức xám đƣợc ƣớc lƣợng từ

bƣớc 2 cho mỗi kênh S và kênh V.

52

Bƣớc 4: Tính tham số của [17] cho kênh FS, FV, cụ thể là các giá trị mức

xám không thuần nhất {δS,ij}, {δV,ij}, số mũ khuếch đại {S,ij}, {V,ij} tại từng

điểm ảnh của kênh FS và kênh FV.

Bƣớc 5: Tính ĐTP và xác định kênh ảnh xám mới của kênh FS và kênh

FV, , ,

,S S n ew V V n ew

F I F I nhƣ sau:

Với kênh FS và kênh FV: Tính ĐTP

i j

S ,i j

i j

( , ) ( ),

( , ) ( )

S S

S S

F i j FC

F i j F

i j

V ,ij

i j

( , ) ( )

( , ) ( )

V V

V V

F i j FC

F i j F

Tính giá trị mức xám mới của kênh S và V:

(2.6)

S ,ij

S ,i j

S ,i j

S ,i j

S ,ij

S ,i j S ,i j S ,i j

S ,i j

S ,n e w

S ,ij


S ,i j

1,

1

I ( , ) ,

1,

1

t

t

t

t

Cg

C

i j

Cg

C

V ,ij

V ,ij

S ,i j

V ,i j

V ,ij

V ,ij V ,ij V ,ij

V ,ij

V ,n e w

V ,ij

V ,ij V ,ij V ,ij

V ,ij

1,

1

I ( , )

1,

1

t

t

t

t

Cg

C

i j

Cg

C

(2.7)

Lƣu ý ở đây kênh S đƣợc đánh chỉ số k = 1, kênh V đánh chỉ số k = 2.

Bƣớc 6: Chuyển đổi ảnh (IH, IS,new, IV,new) trong biểu diễn màu HSV về

biểu diễn màu RGB, ta đƣợc ảnh Inew.

Bƣớc 7: Tùy chọn, tính các chỉ số khách quan CM{R,G,B}, Eavg và Havg

7.1: Tính tham số của [17] cho kênh IR, IG và IB của ảnh gốc I nhƣ đã

trình bày trong mục 1.5 (xem các công thức từ (1.8) đến (1.14) với kích thƣớc

cửa sổ dxd, cụ thể là các giá trị mức xám không thuần nhất {δR,ij}, {δG,ij}, và

{δB,ij} của kênh IR, IG và IB tƣơng ứng.

7.2: Tính CMR, CMG, CMB theo công thức (1.26):

53

7.3: Tính Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công thức (1.22).

Tính Havg = Havg{Inew,R, Inew,G, Inew,B} theo công thức (1.25).

Trả về: Inew, và các tùy chọn đƣợc trả về CMR, CMG, CMB, Eavg, Havg.

Thuật toán 2.2 có độ phức tạp tƣơng đƣơng thuật toán gốc [17].

Mô hình kiến trúc hệ thống đề xuất (Hình 2.3) đƣợc xây dựng và tƣơng

tác nhƣ sau:

Hình 2.3. Lƣu đồ xử lý của thuật toán đề xuất.

2.1.6. Thử nghiệm phép biến đổi mờ hóa ảnh sử dụng thuật toán 2.2.

Trong thử nghiệm này, trên từng kênh ảnh riêng rẽ R, G và B tác giả

thực hiện phép mờ hóa bằng biến đổi S-function đƣợc xây dựng trong [16].

Tính ij, δij và ij của kênh S và kênh V

đã đƣợc biến đổi

Tính các giá trị mức xám mới của

kênh S và kênh V

Chuyển đổi ngƣợc HSV về RGB

Kết thúc

Bắt đầu

Ảnh RGB đầu vào

Chuyển đổi RGB sang HSV

Biến đổi kênh S và V

54

Khi thực nghiệm Thuật toán 2.1, chúng tôi thực hiện đồng thời cho 3

kênh ảnh R, G và B. Các tham số f1, f2 để ƣớc lƣợng khoảng động mức xám

[B1,c,k B2,c,k] của từng cụm c ứng với kênh R, G và B, tham số fcut, số cụm C

đƣợc xác định dựa trên thực nghiệm. Qua quá trình thực nghiệm, chúng tôi

lựa chọn giá trị các tham số nhƣ: fcut = 0.005, số cụm C = 5.

Bảng 2.1: So sánh giá trị Havg trên kênh R, G và B của các ảnh là kết quả

của phép mờ hóa – biến đổi ảnh.

Ảnh Havg (thuật toán [16]) Havg (thuật toán đề xuất 2.2)

#1 0.4478 0.4950

#2 0.6931 0.7879

#3 0.5736 0.7200

#4 0.5822 0.7624

#5 0.6227 0.8157

#6 0.3374 0.3512

Bảng giá trị trên cho chúng ta thấy độ không chắc chắn của phép mờ

hóa sử dụng nhiều dải động mức xám của thuật toán đề xuất 2.2 cao hơn so

với phƣơng pháp sử dụng một dải động mức xám của [16]. Điều này cũng

phù hợp với trực quan khi quan sát các ảnh mờ hóa minh họa của #1 và #2.

(a)

(b)

Hình 2.4. Ảnh mờ hóa của #1 sử dụng [16] (a), sử dụng thuật toán 2.2 (b).

Trên hình ảnh mờ hóa của ảnh #1 sử dụng biến đổi của [16] (hình 2.4a),

chúng ta thấy rõ chi tiết ảnh ở các vùng đƣợc đánh dấu hình chữ nhật là bị

55

mất, trong khi đó ảnh biến đổi sử dụng thuật toán đề xuất 2.2 chi tiết ảnh đƣợc

giữ tốt hơn.

Quan sát các kênh G và B của ảnh biến đổi của ảnh #2 sau đây ta cũng

thấy độ chi tiết của ảnh biến đổi đối sử dụng [16] cũng bị suy giảm nhiều hơn

biến đổi ảnh dựa trên thuật toán 2.2 đã đề xuất.

(a)

(b)

Hình 2.5. Kênh B của ảnh biến đổi sử dụng [16] (a), sử dụng thuật toán (b).

(a)

(b)

Hình 2.6. Sử dụng biến đổi ảnh [16] cho ảnh #3(a), #5 (b).

Trên hình 2.6, các ảnh kết quả minh họa sử dụng [16] bị mất chi tiết

ảnh, xem ở các vùng chữ nhật đánh dấu.

56

Hình 2.7. Phép mờ hóa, cột bên trái [16], cột bên phải sử dụng thuật toán 2.2

57

2.2. Thiết kế hàm biến đổi độ xám dạng chữ S với tiếp cận mờ

Những tiếp cận sử dụng logic mờ để nâng cao ĐTP ảnh nói chung đều

dẫn đến thiết kế một hàm biến đổi mức xám dạng chữ S [16, 23, 67]. Hàm

liên tục đơn điệu tăng, giảm giá trị đầu vào khi đầu vào dƣới ngƣỡng, và

ngƣợc lại tăng giá trị đầu vào khi đầu vào ở trên ngƣỡng [68].

(a) Toán tử NINT [23]

(b) Đồ thị của hàm biến đổi mức xám

sinh bởi hệ luật mờ if-then [68]

(c) Đồ thị biến đổi mức xám của

[16]

(d) Ảnh kết quả sử dụng suy diễn luật

if-then [68] cho ảnh #5 (Phụ lục C)

Hình 2.8. Dạng hàm biến mức xám chữ S trong các phép NCĐTP.

(a) Ảnh gốc

(b) Ảnh kết quả sinh bởi toán tử tăng

cƣờng mờ [68]

58


(d) Ảnh gốc

(e) Kết quả sinh bởi toán tử tăng

cƣờng mờ [68]


Hình 2.9. Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử dụng

toán tử tăng cƣờng mờ [68]

2.2.1. Đánh giá việc xây dựng hàm biến đổi mức xám dạng chữ S

Việc chọn hàm thuộc trong suy diễn hệ luật mờ để tạo ra hàm biến đổi

mức xám dạng chữ S không phải là việc dễ dàng.

Xét hệ luật mờ

R1: If luminance in is dark then luminance out is darker

R2: If luminance in is bright then luminance out is brighter

R3: If luminance in is gray then luminance out is gray

Sử dụng bộ công cụ FIS của mathlab, chúng ta thu đƣợc kết quả sau:

59

(a) (b)

Hình 2.10. Hàm thuộc của 3 tập mờ dark, bright, gray (a) và của tập

mờ darker, brighter (b).

(a) Ảnh gốc (b) Ảnh kết quả sinh bởi luật if-then

R1,R2 và R3


Hình 2.11. Nâng cao ĐTP với suy diễn luật mờ if-then (a), luật mờ nâng

cao ĐTP (b) .

60

Ngay cả với việc đạt đƣợc hàm biến đổi mức xám có dạng chữ S thì kết

quả lập luận mờ của hệ luật {R1, R2 và R3} sử dụng các tập fuzzy có thể cho

kết quả chƣa hợp lý, nhƣ ví dụ thiết kế các hàm thuộc sau:

(a)

(b)

Hình 2.12.(a) Hàm thuộc của tập mờ dark, bright, gray và (b) hàm thuộc

của tập mờ darker, brighter.

(a) Ảnh gốc

(b) Ảnh kết quả sinh bởi luật

{R1,R2,R3}


Hình 2.13. Các hàm thuộc đƣợc thiết kế đã tạo ra hàm biến đổi hình chữ S.

Trong hình 2.13 b vùng đánh dấu chữ nhật cho thấy có hiện tƣợng nâng

cao quá mức (over-enhancement).

61

Trong phần tiếp theo tác giả sẽ đề xuất phƣơng pháp thiết kế hàm biến

đổi có đồ thị dạng chữ S (kiểu nhƣ S-function) sử dụng tiếp cận ĐSGT ứng

dụng cho việc nâng cao ĐTP theo phƣơng pháp trực tiếp.

2.2.2. Xây dựng toán tử tăng cƣờng dựa trên đại số gia tử

Định nghĩa 2.3. Bộ 3 (AX, AY, F) gọi là HA-intensification nếu:

(i) AX = (X, C, w, H, ), AY = (Y, C, w, H, ) với Dom(X) Dom(Y),

C = {c–, c

+}, c

– = low, c

+ = high, H = H

-H

+, H

- = {little}, H

+ = {very}, =

fm(c-), 1 - = fm(c

+), X = X(little), X = 1 - X = X(very), Y = Y(little),

Y = 1 - Y = Y(very), , X, Y [0,1], vX, vY là hàm định lƣợng ngữ nghĩa

của ĐSGT trên X và Y tƣơng ứng.

(ii) ( . o w )

1( o w )

Y

X

v v l

v l

(iii) Hàm F: [0,1][0,1] đơn điệu tăng thực sự, liên tục (suy ra hàm

ngƣợc của F cũng đơn điệu tăng thực sự, liên tục) và tăng tại ngƣỡng .

R1: Nếu x là 0 thì y là 0

R2: Nếu x là c- thì y là very c

-

R3: Nếu x là W thì y là W

R4: Nếu x là c+ thì y là very c

+

R5: Nếu x là 1 thì y là 1

Diễn giải trong miền giá trị số: (a) và (b) tƣơng đƣơng với:

F(0) = 0, F() = , F(1) = 1.

F(vX(c-)) = vY(v.c

-), tƣơng ứng F(vX(low)) = vY(v.low)

F(vX(c+)) = vY(v.c

+), tƣơng ứng F(vX(hight)) = vY(v.high)

Suy ra: 2

X YF ,

21 1 1 1

X YF

(c) tƣơng đƣơng với

( ) , : 0

( ) , : 1

F t t t t

F t t t t

62

Nhận xét:

(i) = X = Y = 0.5 X = Y = 0.5,

m =

2( e r o w )

0 .5( o w )

Y Y

X X

v v y l

v l

, FINT, ở đó

2

2

2 , 0 0 .5

( )

1 2 1 , 0 .5 1

s s

s

s s

x x

IN T x

x x

thì (AX, AY, INT) là một HA-intensification.

(ii) Khi m =

2

,Y

Y X

X

thì một hàm bậc 2, F có đồ thị là parabol đi qua 3 điểm (0; 0), (X, 2

Y), (,

) thì bộ 3 (AX, AY, F) không là HA-intensification.

Chứng minh:

( ) (1 ) ( ) , 0s

s s X s

X

xF x m x m x

F(0)=0. Do X =1-X, nên 2

X YF , F()=.

Do 2

,Y

Y X X

X

m

, nên F(xs) < 0 với ( )

01

X

s

mx

m

vậy (AX, AY, F) không là một HA-intensification.

Từ nhận xét trên ta thấy trong trƣờng hợp tổng quát không thể dùng S-

function để xây dựng một HA-intensification.

Mệnh đề 2.3: (AX, AY, F) là một HA-intensification, với F đƣợc xác

định nhƣ sau:

m =2

( e r o w )1

( o w )

Y Y

X X

v v y l

v l

( ) , 0( )

1 (1 ), 1

s s

s

s s

g x xF x

g x x

với hàm g(xs) xác định: 2

ax( ) , 0

ax

s

s s

s s

g x xx

ở đây

1

1

x

X

ma

m

Chứng minh:

63

0 , 0

( ) .0

1

s

s s s

s

x

ag x x x

ax

Dễ thấy g(0) = 0, 2

X Yg , g() = và g đơn điệu tăng trên đoạn [0,

], từ đó suy ra (AX, AY, F) là một HA-intensification.

Chúng ta sẽ thấy nhƣ dƣới đây ĐSGT có thể thiết kế rất nhanh chóng

toán tử tăng cƣờng dạng HA-intensification với một hàm biến đổi mức xám

dạng chữ S đơn giản cho hệ luật mờ:

R1: If luminance in is dark then luminance out is very dark

R2: If luminance in is bright then luminance out is very bright

R3: If luminance in is gray then luminance out is gray

Thật vậy, hệ luật R1-R3 của lập luận sử dụng tập mờ trên có thể xem

tƣơng ứng với 5 luật R1-R5 trong định nghĩa của toán tử HA-intensification.

Trên từng kênh ảnh Ik {R, G, B} của ảnh mầu RGB gốc, chúng ta thiết lập 2

ĐSGT AL1và AL2 nhƣ sau:

ALk,1= (Lk,1, C, w, H, ), AL2 = (Lk,2, C, w, H, ) với Dom(Lk,1)

Dom(Lk,2), C = {c–, c

+}, c

– = dark, c

+ = bright, H = H

-H

+, H

- = {little}, H

+

= {very}, k = fm(c-), 1 - k = fm(c

+), Lk,1 = L1(little), Lk,1 = 1 - Lk,1 = Lk,1

(very), Lk,2 = Lk,2(little), Lk,2 = 1 - Lk,2 = Lk,2(very), k, Lk,1, Lk,2 [0,1].

Thử nghiệm với Lk,1 = 0.4, Lk,2 = 0.4, k là ngƣỡng Otsu của kênh ảnh Ik.

Hàm Fk: [0,1] [0,1] ở đây sẽ sử dụng hàm tuyến tính từng khúc, có

đồ thị đi qua các mốc nội suy (0, 0), (k, k), (1, 1), (vIk,1(dark), vIk,2(V.dark)),

và (vIk,1(bright), vIk,2(V.bright))

Điều đặc biệt ở đây là đồ thị biến đổi là dạng chữ S đối xứng, điều này

khác biệt cơ bản với các đồ thị sinh bởi lập luận mờ sử dụng tập mờ nhƣ đã

trình bày ở Hình 2.16 và Hình 2.17.

64

(a) Ảnh kết quả phép nội suy HA-

IRMd cho ảnh #1

(b) Đồ thị hàm biến đổi mức xám kiểu

chữ S và đối xứng

Hình 2.14. Phép NCĐTP sử dụng HA-IRMd cho hệ luật {R1 -R5}

Định lý 2.1. Hint (về toán tử Hint)

m =

2( . o w )

1( o w )

Y Y

X X

v v l

v l

,

( , , )( ) , 0in t( )

1 (1 , , )(1 ), 1

c X s s

s

c X s s

g m x xH x

g m x x

(2.8)

với hàm gc(, X, m) (xs) xác định nhƣ sau:

=(X,m) =

1 1 1lo g lo g lo g

1 1 1

1 1 1lo g lo g lo g

1 1 1

X X X

X X X

X X X

X X X

m m m

m m m

,

1-+

( )

-1

+

s

s ss

c s

s ss

s

x

x xxg x

x xx

x

, 0s

x

(2.9)

hay ( )

( )

c s s

c s s

g x x

g x x

, 0s

x ,

Khi đó (AX, AY, Hint) là một HA-intensification, ngoài ra Hint thỏa

mãn:

[ , ]( 0 , ]

in t( ) in t( )a x m in

XX

s s

s s

H x H xm m

x x

, [ ,1 ][ , ]

1 in t(1 ) 1 in t(1 )a x m in

1 1XX

s s

s s

H x H xm m

x x

65

Hình 2.15: trƣờng hợp = 0.6;

x = 0.6 > m = 0.4.

Hình 2.16: trƣờng hợp = 0.6;

x= 0.5 < m = 0.8.

Chứng minh: xem phụ lục.

Nhận xét: Tham số X biểu diễn định lƣợng ngữ nghĩa của biến đầu vào

low thƣờng lấy trong khoảng [0.3, 0.7], khi X = m thì AX đồng nhất AY.

Các hàm g, gc ở Mệnh đề 2.3 và Định lý 2.1 đều thỏa các tính chất sau:

(i) Đơn điệu tăng, khả vi liên tục trên [0,1]

(ii) g(, X, m)(0) = 0, g(, X, m)() = ,

g(, X, m)( X) = mX

0 g(, X, m)(xs) xs, 0 xs .

(iii) g(, X, m1)(xs) g(, X, m2)(xs), 0 xs , 0 < m1 m2 <

[ , ]( 0 , ]

( , , ) ( ) ( , , ) ( )a x m in

XX

X s X s

s s

g m x g m xm m

x x

Hình 2.17. So sánh đồ thị của hàm biến đổi Cheng và Hint giữa mức xám đầu

vào-đầu ra đã chuẩn hóa về đoạn [0,1], độ sáng xung quanh = 0.6, βX = 0.6,

= 0.5, t = 0.5

66

Nhận xét: Phép nâng cao ĐTP theo công thức (2.7) thỏa mãn luật RCE

Phần tiếp theo tác giả đề xuất hai thuật toán để áp dụng toán tử tăng

cƣờng HINT để nâng cao ĐTP cho ảnh đa kênh. Chi tiết của thuật toán đƣợc

thể hiện nhƣ sau

Thuật toán 2.3: Nâng cao ĐTP ảnh đa kênh I = {I1, … IK} sử dụng Hint

Đầu vào: K kênh của ảnh I (trong một biểu diễn màu), 1 K1,

{I , ..., I }K

I ,

tham số C , 2N C

, M x N là kích thƣớc của ảnh I, 1 ... K, các tham số của

ĐSGT

Đầu ra: Ảnh I’ = {I’1, … IK

’}

Bƣớc 1: Phân ảnh I = {I1, … IK} thành C cụm sử dụng thuật toán phân

cụm FCM

Bƣớc 2: Tính lƣợc đồ xám mờ của từng kênh ảnh Ik, k = 1 … K sử dụng

công thức (2.3)

Bƣớc 3: Tính độ xám nâng cao trong đoạn [0, 1]

i j

1

1

2 1'

k ,i j i j ,c i j

m in a x , 0 ,1

in t , ,

N Cck

c

ck c k

X

lm

g HC

B

B B

(2.10)

Bƣớc 4: Kết thúc, trả lại ảnh nâng cao { '

k ,ijg * (Lk, max – Lk, min) + Lk, min,

1 ≤ k ≤ K }

Ở đây, ta đánh giá độ phức tạp theo kích thƣớc MxN của ảnh đầu vào.

Các yếu tố khác tham gia vào độ phức tạp của thuật toán nhƣ số cụm NC

đƣợc coi là hằng số. NK là số lần lặp của thuật toán lặp FCM chuẩn thì thuật

toán FCM có độ phức tạp là Ο(MN). Phép tính lƣợc đồ xám mờ của 3 kênh

ảnh R,G và B của ảnh đầu vào có độ phức tạp là O(MN). Phép tính giá trị

mức xám mới sử dụng biến đổi Hint có độ phức tạp là O(MN). Vậy độ phức

tạp thuật toán là O(MN).

67

2.2.3. Thực nghiệm

Khi thực nghiệm Thuật toán 2.3, chúng tôi chọn các tham số nhƣ sau:

- Các tham số f1, f2, fcut, số cụm C đƣợc lựa chọn bằng thực nghiệm,

giống nhƣ trong phần xây dựng phép biến đổi ảnh (phần 2.1.6): fcut = 0.005, số

cụm C = 5.

- Tham số kích thƣớc cửa sổ Wij tại điểm ảnh (i, j) dij = 3, tƣơng tự nhƣ

phƣơng pháp của Cheng.

- Tham số ĐSGT 1 ... K, với K là số kênh ảnh I, đƣợc chúng tôi lựa

chọn bằng kinh nghiệm của ĐSGT, thƣờng lấy trong đoạn [0.3, 0.7]. Trong

thực nghiệm này 1 =... = K = 0.6.

Để đảm bảo tính khách quan trong việc đánh giá hiệu quả của thuật

toán để xuất, ngoài đánh giá bằng trực quan, chúng tôi sử dụng các chỉ số

khách quan nhƣ chỉ số entropy, chỉ số fuzzy entropy (công thức 1.22 và công

thức 1.25, phần 1.6, chƣơng 1) và đề xuất sử dụng chỉ số ĐTP trực tiếp (công

thức 1.26, phần 1.6, chƣơng 1).

Kết quả các chỉ số Eavg, Havg, CM của thuật toán đề xuất khi thực hiện

trên 6 ảnh #1 - #6 (Phục lục C) và thuật toán gốc đƣợc đƣa ra trong Bảng 2.2

Bảng 2.2: Bảng kết quả so sánh các chỉ số khách quan giữa thuật toán

trong [17] và thuật toán đề xuất

Image CMR CMG CMB Eavg Havg

[17] Đề

xuất [17]

Đề

xuất [17]

Đề

xuất [17]

Đề

xuất [17]

Đề

xuất

#1 0.1292 0.3067 0.2011 0.4422 0.2550 0.5537 6.0405 6.7621 0.3523 0.4966

#2 0.0166 0.0503 0.0208 0.0982 0.0361 0.0579 7.3196 7.3506 0.8212 0.7707

#3 0.0175 0.0602 0.0209 0.0988 0.0566 0.1491 7.4822 7.6852 0.7999 0.7935

#4 0.0305 0.1002 0.0370 0.1464 0.0598 0.1876 7.4586 7.8066 0.8635 0.7929

#5 0.0179 0.0909 0.0315 0.1741 0.0368 0.1973 7.3038 7.6426 0.8519 0.8419

#6 0.0305 0.0373 0.0338 0.0441 0.0410 0.0548 3.5482 3.7398 0.2850 0.2923

68

Tƣơng tự, ảnh kết quả thực nghiệm của thuật toán [17] và thuật toán đề

xuất cho 6 ảnh #1 - #6 (Phục lục C) nhƣ trong các Hình 2.18 đến Hình 2.2:

Hình 2.18: Kết quả của [17] cho ảnh

#2

Hình 2.19: Kết quả của Hint sử

dụng FCM 5 cụm

Hình 2.20: Kết quả sử dụng Curvelet

[67]

Hình 2.21: Kết quả sử dụng Hint

với FCM 5 cụm

Qua Bảng 2.2 và Hình 2.18- Hình 2.21 là kết quả thực nghiệm của các

ảnh #1 - #6 đã thể hiện các chỉ số khách quan ĐTP trực tiếp trên từng kênh R,

G và B khi sử dụng thuật toán 2.3 đều cho kết quả cao hơn khi sử dụng thuật

toán [17]. Chỉ số khách quan Eavg khi áp dụng thuật toán 2.3 cũng cao hơn so

với áp dụng thủ tục 1. Cũng vậy, chỉ số khách quan Havg khi áp dụng thuật

toán 2.3, ngoài ảnh #1, đều có giá trị nhỏ hơn so với chỉ số ảnh kết quả khi áp

dụng thủ tục 1.

Bảng 2.3 là kết quả thử nghiệm so sánh phƣơng pháp của Cheng và Hint

trên 3 ảnh #1, #2, #6 và tập ảnh TID2013 (tác giả đã gộp cả ảnh #3 - #5 là ảnh

của TID2013).

69

Bảng 2.3. So sánh kết quả phép nâng cao ĐTP ảnh mở rộng của Hint (%) và

của Cheng áp dụng cho ảnh mầu RGB và HSV

Imag

e

CM Eavg Havg

R G B

RGB HSV RGB HSV RGB HSV RGB HSV RGB HSV

#1 09.38 144.24 06.02 072.19 04.14 062.04 2.27 12.23 2.410 34.13

#2 05.23 444.51 03.59 023.92 05.66 237.96 0.31 1.56 0.360 08.91

#3 05.97 185.63 06.57 163.06 12.30 142.50 1.20 9.96 1.460 15.17

I01 12.36 175.65 04.98 173.21 09.08 185.46 0.35 7.68 0.340 16.13

I02 11.70 304.68 03.89 198.28 02.99 118.42 4.95 7.24 0.050 01.36

I03 05.24 352.98 02.70 243.28 07.81 062.99 0.34 1.53 0.001 04.39

I04 02.48 457.80 03.88 425.58 05.00 491.01 0.01 5.93 0.110 09.16

I05 11.71 101.72 08.36 102.86 10.09 072.35 0.78 0.89 0.000 07.88

I06 01.67 198.47 01.37 159.40 12.16 115.31 0.45 1.58 0.610 09.12

I07 03.62 116.22 05.02 092.22 05.16 108.18 0.16 2.28 0.340 03.89

I08 17.42 111.34 01.34 114.43 08.58 171.62 0.25 0.03 1.100 09.81

I09 03.91 274.68 07.47 353.12 04.55 479.77 0.51 3.63 0.670 11.28

I10 08.97 438.25 08.66 432.32 07.87 806.81 0.62 4.61 0.980 08.05

I11 05.16 088.11 04.40 064.89 06.26 55.12 0.42 2.19 0.170 06.96

I12 09.05 365.97 07.43 609.36 09.92 400.39 0.71 3.68 0.290 05.83

I13 18.81 015.48 15.23 009.61 13.65 008.90 0.90 1.60 1.650 11.27

I14 02.54 232.72 08.37 220.46 05.77 141.94 0.32 0.56 0.360 07.07

I15 05.81 238.98 07.29 113.66 05.63 249.31 1.62 2.53 0.180 07.31

I16 07.75 248.07 07.60 272.16 09.37 376.76 1.04 5.59 1.010 07.84

I17 03.73 244.41 04.94 194.51 04.97 227.00 0.90 4.26 0.080 08.00

I18 11.00 148.29 09.46 119.31 06.63 088.34 1.41 2.11 0.120 04.16

I19 02.45 051.31 05.31 094.55 13.92 079.52 0.55 0.77 0.630 05.21

I20 10.32 360.89 04.92 365.57 00.71 402.51 0.00 2.32 0.130 01.82

I21 84.39 253.75 37.57 245.56 62.67 257.56 2.50 2.29 9.760 08.42

I22 07.99 198.12 04.73 240.05 05.40 274.03 0.16 0.37 0.770 16.00

I23 01.58 768.02 07.18 775.61 09.53 400.49 0.37 0.57 0.180 10.15

I24 08.97 100.52 06.18 140.23 06.27 280.08 1.00 5.07 0.630 08.16

Mean 10.341 245.215 6.716 222.941 9.485 233.199 0.843 3.230 -0.550 -5.413

70

Kết quả thực nghiệm với tập dữ liệu là 27 ảnh trên là những ảnh mầu có

độ sáng cao hoặc có ĐTP thấp nhƣ đã đề cập ở trên trong biểu diễn mầu RGB

và biểu diễn mầu HSV. Kết quả thực nghiệm đƣợc đánh giá bằng các chỉ số

khách quan CM, Eavg, Havg nhƣ Bảng 2.3. Kết quả bảng này cho thấy tỷ lệ

phần trăm số ảnh có chỉ số khách quan thuận lợi khi sử dụng toán tử Hint lớn

hơn khi sử dụng phƣơng pháp của Cheng 96% trong ba cột đầu, 100% trong

hai cột tiếp theo, 89% cho hai cột kết tiếp và 67% cho cột cuối cùng. Điều này

chứng minh rằng toán tử Hint tốt hơn phƣơng pháp của Cheng.

2.2.4. So sánh với kết quả của các phƣơng pháp gián tiếp

Để làm rõ hơn hiệu quả của toán tử Hint, tác giả so sánh kết quả thuật

toán nâng cao ĐTP ảnh áp dụng toán tử Hint với 5 phƣơng pháp nâng cao

ĐTP gián tiếp gần đây nhƣ ESIHE [42], RICE [43], GHMF [44] and ROHIM

[45]. Dữ liệu ảnh thực nghiệm vẫn gồm 27 ảnh và các chỉ số đánh giá khách

quan nhƣ chỉ số Eavg và chỉ số Havg, giống nhƣ phần trên. Kết quả nhƣ sau:

Bảng 2.4: Giá trị chỉ số Eavg và Havg của ảnh đầu ra khi áp dụng Hint và

bốn phƣơng pháp gián tiến của 27 ảnh trong biểu diễn mầu HSV, trong đó các

giá trị tốt nhất đƣợc in đậm

Imag

e

ID

Ra

w

ima

ges Eavg Havg Hint\

GHMF

(Havg) ESIHE RICE GHMF ROHIM Hint ESIHE RICE GHMF ROHIM Hint

#1 5.9395 6.6176 5.1207 6.7002 5.3846 6.6628 0.5211 0.2793 0.4523 0.6478 0.4574 -0.0051

#2 7.3154 7.4691 7.4358 7.1781 6.8435 7.4364 0.7946 0.7659 0.7019 0.5866 0.7479 -0.0460

#6 3.4443 3.4886 3.6743 3.2663 3.4442 4.1248 0.2632 0.2240 0.1636 0.3339 0.3288 -0.1652

I01 7.2409 7.5023 7.4543 7.6470 7.2075 7.8945 0.8007 0.8502 0.7129 0.8529 0.7453 -0.0324

I02 7.0231 6.9740 7.1843 6.7369 6.2869 7.5610 0.8248 0.6791 0.5130 0.5165 0.7330 -0.2200

I03 7.4847 7.4876 7.4834 7.2844 6.8306 7.6009 0.7554 0.7444 0.7042 0.5790 0.7643 -0.0601

I04 7.3092 7.4382 7.5612 7.1560 6.8622 7.7425 0.7876 0.8091 0.7627 0.5902 0.7734 -0.0107

I05 7.5728 7.6214 7.5884 7.2797 7.1495 7.6645 0.7343 0.6616 0.6163 0.6613 0.6707 -0.0544

I06 7.6130 7.7328 7.6934 7.4857 7.4825 7.7575 0.7258 0.7621 0.7238 0.7187 0.7286 -0.0048

I07 7.4536 7.5746 7.5646 7.3305 7.2661 7.6393 0.8095 0.8124 0.7817 0.7439 0.8285 -0.0468

I08 7.6508 7.7452 7.6566 7.4656 7.3609 7.6859 0.7252 0.7236 0.6881 0.7051 0.6980 -0.0099

I09 7.4954 7.6984 7.6397 7.4251 7.4188 7.7932 0.7597 0.8545 0.8034 0.8079 0.7843 0.0191

I10 7.3664 7.6917 7.5409 7.8570 7.1014 7.7312 0.7941 0.8718 0.7167 0.7065 0.8282 -0.1115

71

I11 7.3929 7.5068 7.4247 7.1441 7.2649 7.5803 0.7489 0.7069 0.6685 0.8193 0.7130 -0.0445

I12 7.4530 7.5553 7.5594 7.3350 7.2926 7.7387 0.7690 0.7879 0.7145 0.7896 0.7732 -0.0587

I13 7.5329 7.6081 7.6283 7.3750 7.3116 7.6849 0.7528 0.7501 0.7081 0.7788 0.7076 0.0005

I14 7.6961 7.7429 7.7889 7.5014 7.3843 7.7615 0.7521 0.7566 0.7024 0.6611 0.7468 -0.0444

I15 7.1638 7.3422 7.0858 6.7842 6.7314 7.3635 0.7224 0.5729 0.5075 0.7503 0.5981 -0.0906

I16 7.2633 7.5921 7.4561 7.8294 7.1905 7.6884 0.8147 0.8800 0.7290 0.8702 0.8417 -0.1127

I17 7.3354 7.3672 7.4038 7.7182 7.2719 7.6628 0.7002 0.6666 0.6439 0.7852 0.6816 -0.0377

I18 7.1717 7.4235 7.2446 6.8988 7.0403 7.3641 0.7904 0.6570 0.5954 0.8565 0.7002 -0.1048

I19 7.7222 7.8068 7.7969 7.5689 7.5784 7.7948 0.7692 0.7851 0.7580 0.7624 0.7860 -0.0280

I20 6.3135 6.3247 6.1416 5.7374 6.2451 6.2145 0.4733 0.4089 0.3367 0.4544 0.4429 -0.1062

I21 7.3067 7.5464 7.4677 7.2190 7.2245 7.5102 0.7913 0.8416 0.8111 0.8177 0.7996 0.0115

I22 7.4309 7.6705 7.6164 7.3454 7.3408 7.4774 0.7343 0.8006 0.7598 0.7919 0.7130 0.0468

I23 7.7178 7.7288 7.7859 7.5482 7.5328 7.6828 0.7451 0.7528 0.6995 0.7170 0.7194 -0.0199

I24 7.0790 7.3761 7.3259 7.7730 7.0280 7.4819 0.7726 0.8358 0.7264 0.8808 0.8100 -0.0836

Từ Bảng 2.4 ta thấy, phƣơng pháp của Hint có 17/27 ảnh đầu ra (tƣơng

ứng 63%), có giá trị Eavg cho kết quả thuận lợi. Tƣơng tự, giá trị Eavg cho kết

quả thuận lợi của các phƣơng pháp còn lại lần lƣợt là: ESIHE có 02/27 ảnh

(tƣơng ứng 7,4%), phƣơng pháp RICE có 03/27 ảnh (tƣơng ứng 11,1%),

phƣơng pháp GHMF có 04/27 ảnh (tƣơng ứng 14,3%), trong khi phƣơng pháp

ROHIM không cho kết quả nào.

Cũng từ Bảng 2.4 ta thấy, phƣơng pháp của GHMF có 16/27 ảnh đầu ra

(tƣơng ứng 59,3%), có giá trị Havg cho kết quả thuận lợi. Tƣơng tự, giá trị Havg

cho kết quả thuận lợi của các phƣơng pháp còn lại lần lƣợt là: ESIHE có

02/27 ảnh (tƣơng ứng 7,4%), phƣơng pháp RICE có 01/27 ảnh (tƣơng ứng

3,7%), phƣơng pháp ROHIM có 06/27 ảnh (tƣơng ứng 22,2%), trong khi

phƣơng pháp Hint có 02/27 ảnh (tƣơng ứng 7,4%).

Tuy nhiên, vì chỉ số Havg là giá trị toàn cục nên việc giảm giá trị của

Havg không phải lúc nào cũng đồng nghĩa với chất lƣợng ảnh đầu ra cao hơn,

điều này phụ thuộc vào tiêu chí thị giác của mắt ngƣời. Trên thực tế, hầu hết

các giá trị Havg của ảnh đầu ra theo phƣơng pháp GHMF nhƣ trong Bảng 2.4

là thuận lợi. Vì vậy, chúng tôi chọn giá trị Havg của ảnh đầu ra theo phƣơng

pháp Hint so sánh với phƣơng pháp GHMF, trong cột “Hint \ GHMF”.

72

Vì giới hạn không gian trình bày của luận án, chúng tôi lựa chọn hai

ảnh I02 và I24, là ảnh đầu tiên có giá trị Havg khác nhau giữa Hint và GHMF

lớn nhất đạt 0.22 và đạt trung bình0.0836, nằm trong khoảng [0.22,

0.0468] và ảnh I10 có giá trị Havg tốt nhất khi sử dụng toán tử ROHIM trong

[45], ảnh này giá trị Havg khác nhau giữa Hint và GHMF là - 0.1115, nằm

trong khoảng [0.2165,0.0051], nghĩa là ở mức độ trung bình. Đồng thời, giá

trị Eavg của ảnh I02 đạt 0.5130, của ảnh I24 đạt 0.7264 với phƣơng pháp

GHMF và giá trị Eavg của ảnh I10 đạt 0.7065 với phƣơng pháp ROHIM là các

giá trị tốt nhất trong số các trƣờng hợp còn lại để minh họa.

Ảnh gốc I02, I10 và I24 và các ảnh kết quả đầu ra tƣơng ứng của chúng

đƣợc trình bày trong Hình 2.22 – Hình 2.24. Theo nhận thức thị giác của con

ngƣời, ta thấy mầu sắc của các ảnh đầu ra của toán tử Hint trong hình Hình

2.22 – Hình 2.24 tự nhiên hơn và chi tiết hơn so với ảnh đầu ra của các toán

tử còn lại.

(a) Ảnh gốc I02

(b) ESIHE [ID1],

Havg = 0.8248

(c) RICE [ID4],

Havg = 0.6791

(d) GHMF [ID3]

Havg = 0.7042

(e) ROHIM [ID2]

Havg = 0.5790

(f) Hint,

Havg = 0.7330

Hình 2.22. Ảnh đầu ra của ảnh gốc I02 trong tập dữ liệu ảnh TID2013 là kết

quả của các toán tử đƣợc quan sát bằng mắt ngƣời

73

(a) Ảnh gốc I10

(b) ESIHE, Havg = 0.7941

(c) RICE, Havg = 0.8718

(d) GHMF, Havg = 0.7167

(e) ROHIM, Havg = 0.7065

(f) Hint, Havg = 0.8282



(a) Ảnh gốc I24

(b) ESIHE, Havg = 0.7726

(c) RICE, Havg = 0.8358

(d) GHMF, Havg = 0.7264

(e) ROHIM, Havg = 0.8808

(f) Hint, Havg = 0.8100



Từ các Hình 2.22 đến Hình 2.24 ta thấy ảnh đầu ra của toán tử Hint có

mầu sắc tƣơi và rõ ràng hơn so với các toán tử còn lại. Ngoài ra nhiều chi tiết

74

của ảnh đầu ra theo toán tử Hint cũng là rõ ràng hơn, đặc biệt tập trung vào

các khu vực đánh dấu của các ảnh trong hình. Có thể thấy rằng phƣơng pháp

đề xuất có thể có một số điểm mạnh của các phƣơng pháp tƣơng ứng. Điều

này cho thấy Hint, là một phƣơng pháp trực tiếp và có kỹ thuật mới thực sự

có thể đạt đƣợc sự cân bằng giữa các đặc điểm toàn cục và cục bộ khi thay đổi

ĐTP điểm ảnh của ảnh.

Hiệu quả của toán tử Hint so với các phƣơng pháp tƣơng ứng đã phân

tích ở trên cho thấy ƣu điểm của phƣơng pháp đề xuất.

(a) Ảnh gốc (b) ESIHE (c) RICE

(d) GHMF

(e) ROHIM

(g) Hint đề xuất

Hình 2.25. Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc Định sử

dụng các thuật toán gián tiếp và Hint

(a) Ảnh gốc

(b) ESIHE

(c) RICE

75

(d) GHMF

(e) ROHIM


Hình 2.26. Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc


(a) Ảnh gốc

(b) ESIHE

(c) RICE

(d) GHMF

(e) ROHIM


Hình 2.27. Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc Định

sử dụng các thuật toán gián tiếp và Hint

2.3. Kết quả khác

Tác giả cũng đã ứng dụng lƣợc đồ xám mờ để cài đặt một thuật toán

tƣơng tự phép cân bằng lƣợc đồ xám cổ điển.

Thuật toán 2.4. Mở rộng thuật toán HEQ cho ảnh đa kênh sử dụng lƣợc đồ

xám mờ.

76

Đầu vào: K kênh của ảnh I (trong một biểu diễn mầu), 1 K1,{ I ,...,I }

KI ,

tham số C , 2N C

, ngƣỡng fcut (fcut > 0, đủ nhỏ), M x N là kích thƣớc của

ảnh I.

Đầu ra: 1 K1,' { I' ,...,I' }

KI : K kênh ảnh sau khi cân bằng.

Bƣớc 1: Phân C cụm tập vector dữ liệu 1, , 1, , 1,

( , )i M j N kk K

I i j

bằng thuật

toán FCM chuẩn ta đƣợc 1

C

c cV

,

1 , , 1 , , 1 ,, ,

i M j N c Ci j c

, theo công thức (2.4).

Bƣớc 2: Xác định lƣợc đồ xám mờ 1, , 1 ,

k

cc C k K

h

theo công thức (2.13).

Bƣớc 3: , m in , m ax

1, , ,k k

k K g L L

,m in

,m a x

,m in

'

1

'

, m in , m a x , m in

( ')

( ')

' ( )

k

k

k

g

k

cC

g L

L

c k

c

g L

k k k k

h g

h g

I g L L LC

Trả về: 1,'

KI

77


Chƣơng này luận án trình bày các đề xuất gồm:

Thứ nhất, luận án đề xuất một phƣơng pháp biến đổi ảnh mới sử dụng

nhiều dải động mức xám. Các dải động mức xám này đƣợc ƣớc lƣợng tự động

bằng thuật toán phân cụm FCM. Phƣơng pháp này đƣợc so sánh trực tiếp với

phƣơng pháp biến đổi sử dụng một hàm S-function với tham số hóa dựa trên

cực đại fuzzy entropy trong [16].

Thứ hai, luận án đề xuất phƣơng pháp xây dựng hàm biến đổi mức xám

dạng chữ S dựa trên một toán tử HA - toán tử Hint (toán tử tăng cƣờng của

ĐSGT). Đặc điểm này là rất quan trọng vì nó cho phép lần đầu tiên sử dụng

kiến thức chuyên gia để giải quyết bài toán tăng cƣờng ĐTP ảnh. Lý thuyết

của HA có thể cung cấp một mô hình toán học, tạo cơ sở để phát triển các

phƣơng pháp cho phép chuyển một hệ luật ngôn ngữ thành một hàm chữ S

trong miền số [Lmin, Lmax]2 bằng cách dựa vào thứ tự ngữ nghĩa của các biến

ngôn ngữ.

Hiệu quả của phƣơng pháp đề xuất đƣợc chứng minh bởi thực nghiệm

khi so sánh trực tiếp với phƣơng pháp của Cheng và bốn phƣơng pháp gián

tiếp: ESIHE (2014), RICE, GHMF (cả hai đƣợc công bố vào năm 2015) và

ROHIM (2017). Kết quả thử nghiệm thu đƣợc đƣợc đánh giá bởi các chỉ số

khách quan. Các phƣơng pháp đề xuất đều cho kết quả tốt hơn.

78

CHƢƠNG 3.

XÂY DỰNG ĐỘ ĐO THUẦN NHẤT MỚI THEO TIẾP CẬN

ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO

ĐỘ TƢƠNG PHẢN ẢNH ĐA KÊNH

Trong [17] theo thuật toán của Cheng và trong thuật toán 2.3 sử dụng

toán tử Hint của chúng tôi, giá trị thuần nhất của điểm ảnh ảnh hƣởng trực

tiếp đến giá trị ĐTP tại điểm ảnh (công thức (1.12), (1.13), (1.14), (1.15)),

cách tính số mũ khuếch đại của Cheng (công thức (1.16) và của Hint (công

thức (2.10) và ảnh hƣởng đến giá trị độ xám xung quanh từng điểm ảnh. Vì

vậy, nếu cải tiến đƣợc cách tính giá trị thuần nhất sẽ cải tiến đƣợc hiệu quả

nâng cao ĐTP ảnh trực tiếp.

Trong chƣơng này luận án trình bày về độ thuần nhất, đề xuất phƣơng

pháp xây dựng độ thuần nhất dựa trên một hệ luật ngôn ngữ, sau đó nhúng

phép lập luận sử dụng ĐSGT mà cụ thể là phép nội suy giải hệ luật mờ của

đại số gia tử. Ứng dụng độ thuần nhất mới vào quy trình nâng cao ĐTP ảnh

đa kênh [CT 2] và so sánh với phƣơng pháp xây dựng độ thuần nhất dựa trên

các toán tử t-norm [CT 3].

3.1. Xây dựng độ đo thuần nhất

3.1.1. Độ thuần nhất của Cheng

ĐTP trong [16, 17] đƣợc xây dựng qua ba bƣớc. Thứ nhất các đặc

trƣng địa phƣơng nhƣ gradient, entropy, độ lệch chuẩn trung bình và moment

bậc 4 tại từng điểm ảnh đƣợc tính và kết nhập thành một giá trị chỉ mức độ

thuần nhất của điểm ảnh. Thứ hai, từ giá trị độ thuần nhất của điểm ảnh, định

nghĩa mức độ sáng xung quanh điểm ảnh, đƣợc gọi là giá trị trung bình không

thuần nhất của điểm ảnh. Thứ ba, tính ĐTP giữa mức sáng của điểm ảnh và

giá trị trung bình không thuần nhất của điểm ảnh.

Nhƣ vậy, chất lƣợng ảnh đƣợc nâng cao ĐTP phụ thuộc vào giá trị

thuần nhất tại mỗi điểm ảnh, vì độ đo thuần nhất liên quan chính đến các

79

thông tin địa phƣơng của một ảnh và phản ánh tính đều của các vùng ảnh và

nó đóng vai trò quan trọng trong nâng cao chất lƣợng ảnh [17].

Trong [17] giá trị thuần nhất của điểm ảnh đƣợc kết nhập từ các giá trị

địa phƣơng Eij, Hij, Vij, R4,ij công thức sau:

ij ij ij 4 ,ij ij ij ij 4 ,ij* * * 1 * 1 * 1 * 1

ijH O E V H R E V H R (3.1)

Khi thử nghiệm với ảnh mầu, tác giả nhận thấy kết nhập theo công thức

(3.1) có thể tạo ra giá trị độ thuần nhất không trơn, do đó ảnh hƣởng đến độ

trơn của ảnh nâng cao ĐTP đầu ra.

(a)

(b)

Hình 3.1. Độ thuần nhất tính theo công thức gốc (3.1) (a) [17] Ảnh nâng

cao ĐTP kênh R,G và B sử dụng công thức (3.1) (b)

Hình 3.1.a chứng tỏ các giá trị độ thuần nhất tại các điểm ảnh của ảnh

#5 và ảnh kết quả của phép nâng cao của [17] khi dùng công thức gốc (3.1) là

không đủ trơn (hình 3.1.b ở các vùng đánh dấu ô chữ nhật).

Ở đây cần nhấn mạnh là các giá trị entropy địa phƣơng Hij rất nhạy với

nhiễu và sự thay đổi của giá trị mức xám, điều này đã làm cho phép kết nhập

theo công thức (3.1) có thể không hiệu quả.

(a)

(b)

Hình 3.2. {Hij}.(a) {Vij} (b) 3 kênh R, G và B với ảnh #5.

80

Thực tế giá trị độ thuần nhất của điểm ảnh là một giá trị mờ và chúng ta

có thể áp dụng lập luận mờ để thu nhận giá trị này.

Nếu các đặc trƣng địa phƣơng đƣợc i j i j,E H chuyển cho một tiếp cận

tính toán với từ (computing with words) thì công thức kết nhập dạng

i j i j,eh

T E H cần phản ánh luật mờ nhƣ sau:

Nếu g r a d ie n t là cao và e n tr o p y là cao thì độ thuần nhất là cao

Nếu g r a d ie n t là thấp và e n tr o p y là thấp thì độ thuần nhất là thấp

(Ký hiệu X là biến ngôn ngữ với giá trị ngữ nghĩa là phủ định giá trị

ngữ nghĩa của biến ngôn ngữ X)

3.1.2. Độ đo thuần nhất với toán tử t-norm

Tác giả đã thay thế công thức kết nhập (1) bởi công thức sau:

i j i j i j i j 4 , ijm ax * , *H O E H V R (3.2)

và nhận thấy rằng công thức (3.2) là phù hợp cho đa dạng ảnh mầu RGB (các

ảnh đã đƣợc nâng cao ĐTP khi sử dụng công thức (3.2) đều trơn).

(a)

(b)

Hình 3.3. Độ thuần nhất tính theo công thức (3.2) (a)

Ảnh nâng cao sử dụng công thức (3.2)(b)

Giá trị thuần nhất của điểm ảnh tính theo công thức (3.2) đã đƣợc

lƣợng hóa đơn giản, chỉ tại những vùng mà sự trực giác thấy rõ là không

thuần nhất, giá trị độ thuần nhất mới đƣợc lƣợng hóa có giá trị thấp.

Ngoài ra thử nghiệm với các ảnh mầu khác nhau cùng thuật toán của

[16, 17] cho từng kênh ảnh R, G và B tác giả cũng nhận thấy cả 2 công thức

81

(3.1) và công thức (3.2) cùng cho ảnh đầu ra của thuật toán [16] có sự tƣơng

phản mạnh ở vùng có độ thuần nhất thấp (chẳng hạn, vùng đôi mắt, xem hình

3.1.b và 3.3.b) và mức độ sáng của hình ảnh đƣợc nâng cao là nhƣ nhau.

Qua sự phân tích trên chúng ta có thể thấy phép kết nhập các đặc trƣng

địa phƣơng thích hợp (ảnh kết quả phải trơn) nên có dạng:

i j i j 4 , i j i j 4 ,i j

, , , , , ,i j i ji j i je h h rH O f E V H R T T E H T V R

(3.3)

Các đặc trƣng địa phƣơng Vij, R4,ij biến đổi chậm nên ở đây chủ yếu là

ảnh hƣởng của phép kết nhập i j i j,eh

T E H . Sử dụng một toán tử t-norm, chúng

ta xác định một độ đo thuần nhất địa phƣơng của ảnh nhƣ sau:

i j i j 4 ,i j o rm

a x , , * i ji jnH O m T E H V R

(3.4)

Mở rộng phép kết nhập ở công thức (3.2) chúng ta có thể sử dụng các

toán tử tập mờ t-norm thay cho toán tử nhân ở công thức này. Các toán tử t-

norm đảm bảo tính chất đơn điệu của phép kết nhập [22] nên có thể xây dựng

phép kết nhập các giá trị địa phƣơng cho việc ƣớc lƣợng độ đo thuần nhất địa

phƣơng của ảnh. Bảng dƣới đây là các dạng độ đo thuần nhất khác nhau sử

dụng các toán tử t-norm thông dụng [22].

Bảng 3.1. Các phép kết nhập giá trị địa phƣơng khác nhau.

Dạng i j 4 , iji ji j, , ,i jH O T E H V R Công thức

HO1 i j i j i j i j 4 , ijm ax * , *H O E H V R

HO2 (Aczel) i j i j 4 ,

i jm a x , , * i ji jA c ze l

H O T E H V R

0 .5

2 2lo g ( ) lo g ( )

( , )a b

A c ze lT a b e

HO3 (Dombi) i j i j 4 ,i j

m a x , , * i ji jD o m b iH O T E H V R

0 .52 2

1( , )

1 11

D o m b iT a b

a b

a b

82

HO4 (Frank) i j i j 4 ,i j

m a x , , * i ji jF ra n kH O T E H V R

( 1)( 1)( , ) lo g 1

1

a b

F ra n k

e eT a b

e

HO5 (Hamacher) i j i j 4 ,i j

m a x , , * i ji jH a m a ch e rH O T E H V R

( , )2 1

H a m a ch er

a bT a b

a b a b

HO6 (Yager) i j i j 4 ,i j e r

m a x , , * i ji jY a gH O T E H V R

0 .5

0 .50 .5

(a b )( , )

( ) (1 )(1 )Ya g er

T a b

a b a b

Nhận xét:

Các hàm 2

o r: [ 0 ,1] [ 0 ,1]

t n mT

cho ở bảng trên, bảo toàn thứ tự nghĩa là

o r o r, , ', ' [ 0 ,1] , ', ' ( , ) ( ', ')

t n m t n ma b a b a a b b T a b T a b

3.1.3. Xây dựng độ đo thuần nhất với tiếp cận ĐSGT

Chúng ta thấy luật “Nếu !entropy là lớn và !gradient là lớn, thì

homogeneity là lớn” biểu thị một quan hệ đơn điệu tăng. Nó chứng tỏ ngữ

nghĩa dựa trên thứ tự của từ là rất quan trọng, nó phản ánh quan hệ đơn điệu

với cùng các biến nhƣng trong miền giá trị số. ĐSGT cho phép lƣợng hóa bảo

toàn ngữ nghĩa thứ tự nhƣng điều này không đảm bảo khi các từ đƣợc biểu

diễn bằng các tập mờ. Phép lƣợng hóa của ĐSGT cho phép làm chủ ngữ

nghĩa của các từ một cách trực tiếp và tính toán ngữ nghĩa dễ dàng, cho phép

ngƣời chuyên gia phát biểu một hệ luật ngôn ngữ trong đó thay thế việc biểu

diễn các hàm thuộc bằng một phân hoạch bảo toàn thứ tự thích hợp của đoạn

[0, 1]. Phép lƣợng hóa của ĐSGT đƣợc xây dựng theo tiếp cận tiên đề dựa

trên ngữ nghĩa thứ tự và phép mờ hóa tự nhiên của các từ.

Từ những phân tích trên ta thấy độ đo thuần nhất đƣợc xây dựng dựa

trên hệ luật khá đơn giản và rõ ràng sau:

83

Giả sử G ( g ra d ie n t ), E ( e n tr o p y ) và T là các biến ngôn ngữ với miền ngữ

nghĩa giá trị số đƣợc chuẩn hóa về đoạn [0, 1] thì HMR(G , E ,T ) là một hệ

luật mờ cho G , E và T .

Bằng việc ứng dụng phương pháp lập luận ngôn ngữ khi bổ sung các

gia tử, minh họa với trường hợp đơn giản hai gia tử very và litle thì hệ luật

mờ HMR( G , E ,T ) được phát biểu như sau:

R1: If G là very hight AND E is hight Then T is very higt

R2: If G là very low AND E is low Then T is very low

R3: If G là hight AND E is very hight Then T is very hight

R4: If G là low AND E is very low Then T is very low

R5: If G là hight AND E is hight Then T is hight

R6: If G là low AND E is low Then T is low

R7: If G là little hight AND E is hight Then T is little hight

R8: If G là little low AND E is low Then T is little low

R9: If G là hight AND E is little hight Then T is little hight

R10: If G là low AND E is little low Then T is little low

R11: If G là very hight AND E is very hight Then T is very

very hight

R12: If G là very low AND E is very low Then T T is very

very low

(3.5)

Xây dựng hàm fSnorm cho hệ luật (3.5)

Sử dụng phƣơng pháp lập luận ĐSGT, ta có các bƣớc để tính kết quả

đầu ra khi cho biết đầu vào theo 3 bƣớc nhƣ sau:

Bƣớc 1: Thiết lập các ĐSGT và các tham số tính mờ tƣơng ứng

84

Ký hiệu AG = (G , C, w, H, ), AE = ( E , C, w, H, ) và AT = (T , C, w,

H, ), C = {c–, c

+}, c

– = low, c

+ = hight, H = H

- H

+, H

- = {little}, H

+ =

{very}, L ≡ little, V ≡ very.

Đặt ( ), ( ), (

), ( ),

( ), ( ), trong đó , , , , , (0, 1).

Mối quan hệ dấu của các gia tử đối với các gia tử khác đƣợc xác định

nhƣ Bảng 3.2 sau:

Bảng 3.2. Mối quan hệ dấu của các gia tử

V L

V + +

L - -

Từ bảng trên ta có: sign(Vc-) = sign(VIc

-) = sign(VI)sign(Ic

-) =

1*sign(Ic-) = -1, ở đây I là gia tử đơn vị, Ix=x với mọi x.

Bảng 3.3. Bảng giá trị độ đo tính mờ và SQM tƣơng ứng với AG, AE, AT

Tham số For G For E For T

U(c+) 1G

G 1E

E 1T

T

U (V) 1G G

1E E

1T T

v U (low) G G

E E

T T

vU(V.low) (very low) 2

G G 2

E E

2

T T

vU(L.low) (little low) ( ) + G G G

( ) + E E E

( )+T T T

vU(hight) 1GG

1 EE

1 TT

vU(V.hight) (very

hight)

21

GG 2

1EE

2

1 TT

vU(L.hight) (little

hight)

( ) - GG G

( ) - EE E

( )- TT T

vU(V.V.low) (very

very low)

3

G G 3

E E 3

T T

vU(V.V.hight) (very

very hight)

31

GG 3

1EE

31 TT

, trong đó U đóng vai trò của G , E và T .

85

Để tính các giá trị vX(x) cho một ĐSGT AX bất kỳ chúng ta cần lập

bảng sắp thứ tự của các gia tử nhấn và bảng dấu giữa các gia tử. Trong luận

án chỉ sử dụng hai gia tử nên chúng ta chỉ cần sử dụng các phép tính giá trị

định lƣợng ngữ nghĩa rất đơn giản của ĐSGT để chứng tỏ bảng trên là đúng.

Thật vậy, ta có:

( ) ( ) ( )U U U U U U U

v c fm c fm c

( . ) 1 ( ) ( . ) ( ) * ( )U U U U U U U U U U

S ig n L c L v L c v c v c

U U U U U

( ) ( ) (1 ) * 1 (1 ) * 1 *U U U UU U U U U U U U U

v c fm c

( . ) 1 ( ) ( . ) ( ) * 1 ( )U U U U U U U U U U

S ign L c L v L c v c v c

1 * U UU U U

Ngoài ra, chúng ta có mệnh đề sau:

Mệnh đề 3.1.

(i) 1

( . ) ( )k k

U U U Uv V c k N

(ii) 1

( . ) 1 ( )k k

U U U Uv V c k N

, ở đây ký hiệu Vk.x là phép nhấn k lần gia tử very lên x U

Chứng minh:

(i) Ta chứng minh bằng quy nạp theo k.

Khi k=0, ( ) ( ) ( )U U U U U U U

v c fm c fm c

. Vậy (i) đúng khi k=0.

Giả sử (i) đúng với k, tức là 1

( . ) ( )k k

U U U Uv V c

. Chúng ta cần chứng

minh (i) đúng với k+1 tức là 1 2

( . ) ( )k k

U U U Uv V c

Thật vậy,

1

{ V }

.( . ) 1, ( ) . . .

U

k k k

U U U U U U U

h H

s ig n V V c h v V c v V V c

86

1 2

. ( ) ( )k k k

U U U U U U U Uv V c

Vậy (i) là đúng.

(ii) Ta chứng minh bằng quy nạp theo k.

Khi k=0,

( ) ( ) (1 ) * 1 (1 ) * 1 *U U U UU U U U U U U U U

v c fm c

. Vậy (ii) đúng khi k=0.

Giả sử (ii) đúng với k, tức là 1

( . ) 1 ( )k k

UU U U

v V c

. Chúng ta cần

chứng minh (ii) đúng với k+1 tức là 1 2( . ) 1 ( )

k k

UU U U

v V c

Thật vậy,

{ V }

.( . ) 1, ( )

U

k

U U U

h H

S ig n V V c h

1 1 1. . 1 . 1 ( ) ( )

k k k k k

U UU U U U U U U U U Uv V c v V c v V c

1 1 21 (1 ) * ( ) 1 * ( ) 1 ( )

k k k

U U UU U U U U

Vậy (ii) là đúng.

Ví dụ: khi 0 .5 , 0 .5 , 0 .4U U

ta có bảng giá trị độ đo tính mờ

và SQM ứng với AG, AE, AT nhƣ sau:

Bảng 3.4. Bảng giá trị tính toán minh họa độ đo tính mờ và SQM tƣơng ứng

với AG, AE, AT

Tham số For G For E For T

U(c+) 0.6 0.6 0.6

U (V) 0.5 0.5 0.5

v U (low) 0.2 0.2 0.2

vU(V.low) (very low) 0.1 0.1 0.1

vU(L.low) (little low) 0.3 0.3 0.3

vU(hight) 0.7 0.7 0.7

87

vU(V.hight) (very hight) 0.85 0.85 0.85

vU(L.hight) (little hight) 0.55 0.55 0.55

vU(V.V.low) (very very low) 0.05 0.05 0.05

vU(V.V.hight) (very very hight) 0.925 0.925 0.925

Bƣớc 2:

2.1: Tính các SQM của các thành phần bên trái và bên phải hệ luật mờ

sử dụng bảng 3.3.

2.2: Với một toán tử “và” 2 ngôi AND: 2: [ 0 ,1] [0 ,1]A N D , AND(G , E

) = G * E , chúng ta có mảng các điểm nội suy bề mặt Snorm (ở đây m = 2) của

hệ luật (3.5) nhƣ sau:

Bảng 3.5. Bảng giá trị các mốc nội suy dựa trên toán tử AND

của hệ luật (3.5)

Chỉ số luật Các điểm nội suy (x,y)[0,1]2

x y

R1 AND ( ( ) ( )) ( )

R2 AND ( ( ) ( )) ( )

R3 AND ( ( ) ( )) ( )

R4 AND ( ( ) ( )) ( )

R5 AND ( ( ) ( )) ( )

R6 AND ( ( ) ( )) ( )

R7 AND ( ( ) ( )) ( )

R8 AND ( ( ) ( )) ( )

R9 AND ( ( ) ( )) ( )

R10 AND ( ( ) ( )) ( )

R11 AND ( ( ) ( )) ( )

R12 AND ( ( ) ( )) ( )

Từ đây có thể sử dụng một phép nội suy đơn giản fSnorm nhƣ phép tuyến

tính từng khúc trên các mốc nội suy.

88

Nhận xét:

Cho trƣớc cặp giá trị ngữ nghĩa đầu vào (G , E ) [0, 1]2, ta xác định

giá trị ngữ nghĩa đầu ra hT [0, 1] nhƣ sau: hT = fSnorm (AND(G , E ));

Hàm fSnorm cho hệ luật (3.5) đƣợc xây dựng nhƣ trên đƣợc ký hiệu là

THA, AND hay gọn hơn THA khi đã cho trƣớc toán tử AND.

Mệnh đề 3.2. Hàm 2: [ 0 ,1] [ 0 ,1]

H AT bảo toàn thứ tự nghĩa là

, , ', ' [ 0 ,1] , ', ' ( , ) ( ', ')H A H A

a b a b a a b b T a b T a b

Chứng minh: Do

(i) AND bảo toàn thứ tự.

(ii) Các SQM Gv , E

v và Tv bảo toàn thứ tự trên G , E và T (xem

Định nghĩa 1.2 và Định nghĩa 1.3)

Suy ra THA bảo toàn thứ tự tại các mốc nội suy (xem bảng 3.5)

Do fSnorm đƣợc tạo thành từ phép nội suy tuyến tính từng khúc giữa các

mốc nội suy, nên bảo toàn thứ tự THA trên [0, 1]2 .

Sử dụng THA, chúng ta xác định một độ đo thuần nhất địa phƣơng của

ảnh nhƣ sau:

i j i j 4 ,i j

, , * i ji jH AH O T T E H V R

(3.6)

Kỹ thuật xây dựng độ đo thuần nhất sử dụng ĐSGT đƣợc thực hiện

theo thuật toán 3.1 nhƣ sau:

Thuật toán 3.1. Xác định độ thuần nhất tại mỗi điểm ảnh HA-HRM.

Đầu vào: Ảnh đa cấp xám I, có kích thƣớc M x N.

Tham số: g, gr, ep, ep, ho, ho (0, 1) của ĐSGT AGr, AEp và

AHo

Đầu ra: Bảng giá trị độ thuần nhất tại mỗi điểm ảnh.

Bƣớc 1: Tính gradient, entropy, độ lệch chuẩn và mô men bậc 4 chuẩn

hóa về đoạn [0, 1] các giá trị này.

89

For mỗi điểm ảnh gij

1.1: Tính Eij, Hij, Vij, R4,ij dùng công thức (1.11)

1.2: Tính 1ijij

E E , 1ijij

H H , 1ijij

V V , 4 ,4 ,

1ijij

R R

Bƣớc 2: Với toán tử AND, xây dựng hàm THA cho hệ luật HRM(AGr,

AEp, AHo) của các biến ngôn ngữ Gr( g ra d ie n t ), Ep( e n tr o p y ) và

Ho(homogeneity) với các tham số độ đo mờ g, gr, ep, ep, ho, ho (0,1).

Bƣớc 3: Tính độ thuần nhất tại từng điểm ảnh

3.1: For mỗi điểm ảnh gij

Tính ,i j i ji j H A

E H T E H

Tính 4 ,ij ij

ax , * i ji jH O m E H V R

3.2: Chuẩn hóa

For mỗi điểm ảnh gij-

Tính i j

i j

i j

=m a x { }

H O

H O

Trả về: {βij}

Thuật toán 1 có độ phức tạp O(M*N).

(a)

(b)

Hình 3.4. Các giá trị nhất của kênh V của ảnh #5 sử dụng [18] (a), giá

trị thuần nhất sử dụng ĐSGT (b)

3.2. Nâng cao độ tƣơng phản ảnh mầu với độ đo thuần nhất đề xuất

Trƣớc tiên đề xuất xây dựng một biến đổi ảnh F của từng kênh ảnh

xám của tổ hợp kênh ảnh đầu vào. Khi đó ĐTP đƣợc tính theo công thức:

90

i j i j

i j

i j i j

( ) ( )

( ) ( )

F g FC

F g F

(3.7)

ở đây ta đồng nhất biến đổi F với ảnh {F(i,j)}.

Nhƣ trong chƣơng 2, tác giả cũng sử dụng một phép phân cụm FCM để

ƣớc lƣợng nhiều dải động mức xám của từng kênh ảnh và xây dựng một biến

đổi ảnh ứng với từng kênh. Ở đây khác với chƣơng 2, tác giả đề xuất sử dụng

hàm S-function thay cho hàm clip để xây dựng một biến đổi ảnh

Với mỗi 1,k K , chúng ta xác định một biến đổi Fk cho kênh ảnh Ik nhƣ

sau:

, m a x , m in ,1 , , , 2 ,

1

, m in

( , ) ; , ,

( , )

C

k k k k c k c k c

c

k k

L L S fu n c tio n I i j B V B

F i j LC

(3.8)

, trong đó 1, , 1, , 1,k K i M j N , [x] chỉ phần nguyên của số thực x.

Nhận xét: Biến đổi ảnh Fk bảo toàn thứ tự….

Sử dụng độ đo thuần nhất HA-HRM đƣợc xây dựng trong thuật toán

3.1, kỹ thuật nâng cao ĐTP ảnh mầu trong biểu diễn mầu HSV đƣợc thực

hiện theo thuật toán 3.2 nhƣ sau:

Thuật toán 3.2. Nâng cao ĐTP ảnh mầu HSV sử dụng độ đo thuần

nhất HA-HRM.

Đầu vào: Ảnh I trong biểu diễn mầu RGB, kích thƣớc M x N. Tham số

C , 2N C

, ngƣỡng fcut (fcut > 0, đủ nhỏ), d (d x d là kích thƣớc cửa sổ).

Đầu ra: Ảnh mầu RGB Inew, và tùy chọn trả về:

Giá trị tƣơng phản trung bình CMR, CMG, CMB, Giá trị Eavg, Havg

Bƣớc 1: Gọi (IH, IS, IV) là biểu diễn mầu của I trong không gian mầu

HSV. Lƣợng hóa để coi các kênh IS, IV nhƣ là các ảnh đa cấp xám.

91

Bƣớc 2: Với dữ liệu đầu vào là tổ hợp kênh (IS, IV), tham số số cụm là

C và ngƣỡng fcut, thực hiện phân cụm FCM để ƣớc lƣợng C dải động mức

xám [Bk,1,c, Bk,2,c] với k{S, V} (xem công thức (2.4)).

Bƣớc 3: Xác định ảnh biến đổi FS, FV của kênh IS, IV tƣơng ứng theo

công thức (2.5).

Bƣớc 4:

4.1: Tính các giá trị thuần nhất của FS, FV dựa trên ĐSGT sử dụng HA-

HRM.

4.2: Tính tham số của [17] cho kênh FS, FV với kích thƣớc cửa sổ d x d,

cụ thể là các giá trị mức xám không thuần nhất {δFS, ij}, {δFV, ij}, số mũ khuếch

đại {FS,ij}, {FV,ij} tại từng điểm ảnh của kênh FS và kênh FV (công thức

(1.14), và (1.16)).

Bƣớc 5: Tính ĐTP và xác định kênh ảnh xám mới của kênh FS và kênh

FV, , ,

,S S n ew V V n ew

F I F I nhƣ sau:

Với kênh FS FS(IS) và kênh FV FV(IV): Tính ĐTP

S ,i j i j

S ,i j

S ,i j i j

( ) ( ),

( ) ( )

S S

S S

F g FC

F g F

V ,ij i j

V ,i j

V ,i j i j

( ) ( )

( ) ( )

V V

V V

F g FC

F g F

(3.9)

Tính giá trị mức xám mới của kênh S và V:

S ,ij

S ,i j

S ,i j

S ,i j

S ,ij


S ,i j

S ,n e w

S ,ij


S ,i j

1,

1

I ( , )

1,

1

t

t

t

t

Cg

C

i j

Cg

C

(3.10)

92

V ,ij

V ,ij

S ,i j

V ,i j

V ,ij

V ,ij V ,ij V ,ij

V ,ij

V ,n e w

V ,ij

V ,ij V ,ij V ,ij

V ,ij

1,

1

I ( , )

1,

1

t

t

t

t

Cg

C

i j

Cg

C

Lƣu ý: kênh S đƣợc đánh chỉ số k = 1, kênh V đƣợc đánh chỉ số k = 2.

Bƣớc 6: Chuyển ảnh (IH, IS,new, IV,new) trong biểu diễn mầu HSV về biểu

diễn mầu RGB, ta đƣợc ảnh Inew.

Bƣớc 7: Bƣớc tùy chọn, tính các chỉ số CM{R,G,B}, Eavg và Havg.

7.1: Tính tham số của [17] cho kênh IR, IG và IB của ảnh gốc I với kích

thƣớc cửa sổ dxd, cụ thể là các giá trị mức xám không thuần nhất {δR,ij},

{δG,ij}, và {δB,ij} của kênh IR, IG và IB tƣơng ứng (công thức (1.14) và (1.16)).

7.2: Tính CMR, CMG, CMB theo công thức (1.12), cụ thể là:

, , i j

i j , , i j

( , )

( , )

*

n ew R R

n ew R R

R

I i j

I i jC M

M N

, , i j

i j , , i j

( , )

( , )

*

n ew G G

n ew G G

G

I i j

I i jC M

M N

, , i j

i j , , i j

( , )

( , )

*

n ew B B

n ew B B

B

I i j

I i jC M

M N

7.3: Tính: Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công thức (1.8),

Havg = Havg{Inew,R, Inew,G, Inew,B} theo công thức (1.9).

Trả về: Inew,

Và các tùy chọn đƣợc trả về CMR, CMG, CMB, Eavg, Havg.

Không tính đến thuật toán FCM và phép nội suy giải hệ lập luận mờ

(3.5) của ĐSGT, thuật toán 3.2 có độ phức tạp tƣơng đƣơng thuật toán gốc

[17]. Mô hình kiến trúc hệ thống đề xuất đƣợc xây dựng nhƣ hình 3.5:

93

Hình 3.5. Lƣu đồ xử lý của thuật toán đề xuất.

3.3. Thực nghiệm

3.3.1. Tính độ thuần nhất kênh ảnh

Các tham số sử dụng trong phép biến đổi mờ hóa ảnh đƣợc lựa chọn

nhƣ trong phần 2.1.6, chƣơng 2, cụ thể: fcut = 0.005, C = 5.

Các giá trị tham số ĐSGT của các biến ngôn ngữ Gr, Ep, Ho thiết kế độ

đo thuần nhất đƣợc cho bằng thực nghiệm nhƣ bảng sau:

Bảng 3.6. Các tham số cơ sở của ĐSGT Agr, Aep và Aho.

Tham số For Gr ( g ra d ie n t ) For Ep ( e n tr o p y ) For Ho ( h o m o g en e ity )

U(c-1

) 0.5 0.5 0.5

U(little) 0.5 0.5 0.5

Tính giá trị sáng xung quanh, ĐTP và số mũ

khuếch đại của S và V.

Tính các giá trị mức xám mới của kênh S và

kênh V

Chuyển đổi ngƣợc HSV về RGB

Kết thúc

Bắt đầu

Ảnh RGB đầu vào

Chuyển đổi RGB sang HSV

Tính các giá trị thuần

nhất δRij,, δGij,, δB,ij

Biến đổi kênh S

và V

94

, trong đó U đóng vào của các biến ngôn ngữ Gr, Ep và Ho.

Các tham số , ,U U

đƣợc lựa chọn bằng thực nghiệm nhƣ sau:

0 .5 , 0 .5 , 0 .4U U

.

3.3.2. Đánh giá độ đo HA-HRM

Khi đánh giá kết quả của tác giả so với độ đo gốc đƣợc công bố trong

[17], vì [17] chỉ đƣợc phát biểu ứng dụng cho ảnh đa cấp xám, trong khi thuật

toán của tác giả đƣợc phát biểu cho ảnh mầu, ngoài đánh giá bằng trực quan

tác giả cũng sử dụng các chỉ số khách quan Eavg, Havg và CM để đánh giá,

tƣơng tự nhƣ trong Chƣơng 2.

3.4. Các kết quả và luận giải

Trong phần này tác giả trình bày thử nghiệm nâng cao ĐTP sử dụng

biến đổi ảnh trên kênh ảnh S và V) trong biểu diễn mầu HSV.

Trong thử nghiệm này, tác giả thực hiện kiểm tra hiệu quả của độ đo

HA-HRM đề xuất sử dụng phép phân cụm FCM xác định tham số cho phép

biến đổi ảnh trong công thức (2.5). Các bƣớc đƣợc thực hiện nhƣ sau:

- Đầu tiên, chuyển biểu diễn mầu RGB sang biểu diễn mầu HSV của

ảnh đầu vào. Phân cụm dữ liệu mức xám tổ hợp kênh S và kênh V với tham

số đƣợc chọn nhƣ trong thử nghiệm A (số cụm C = 5 v.v…). Trên từng kênh

ảnh S và kênh V riêng rẽ ƣớc lƣợng {B1,c,k, B2,c,k} (k{S, V}) và thực hiện

biến đổi ảnh cho kênh S và kênh V tƣơng ứng sử dụng hàm biến đổi FS, FV

(công thức (2.5)).

- Thứ hai, xác định giá trị ĐTP theo thuật toán 3.2 và các bƣớc liên

quan cho kênh ảnh S và V đã biến đổi ở bƣớc thứ nhất với kích thƣớc cửa sổ

3x3 và tham số t = 0.25 (1.10).

95

- Thứ ba, tổng hợp lại các kênh ảnh H gốc, kênh S và kênh V đã nâng

cao ĐTP, sau đó biến đổi ngƣợc từ biểu diễn mầu HSV sang biểu diễn mầu

RGB.

- Cuối cùng, tính giá trị mức xám không thuần nhất tại từng điểm ảnh

ứng với các kênh ảnh R, G và B (các giá trị này đƣợc dùng để tính độ đo

tƣơng phản trung bình trên từng kênh R, G và B).

Giá trị trung bình ĐTP trực tiếp CM trên kênh R, G và B trong biểu

diễn mầu RGB ảnh đầu vào đƣợc tính với ảnh giá trị mức xám trung bình

không thuần nhất của từng kênh R, G và B của ảnh RGB gốc và ảnh kết quả

đầu ra khi sử dụng thuật toán 2 với các HOk, k = 1…6 và phƣơng pháp đề

xuất (HA-HRM) thể hiện ở các bảng 3.7-3.11.

Bảng 3.7. Giá trị chỉ số CMR cho từng ảnh và các phƣơng pháp kết nhập

để tạo giá trị thuần nhất

Độ đo/ảnh #1 #2 #3 #4 #5 #6

HO1 0.3692 0.1806 0.1688 0.2002 0.2132 0.1494

HO 2 0.3687 0.1805 0.1687 0.1993 0.2144 0.1494

HO 3 0.3687 0.1805 0.1687 0.1993 0.2144 0.1450

HO 4 0.3688 0.1805 0.1687 0.1992 0.2144 0.1493

HO 5 0.3687 0.1805 0.1686 0.1993 0.2144 0.1451

HO 6 0.3691 0.1806 0.1687 0.1997 0.2160 0.1454

HA-HRM 0.3889 0.1813 0.1802 0.2065 0.2161 0.1505

Bảng 3.8. Giá trị chỉ số CMG cho từng ảnh và các phƣơng pháp kết nhập


Độ đo/ ảnh #1 #2 #3 #4 #5 #6

HO 1 0.3780 0.1815 0.1703 0.2016 0.2142 0.1503

HO 2 0.3773 0.1814 0.1701 0.2007 0.2154 0.1503

96

HO 3 0.3773 0.1814 0.1701 0.2007 0.2154 0.1458

HO 4 0.3774 0.1814 0.1701 0.2006 0.2154 0.1502

HO 5 0.3774 0.1814 0.1701 0.2006 0.2154 0.1459

HO 6 0.3778 0.1814 0.1702 0.2011 0.2168 0.1463

HA-HRM 0.4000 0.1822 0.1814 0.2080 0.2170 0.1623

Bảng 3.9. Giá trị chỉ số CMB cho từng ảnh và các phƣơng pháp kết nhập


Độ đo/ảnh #1 #2 #3 #4 #5 #6

HO 1 0.4200 0.1851 0.1869 0.2126 0.2148 0.1498

HO 2 0.4192 0.1851 0.1868 0.2118 0.2160 0.1498

HO 3 0.4192 0.1851 0.1868 0.2118 0.2160 0.1451

HO 4 0.4194 0.1850 0.1869 0.2117 0.2160 0.1497

HO 5 0.4193 0.1851 0.1868 0.2118 0.2160 0.1453

HO 6 0.4197 0.1851 0.1869 0.2121 0.2176 0.1457

HA-HRM 0.4418 0.1860 0.2048 0.2194 0.2177 0.1626

Bảng 3.10. Giá trị chỉ số Eavg cho từng ảnh và các phƣơng pháp kết nhập


Độ đo/ảnh #1 #2 #3 #4 #5 #6

HO 1 6.1126 7.2722 7.3154 7.5641 7.3993 4.2105

HO 2 6.1129 7.2712 7.3127 7.5456 7.4098 4.2174

HO 3 6.1123 7.2698 7.3122 7.5464 7.4076 4.2051

HO 4 6.1175 7.2684 7.3144 7.5462 7.4167 4.2228

HO 5 6.1101 7.2758 7.3096 7.5631 7.4168 4.2165

HO 6 6.1094 6.8158 6.9599 7.3155 7.2337 4.2239

HA-HRM 6.1509 7.3862 7.5124 7.6307 7.5833 4.3675

97

Bảng 3.11. Giá trị chỉ số Havg cho từng ảnh và các phƣơng pháp kết nhập


Độ đo/ ảnh #1 #2 #3 #4 #5 #6

HO 1 0.3999 0.6943 0.7198 0.7640 0.7891 0.4599

HO 2 0.4022 0.6944 0.7201 0.7648 0.7909 0.4606

HO 3 0.4021 0.6944 0.7201 0.7648 0.7909 0.4424

HO 4 0.4023 0.6944 0.7201 0.7648 0.7909 0.4612

HO 5 0.4020 0.6944 0.7201 0.7645 0.7909 0.4420

HO 6 0.4017 0.6944 0.7200 0.7646 0.7904 0.4414

HA-HRM 0.3984 0.6943 0.7197 0.7610 0.7907 0.4501

Bảng 3.7 đến bảng 3.11 của kết quả thực nghiệm của các ảnh #1 - #6 đã

thể hiện các chỉ số khách quan ĐTP trực tiếp trên từng kênh R, G và B khi sử

dụng phép kết nhập 4 đặc trƣng địa phƣơng HO7 đều cho kết quả cao hơn khi

sử dụng các HOk, k = 1…6. Chỉ số khách quan Eavg khi áp dụng thuật cũng

cao hơn với HA-HRM. Cũng vậy, chỉ số khách quan Havg khi áp dụng HA-

HRM, ngoài ảnh #5 và ảnh #6, đều có giá trị nhỏ hơn so với chỉ số ảnh kết

quả khi áp dụng HOk, k = 1…6. Đây là những chứng cứ khách quan thể hiện

hiệu quả của độ đo thuần nhất dựa trên ĐSGT so với các phép xây dựng sử

dụng toán tử t-norm.

(a)

(b)

98

(c)

(d)

(e)

(g)

(h)

(k)

(l)

(m)

99

(n)

(p)

Hình 3.6. Thử nghiệm cho ảnh #1 - #6. Ảnh kết quả (cột bên trái ) khi sử

dụng [17], (cột bên phải) sử dụng thuật toán 3.2 với HO7 đề xuất.

Hình 3.7. Ảnh kết quả sử dụng thuật toán 2 với phép kết nhập gốc [17]

ij 4 ,* * *

ij ij ij ijH O E V H R cho ảnh #1 và ảnh kết quả không trơn.

100


Chƣơng này phân tích phƣơng pháp xây dựng độ đo thuần nhất địa

phƣơng của ảnh theo phƣơng pháp của Cheng, chỉ ra những hạn chế của

phƣơng pháp này khi áp dụng vào quy trình nâng cao ĐTP, đồng thời đề xuất

02 đóng góp mới cho phƣơng pháp xây dựng độ đo thuần nhất địa phƣơng

của ảnh, cụ thể:

Thứ nhất, tác giả đã đề xuất phƣơng pháp mới xây dựng độ đo thuần

nhất địa phƣơng của ảnh khi sử dụng lập luận mờ với thuật toán dựa trên

ĐSGT để kết nhập các giá trị địa phƣơng nhƣ gradient, entropy, độ lệch chuẩn

trung bình và moment bậc 4 so với cách kết nhập của [17].

Thứ hai, tác giả cũng đã đề xuất phƣơng pháp mới khác xây dựng độ đo

thuần nhất địa phƣơng của ảnh khi sử dụng lập luận mờ với thuật toán dựa

trên các toán tử t-norm để kết nhập các giá trị địa phƣơng gradient, entropy,

độ lệch chuẩn trung bình và moment bậc 4 so với cách kết nhập của [17];

Chƣơng này cũng trình bày đề xuất một thuật toán mới theo phƣơng

pháp nâng cao ĐTP trực tiếp cho ảnh mầu trong biểu diễn mầu HSV dựa trên

độ đo thuần nhất mới đã đƣợc xây dựng bằng ĐSGT. So sánh hiệu quả nâng

cao ĐTP ảnh khi áp dụng các phƣơng pháp xây dựng độ đo thuần nhất đề

xuất.

Kết quả thực nghiệm đã chứng tỏ rằng các kỹ thuật đã đề xuất của tác

giả đã làm việc tốt với đa dạng ảnh mầu. Độ đo thuần nhất đề xuất hoạt động

hiệu quả hơn các độ đo sử dụng các toán tử kết nhập mờ t-norm thông dụng.

Ảnh nâng cao ĐTP cũng trơn, tăng đƣợc độ sáng toàn bộ ảnh.

101

KẾT LUẬN

Từ những hạn chế trong phƣơng pháp của Cheng nhƣ:

(1) Dùng phép biến đổi ảnh của Cheng có thể làm mất chi tiết của ảnh

gốc và độ sáng ảnh đầu ra của phép nâng cao ĐTP của cheng ít thay đổi;

(2) Hàm biến đổi mức xám trong của Cheng không đối xứng và giá trị

độ xám của điểm ảnh đầu ra có thể nằm ngoài miền giá trị độ xám.

(3) Phép xây dựng độ đo thuần nhất địa phƣơng của ảnh khi áp dụng

vào nâng cao ĐTP ảnh, ảnh kết quả có thể không trơn.

Luận án đã đề xuất 3 vấn đề nghiên cứu mới là:

(1) Xây dựng phép biến đổi mờ hóa ảnh áp dụng cho ảnh đa kênh làm

bƣớc tiền đề cho quy trình nâng cao ĐTP nhằm thay đổi độ sáng của ảnh kết

quả. Phép biến đổi ảnh bảo toàn thứ tự và không làm mất chi tiết ảnh.

(2) Xây dựng hàm biến đổi độ xám dạng chữ S dựa trên hệ luật ngôn

ngữ và giải hệ luật bằng ĐSGT (toán tử Hint) để cải tiến thuật toán của

Cheng, ứng dụng nâng cao ĐTP ảnh đa kênh.

(3) Xây dựng độ thuần nhất theo tiếp cận đại số gia tử áp dụng vào quy

trình nâng cao ĐTP ảnh đa kênh.

Tuy nhiên, luận án còn một số hạn chế:

(1) Hệ luật ngôn ngữ mới dừng lại ở 05 luật, số gia tử mới dừng lại ở

02 gia tử, mặc dù đƣợc chứng minh là có ích nhƣng vẫn rất đơn giản;

(2) Vấn đề ảnh hƣởng của các yếu tố nhƣ phƣơng pháp nội suy, giá trị

các tham số mờ….đến hiệu quả nâng cao ĐTP ảnh chƣa đƣợc xét đến;

(3) Yếu tố độ phức tạp của thuật toán cũng chƣa đƣợc xem xét.

Từ những hạn chế trên, hƣớng nghiên cứu tiếp theo của luận án là:

(1) Nghiên cứu mở rộng số luật trong hệ luật ngôn ngữ, số lƣợng gia tử;

(2) Nghiên cứu sự ảnh hƣởng của các yếu tố liên quan nhƣ phƣơng

pháp nội suy, các giá trị tham số mờ;

(3) Nghiên cứ cải thiện tốc độ tính toán.

102

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ

[CT 1] Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, Ngô

Hoàng Huy, Đặng Duy An, Một phƣơng pháp mới để nâng cao độ tƣơng phản

ảnh mầu theo hƣớng tiếp cận trực tiếp, Tạp chí Công nghệ Thông tin và

Truyền thông, Tập V-1 số 17(37), 06-2017, trang 59-74.

[CT 2] Nguyễn Văn Quyền, Ngô Hoàng Huy, Nguyễn Cát Hồ, Trần

Thái Sơn, Xây dựng độ đo thuần nhất và nâng cao độ tƣơng phản ảnh mầu

theo tiếp cận trực tiếp dựa trên ĐSGT”, Tạp chí Công nghệ Thông tin và

Truyền thông, Tập V-2 số 18(38), 12-2017, trang 19-32.

[CT 3] Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Hoàng

Xuân Trung, Tạ Yên Thái, Xây dựng độ đo thuần nhất cho ảnh mầu dựa trên

các toán tử t-norm, Tạp chí Nghiên cứu khoa học và công nghệ quân sự, số

49, 06-2017, trang 117-131.

[CT 4] Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Hoàng

Xuân Trung, Tạ Yên Thái, Phƣơng pháp xây dựng một histogram mở rộng

cho ảnh đa kênh và ứng dụng, Tạp chí Nghiên cứu khoa học và công nghệ

quân sự, số 50, 08-2017, trang 127-137.

[CT 5] Nguyễn Văn Quyền, Nguyễn Tân Ân, Trần Thái Sơn, Thiết kế

hàm biến đổi độ xám dạng chữ S tăng cƣờng độ tƣơng phản ảnh sử dụng

ĐSGT, Kỷ yếu hội thảo quốc gia về nghiên cứu Cơ bản và Ứng dụng công

nghệ thông tin lần thứ 10 (Fair 10), tháng 8 năm 2017, trang 884-897.

103

TÀI LIỆU THAM KHẢO

Tiếng Việt

[1] Nguyễn Cát Hồ, Nguyễn Văn Long (2003), “Làm đầy đại số gia tử trên

cơ sở bổ sung các phần tử giới hạn”, Tạp chí Tin học và Điều khiển học,

Tập 19(1), tr. 62–71.

[2] Nguyễn Cát Hồ, Trần Thái Sơn (1995), “Về khoảng cách giữa các giá trị

của biến ngôn ngữ trong đại số gia tử”, Tạp chí Tin học và Điều khiển

học, Tập 11(1), tr. 10-20.

[3] Nguyễn Cát Hồ (2008), “Cơ sở dữ liệu mờ với ngữ nghĩa đại số gia tử”,

Bài giảng trường Thu - Hệ mờ và ứng dụng, Viện Toán học Việt Nam.

[4] Nguyễn Cát Hồ, Phạm Thanh Hà (2007), “Giải pháp kết hợp sử dụng đại

số gia tử và mạng nơron RBF trong việc giải quyết bài toán điều khiển

mờ”, Tạp chí Tin học và Điều khiển học, Tập 25(1), tr. 17-32.

[5] Dƣơng Thăng Long (2010), Một phương pháp xây dựng hệ mờ dạng luật

với ngữ nghĩa dựa trên đại số gia tử và ứng dụng trong bài toán phân

lớp, Luận án tiến sĩ Toán học, Viện Công nghệ Thông tin - Viện Khoa

học và Công nghệ Việt Nam.

[6] Trần Thái Sơn, Nguyễn Thế Dũng (2005), “Một phƣơng pháp nội suy

giải bài toán mô hình mờ trên cơ sở đại số gia tử”, Tạp chí Tin học và

Điều khiển học, Tập 21(3), tr. 248-260.

[7] Lê Xuân Việt (2008), Định lượng ngữ nghĩa các giá trị của biến ngôn

ngữ dựa trên đại số gia tử và ứng dụng, Luận án Tiến sĩ Toán học, Viện

Công nghệ Thông tin - Viện Khoa học và Công nghệ Việt Nam.

[8] Lê Xuân Vinh (2006), Về một cơ sở đại số và logíc cho lập luận xấp xỉ

và ứng dụng, Luận án Tiến sĩ Toán học, Viện Công nghệ Thông tin -

Viện Khoa học và Công nghệ Việt Nam.

104

Tiếng anh

[9] S. S. Agaian, S. Blair and K. A. Panetta (2007), “Transform coefficient

histogram-based image enhancement algorithms using contrast entropy”,

IEEE Trans. Image Processing, vol. 16, no. 3, pp. 741-758.

[10] Aditi M., Irani S. (2006), “Contrast Enhancement of Images using

Human Contrast Sensitivity”, Applied perception in graphics and

visualization, 11, pp. 69-76.

[11] Aman T., Naresh K. (2014), “Performance Analysis of Type-2 Fuzzy

System for Image Enhancement using Optimization”, International

Journal of Enhanced Research in Science Technology & Engineering,

Vol. 3 Issue 7, pp. 108-116.

[12] Arici T., Dikbas S., and Altunbasak Y. (2009), “A Histogram Modification

Framework and Its Application for Image Contrast Enhancement,” IEEE

Transactions on Image Processing, vol. 18, no. 9, pp.1921-1935.

[13] A. Beghdadi, A.L. Negrate (1989), “Contrast enhancement technique

based on local detection of edges”, Comput. Vision Graphics Image

Process. 46, pp.162–174.

[14] Bezdek, James C (2013), “Pattern recognition with fuzzy objective

function algorithms”, Springer Science & Business Media.

[15] A.O. Boudraa and E. H. S. Diop (2008), “Image contrast enhancement

based on 2D teager-kaiser operator”, Proc. of the IEEE International

Conference on Image Processing, pp. 3180-3183.

[16] Cheng H.D, Huijuan Xu (2000), “A novel fuzzy logic approach to

contrast enhancement”, Pattern Recognition 33, pp. 809-819.

[17] Cheng H.D., Mei Xue, Shi X, J. (2003), “Contrast enhancement based on

a novel homogeneity measurement”, Pattern Recognition 36, pp. 2687–

2697.

105

[18] L. Dash, B. N. Chatterji (1991), “Adaptive contrast enhancement and de-

enhancement”, Pattern Recognition 24, pp. 289–302.

[19] A. P. Dhnawan, G. Buelloni, R. Gordon (1986), Enhancement of

mammographic features by optimal adaptive neighborhood image

processing, IEEE Trans. Med. Imaging 5, pp. 8–15.

[20] Fachao L., Lianquin S., Shuxin L. (2004), “A general model of fuzziness

measure”, in: Proc. 2004 Int. Conf. on Machine Learning and

Cybernetic 3, pp. 1831–1835.

[21] R. C. Gonzalez and R. E. Woods, Digital Image Processing, Prentice

Hall, New Jersey, 2008.

[22] M. M. Gupta, J. Qi (1991), “Theory of t-norms and fuzzy inference

methods”, Fuzzy Sets and Systems 40, pp:431-450.

[23] Hanmandlu M., Devendra Jha, Rochak (2003), “Color image enhancement

by fuzzy intensification”, Pattern Recognition Letters 24, pp.81–87.

[24] Hanmandlu M., Devendra Jha (2006), “An Optimal Fuzzy System for

Color Image Enhancement”, IEEE Transactiong on Image Processiong,

Vol. 15, No.10, pp. 2956-2966.

[25] Hanmandlu M., Om Prakash Verma, Nukala Krishna Kumar and

Muralidhar Kulkami (2009), “A Novel Optimal Fuzzy System for Color

Image Enhancement Using Bacterial Foraging”, IEEE Transactions on

Instrumentation and Measurement, Vol. 58, No. 8, pp. 2867-2879.

[26] Hasanien A.E., Badr A. (2003), “A Comparative Study on Digital

Mamography Enhancement Algorithms Based on Fuzzy Theory”,

Studies in Informatics and Control, Vol.12, No.1, pp. 21-31.

[27] Hashemi, S., Kiani, S., Noroozi, N., & Moghaddam, M. E (2010), “An

image contrast enhancement method based on genetic algorithm”,

Pattern Recognition Letters, 31(13), pp. 1816–1824.

106

[28] Ho N. C., Wechler W. (1990), “Hedge algebra: An algebraic approach to

structures of sets of linguistic truth values”, Fuzzy Sets and Systems 35,

pp. 281–293.

[29] Ho N. C., Wechler W. (1992), “Extended algebra and their application to

fuzzy logic”, Fuzzy Sets and Systems 52, pp. 259–281.

[30] Ho N. C., Lan V. N. and Viet L. X. (2008), “Optimal hedge-algebras-

based controller: Design and application”, Fuzzy Sets and Systems,

vol.159, pp.968-989.

[31] Ho N. C., Khang T. D., Nam H. V., Chau N. H. (1999), “Hedge algebras,

linguistic–valued logic and their application to fuzzy reasoning”,

International Journal of Uncertainty, Fuzziness and Knowledge–Based

Systems, 7(4), pp. 347–361.

[32] Ho N. C., Nam H. V. (1999), “Ordered Structure-Based Semantics of

Linguistic Terms of Linguistic Variables and Approximate Reasoning”,

AIP Conf. Proc. on Computing Anticipatory Systems, CASYS’99, 3th

Inter. Conf., pp. 98–116.

[33] Ho N. C., Lan V. N. (2006), “Hedges Algebras: An algebraic approach

to domains of linguistic variables and their applicability”, ASEAN J. Sci.

Technol. Development, 23(1), pp. 1–18.

[34] Ho N. C. (2007), “A topological completion of refined hedge algebras

and a model of fuzziness of linguistic terms and hedges”, Fuzzy Sets and

Systems 158 (4), pp. 436–451.

[35] Ho N. C., Long N. V. (2007), “Fuzziness measure on complete hedge

algebras and quantifying semantics of terms in linear hedge algebras”,

Fuzzy Sets and Systems, 158(4), pp. 452–471.

[36] Huang K.Q., Wang Q., Wu Z.Y. (2006), “Natural color image

enhancement and evaluation algorithm based on human visual system”,

Comput. Vis. Image Underst, 103, pp. 52–63.

107

[37] Balasubramaniam Jayaram, Kakarla V.V.D.L. Narayana, V. Vetrivel,

“Fuzzy Inference System based Contrast Enhancement”, EUSFLAT-LFA

2011.011.

[38] John S., Hanmandlu M., Vasikarla S. (2005), “Fuzzy based arameterized

Guassian Edge Detector Using Global and Local Properties”,

International Conference on Information Technology, 02, pp. 101–106.

[39] Kim J-Y, Kim L-S, Hwang S.-H (2001), “An advanced contrast

enhancement using partially overlapped sub-block histogram equalization”,

IEEE Trans. Circuits Syst. Video Technol.11(4), pp:475–484.

[40] Kiszka J. B., Kochanska M. E., Sliwinska D. S. (1985), “The inference

of some fuzzy implication operators on the accuracy of a fuzzy model”,

Part I, Fuzzy Sets and Systems 15, pp. 111–128.

[41] Koczy L. T., Hirota K. (1993), “Interpolative reasoning with insufficient

evidence in sparse fuzzy rules bases”, Infor. Science 71, pp. 169–201.

[42] K. Singh, R. Kapoor (2014), "Image enhancement using exposure based

sub image histogram equalization", Pattern Recogn. Lett. 36, pp:10–14.

[43] K. Gu, G. Zhai, M. Liu, Q. Xu, X. Yang, and W. Zhang (2013),

"Brightness preserving video contrast enhancement using S-shaped

transfer function," in Proc. IEEE Vis. Commun. Image Process., pp. 1-6.

[44] K. Gu, G. Zhai, S. Wang, M. Liu, J. Zhou, and W. Lin (2015), "A general

histogram modification framework for efficient contrast enhancement," in

Proc. IEEE Int. Symp. Circuits and Syst., pp. 2816-2819.

[45] K. Gu, G. Zhai, W. Lin, and M. Liu (2016), "The analysis of image

contrast: From quality asessment to automatic enhancement," IEEE

Trans. Cybernetics, vol. 46, no. 1, pp. 284-297.

[46] Yu-Ren Lai, Kuo-Liang Chung, Chyou-Hwa Chen, Guei-Yin Lin, Chao-

Hsin Wang (2012), “Novel mean-shift based histogram equalization using

textured regions”, Expert Systems with Applications 39, pp:2750–2758.

108

[47] Yu-Ren Lai, Kuo-Liang Chung, Guei-Yin Lin, Chyou-Hwa Chen (2012),

“Gaussian mixture modeling of histograms for contrast enhancement”,

Expert Systems with Applications 39, pp:6720–6728.

[48] Yu-Ren Lai, Kuo-Liang Chung, Guei-Yin Lin, Chyou-Hwa ChenN

(2012), “Gaussian mixture modeling of histograms for contrast

enhancement”, Expert Systems with Applications 39, pp: 6720–6728.

[49] S. Lee (2007), “An efficient content-based image enhancement in the

compressed domain using Retinex theory”, IEEE Trans. Circuits and

Systems for Video Technology, vol. 17, no. 2, pp:199-213.

[50] Lior S.(2006), “Human Perception-based Color Segmentation Using

Fuzzy Logic”, IPCV, pp. 496-502.

[51] Manglesh K., Shweta S., Priya B. (2005), “An efficient algorithm for

Image Enhancement”, Indian Journal of Computer Science and

Engineering (IJCSE), pp. 118-123.

[52] Matinfar H.R., Sarmadian F., Alavi P. S.K., Heck R.J. (2007),

“Comparison of object-oriented and pixel-based classification on

Lansadsat7, Etm+ Spectral Bands (Case Study: Arid Region of Iran)”,

American-Eurasian J. Agric. & Environ, pp.448-456.

[53] Meshoul S., Batouche M. (2002), “Ant colony system with extremal

dynamics for point matching and pose estimation”, International

Conference on Pattern Recognition, pp. 823–826.

[54] Mizumoto M., Extended fuzzy reasoning (1985), “Approximately

reasoning in Expert systems”, Elsevier Science Publishers B. V, (North

Holland), pp. 71–85.

[55] Mizumoto M. (1985), “Fuzzy inference with “if…then…else…” under

new compositional rules of inference”, Management Decision Support

Systems Using Fuzzy Sets and Possibility Theory (ed. by J.Kacprzyk and

R.R.Yager), Verlag TUV Rheinland, W.Germany, pp. 229–239.

109

[56] M. Shakeri, M.H. Dezfoulian ∗, H. Khotanlou, A.H. Barati, Y. Masoumi

(2017), “Image contrast enhancement using fuzzy clustering with

adaptive cluster parameter and sub-histogram equalization”, Digital

Signal Processing 62, pp. 224-237

[57] Naik, S.K., Murthy, C.A. (2003), “Hue-preserving color image

enhancement without gamut problem”, IEEE Trans. Image Process.

12(12), pp.1591–1598.

[58] Nock, Richard (2004), "Statistical Region Merging" IEEE Transactions

on Pattern Analysis and Machine Intelligence, 26 (11), pp. 1–7.

[59] Om P. V., Puneet K., Hanmandlu M., Sidharth C. (2011), “High

dynamic range optimal fuzzy color image enhancement using Artificial

Ant Colony System”, Applied Soft Computing, pp. 394-404.

[60] Palanikumar S., Sasikumar M., J. Rajeesh (2012), “Entropy Optimized

Palmprint Enhancement Using Genetic Algorithm and Histogram

Equalization”, International Journal of Genetic Engineering, pp. 12-18.

[61] Ponomarenko N. Ponomarenko, L. Jin, O. Ieremeiev, V. Lukin, K.

Egiazarian, J. Astola, B. Vozel, K. Chehdi, M. Carli, F.Battisti, C.-C. Jay

Kuo (2015), “Image database TID2013: Peculiarities, results and

perspectives, Signal Processing”, Image Communication, vol. 30, pp.57-77

[62] Pei, S.C., Zeng, Y.C., Chang, C.H. (2004), “Virtual restoration of

ancient Chinese paintings using color contrast enhancement and Lacuna

texture synthesis”, IEEE Trans. Image Process. 13(3), pp. 416–429.

[63] Sarode M.K.V, Ladhake S.A., Deshmukh P.R. (2008), Fuzzy system for

color image enhancement, World Academy of Science, Engineering &

Technology, 48, pp. 311-316.

[64] M. J. Soha and A. A. Schwartz (1978), “Multi-dimensional histogram

normalization contrast enhancement,” in Proc. 5th Canada. Symp..

Remote Sensing, pp.86–93.

110

[65] Jaynes E.T. (1957), Information Theory and Statistical Mechanics,

Physical Review, pp. 620-630.

[66] Jean-Luc Starck, Fionn Murtagh, and David L. Donoho (2003), “Gray

and Color Image Contrast Enhancement by the Curvelet Transform”,

IEEE Transactions on Image Processing, Vol. 12, No. 6.

[67] Sheeba Jenifer, S.Parasuraman, Amudha Kadirvelu (2016), “Contrast

enhancement and brightness preserving of digital mammograms using

fuzzy clipped contrast-limited adaptive histogram equalization

algorithm”, Applied Soft Computing, Volume 42, pp.167-177

[68] Shen-Chuan Tai, Ting-Chou Tsai, Yi-Ying Chang, Wei-Ting Tsai and

Kuang-Hui Tang (2012), “Contrast Enhancement through Clustered

Histogram Equalization”, Research Journal of Applied Sciences,

Engineering and Technology 4(20), pp.3965-3968.

[69] Shi Y., Mizumoto M. (1997), “Reasoning conditions on Koczy’s

interpolative reasoning method in sparse fuzzy rules bases”, Part II,

Fuzzy Sets and Systems 87, pp. 47–56.

[70] Shi Y., Mizumoto M., Wu Z. Q. (1995), “Reasoning conditions on

Koczy’s interpolative reasoning methods in sparse fuzzy rules bases”,

Fuzzy Sets and Systems 75, pp. 63–71.

[71] Subba R. K., Raju C. N., and Maddala L. B. (2011), “Feature Extraction

for Image Classification and Analysis with Ant Colony Optimization

Using Fuzzy Logic Approach, Signal and image processing”, An

International Journal (SIPIJ), 2(4), pp.137-143.

[72] Sudhavani G., Srilakshmi M., Rao P. V. (2014), “Comparison of Fuzzy

Contrast Enhancement Techniques”, International Journal of Computer

Applications, Volume 95– No.22, pp.26-31.

[73] Tang B., Sapiro G., Caselles V. (2001), “Color image enhancement via

chromaticity diffusion”, IEEE Trans. Image Process., pp. 701–707.

111

[74] Tao C.W., Taur J.S., Jeng J.T., and Wang W.Y. (2009), “A Novel Fuzzy

Ant Colony System for Parameter Determination of Fuzzy Controllers”,

International Journal of Fuzzy Systems, 11(4), pp.298-307.

[75] Tizhoosh H. R., Fochem M., “Image Enhancement with Fuzzy

Histogram Hyperbolization”, Proceedings of EUFIT’95, vol. 3, 1995,

pp. 1695-1698.

[76] Wadud, M. A. A., Kabir, M. H., Dewan, M. A. A., & Chae, O. (2007),

“A dynamic histogram equalization for image contrast enhancement”,

IEEE Transactions on Consumer Electronics, 53(2), pp.593–600.

[77] Yager R. R. (1994), “Aggregation operators and fuzzy systems

modelling”, Fuzzy Sets and Systems 67, pp. 129–145.

[78] Yu D., Ma L. H., Lu H.Q. (2007), “Normalized SI correction for hue-

preserving color image enhancement”, International Conference on

Machine Learning and Cybernetics, pp. 1498–1503.

[79] Zadeh L. A. (1975), “The concept of linguistic variable and its

application to approximate reasoning”, Inform. Sci. 8, pp. 199–249.

[80] Zimmermann H.J. (1991), Fuzzy sets theory and its applications, 2nd

Ed., Kluwer Acad. Pub., USA.

112

PHỤ LỤC

A/ ĐẠI SỐ GIA TỬ

I. Chứng minh (AX, AY, Hint) là một HA-intensification

. 1 1

1 1

m

m

m

với ,m (0,1).

Thật vậy: Xét hàm

( ) 1 (1 ) 1 (1 )m m

g m m 1 1

1 1 0m mg

m

( ) (0 ) 0 0 1, 0 1g g m

Vậy 1 1

1 1

m

m

m

b. Nếu chọn sao cho 1 1

1 1

m

m

thì 1 1

1 1

m

< m

Khi đó x, < x 1, ta có

1 1

1 1

x m x

x m x

x, < x 1 và 1 1 1

1 1 1

m x x x

m x x x

x, 0 < x <

Thật vậy:

Ta chứng minh 1

1ln

1( )

1ln

1

m x

m xf x

x

x

là hàm giảm trên (0,1) khi 0 < m <1.

Do

2

1

21

1

m x

mm x

x m x

;

2

1

21

1

x

x

x x

2 2 21

2

2 2 2

2 1 11 ln 1 ln

1 11ln 1 1

1

f x m xm x m x

x x m xxm x x

x

Xét 2 2 2

2

1 1( ) 1 ln 1 ln

1 1

x m xf x m x m x

x m x

, 2

( 0 ) 0f

21 1

2 ln ln1 1

f x m xm x m

x x m x

Do 0 <mx < x <1, 1 1 1ln ln ln

1 1 1

x m x m xm

x m x m x

20

f

x

2

( ) 0f x x (0,1) 1( )f x giảm trên (0,1) (đpcm)

Từ đó suy ra điều phải chứng minh.

113

B. MỘT SỐ KỸ THUẬT LIÊN QUAN ĐẾN XỬ LÝ ẢNH

I. Mô hình mầu

Mô hình màu là một mô hình toán học dùng để mô tả các màu sắc trong thực

tế đƣợc biểu diễn dƣới dạng số học. Trên thực tế có rất nhiều mô hình màu khác

nhau đƣợc mô hình để sử dụng vào những mục đích khác nhau. Trong bài này tôi

giới thiệu về ba mô hình màu cơ bản hay đƣợc nhắc tới và ứng dụng nhiều, đó là hệ

mô hình màu RGB, HSV và CMYK.

1.1. Mô hình màu RGB

RGB là mô hình màu rất phổ biến đƣợc dùng trong đồ họa máy tính và nhiều

thiết bị kĩ thuật số khác. Ý tƣởng chính của mô hình màu này là sự kết hợp của 3

màu sắc cơ bản: màu đỏ (R, Red), xanh lục (G, Green) và xanh lơ (B, Blue) để mô

tả tất cả các màu sắc khác.

Nếu nhƣ một ảnh số đƣợc mã hóa bằng 24bit, nghĩa là 8 bit cho kênh R, 8 bit

cho kênh G, 8 bit cho kênh B, thì mỗ kênh này màu này sẽ nhận giá trị từ 0-255.

Với mỗi giá trị khác nhau của các kênh màu kết hợp với nhau ta sẽ đƣợc một màu

khác nhau, nhƣ vậy ta sẽ có tổng cộng 255x255x255 = 1.66 triệu màu sắc. Ví dụ:

màu đen là sự kết hợp của các kênh màu (R, G, B) với giá trị tƣơng ứng (0, 0, 0)

màu trắng có giá trị (255, 255, 255), màu vàng có giá trị (255, 255, 0), màu tím đậm

có giá trị (64, 0, 128) ...Nếu ta dùng 16bit để mã hóa một kênh màu (48bit cho toàn

bộ 3 kênh màu) thì dải màu sẽ trãi rộng lên tới 3*2^16 = ... Một con số rất lớn.

Mô hình màu RGB

http://2.bp.blogspot.com/-42XuPpZ_Ehw/TxOj99lDxFI/AAAAAAAAAEI/CrnOe_HGquw/s1600/colorSpace.jpg

114

1.2. Mô hình màu CMYK

CMYK là mô hình màu đƣợc sử dụng phổ biến trong ngành công nghiệp in ấn.

Ý tƣởng cơ bản của hệ mô hình này là dùng 4 màu sắc cơ bản để phục vụ cho việc

pha trộn mực in. Trên thực tế, ngƣời ta dùng 3 màu là C=Cyan: xanh lơ, M =

Magenta: hồng xẫm, và Y = Yellow: vàng để biểu diễn các màu sắc khác nhau. Nếu

lấy màu hồng xẫm cộng với vàng sẽ ra màu đỏ, màu xẫm kết hợp với xanh lơ sẽ cho

xanh lam ... Sự kết hợp của 3 màu trên sẽ cho ra màu đen, tuy nhiên màu đen ở đây

không phải là đen tuyệt đối và thƣờng có độ tƣơng phản lớn, nên trong ngành in, để

tiết kiệm mực in ngƣời ta thêm vào màu đen để in những chi tiết có màu đen thay vì

phải kết hợp 3 màu sắc trên. Và nhƣ vậy ta có hệ màu CMYK. Chữ K ở đây là để kí

hiệu màu đen (Black), có lẽ chữ B đã đƣợc dùng để biểu diễn màu Blue nên ngƣời

ta lấy chữ cái cuối K để biểu diễn màu đen?

Nguyên lý làm việc của hệ màu này nhƣ sau: Trên một nền giấy trắng, khi mỗi

màu này đƣợc in lên sẽ loại bỏ dần đi thành phần màu trắng. Ba màu C, M, Y khác

nhau in theo những tỉ lệ khác nhau sẽ loại bỏ đi thành phần đó một cách khác nhau

và cuối cùng cho ta màu sắc cần in. Khi cần in màu đen, thay vì phải in cả 3 màu

ngƣời ta dùng màu đen để in lên. Nguyên lý này khác với nguyên lý làm việc của hệ

RGB ở chỗ hệ RGB là sự kết hợp của các thành phần màu, còn hệ CMYK là sự loại

bỏ lẫn nhau của các thành phần màu.

Mô hình màu CYMK

http://2.bp.blogspot.com/-lpSRParkXBs/TxTcwK_TAgI/AAAAAAAAAEQ/Wha_vm2cxdo/s1600/colorSpace1.jpg

115

1.3. Mô hình màu HSV

HSV là mô hình màu đƣợc dùng nhiều trong việc chỉnh sửa ảnh, phân tích ảnh

và một phần của lĩnh vực thị giác máy tính. Hệ mô hình này dựa vào 3 thông số H =

Hue: màu sắc, S = Saturation: độ đậm đặc, sự bảo hòa, V = value: giá trị cƣờng độ

sáng để mô tả màu sắc.

Mô hình màu này thƣờng đƣợc biểu diễn dƣới dạng hình trụ hoặc hình nón.

Theo đó, đi theo vòng tròn từ 0 -360 độ là trƣờng biểu diễn màu sắc(Hue).

Trƣờng này bắt đầu từ màu đỏ đầu tiên (red primary) tới màu xanh lục đầu tiên

(green primary) nằm trong khoảng 0-120 độ, từ 120 - 240 độ là màu xanh lục tới

xanh lơ (green primary - blue primary). Từ 240 - 360 là từ màu đen tới lại màu đỏ.

Theo nhƣ cách biểu diễn mô hình màu theo hình trụ nhƣ trên, đi từ giá trị độ

sáng (V) đƣợc biểu diễn bằng cách đi từ dƣới đáy hình trụ lên và nằm trong khoảng

từ 0 -1. Ở đáy hình trụ V có giá trị là 0, là tối nhất và trên đỉnh hình trụ là độ sáng

lớn nhất (V = 1). Đi từ tâm hình trụ ra mặt trụ là giá trị bão hòa của màu sắc (S). S

có giá trị từ 0 - 1. 0 ứng với tâm hình trụ là chỗ mà màu sắc là nhạt nhất. S = 1 ở

ngoài mặt trụ, là nơi mà giá trị màu sắc là đậm đặc nhất.

Nhƣ vậy với mỗi giá trị (H, S, V) sẽ cho ta một màu sắc mà ở đó mô tả đầy đủ

thông tin về máu sắc, độ đậm đặc và độ sáng của màu đó.

1.4. Chuyển đổi từ RGB sang HSV

Hàm RGB_HSV_Conversion

H: Sắc độ màu [0-360] với màu đỏ tại điểm 0

http://3.bp.blogspot.com/-yAY6E2iz62w/TxTgpkwNcSI/AAAAAAAAAEY/cMoRmAUkv54/s1600/colorSpace3.jpg

http://3.bp.blogspot.com/-pteLKxkQhaI/TxTibv2sk2I/AAAAAAAAAEg/D0yvDldCYVQ/s1600/colorSpace4.jpg

http://3.bp.blogspot.com/-yAY6E2iz62w/TxTgpkwNcSI/AAAAAAAAAEY/cMoRmAUkv54/s1600/colorSpace3.jpg

http://3.bp.blogspot.com/-pteLKxkQhaI/TxTibv2sk2I/AAAAAAAAAEg/D0yvDldCYVQ/s1600/colorSpace4.jpg

116

S: Độ bão hòa [0-1]

V: Giá trị cƣờng độ sáng [0-1]

{

//Xác định giá trị cƣờng độ sáng

V= max(R,G,B)

//Xác định độ bão hòa

Temp= min(R,G,B)

If V=0 than

S= 0

Else

S= (V-Temp)/V

End

//Xác định sắc màu

IF s=0 THEN

H= Undefined

Else

Cr= (V-R)/(V-Temp);

Cg= (V-G)/(V-Temp);

Cb= (V-B)/(V-Temp);

// Màu nằm trong khoảng giữa vàng (Yellow) và đỏ tía (Magenta)

If R=V then

H= Cb-Cg

// Màu nằm trong khoảng giữa xanh tím (cyan) và vàng (yellow)

If G= V then

H= 2+Cr-Cb

// Màu nằm trong khoảng giữa đỏ tƣơi (magenta) và xanh (cyan)

If B=V then

H= 4+ Cg – Cr

H= 60*H // Chuyển sang độ

//Loại các giá trị âm

If H < 0 then

H= H+360

117

}

1.5. Chuyển đổi từ HSV sang RGB

Hàm HSV_RGB_Conversion()

H: Sắc độ màu [0-360] với màu đỏ tại điểm 0

S: Độ bão hòa [0-1]

V: Giá trị cƣờng độ sáng [0-1]

{

//Kiểm tra trƣờng hợp ánh sáng không màu

If S=0 then

If H=Undifined then

R= V

G= V

B= V

Endif

Else

If H=360 then

H= 0

Else

H= H/60

endif

I= Floor(H)

F= H-I

M= V*(1-S)

N= V*(1-S*F)

K= V*(1-S*(1-F))

//(R,G,B)=(V,K,M) R= V; C= K; B= M

If I=0 then

(R,G,B)=(V,K,M);

If I=1 then

(R,G,B)=(N,V,M);

If I=2 then

(R,G,B)=(M,V,K);

118

If I=3 then

(R,G,B)=(M,N,V);

If I=4 then

(R,G,B)=(K,M,V);

If I=5 then

(R,G,B)=(V,M,N);

} II. Phép căn bằng lƣợc đồ xám của ảnh một kênh

Phép cân bằng lƣợc đồ xám của một kênh ảnh là phép biến đổi mức xám để lƣợc đồ

xám đƣợc hiệu chỉnh cân đối bằng nhau.

m in m ax m in m ax( , ) [ , ] 1 ,1 ( , ) [ , ] 1 ,1I I i j L L i M j N Ieq Ieq i j L L i M j N

m in'

m in m a x m in

( ')

1, , 1, : ( , ) ( , )

g

Id e f

g L

H is g

i M j N g I i j Ie q i j L L LM N

, trong đó

( ) # { (i,j) ( , ) }I

H is g I i j g , [x] ký hiệu là phần nguyên của số thực x.

(a) Ảnh gốc.

Ảnh sau khi cân bằng

Lƣợc đồ xám kênh R

Lƣợc đồ xám kênh R

119

Lƣợc đồ xám kênh G

Lƣợc đồ xám kênh G

Lƣợc đồ xám kênh B

Lƣợc đồ xám kênh B.

Hình A.1. Cân bằng lƣợc đồ xám áp dụng cho từng kênh của ảnh mầu

III. Các phƣơng pháp phát hiện biên ảnh trực tiếp

1. Kỹ thuật phát hiện biên Gradient

Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ

thay đổi giá trị của điểm ảnh, ta có:

Trong đó, dx, dy là khoảng cách (tính bằng số điểm) theo hƣớng x và y.

* Nhận xét:

Vì ảnh số là tín hiệu rời rạc nên khi tính toán chúng ta xấp xỉ đạo hàm

bằng các kỹ thuật nhân chập, chẳng hạn khi lấy dx = dy = 1 chúng ta xấp xỉ

Với dx = dy = 1, ta có:

dy

yxfdyyxffy

y

yxf

dx

yxfydxxffx

x

yxf

),(),(),(

),(),(),(

120

yxfyxfy

f

yxfyxfx

f

,1,

,,1

Do đó, mặt nạ nhân chập theo hƣớng x là A= 11 và hƣớng y là

B =

1

1

2. Kỹ thuật Prewitt

Kỹ thuật sử dụng 2 mặt nạ nhập chập xấp xỉ đạo hàm theo 2 hƣớng x

và y là:

Hx = (

), Hy = (

)

3. Kỹ thuật Sobel

Tƣơng tự nhƣ kỹ thuật Prewitt kỹ thuật Sobel sử dụng 2 mặt nạ nhân

chập theo 2 hƣớng x, y là:

Hx = (

), Hy = (

)

B/ LÝ THUYẾT TẬP MỜ

I. Định ngĩa toán tử t-norm

Định nghĩa toán tử t-norm [22]. Giả sử hàm số T:[0, 1] x [0, 1] [0, 1], T là một

t-norm nếu và chỉ nếu:

Với mọi x, y, z [0, 1]:

(1.1) T(x, y) = T(y, x) (giao hoán),

(1.2) T(x, y) T(x, z), nếu y z (đơn điệu),

(1.3) T(x, T(y, z)) = T(T(x, y), z) (kết hợp),

(1.4) T(x, 1 ) = x .

t-norm T gọi là thỏa mãn điều kiện Archimed, nếu

(1.5) T(x, y) là liên tục,

(1.6) T(x, x) < x x (0, 1).

Một t-norm thỏa mãn điều kiện Archimed thì

121

(1.7) T(x', y') < T(x, y), thì x ' <x, y' <y, x', y', x, y (0, 1).

II. Thuật toán phân cụm FCM

Thuật toán phân cụm mờ đƣợc Bezdek [2] đề xuất dựa trên độ thuộc ukj của

phần tử dữ liệu Xk từ cụm j. Hàm mục tiêu đƣợc xác định nhƣ sau: 2

1 1

m in

N C

m

kj j

k j

kI VJ u

(12)

+ m là số mờ hóa + C là số cụm, N là số phần tử dữ liệu, r là số chiều của dữ liệu. + ukj là độ thuộc của phần tử dữ liệu Xk từ cụm j.

+ Xk ∈ Rr là phẩn tử thứ k của X X1, X2, ..., X N .

+ Vj là tâm của cụm j. Khi đó ràng buộc của (1) là:

1

1

C

k j

j

u

, [0 ,1]kj

u k 1, N (2)

Sử dụng phƣơng pháp Lagrange, xác định đƣợc tâm của cụm dựa vào (3) và

độ thuộc dựa vào (4) từ hàm mục tiêu (1):

1

1

C

m

k j k

k

C

m

k j

k

j

u X

u

V

(3)

1

1

1

1

C

i

k j

m

k j

k i

u

VX

VX

Khi đó thuật toán Fuzzy C-means nhƣ sau:

Input: Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C;

mờ hóa m; ngƣỡng ; số lần lặp lớn nhất Maxstep

Ountput Ma trận U và tâm cụm V.

Bƣớc

1 t = 0

2 ( ); ( 1, ; 1, )

t

k ju random k N j C thỏa mãn điều kiện (2)

3 Repeat

4 t = t + 1

5 Tính ( ); ( 1, )

t

jV j C bởi công thức (3)

6 Tính ( ); ( 1, ; 1, )

t

k ju k N j C theo công thức (4)

7 Until

( ) ( 1)t tU U

hoặc t > Maxstep

122

C/ TẬP DỮ LIỆU ẢNH

I. Tập dữ liệu

#I01: Kích thƣớc 512x384


#I03: Kích thƣớc 512x384, cũng ký hiệu là #3






123









124









125

#6: Kích thƣớc 512x384



hỌc viỆn khoa hỌc vÀ cÔng nghỆ -...

Documents