hỌc viỆn khoa hỌc vÀ cÔng nghỆ -...
TRANSCRIPT
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
NGUYỄN VĂN QUYỀN
NGHIÊN CỨU NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ
LUẬN ÁN TIẾN SĨ TOÁN HỌC
Hà Nội – 2018
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA VÀ CÔNG NGHỆ
NGUYỄN VĂN QUYỀN
NGHIÊN CỨU NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ
Chuyên ngành: Cơ sở Toán học cho Tin học
Mã số : 9 46 01 10
LUẬN ÁN TIẾN SĨ TOÁN HỌC
NGƢỜI HƢỚNG DẪN KHOA HỌC:
1. TS. TRẦN THÁI SƠN
2. PGS.TS. NGUYỄN TÂN ÂN
Hà Nội – 2018
i
LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả.
Các kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không
sao chép từ bất kỳ một nguồn nào và dƣới bất kỳ hình thức nào. Việc tham
khảo các nguồn tài liệu đã đƣợc thực hiện trích dẫn và ghi nguồn tài liệu tham
khảo đúng quy định.
Tác giả luận án
Nguyễn Văn Quyền
ii
LỜI CẢM ƠN
Luận án đƣợc hoàn thành dƣới sự hƣớng dẫn tận tình của TS. Trần Thái
Sơn và PGS.TS. Nguyễn Tân Ân. Lời đầu tiên, xin bày tỏ lòng kính trọng và
biết ơn sâu sắc tới hai Thầy.
Tôi xin chân thành cảm ơn PGS.TSKH. Nguyễn Cát Hồ, TS. Ngô
Hoàng Huy đã đóng góp những ý kiến quý báu cả về học thuật và kinh
nghiệm nghiên cứu giúp đỡ tôi trong suốt quá trình thực hiện luận án.
Tôi xin chân thành cảm ơn Ban lãnh đạo Học viện Khoa học và Công
nghệ, Bộ phận quản lý nghiên cứu sinh - Học viện Khoa học và Công nghệ đã
tạo mọi điều kiện thuận lợi trong quá trình hoàn thành và bảo vệ luận án.
Xin cảm ơn các đồng nghiệp tại Phòng Nhận dạng và Công nghệ tri
thức, Viện Công nghệ Thông tin đã đóng góp những ý kiến thiết thực để tôi
hiệu chỉnh lại các tiếp cận nghiên cứu của mình.
Xin cảm ơn Ban Giám hiệu Trƣờng Đại học Hải Phòng, các đồng
nghiệp tại Phòng Quản lý sau đại học – Trƣờng Đại học Hải Phòng đã luôn
động viên giúp đỡ tôi trong công tác để tôi có thời gian tập trung nghiên cứu
và thực hiện luận án.
Đặc biệt tôi xin bày tỏ lòng biết ơn sâu sắc tới Cha, Mẹ, Vợ và các anh,
chị em trong gia đình, những ngƣời luôn dành cho những tình cảm nồng ấm
và sẻ chia những lúc khó khăn trong cuộc sống, luôn động viên giúp đỡ tôi
trong quá trình nghiên cứu. Luận án cũng là món quà tinh thần mà tôi trân
trọng gửi tặng đến các thành viên trong Gia đình.
Tôi xin trân trọng cảm ơn!
iii
MỤC LỤC
LỜI CAM ĐOAN .............................................................................................. I
LỜI CẢM ƠN ................................................................................................... II
MỤC LỤC ....................................................................................................... III
DANH MỤC CÁC TỪ VIẾT TẮT VÀ KÝ HIỆU ........................................ VI
DANH MỤC CÁC BẢNG.............................................................................. IX
DANH MỤC HÌNH VẼ ................................................................................... X
MỞ ĐẦU ........................................................................................................... 1
1. Tính cấp thiết của đề tài ................................................................................ 1
2. Mục tiêu, phạm vi nghiên cứu của luận án ................................................. 10
3. Phƣơng pháp và nội dung nghiên cứu ......................................................... 10
4. Cấu trúc luận án .......................................................................................... 11
5. Kết quả đạt đƣợc của luận án ...................................................................... 12
CHƢƠNG 1. TỔNG QUAN VỀ NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH VÀ
TIẾP CẬN ĐẠI SỐ GIA TỬ GIẢI HỆ LUẬT MỜ ....................................... 13
1.1. Đại số gia tử: một số vấn đề cơ bản ......................................................... 13
1.1.1. Các khái niệm cơ bản về đại số gia tử .................................................. 13
1.1.2. Vấn đề định lƣợng ngữ nghĩa trong đại số gia tử ................................. 15
1.1.3. Phƣơng pháp lập luận xấp xỉ dựa trên ĐSGT ....................................... 23
1.2. Khả năng xấp xỉ hàm của phƣơng pháp HA-IRMd và ứng dụng ............ 24
1.2.1. Khả năng xấp xỉ hàm............................................................................. 24
1.2.2. Ứng dụng việc xấp xỉ hàm trong xây dựng luật .................................... 26
1.2.3. Phƣơng pháp lập luận tối ƣu dựa trên ĐSGT ....................................... 27
1.2.4. Hệ tham số của phƣơng pháp nội suy gia tử ......................................... 28
1.3. Tổng quan về nâng cao độ tƣơng phản ảnh ............................................. 30
1.3.1. Tăng cƣờng độ tƣơng phản ảnh dựa trên logic mờ ............................... 30
1.3.2. Một số thuật toán tăng cƣờng theo tiếp cận mờ .................................... 30
iv
1.4. Một số thuật toán nâng độ sáng tối của điểm ảnh .................................... 35
1.4.1. Toán tử tăng cƣờng ............................................................................... 35
1.4.2. Tăng cƣờng với toán tử Hyperbol ......................................................... 36
1.4.3. Tăng cƣờng dựa trên suy diễn hệ luật mờ (Fuzzy rule) ........................ 37
1.4.4. Một số độ đo chất lƣợng tăng cƣờng ảnh .............................................. 38
1.5. Thuật toán nâng cao độ tƣơng phản ảnh của Cheng ................................ 38
1.6. Các chỉ số đánh giá .................................................................................. 41
1.7. Tập dữ liệu thực nghiệm .......................................................................... 43
CHƢƠNG 2. BIẾN ĐỔI ẢNH ĐA KÊNH VÀ XÂY DỰNG HÀM BIẾN
ĐỔI CHỮ S THEO TIẾP CẬN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG
CAO ĐỘ TƢƠNG PHẢN ẢNH ĐA KÊNH .................................................. 44
2.1. Biến đổi ảnh đa kênh ................................................................................ 45
2.1.1. Ƣớc lƣợng nhiều dải động mức xám dựa vào phân cụm mờ FCM ...... 45
2.1.2. Lƣợc đồ xám mờ với phân cụm FCM ................................................... 46
2.1.3. Ƣớc lƣợng nhiều dải động mức xám dựa vào lƣợc đồ xám mờ ........... 48
2.1.4. Biến đổi kênh ảnh .................................................................................. 50
2.1.5. Nâng cao độ tƣơng phản ảnh kết hợp với biến đổi ảnh ........................ 51
2.1.6. Thử nghiệm phép biến đổi mờ hóa ảnh sử dụng thuật toán 2.2. ........... 53
2.2. Thiết kế hàm biến đổi độ xám dạng chữ S với tiếp cận mờ .................... 57
2.2.1. Đánh giá việc xây dựng hàm biến đổi mức xám dạng chữ S ............... 58
2.2.2. Xây dựng toán tử tăng cƣờng dựa trên đại số gia tử ............................. 61
2.2.3. Thực nghiệm ......................................................................................... 67
2.2.4. So sánh với kết quả của các phƣơng pháp gián tiếp ............................. 70
2.3. Kết quả khác ............................................................................................. 75
CHƢƠNG 3. XÂY DỰNG ĐỘ ĐO THUẦN NHẤT MỚI THEO TIẾP CẬN
ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH
ĐA KÊNH ....................................................................................................... 78
3.1. Xây dựng độ đo thuần nhất ...................................................................... 78
v
3.1.1. Độ thuần nhất của Cheng ...................................................................... 78
3.1.2. Độ đo thuần nhất với toán tử t-norm ..................................................... 80
3.1.3. Xây dựng độ đo thuần nhất với tiếp cận ĐSGT .................................... 82
3.2. Nâng cao độ tƣơng phản ảnh mầu với độ đo thuần nhất đề xuất ............. 89
3.3. Thực nghiệm ............................................................................................ 93
3.3.1. Tính độ thuần nhất kênh ảnh ................................................................. 93
3.3.2. Đánh giá độ đo HA-HRM ..................................................................... 94
3.4. Các kết quả và luận giải ........................................................................... 94
KẾT LUẬN ................................................................................................... 101
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ .............................................. 102
TÀI LIỆU THAM KHẢO ............................................................................. 103
PHỤ LỤC ...................................................................................................... 112
vi
DANH MỤC CÁC TỪ VIẾT TẮT VÀ KÝ HIỆU
Từ viết tắt Tên đầy đủ (và tạm dịch)
ĐLNN Định lƣợng ngữ nghĩa
ĐSGT ĐSGT
ĐTP Độ tƣơng phản
NCĐTP Nâng cao độ tƣơng phản
LLXX Lập luận xấp xỉ
ACO Ant Colony Optimization
Tối ƣu đàn kiến
AS hoặc
ACS
Ant Colony System
(Hệ kiến)
AIVHE Adaptively Increasing the Value of lƣợc đồ xám
(Tăng giá trị lƣợc đồ xám thích ứng)
FAM Fuzzy Associative Memory
(Bộ nhớ kết hợp mờ)
FCM Fuzzy C-mean
(Thuật toán phân cụm mờ C-mean)
FMCR Fuzzy multiple conditional reasoning
(Hệ mờ đa điều kiện)
HA Hedge algebra
(Đại số gia tử)
HA-IRMd Hedge Algebras-based Interpolative Reasoning Method
(Phƣơng pháp lập luận nội suy dựa trên đại số gia tử)
HA-HRM Hedge Algebras – Homogeneity Measure
HE Histogram equalization
(Cân bằng lƣợc đồ xám)
HIS Hệ biểu diễn mầu HIS
HSV Hệ biểu diễn mầu HSV (Hue, Saturation, Value)
NINT New Intensifycation
RGB Hệ biểu diễn mầu RGB (Red, Green, Blue)
SAM Semantic Associative Memory
(Bộ nhớ kết hợp ngữ nghĩa)
SQMs Ánh xạ định lƣợng ngữ nghĩa
YIQ Hệ biểu diễn mầu YIQ
vii
Ký hiệu
Ký hiệu Tên đầy đủ
I Ảnh đa kênh nói chung
M, N MxN là kích thƣớc theo pixel của ảnh đầu vào.
1, KI K kênh ảnh {I1,I2,…,IK} của ảnh I
IR,IG,IB Kênh ảnh R, G và B của ảnh mầu trong biểu diễn mầu RGB
IS,IH,IV Kênh ảnh H, S và V của ảnh mầu trong biểu diễn mầu HSV
Lk,min, Lk,max Miền giá trị mức xám của kênh ảnh thứ k của ảnh đầu vào
Lk,min
Giá trị mức xám nhỏ nhất theo kênh Ik của ảnh I, thông thƣờng
Lk,min = 0
Lk,max
Giá trị mức xám lớn nhất theo kênh Ik của ảnh I, thông thƣờng
Lk,max = 255
H isk
I Lƣợc đồ xám của một kênh ảnh Ik H is (g )= # { ( i ,j ) :I ( i ,j )= g }
kI k
D dxd là kích thƣớc cửa sổ lân cận có tâm là điểm ảnh (i, j).
f1,f2 f1, f2 (0, 1): Tham số xác định dải động mức xám
K Số kênh ảnh cần xử lý của ảnh đầu vào
fcut fcut (0, 1): Tham số xác định C dải động mức xám của một
kênh ảnh
ij Giá trị trung bình mức xám tại điểm ảnh (i, j)
Giá trị mức xám không thuần nhất tại điểm ảnh (i, j)
Độ xám tại điểm ảnh (i, j)
Độ tƣơng phản tại điểm ảnh (i, j)
eij Giá trị cƣờng độ biên tại điểm ảnh (i, j)
vij Độ lệch chuẩn mức xám lấy tại lân cận điểm ảnh gij
R4,ij Moment bậc 4 tại điểm ảnh (i, j)
Hij Giá trị entropy đại điểm ảnh (i, j)
viii
i j Đo độ thuần nhất tại điểm ảnh (i, j)
i jH O Giá trị kết nhập dạng f(Eij, Hij, Vij, R4,ij) tại điểm ảnh (i, j)
i j Số mũ khuếch đại tại điểm ảnh (i, j)
CM Chỉ số độ tƣơng phản ảnh trực tiếp
AX ĐSGT tuyến tính
AX ĐSGT tuyến tính đầy đủ
(h), fm(x) Độ đo tính mờ gia tử h và của hạng từ x
Giá trị định lƣợng theo điểm của giá trị ngôn ngữ
Khoảng tính mờ của giá trị ngôn ngữ
T t(0, 1): Tham số của phép nâng độ khuếch đại
K Số kênh ảnh cần xử lý của ảnh đầu vào
C Số cụm cần phân cụm của tổ hợp kênh ảnh đầu vào.
i,j,c Giá trị độ thuộc cụm thứ c của điểm ảnh (i, j), đầu ra của thủ
tục phân cụm FCM
fcut fcut (0, 1): Tham số xác định C dải động mức xám của một
kênh ảnh
ix
DANH MỤC CÁC BẢNG
Số hiệu
bảng
Tên bảng Trang
2.1 So sánh giá trị Havg trên kênh R, G và B của các ảnh là kết
quả của phép mờ hóa – biến đổi ảnh
54
2.2 Bảng kết quả so sánh các chỉ số khách quan giữa thuật
toán trong [17] và thuật toán đề xuất
67
2.3 So sánh kết quả phép nâng cao ĐTP ảnh mở rộng của Hint
(%) và của Cheng áp dụng cho ảnh mầu RGB và HSV
69
2.4 Giá trị chỉ số Eavg và Havg của ảnh đầu ra khi áp dụng Hint
và bốn phƣơng pháp gián tiếp của 27 ảnh trong biểu diễn
mầu HSV, trong đó các giá trị tốt nhất đƣợc in đậm
70
3.1. Các phép kết nhập giá trị địa phƣơng khác nhau 82
3.2 Mối quan hệ dấu của các gia tử 84
3.3 Bảng giá trị độ đo tính mờ và SQM tƣơng ứng với AG,
AE, AT
84
3.4 Bảng giá trị tính toán minh họa độ đo tính mờ và SQM
tƣơng ứng với AG, AE, AT
86
3.5 Bảng giá trị các mốc nội suy dựa trên toán tử AND của hệ
luật (3.5)
87
3.6 Các tham số cơ sở của ĐSGT Agr, Aep và Aho 93
3.7 Giá trị chỉ số CMR cho từng ảnh và các phƣơng pháp kết
nhập để tạo giá trị thuần nhất
95
3.8 Giá trị chỉ số CMG cho từng ảnh và các phƣơng pháp kết
nhập để tạo giá trị thuần nhất
95
3.9 Giá trị chỉ số CMB cho từng ảnh và các phƣơng pháp kết
nhập để tạo giá trị thuần nhất
96
3.10 Giá trị chỉ số Eavg cho từng ảnh và các phƣơng pháp kết
nhập để tạo giá trị thuần nhất
96
3.11 Giá trị chỉ số Havg cho từng ảnh và các phƣơng pháp kết
nhập để tạo giá trị thuần nhất
97
x
DANH MỤC HÌNH VẼ
Số hiệu
hình vẽ
Tên hình vẽ Trang
1 Dạng hàm biến mức xám chữ S trong các phép nâng cao
ĐTP
4
2 Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử
dụng toán tử tăng cƣờng mờ [72]
5
1.1 Độ đo tính mờ của biến TRUTH 17
1.2 Khoảng tính mờ của các hạng từ của biến TRUTH 20
1.3 Đồ thị toán tử INT 32
1.4 (a) Ảnh gốc, (b), (d) biểu diễn mờ với toán tử INT của kênh
R,G và B tƣơng ứng
32
1.5 Phân cụm FCM với C = 5 cụm, (a) ảnh gốc, (b)-(g) ảnh ma trận
độ thuộc cụm số 1 {µi,j,1} -5 {µi,j,5}
35
1.6 Nguyên tắc chính của tăng cƣờng ảnh mờ [29]. 35
1.7 Một số thử nghiệm nâng cao ĐTP sử dụng toán tử tăng
cƣờng
36
1.8 Ảnh kết quả sử dụng suy diễn luật if-then [31] cho ảnh ở
hình 1.4.a
37
2.1 Ảnh gốc #3(a) lƣợc đồ xám kênh R (b), giá trị độ thuộc
{i,j,4}-cụm số 4/5 (c). Lƣợc đồ xám mờ kênh R, cụm số
4/5 (d)
48
2.2 Lƣợc đồ xám của kênh V, cụm số 1 ảnh #4 (C = 5), trục
hoành biểu diễn giá trị xám, trục tung biểu thị tần suất
49
2.3 Lƣu đồ xử lý của thuật toán đề xuất 53
2.4 Ảnh mờ hóa của #1 sử dụng [16] (a), sử dụng thuật toán 2.2
(b)
54
xi
2.5 Kênh B của ảnh biến đổi sử dụng [16] (a), sử dụng thuật
toán (b).
55
2.6 Sử dụng biến đổi ảnh [16] cho ảnh #3(a), #5 (b 55
2.7 Phép mờ hóa, cột bên trái [16], cột bên phải sử dụng thuật
toán 2.2
56
2.8 Dạng hàm biến mức xám chữ S trong các phép NCĐTP 57
2.9 Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử
dụng toán tử tăng cƣờng mờ [68]
58
2.10 Hàm thuộc của 3 tập mờ dark, bright, gray (a) và của tập
mờ darker, brighter (b).
59
2.11 Nâng cao ĐTP với suy diễn luật mờ if-then (a), luật mờ
nâng cao ĐTP (b)
59
2.12 (a) Hàm thuộc của tập mờ dark, bright, gray và (b) hàm
thuộc của tập mờ darker, brighter.
60
2.13 Các hàm thuộc đƣợc thiết kế đã tạo ra hàm biến đổi hình
chữ S.
60
2.14 Phép NCĐTP sử dụng HA-IRMd cho hệ luật {R1 -R5} 64
2.15 Trƣờng hợp = 0.6; x = 0.6 > m = 0.4. 65
2.16 Trƣờng hợp = 0.6; x = 0.5 < m = 0.8. 65
2.17 So sánh đồ thị của hàm biến đổi Cheng và Hint giữa mức
xám đầu vào-đầu ra đã chuẩn hóa về đoạn [0, 1], độ sáng
xung quanh = 0.6, βX = 0.6, = 0.5, t = 0.5
65
2.18 Kết quả của [17] cho ảnh #2 68
2.19 Kết quả của Hint sử dụng FCM 5 cụm 68
2.20 Kết quả sử dụng Curvelet [66] 68
2.21 Kết quả sử dụng Hint với FCM 5 cụm 68
2.22 Ảnh đầu ra của ảnh gốc I02 trong tập dữ liệu ảnh TID2013
là kết quả của các toán tử đƣợc quan sát bằng mắt ngƣời
72
xii
2.23 Ảnh đầu ra của ảnh gốc I10 trong tập dữ liệu ảnh TID2013
là kết quả của các toán tử đƣợc quan sát bằng mắt ngƣời
73
2.24 Ảnh đầu ra của ảnh gốc I24 trong tập dữ liệu ảnh TID2013
là kết quả của các toán tử đƣợc quan sát bằng mắt ngƣời
73
2.25 Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc
Định sử dụng các thuật toán gián tiếp và Hint
74
2.26 Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc
Định sử dụng các thuật toán gián tiếp và Hint
75
2.27 Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc
Định sử dụng các thuật toán gián tiếp và Hint
75
3.1 Độ thuần nhất tính theo công thức gốc (3.1) (a) [9] Ảnh
nâng cao độ tƣơng phản kênh R,G và B sử dụng công thức
(3.1) (b)
79
3.2 {Hij}(a) {Vij} (b) 3 kênh R, G và B với ảnh #5 79
3.3 Độ thuần nhất tính theo công thức (3.2) (a) Ảnh nâng cao
sử dụng công thức (3.2)(b)
80
3.4 Các giá trị nhất của kênh V của ảnh #5 sử dụng [10] (a), giá
trị thuần nhất sử dụng ĐSGT (b)
89
3.5 Lƣu đồ xử lý của thuật toán đề xuất 93
3.6 Thử nghiệm cho ảnh #1 - #6. Ảnh kết quả (cột bên trái ) khi
sử dụng [17], (cột bên phải) sử dụng thuật toán 3.2 với HO7
đề xuất
99
3.7 Ảnh kết quả sử dụng thuật toán 2 với phép kết nhập gốc
[17] ij 4 ,
* * *ij ij ij ij
H O E V H R cho ảnh #1 và ảnh kết quả
không trơn
99
1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Nâng cao độ tƣơng phản (ĐTP) ảnh là một vấn đề quan trọng trong xử
lý và phân tích hình ảnh, là một bƣớc cơ bản trong phân tích, phân đoạn ảnh.
Mục đích của việc nâng cao ĐTP ảnh là làm nổi rõ chi tiết của ảnh và tăng độ
sáng của ảnh.
Các kỹ thuật thông dụng để nâng cao ĐTP ảnh đƣợc phân thành hai
tiếp cận chính: (1) Các phƣơng pháp gián tiếp và (2) các phƣơng pháp trực
tiếp [12, 19, 20].
a) Đối với các phƣơng pháp gián tiếp
Phƣơng pháp tăng cƣờng ĐTP gián tiếp chỉ biến đổi lƣợc đồ xám mà
không sử dụng bất kỳ một độ đo tƣơng phản nào. Biến đổi lƣợc đồ xám của
ảnh là phƣơng pháp làm cho lƣợc đồ xám của ảnh kết quả đều hơn, khi đó
ĐTP của ảnh đầu ra đƣợc nâng cao, độ sáng của ảnh đƣợc nâng nên. Trong
phƣơng pháp này những điểm ảnh đầu vào có cùng giá trị mức xám thì ở ảnh
kết quả, giá trị mức xám của những điểm ảnh này cũng bằng nhau, vì thế có
thể làm mất chi tiết ảnh so với ảnh đầu vào.
Có nhiều kỹ thuật đã đề xuất đƣợc tìm thấy trong tài liệu tham khảo [9,
10, 12, 15, 23, 26, 39, 51, 57, 61, 63, 68, 72].
Trong vài năm gần đây, nhiều nhà nghiên cứu đã áp dụng lý thuyết tập
mờ để phát triển các kĩ thuật mới nhằm nâng cao ĐTP của ảnh:
Tăng cƣờng ảnh mờ dựa trên việc ánh xạ mức xám vào miền mờ, sử
dụng hàm biến đổi thành viên [26]. Mục tiêu là sinh một ảnh có ĐTP cao hơn
ảnh gốc bằng việc gán các giá trị mức xám bằng một giá trị mới lớn hơn, gần
hơn với mức xám trung bình của ảnh [26].
2
Manglesh đã đề xuất thuật toán mới sử dụng logic mờ để tăng cƣờng
ảnh màu với chất lƣợng bị suy giảm bởi nhiễu Gaussian. Đầu tiên luật logic
mờ đƣợc sinh, sau đó giá trị RGB của ảnh đƣợc đƣa vào tiếp cận logic mờ.
Ảnh mờ đầu ra sẽ phân biệt giữa các màu mơ hồ [51] Sarode đã giới thiệu
thuật toán NCĐTP ở đó kênh sắc độ mầu đƣợc bảo tồn, chỉ thay đổi các kênh
cƣờng độ mầu sắc và kênh độ bão hoà, sau đó luật logic mờ đƣợc áp dụng.
Dựa trên điều này những quyết định liên quan đến việc phân lớp màu sẽ đƣợc
thực hiện. Ảnh đầu ra sẽ chỉ bao gồm những vùng ảnh rõ, những điểm ảnh
nhiễu bị loại bỏ [63]. Các nghiên cứu này đã đề xuất một phƣơng pháp tăng
cƣờng ĐTP mờ trực tiếp thích ứng mới dựa trên hàm thành viên Sigma để ánh
xạ ảnh từ miền không gian vào miền mờ. Khi chuyển ảnh từ một không gian
màu (RGB) vào không gian màu khác (HSV, HIS, YIQ) sắc độ không bị thay
đổi, chỉ những thành phần cƣờng độ màu và độ bão hoà bị thay đổi. Tuy
nhiên, ảnh sau tăng cƣờng có thể không còn giữ đƣợc chi tiết ảnh. Để khắc
phục vấn đề này, trong [63], Naik đã đƣa ra phƣơng pháp giữ các giá trị mức
xám đƣợc biến đổi trong phạm vi của miền mức xám.
Trong [72], hai kĩ thuật tăng cƣờng ĐTP là tăng cƣờng dựa trên luật mờ
và tăng cƣờng sử dụng toán tử tăng cƣờng áp dụng với ảnh xám ĐTP thấp
đƣợc đề xuất. Kĩ thuật đầu tiên sử dụng hàm ứng với hệ mờ luật if-then, kĩ
thuật thứ hai sử dụng toán tử tăng cƣờng ĐTP mờ để biến đổi mức xám trong
miền mờ. Kết quả thực nghiệm cho thấy, lƣợc đồ xám của ảnh gốc và các ảnh
tăng cƣờng có các đặc trƣng cơ bản giống nhau, điều này không làm đƣợc
trong cân bằng lƣợc đồ xám [72]. Ngoài ra, tăng cƣờng ĐTP sử dụng kĩ thuật
toán tử tăng cƣờng có các giá trị chỉ số đánh giá khách quan mờ thấp hơn so
với kĩ thuật tăng cƣờng ĐTP sử dụng luật mờ. Tuy nhiên, về thời gian xử lý,
kĩ thuật tăng cƣờng ĐTP dựa trên luật mờ yêu cầu thời gian ít hơn kĩ thuật
tăng cƣờng sử dụng toán tử tăng cƣờng.
3
Phƣơng pháp tăng cƣờng mờ đƣợc đề xuất bởi Hanmandlu trong đó
một toán tử tăng cƣờng ĐTP đƣợc giới thiệu. Bằng việc bảo tồn kênh H, chỉ
thay đổi kênh S, kênh V và cực tiểu entropy mờ, chất lƣợng của ảnh đƣợc cải
thiện về mặt trực quan [23]. Hanmandlu cũng đã giới thiệu một hàm thành
viên Gaussian để mờ hoá ảnh màu, cùng với việc tối ƣu entropy mờ của ảnh
thì các tham số đƣợc tối ƣu, ĐTP và độ sáng các ảnh tối đầu vào đã đƣợc cải
thiện [24].
John See đã đề xuất bộ dò tìm cạnh Gaussian dựa trên tập mờ sử dụng
cả thuộc tính toàn cục và cục bộ [38]. Trong giai đoạn tăng cƣờng ĐTP toàn
cục, hàm thành viên Gaussian đƣợc sử dụng. Một hàm tăng cƣờng ĐTP phi
tuyến bao gồm ba tham số đƣợc sử dụng để tăng cƣờng ảnh. Trong giai đoạn
tăng cƣờng ĐTP cục bộ, mặt nạ dò tìm cạnh kiểu Gaussian chứa hai tham số
mờ đƣợc tối ƣu bằng việc sử dụng hàm entropy ảnh mờ. Thuật toán này đã
thể hiện một cải tiến trực quan tƣơng đối hiệu quả.
Palanikumar đã giới thiệu một thuật toán mới dựa trên cân bằng lƣợc
đồ xám (HE) và HE tăng giá trị thích ứng (AIVHE) [60]. Bằng việc sử dụng
phƣơng pháp AIVHE, phép tăng cƣờng ĐTP đƣợc điều khiển bởi hai tham số
beta và gamma, nhƣng xuất hiện vấn đề là thông tin chi tiết ảnh không phải
lúc nào cũng đƣợc bảo tồn. Để khắc phục vấn đề này thuật toán di truyền
đƣợc dùng để tối ƣu giá trị beta và gamma thông qua việc tối ƣu giá trị
entropy [27].
Một ảnh có thể đƣợc nhóm thành các vùng tối, vùng hỗn tạp và vùng
sáng [59]. Ảnh RGB đƣợc chuyển đổi thành ảnh HSV. Sắc độ ảnh đƣợc bảo
tồn còn thành phần độ sáng của ảnh bị thay đổi. Việc mờ hoá đƣợc thực hiện
trên các vùng tối và vùng sáng bằng việc sử dụng hàm thành viên Gaussian
dựa trên điểm giao và tham số tăng cƣờng. Giá trị tối ƣu của các tham số này
đạt đƣợc bởi kĩ thuật lặp tối ƣu hệ kiến [59].
4
Trong [11], Aman Tusia và cộng sự đã thực hiện một phân tích hiệu
năng của hệ thống mờ loại 2 cho việc tăng cƣờng ảnh. Trƣớc khi xử lý, ảnh
đầu vào đƣợc chuyển từ không gian màu RGB về không gian HSV để bảo tồn
thông tin màu sắc. Hai ngƣỡng dƣới và trên đƣợc định nghĩa để cung cấp ƣớc
lƣợng của các vùng tối và vùng sáng trong ảnh. Ảnh đƣợc mờ hoá (loại 2) sử
dụng hàm thành viên Gausian.
Những tiếp cận sử dụng logic mờ để nâng cao ĐTP ảnh nói chung đều
dẫn đến tạo ra một hàm biến đổi mức xám dạng chữ S (Hàm liên tục đơn điệu
tăng, giảm giá trị đầu vào khi đầu vào dƣới ngƣỡng, và ngƣợc lại tăng giá trị
đầu vào khi đầu vào ở trên ngƣỡng).
(a) Toán tử NINT [23]
(b) Dạng đồ thị của hàm
biến đổi mức xám sinh bởi
hệ luật mờ if-then [72]
(c)Dạng đồ thị biến đổi
mức xám của [17]
(d) Ảnh kết quả sử dụng suy diễn luật if-then [72] cho ảnh #5 (Phụ lục C)
Hình 1. Dạng hàm biến mức xám chữ S trong các phép nâng cao ĐTP.
5
(a) Ảnh gốc
(b) Ảnh kết quả sinh bởi
toán tử tăng cƣờng mờ [72] (c) Dạng hàm biến đổi
(d) Ảnh gốc
(e) Kết quả sinh bởi toán tử
tăng cƣờng mờ [72]
(g) Dạng hàm biến đổi
Hình 2. Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử dụng toán
tử tăng cƣờng mờ [72]
b) Về phƣơng pháp nâng cao ĐTP trực tiếp
Nâng cao ĐTP ảnh theo phƣơng pháp trực tiếp là xây dựng một phƣơng
pháp biến đổi ĐTP tại một điểm ảnh dựa trên định nghĩa độ đo tƣơng phản
giữa độ sáng điểm ảnh và lân cận xung quanh nó. Bài toán đƣợc phát biểu
nhƣ sau:
Nâng cao ĐTP theo phƣơng pháp trực tiếp là quy trình thực hiện một
dãy biến đổi: ' ' '
, , ,, , 0 1
f b f b f bf b C C f C C , cụ thể:
Bƣớc 1: Tính ĐTP tại từng điểm ảnh:
,f b
C C f bf b
Bƣớc 2: Nâng ĐTP: '
,1C C C E C C
Bƣớc 3: Xác định f sao cho ' ',C f b C và:
- Nếu 0 f b thì '0 f f (do 'C C )
- Nếu b f thì 'f f (do 'C C )
6
Nhƣ vậy, quy trình biến đổi 'f f tăng cƣờng tại ngƣỡng b.
Trong một thời gian dài cho đến nay, có rất ít các nghiên cứu theo
phƣơng pháp trực tiếp trong đó biến đổi độ tƣơng phản ảnh dựa trên một độ
đo tƣơng phản xác định tại mỗi điểm ảnh, chẳng hạn các nghiên cứu [16, 17,
18, 19]. Hầu nhƣ chỉ có các nghiên cứu của Cheng và cộng sự là theo hƣớng
tiếp cận này [16, 17].
Các thuật toán của Cheng là cơ sở của phép nâng cao ĐTP ảnh đa cấp
xám. Tuy vậy các thuật toán này vẫn còn tồn tại một số hạn chế sau khi áp
dụng cho ảnh mầu, ảnh đa kênh:
(i) Ảnh nâng cao ĐTP có thể không thay đổi mức độ sáng của mầu so
với ảnh gốc.
(ii) Sử dụng các ảnh đã đƣợc biến đổi theo phƣơng pháp biến đổi ảnh
của Cheng để nâng cao ĐTP ảnh có thể làm mất chi tiết của ảnh gốc.
Về độ đo thuần nhất cho điểm ảnh, Cheng đề xuất cách ƣớc lƣợng giá
trị thuần nhất của điểm ảnh đƣợc kết nhập từ các giá trị địa phƣơng Eij, Hij,
Vij, R4,ij. Khi thử nghiệm với ảnh mầu, tác giả nhận thấy với phép kết nhập này
ảnh kết quả có thể không trơn.
Thực tế giá trị độ thuần nhất của điểm ảnh là một giá trị mờ và chúng ta
có thể áp dụng lập luận mờ để thu nhận giá trị này.
Nếu các đặc trƣng địa phƣơng đƣợc i j i j,E H chuyển cho một tiếp cận
tính toán với từ thì công thức kết nhập dạng i j i j,eh
T E H cần phản ánh luật mờ
nhƣ sau:
Nếu g r a d ie n t là cao và e n tr o p y là cao thì độ thuần nhất là cao
Nếu g r a d ie n t là thấp và e n tr o p y là thấp thì độ thuần nhất là thấp
Ở đây ký hiệu g r a d ie n t là phần bù của gradient và e n tr o p y là phần bù
của entropy tƣơng ứng.
7
Nếu chúng ta bổ sung thêm các luật với từ các gia tử nhƣ “rất”, “ít”,
“vừa” v.v .. với các biến ngôn ngữ nhƣ “homogeneity”, “entropy”, “gradient”
v.v... thì các giá trị thuần nhất có thể đƣợc ƣớc lƣợng bằng suy diễn của con
ngƣời và vì thế sẽ mịn hơn.
Do lý thuyết tập mờ ít quan tâm đến cơ sở hình thức giữa quan hệ của
các biến ngôn ngữ và các tập mờ, cũng nhƣ quan hệ thứ tự giữa các từ nên
cần xem xét sử dụng một phƣơng pháp lập luận luôn đảm bảo thứ tự hoặc yêu
cầu cao hơn là tạo ra một hàm biến đổi mức xám dạng chữ S dựa trên hệ luật
ngôn ngữ.
Hơn nữa, bản thân lý thuyết tập mờ rất khó để mô phỏng hoàn chỉnh
cấu trúc ngôn ngữ mà con ngƣời vẫn sử dụng để suy luận, cho dù cách tiếp
cận này đã đƣợc ứng dụng thành công trên rất nhiều lĩnh vực của cuộc sống.
Vì cấu trúc thứ tự cảm sinh trên các khái niệm mờ biểu thị bằng các giá trị
ngôn ngữ không đƣợc thể hiện trên các tập mờ. Chẳng hạn, về mặt ngữ nghĩa
chúng ta luôn cảm nhận đƣợc “yếu” nhỏ hơn “khỏe”, “cao” lớn hơn “thấp”
nhƣng hàm thuộc của chúng lại không so sánh đƣợc với nhau. Mặt khác, tập
các khái niệm mờ không đóng đối với một số các phép toán trên các tập mờ
[80]. Vì vậy trong quá trình lập luận nhiều khi ngƣời ta cần phải xấp xỉ ngôn
ngữ, tức là phải tìm một giá trị ngôn ngữ mà ý nghĩa của nó xấp xỉ với một
tập mờ cho trƣớc, điều này làm tăng độ phức tạp của thuật toán và sai số cho
quá trình tính toán. Hơn nữa, chúng ta biết rằng một hệ suy diễn xây dựng
trên một ngôn ngữ hình thức đều xác định trên tập các lớp công thức tƣơng
đƣơng một cấu trúc đại số thuộc lớp các đại số trừu tƣợng [6], trong khi lôgíc
mờ giá trị ngôn ngữ (hay lôgíc mờ theo nghĩa Zadeh) còn thiếu một cơ sở đại
số làm nền tảng.
Vì vậy, nhằm khắc khắc phục phần nào những nhƣợc điểm trên, năm
1990, N.C. Ho & W. Wechler trong [29] đã khởi xƣớng phƣơng pháp tiếp cận
đại số đến cấu trúc tự nhiên của miền giá trị của các biến ngôn ngữ. Theo
8
cách tiếp cận này, mỗi giá trị ngôn ngữ của một biến ngôn ngữ nằm trong một
cấu trúc đại số gọi là đại số gia tử (ĐSGT). Dựa trên những tính chất ngữ
nghĩa của ngôn ngữ đƣợc phát hiện, bằng phƣơng pháp tiên đề hóa nhiều tác
giả đã tập trung phát triển lý thuyết ĐSGT với các kết quả nhƣ ĐSGT mở
rộng [29], ĐSGT mịn hóa [32], ĐSGT mở rộng đầy đủ [1], ĐSGT PN-không
thuần nhất [6]. Trong đó, tiêu biểu là ĐSGT mịn hóa cùng với việc trang bị
khái niệm độ đo tính mờ của các giá trị ngôn ngữ và phƣơng pháp định lƣợng
ngữ nghĩa [35]. Trên cơ sở đó, các phƣơng pháp lập luận xấp xỉ dựa trên
ĐSGT và ứng dụng trong một số lĩnh vực đƣợc các tác giả phát triển, có thể
kể đến nhƣ phƣơng pháp lập luận sử dụng mạng nơron trong điều khiển mờ
[4], ứng dụng trong cơ sở dữ liệu mờ [3], lập luận bằng nội suy gia tử có tối
ƣu tham số và ứng dụng trong điều khiển mờ [7], [30], [33] v.v... Tuy nhiên,
việc ứng dụng đại số gia tử vào lĩnh vực xử lý ảnh nói chung và bài toán nâng
cao ĐTP ảnh nói riêng chƣa đƣợc thực hiện.
Qua khảo sát, phân tích và thực nghiệm tác giả đã rút ra kết luận:
Thứ nhất, phép lập luận if-then dựa trên tập mờ rất khó đảm bảo hình
dạng chữ S của hàm biến đổi mức xám. Phép nâng cao ĐTP theo hƣớng tiếp
cận trực tiếp của Cheng sử dụng một hàm biến đổi mức xám dạng chữ S
không đối xứng, giá trị mức xám biến đổi có thể rơi ra ngoài miền giá trị của
độ xám.
Thứ hai, độ đo thuần nhất của Cheng vẫn còn một vài hạn chế, chẳng
hạn ảnh kết quả có thể không trơn.
Thứ ba, sử dụng trực tiếp thuật toán của Cheng trên kênh ảnh gốc thì
độ sáng của ảnh kết quả có thể không thay đổi đáng kể. Để thay đổi đƣợc độ
sáng của ảnh cần phải biến đổi ảnh gốc trƣớc khi áp dụng phép nâng cao ĐTP
của Cheng. Tuy nhiên, phép biến đổi ảnh của Cheng có thể làm mất chi tiết
của ảnh gốc.
Vấn đề nghiên cứu của luận án là:
9
Vấn đề 1: Xây dựng phép mờ hóa ảnh không đánh mất chi tiết ảnh gốc.
Vấn đề 2: Thiết kế hàm biến đổi mức xám dạng chữ S và đối xứng;
Vấn đề 3:Xây dựng độ đo thuần nhất địa phƣơng của ảnh;
Ba vấn đề nghiên cứu của luận án có thể đƣợc khái quát lại theo hình
nhƣ sau:
Phƣơng pháp của Cheng Phƣơng pháp đề xuất
Ảnh đầu vào:
Ảnh đa cấp xám (Một kênh)
Biến đổi ảnh:
- Sử dụng một DĐMX
- Sử dụng lƣợc đồ xám thƣờng
Tính các giá trị địa phƣơng:
Eij, Hij, Vij, R4ij
Tính giá trị mức xám không thuần
nhất:ij
Tính ĐTP:Cij
Nâng ĐTP:
Tính giá trị mức xám của điểm
ảnh mới
Ảnh nâng cao
Tính giá trị thuần nhất:
HO = (1-Eij)*(1- Hij)*(1-Vij)*(1- R4ij)
Tính số mũ khuếch đại:
Ảnh đầu vào:
Ảnh mầu (đa kênh)
Biến đổi ảnh:
- Sử dụng phân cụm FCM
- Sử dụng nhiều DĐMX
- Sử dụng lƣợc đồ xám mờ
Tính các giá trị địa phƣơng:
Eij, Hij, Vij, R4ij
Tính giá trị mức xám không thuần
nhất:ij
Tính ĐTP:Cij
Tính số mũ khuếch đại:
Dùng hệ luật NN và ĐSGT (Toán tử Hint)
Nâng ĐTP:
Tính giá trị mức xám của điểm
ảnh mới
Ảnh nâng cao
Tính giá trị thuần nhất:
Dùng hệ luật NN và ĐSGT
10
2. Mục tiêu, phạm vi nghiên cứu của luận án
2.1. Mục tiêu chính của đề tài là tập trung chủ yếu ở vấn đề:
Nghiên cứu các vấn đề của xử lý ảnh dƣới tiếp cận của lý thuyết ĐSGT,
cụ thể nhƣ:
- Xây dựng hàm biến đổi mức xám dạng chữ S nâng cao ĐTP cho ảnh
mầu áp dụng ĐSGT.
- Xây dựng độ đo thuần nhất mới bằng đại số gia tử áp dụng nâng cao
ĐTP cho ảnh mầu.
- Xây dựng phép biến đổi mờ hóa ảnh áp dụng cho ảnh đa kênh không
làm mất chi tiết ảnh.
Theo hiểu biết của chúng tôi đây là vấn đề nghiên cứu có tính liên
ngành, hoàn toàn mới trong xử lý ảnh và ĐSGT.
2.2. Phạm vi nghiên cứu
Xuất phát từ mục tiêu trên, phạm vi nghiên cứu của đề tài tập trung vào
các vấn đề sau:
- Biến đổi ảnh mầu, ảnh đa kênh.
- Xây dựng hàm biến đổi mức xám dạng chữ S dựa trên ĐSGT.
- Xây dựng độ đo thuần nhất địa phƣơng cho ảnh dựa trên ĐSGT.
2.3. Đối tƣợng nghiên cứu của luận án:
- Ảnh đa kênh: ảnh mầu RGB (24 bit), kênh ảnh mầu của ảnh viễn
thám.
- Lập luận hệ luật mờ bằng ĐSGT.
- Độ đo tƣơng phản của ảnh mầu RGB (24 bit), kênh ảnh mầu của ảnh
viễn thám.
3. Phƣơng pháp và nội dung nghiên cứu
Phƣơng pháp luận trong nghiên cứu của luận án là kết hợp giữa nghiên
cứu lý thuyết và thực nghiệm. Các tƣ liệu và thông tin liên quan chủ yếu đƣợc
11
thu thập, tổng hợp từ các nguồn tạp chí khoa học chuyên ngành trong và
ngoài nƣớc, qua các buổi seminar hoặc tham gia báo cáo tại các hội thảo khoa
học, qua trao đổi với thầy hƣớng dẫn và các đồng nghiệp cùng lĩnh vực
nghiên cứu v.v…Tổng hợp các thông tin liên quan, lựa chọn các cách tiếp cận
đã đƣợc áp dụng thành công, tiến hành thử nghiệm với tiếng Việt, đánh giá
kết quả, từ đó sẽ tiến hành nghiên cứu sâu hơn về giải pháp cải tiến có thể xây
dựng đƣợc biến đổi ảnh đa kênh, xây dựng đƣợc hàm biến đổi dạng chữ S và
xây dựng độ đo thuần nhất dựa trên ĐSGT.
4. Cấu trúc luận án
Cấu trúc luận án gồm: phần mở đầu, 3 chƣơng nội dung, kết luận, danh
mục tài liệu tham khảo và phụ lục.
Chƣơng 1: Tổng quan về nâng cao ĐTP ảnh và tiếp cận đại số gia tử
giải hệ luật mờ.
Chƣơng này trình bày khái quát kiến thức về ĐSGT, phƣơng pháp giải
hệ luật mờ bằng ĐSGT. Cũng trong chƣơng này trình bày thuật toán nâng cao
ĐTP trực tiếp của Cheng, phân tích những điểm mạnh và điểm hạn chế của
phƣơng pháp làm căn cứ cho các nghiên cứu, đề xuất trong chƣơng 2 và
chƣơng 3.
Chƣơng 2: Biến đổi ảnh đa kênh và xây dựng hàm biến đổi chữ S theo
tiếp cận ĐSGT và ứng dụng nâng cao ĐTP ảnh đa kênh.
Chƣơng này trình bày đề xuất của NCS về xây dựng phép biến đổi mờ
hóa ảnh cho ảnh đa kênh nhƣ ảnh mầu, kênh ảnh mầu của ảnh viễn thám... .
Cũng trong chƣơng này trình bày phƣơng pháp xây dựng hàm biến đổi mức
xám dạng chữ S sử dụng ĐSGT ứng dụng nâng cao ĐTP ảnh đa kênh.
Chƣơng 3. Xây dựng độ đo thuần nhất mới theo tiếp cận ĐSGT và ứng
dụng nâng cao ĐTP ảnh đa kênh
12
Chƣơng này trình bày đề xuất của NCS về đo thuần nhất, các phƣơng
pháp xây dựng độ đo thuần nhất, xây dựng độ đo thuần nhất sử dụng ĐSGT
và ứng dụng độ đo thuần nhất mới nâng cao ĐTP ảnh đa kênh.
5. Kết quả đạt đƣợc của luận án
Các kết quả đạt đƣợc của luận án đã đƣợc công bố trong 2 bài tạp chí
chuyên ngành Quốc gia năm 2017, 02 bài tạp chí chuyên ngành có tính điểm
năm 2017, 01 bài báo cáo đăng tại kỷ yếu hội nghị Quốc gia năm 2017.
Những kết quả đạt đƣợc của luận án:
1) Đề xuất phƣơng pháp xây dựng phép biến đổi mờ hóa ảnh đa kênh
sử dụng nhiều dải động mức xám, các dải động đƣợc ƣớc lƣợng tự động dựa
trên thuật toán phân cụm FCM [CT 4] làm bƣớc tiền đề cho quy trình nâng
cao ĐTP ảnh [CT 1];
2) Đề xuất phƣơng pháp xây dựng hàm biến đổi độ xám dạng chữ S
dựa trên một toán tử HA, cụ thể là toán tử Hint (toán tử tăng cƣờng của
ĐSGT) để cải tiến thuật toán của Cheng, ứng dụng nâng cao ĐTP ảnh đa kênh
[CT 5].
3) Đề xuất phƣơng pháp xây dựng độ thuần nhất dựa trên một hệ luật
ngôn ngữ, sau đó nhúng phép lập luận sử dụng ĐSGT mà cụ thể là phép nội
suy giải hệ luật mờ của đại số gia tử. Ứng dụng độ thuần nhất mới vào quy
trình nâng cao ĐTP ảnh đa kênh [CT 2] và so sánh với phƣơng pháp xây dựng
độ thuần nhất dựa trên các toán tử t-norm [CT 3].
13
CHƢƠNG 1. TỔNG QUAN VỀ NÂNG CAO ĐỘ TƢƠNG PHẢN ẢNH
VÀ TIẾP CẬN ĐẠI SỐ GIA TỬ GIẢI HỆ LUẬT MỜ
Trong chƣơng này luận án hệ thống lại một số kiến thức cơ bản về đại
số gia tử (ĐSGT) và phƣơng pháp lập luận xấp xỉ dựa trên ĐSGT. Trình bày
tổng quan về nâng cao ĐTP ảnh, hệ thống một số thuật toán nâng cao độ sáng
tối của điểm ảnh, phân tích thuật toán nâng cao ĐTP ảnh theo hƣớng tiếp cận
trực tiếp của Cheng làm tiền đề cho những nội dung nghiên cứu trong chƣơng
2 và chƣơng 3. Cũng trong chƣơng này, luận án trình bày các phƣơng pháp
đƣợc sử dụng để đánh giá tính hiệu quả của các kết quả đề xuất và tập dữ liệu
dùng để thử nghiệm.
1.1. Đại số gia tử: một số vấn đề cơ bản
1.1.1. Các khái niệm cơ bản về đại số gia tử
Phƣơng pháp lập luận tính toán nhằm giải quyết vấn đề mô phỏng tƣ
duy, lập luận của con ngƣời chính là việc chúng ta mƣợn cấu trúc tính toán rất
phong phú của tập tất cả các hàm F(U, [0,1]) để mô phỏng các cách lập luận
của con ngƣời mà chúng ta thƣờng đƣợc thực hiện trên nền ngôn ngữ tự
nhiên. Tuy nhiên, trong [5], các tác giả đã chỉ ra rằng tập các giá trị ngôn ngữ
của một biến ngôn ngữ sẽ là một cấu trúc đại số đủ giàu để tính toán và
nghiên cứu các phƣơng pháp lập luận. Nhƣ vậy thay vì mƣợn cấu trúc của
F(U,[0,1]), chúng ta có một khả năng lựa chọn khác là sử dụng cấu trúc đại số
của chính các tập các giá trị ngôn ngữ.
Đại số gia tử (ĐSGT) đƣợc ra đời do đề xuất của N.C. Ho và W.
Wechler vào năm 1990 [28], đến nay đã có nhiều nghiên cứu phát triển và
ứng dụng thành công của các tác giả [1]-[4], [6]-[8], [28], [29], [32].
Trong [28], các tác giả đã chứng minh miền ngôn ngữ X = Dom(X) của
một biến ngôn ngữ X có thể đƣợc tiên đề hóa và đƣợc gọi là đại số gia tử và
đƣợc ký hiệu là AX = (X, G, H, ) trong đó G là tập các phần tử sinh, H là tập
14
các gia tử (hedge) còn “” là quan hệ cảm sinh ngữ nghĩa trên X. Giả thiết
trong G có chứa các phần tử hằng 0, 1, W với ý nghĩa là phần tử bé nhất, phần
tử lớn nhất và phần tử trung hòa (neutral) trong X. Ta gọi mỗi giá trị ngôn
ngữ x X là một hạng từ (term) trong ĐSGT.
Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H,
) là ĐSGT tuyến tính. Hơn nữa, nếu đƣợc trang bị thêm hai gia tử tới hạn là
và với ngữ nghĩa là cận trên đúng và cận dƣới đúng của tập H(x) khi tác
động lên x, thì ta đƣợc ĐSGT truyến tính đầy đủ, ký hiệu AX = (X, G, H, ,
, ). Vì trong luận án chỉ quan tâm đến ĐSGT tuyến tính, kể từ đây nói
ĐSGT cũng có nghĩa là ĐSGT tuyến tính.
Khi tác động gia tử h H vào phần tử x X, thì thu đƣợc phần tử ký
hiệu hx. Với mỗi x X, ký hiệu H(x) là tập tất cả các hạng từ u X sinh từ x
bằng cách áp dụng các gia tử trong H và viết u = hn…h1x, với hn, …, h1 H.
Tập H gồm các gia tử dƣơng H+ và gia tử âm H
-. Các gia tử dƣơng làm
tăng ngữ nghĩa của một hạng từ mà nó tác động, còn gia tử âm làm giảm ngữ
nghĩa của hạng từ. Không mất tính tổng quát, ta luôn giả thiết rằng H- = {h-1 <
h-2 < ... < h-q} và H+ = {h1 < h2 < ... < hp}.
Để ý rằng biểu thức hn...h1u đƣợc gọi là một biểu diễn chính tắc của
một hạng từ x đối với u nếu x = hn...h1u và hi...h1u hi-1...h1u với i nguyên và i
n. Ta gọi độ dài của một hạng từ x là số gia tử trong biểu diễn chính tắc của
nó đối với phần tử sinh cộng thêm 1, ký hiệu l(x).
Ví dụ 1.1. Cho biến ngôn ngữ TRUTH, có G = {0, FALSE, W, TRUE,
1}, H- = { Possible < Little } và H
+ = { More < Very }. Khi đó TRUE < More
TRUE < Very TRUE, Little TRUE < TRUE,...
Bây giờ chúng ta xét một số tính chất của đại số gia tử tuyến tính. Định
lý sau cho thấy tính thứ tự ngữ nghĩa của các hạng từ trong ĐSGT.
15
Định lý 1.1. [28] Cho tập H- và H
+ là các tập sắp thứ tự tuyến tính của
ĐSGT AX = (X, G, H, ). Khi đó ta có các khẳng định sau:
(1) Với mỗi u X thì H(u) là tập sắp thứ tự tuyến tính.
(2) Nếu X đƣợc sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến
tính thì X cũng là tập sắp thứ tự tuyến tính. Hơn nữa nếu u < v, và u, v là độc
lập với nhau, tức là u H(v) và v H(u), thì H(u) H(v).
Định lý tiếp theo xem xét sự so sánh của hai hạng từ trong miền ngôn
ngữ của biến X.
Định lý 1.2. [29] Cho x = hn…h1u và y = km…k1u là hai biểu diễn chính
tắc của x và y đối với u. Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho hj' =
kj' với mọi j' < j (ở đây nếu j = min {n, m} + 1 thì hoặc hj là toán tử đơn vị I, hj
= I, j = n + 1 ≤ m hoặc kj = I, j = m + 1 ≤ n) và
(1) x < y khi và chỉ khi hjxj < kjxj, trong đó xj = hj-1...h1u.
(2) x = y khi và chỉ khi m = n và hjxj = kjxj.
(3) x và y là không so sánh đƣợc với nhau khi và chỉ khi hjxj và kjxj là
không so sánh đƣợc với nhau.
Trong phần tiếp theo, chúng ta trình bày một số vấn đề của đại số gia tử
làm cơ sở cho việc nghiên cứu và phát triển một số mô hình lập luận và ứng
dụng về sau.
1.1.2. Vấn đề định lƣợng ngữ nghĩa trong đại số gia tử
Trong phần này chúng ta xem xét ba vấn đề cơ bản đó là độ đo tính mờ
của các giá trị ngôn ngữ (hạng từ), phƣơng pháp định lƣợng ngữ nghĩa và
khoảng tính mờ của các khái niệm mờ.
Tính mờ của các giá trị ngôn ngữ xuất phát từ thực tế rằng một giá trị
ngôn ngữ mang ý nghĩa mô tả cho nhiều sự vật và hiện tƣợng trong thế giới
thực, với lý do tập hữu hạn các giá trị ngôn ngữ không đủ để phản ánh thế
16
giới vô hạn các sự vật hiện tƣợng [34]. Nhƣ vậy khái niệm tính mờ và độ đo
tính mờ của một giá trị ngôn ngữ đƣợc hình thành và nó là một khái niệm rất
khó xác định, đặc biệt trong lý thuyết tập mờ [7]. Tuy nhiên, trong ĐSGT các
tác giả đã cho thấy độ đo tính mờ đƣợc xác định một cách hợp lý: “tính mờ
của một hạng từ x được hiểu như là ngữ nghĩa của nó vẫn có thể được thay
đổi khi tác động vào nó bằng các gia tử” [34], [35]. Do đó, tập các hạng từ
sinh từ x bằng các gia tử sẽ thể hiện cho tính mờ của x và do đó, H(x) có thể
sử dụng nhƣ là một mô hình biểu thị tính mờ của x và kích thƣớc tập H(x)
đƣợc xem nhƣ độ đo tính mờ của x. Ta có định nghĩa sau về độ đo tính mờ.
Định nghĩa 1.1. [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến
tính đầy đủ. Ánh xạ fm: X [0,1] đƣợc gọi là một đo tính mờ của các hạng
từ trong X nếu:
(1) fm là đầy đủ, tức là fm(c-) + fm(c
+) =1 và hH fm(hu) = fm(u),
uX;
(2) fm(x) = 0, với các x thỏa H(x) = {x}. Đặc biệt, fm(0) = fm(W) =
fm(1) = 0;
(3) x,y X, h H, )(
)(
)(
)(
yfm
hyfm
xfm
hxfm , tỷ số này không phụ thuộc vào x
và y, vì vậy nó đƣợc gọi là độ đo tính mờ của các gia tử và đƣợc ký hiệu bởi
(h).
Trong đó, điều kiện (1) thể hiện tính đầy đủ của các phần tử sinh và các
gia tử cho việc biểu diễn ngữ nghĩa của miền thực đối với các biến. (2) thể
hiện tính rõ của các hạng từ và (3) có thể đƣợc chấp nhận vì chúng ta đã chấp
nhận giả thiết rằng các gia tử là độc lập với ngữ cảnh và, do vậy, khi áp dụng
một gia tử h lên các hạng từ thì hiệu quả tác động tƣơng đối làm thay đổi ngữ
nghĩa của các hạng từ đó là nhƣ nhau. Hình vẽ sau (Hình 1.1) minh họa rõ
17
hơn cho khái niệm độ đo tính mờ của biến ngôn ngữ TRUTH (đã xét trong Ví
dụ 1.1).
Các tính chất của độ đo tính mờ của các hạng từ và gia tử đƣợc thể hiện
qua mệnh đề sau:
Mệnh đề 1.1. [35] Với độ đo tính mờ fm và đã đƣợc định nghĩa trong
Định nghĩa 1.1, ta có:
(1) fm(c-) + fm(c
+) = 1 và ( ) ( )
h Hfm hx fm x
;
(2)
1
)(qj j
h ,
p
j jh
1)( , với , > 0 và + = 1;
(3)
kXx
xfm 1)( , trong đó Xk là tập các hạng từ có độ dài đúng k;
(4) fm(hx) = (h).fm(x), và xX, fm(x) = fm(x) = 0;
(5) Cho fm(c-), fm(c
+) và (h) với hH, khi đó với x = hn...h1c
, {-
,+}, dễ dàng tính đƣợc độ đo tính mờ của x nhƣ sau:
fm(x) = (hn)...(h1)fm(c).
Thông thƣờng, ngữ nghĩa của các hạng từ thuần túy mang tính định
tính. Tuy nhiên, trong nhiều ứng dụng, chúng ta cần giá trị định lƣợng của các
hạng từ này cho việc tính toán và xử lý. Theo tiếp cận của tập mờ, việc định
fm(True)
fm(VeryTrue) fm(LittleTr) fm(PossTr))
fm(MTr)
True
Very True Little True Poss True MoreTrue
W 1
Hình 1.1: Độ đo tính mờ của biến TRUTH
fm(VLTr)
fm(MLTr)
fm(PLTr)
fm(LLTr) fm(VVTr)
fm(MVTr)
fm(PVTr)
fm(LVTr)
18
lƣợng hóa các khái niệm mờ đƣợc thực hiện qua các phƣơng pháp khử mờ
(defuzzification). Đối với ĐSGT, giá trị định lƣợng của các hạng từ đƣợc định
nghĩa dựa trên cấu trúc thứ tự ngữ nghĩa của miền giá trị của các biến ngôn
ngữ, cụ thể là độ đo tính mờ của các hạng từ và gia tử. Tuy có nhiều phƣơng
pháp xác định giá trị định lƣợng của các hạng từ dựa trên các tham số này
nhƣng phải thỏa mãn một số ràng buộc nhất định và đƣợc thể hiện trong định
nghĩa sau.
Định nghĩa 1.2. [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến
tính đầy đủ. Ánh xạ : X [0,1] đƣợc gọi là một hàm định lƣợng ngữ nghĩa
(SQM) của AX nếu:
(1) là ánh xạ 1-1 từ tập X vào đoạn [0,1] và đảm bảo thứ tự trên X,
tức là x,y X, x < y (x) < (y) và (0) = 0, (1) = 1.
(2) liên tục: x X, (x) = infimum (H(x)) và (x) = supremum
(H(x)).
Điều kiện (1) là bắt buộc tối thiểu đối với bất kỳ phƣơng pháp định
lƣợng nào, còn điều kiện (2) đảm bảo tính trù mật của H(G) trong X. Dựa trên
những ràng buộc này, các tác giả trong [35] đã xây dựng một phƣơng pháp
định lƣợng ngữ nghĩa của các hạng từ trong ĐSGT. Trƣớc hết chúng ta xét
định nghĩa về dấu của các hạng từ nhƣ sau.
Định nghĩa 1.3. [35] Một hàm dấu Sign : X {-1, 0, 1} là một ánh xạ
đƣợc định nghĩa đệ qui nhƣ sau, trong đó h, h' H và c {c-, c
+}:
(1) Sign(c-) = -1, Sign(c
+) = 1;
(2) Sign(hc) = -Sign(c) nếu h âm đối với c; Sign(hc) = Sign(c) nếu h
dƣơng đối với c;
(3) Sign(h'hx) = -Sign(hx), nếu h'hx hx và h' âm đối với h; Sign(h'hx)
= Sign(hx), nếu h'hx hx và h' dƣơng đối với h;
19
(4) Sign(h'hx) = 0, nếu h'hx = hx.
Dựa trên hàm dấu này, chúng ta có tiêu chuẩn để so sánh hx và x.
Mệnh đề 1.2. [35] Với bất kỳ h và x, nếu Sign(hx) = 1 thì hx > x; nếu
Sign(hx) = -1 thì hx < x và nếu Sign(hx) = 0 thì hx = x.
Định nghĩa 1.4. [35] Cho AX là một ĐSGT tuyến tính đầy đủ và fm là
một độ đo tính mờ trên X. Ta nói ánh xạ : X [0,1] đƣợc cảm sinh bởi độ
đo tính mờ fm nếu đƣợc định nghĩa bằng đệ qui nhƣ sau:
(1) (W) = = fm(c-), (c
-) = – .fm(c
-) = .fm(c
-), (c
+) =
+.fm(c+);
(2)
)()(
)()()()()()()()( jSignjjSigni
xfmxj
hxj
hxfmi
hxj
hSignxxj
h ,
với mọi j, –q j p và j 0, trong đó:
,))(()(12
1)( xhhSignxhSignxh
jpjj;
(3) (c-) = 0, (c
-) = = (c
+), (c
+) = 1, và với mọi j thỏa –q
j p, j 0, ta có:
(hjx) = (x) +
),()()(12
1)()()(
)(
)(xfmhxhSignxfmhxhSign
jj
jSignj
jSigni ij
(hjx) = (x) +
).()()(1
2
1)()()(
)(
)(xfmhxhSignxfmhxhSign
jj
jSignj
jSigni ij
Với định nghĩa này, các tác giả trong [31] đã chứng minh nó thỏa mãn
các yêu cầu của một hàm định lƣợng ngữ nghĩa và đảm bảo tính trù mật của
nó đối với các hạng từ của AX trong đoạn [0,1] (xem Định lý 1.3).
Một khái niệm rất quan trọng làm cơ sở cho việc nghiên cứu và xây
dựng các mô hình ứng dụng về sau đó là khoảng tính mờ (fuzziness interval)
20
của các khái niệm mờ. Trong ĐSGT, dựa trên độ đo tính mờ fm, chúng ta sẽ
định nghĩa khoảng tính mờ của các hạng từ. Gọi Itv([0,1]) là họ các đoạn con
của đoạn [0,1], ký hiệu || là độ dài của đoạn “”.
Định nghĩa 1.5 [35]. Khoảng tính mờ của các hạng từ x X, ký hiệu
fm(x), là một đoạn con của [0,1], fm(x) Itv([0,1]), nếu nó có độ dài bằng
độ đo tính mờ, |fm(x)| = fm(x), và đƣợc xác định bằng qui nạp theo độ dài của
x nhƣ sau:
(1) Với độ dài của x bằng 1 (l(x)=1), tức là x {c-, c
+}, khi đó |fm(c
-)|
= fm(c-), |fm(c
+)| = fm(c
+) và fm(c
-) fm(c
+);
(2) Giả sử x có độ dài n (l(x)=n) và khoảng tính mờ fm(x) đã đƣợc định
nghĩa với |fm(x)| = fm(x). Khi đó tập các khoảng tính mờ {fm(hjx): -q j p
và j 0} Itv([0,1]) đƣợc xây dựng sao cho nó là một phân hoạch của fm(x),
và thỏa mãn |fm(hjx)| = fm(hjx) và có thứ tự tuyến tính tƣơng ứng với thứ tự
của tập {h-qx, h-q+1x, ..., hpx}, tức là nếu h-qx > h-q+1x > ... > hpx thì fm(h-qx) >
fm(h-q+1x) > ... > fm(hpx) và ngƣợc lại (xem Hình 1.2). Dễ dàng thấy rằng hệ
phân hoạch nhƣ vậy luôn tồn tại dựa vào tính chất (1) trong Mệnh đề 1.1.
Trƣờng hợp độ dài của x bằng k, l(x) = k, ta ký hiệu k(x) thay cho
fm(x), khi đó ta nói khoảng tính mờ của x có độ sâu k (hay khoảng tính mờ
mức k). Để thuận tiện về sau, ta ký hiệu:
Hình 1.2: Khoảng tính mờ của các hạng từ của biến TRUTH
(True) (LTr) (PTr) (MTr) (VTr)
2(LTr) 2(PTr) 2(MTr) 2(VTr)
3(VLTr)
3(MLTr)
3(PLTr)
3(LLTr)
3(LPTr) 3(MPTr
)
3(LMTr) 3(MMTr
)
3(LVTr) 3(MVTr
)
3(PPTr) 3(VPTr) 3(PMTr
)
3(VMTr
)
3(PVTr) 3(VVTr)
21
Xk là tập các hạng từ có độ dài đúng k,
X(k) = l=1,...,k Xl là tập tất cả các hạng từ có độ dài từ 1 đến k.
Rõ ràng X =
1k Xk, và
Ik = {k(x): x Xk} là tập tất cả các khoảng tính mờ độ sâu k,
I = {(x): x X} =
1k Ik.
Tƣơng tự ta cũng có tập I(k) = l=1,...,k Il.
Tiếp theo chúng ta xem xét một số tính chất của khoảng tính mờ cũng
nhƣ cấu trúc của họ tất cả các khoảng tính mờ trong mệnh đề sau. Họ các
khoảng tính mờ đóng một vai trò quan trọng trong việc xem xét quan hệ
tƣơng tự đối với dữ liệu trong miền tham chiếu của các biến. Ở đây, ta sử
dụng khái niệm tựa phân hoạch tức là phân hoạch mà hai tập bất kỳ của nó có
nhiều nhất một điểm chung.
Mệnh đề 1.3 [35]. Cho AX = (X, G, H, , , ) là một ĐSGT tuyến
tính đầy đủ:
(1) Nếu Sign(hpx) = 1, thì ta có (h-qx) (h-q+1x) ... (h-1x)
(h1x) (h2x) ... (hpx), và nếu Sign(hpx) = -1, thì ta có (hpx)
(hp-1x) ... (h1x) (h-1x) (h-2x) ... (h-qx);
(2) Tập Ik = {(x): x Xk} là một tựa phân hoạch của đoạn [0,1];
(3) Cho một số m, tập {(y): y = km... k1x, km,... , k1 H} là một tựa
phân hoạch của khoảng tính mờ (x);
(4) Tập Ik = {(x): x Xk} “mịn” hơn tập Ik-1 = {(x): x Xk-1}, tức là
bất kỳ một khoảng tính mờ trong Ik chắc chắn đƣợc chứa bên trong một
khoảng của Ik-1;
(5) Với x < y và l(x) = l(y), thì (x) ≤ (y) và (x) (y).
22
Chứng minh. Các tính chất (2) đến (5) đã đƣợc chứng minh trong [31],
ở đây ta chứng minh (1). Theo Mệnh đề 1.2, nếu Sign(hpx) = 1 thì ta có x
hpx. Vì các gia tử trong H+ là so sánh đƣợc và H
+ và H
- là đối ngƣợc nhau,
nên h-qx h-q+1x ... h-1x x h1x h2x ... hpx. Từ Định nghĩa 1.5
của khoảng tính mờ ta suy ra (h-qx) (h-q+1x) ... (h-1x) (h1x)
(h2x) ... (hpx). Chứng minh tƣơng tự với trƣờng hợp Sign(hpx) = -1.
Dễ dàng suy ra từ mệnh đề trên trong trƣờng hợp các khoảng tính mờ
đƣợc xét ở dạng nửa đóng, tức là (x) = (lmp( (x)), rmp((x))], và khoảng
tính mờ của hạng từ bé nhất trong phân hoạch ở dạng đóng thì các tựa phân
hoạch trong (2), (3) trở thành các phân hoạch thực sự. Trong đó, lmp và rmp
là điểm mút trái và điểm mút phải của khoảng tính mờ.
Để ý rằng dựa trên cấu trúc thứ tự của X, phần tử x nằm ở giữa hai tập
{h-ix: -q i -1} và {hjx: 1 j p}, hơn nữa ta có
i[-q,-1] |(hix)| = fm(x). i[-q,-1] (hi) = .fm(x) = .|(x)|
Điều này cho thấy điểm cuối chung của hai khoảng tính mờ (h-1x) và
(h1x) chính là giá trị định lƣợng ngữ nghĩa (x) (xem [31]) của hạng từ x.
Giá trị này chia đôi khoảng tính mờ (x) theo tỷ lệ : nếu Sign(hpx) = 1,
hoặc tỷ lệ : nếu Sign(hpx) = -1 (xem (1) của Mệnh đề 1.3).
Theo Định nghĩa 1.4 và 1.5, có một mối liên hệ giữa ánh xạ định lƣợng
ngữ nghĩa và khoảng tính mờ của của hạng từ trong một ĐSGT, đƣợc thể hiện
bằng định lý sau.
Định lý 1.3. [35] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến tính
đầy đủ và hàm đƣợc định nghĩa trong Định nghĩa 1.4. Khi đó là một ánh
xạ định lƣợng ngữ nghĩa và tập các giá trị của đối với H(x), viết là (H(x)),
trù mật trong đoạn [(x), (x)], x X. Hơn nữa,
(x) = infimum (H(x)), (x) = supremum (H(x)) và
23
fm(x) = (x) - (x),
và nhƣ vậy fm(x) = d((H(x))), trong đó d(A) là đƣờng kính của A [0,1].
Kết quả, (H(G)) trù mật trong đoạn [0,1].
Định lý này cũng khẳng định rằng ĐSGT AX cùng với hàm định lƣợng
ngữ nghĩa có thể ứng dụng trong mọi quá trình thực.
Từ những kết quả trên cho thấy giá trị định lƣợng ngữ nghĩa (x) của
một hạng từ x cũng nhƣ khoảng tính mờ (x), x X, phụ thuộc đầy đủ vào
các tham số mờ gia tử fm(c-), fm(c
+), (h) h H.
1.1.3. Phƣơng pháp lập luận xấp xỉ dựa trên ĐSGT
Phần này trình bày cách giải hệ luật mờ bằng phƣơng pháp lập luận xấp
xỉ dựa trên ĐSGT. Trƣớc hết xét mô hình mờ:
If X1 = A11 and ... and Xm = A1m then Y = B1
If X1 = A21 and ... and Xm = A2m then Y = B2
. . . . . . . . . .
If X1 = An1 and ... and Xm = Anm then Y = Bn
(1.1)
ở đây X1, X2, …, Xm và Y là các biến ngôn ngữ, Aij, Bi (i = 1,…, n; j = 1,…, m)
là các giá trị ngôn ngữ tƣơng ứng (xem [79]).
Bài toán đặt ra là: với các giá trị ngôn ngữ A11, A12, …, A1m tƣơng ứng
với các biến ngôn ngữ X1, X2, …, Xm . Hãy tính giá trị của Y.
Tƣ tƣởng chính của phƣơng pháp là từ mỗi mệnh đề “If ...then...” sẽ
xác định một điểm trong không gian tích Đề các Dom(X1) .. Dom(Xm)
Dom(Y), ở đây Dom(Xi), Dom(Y) là các miền ngôn ngữ tƣơng ứng của các
biến ngôn ngữ Xi và Y và chúng đƣợc xem nhƣ các ĐSGT. Vì vậy, các giả
thiết của bài toán xác định một siêu mặt Cf trong không gian tích Đề các này
cho nên giải bài toán mô hình mờ đa điều kiện có nghĩa là chúng ta đi tìm giá
24
trị B ứng với giá trị A = (A11, ..., A1m) bằng cách nội suy trên siêu mặt Cf.
Cụ thể chúng ta phải thực hiện các bƣớc sau đây (xem [6]):
1) Xây dựng các ánh xạ định lƣợng ngữ nghĩa Xi và Y, tức là các ánh
xạ từ các ĐSGT Xi, Y vào [0,1]. Các ánh xạ này đƣợc xác định bởi độ đo mờ
của các phần tử sinh nguyên thủy và của các gia tử, chúng đóng vai trò các
tham số của phƣơng pháp. Kết quả nội suy sẽ chịu ảnh hƣởng từ cách chọn
các tham số này.
2) Các ánh xạ định lƣợng ngữ nghĩa trên sẽ chuyển siêu mặt Cf trong
Dom(X1) ... Dom(Xm) Dom(Y) thành siêu mặt Cr,m+1 trong không gian
thực [0, d1] ... [0, dm] [0, b] với [0, di], [0, b] là miền giá trị của các biến
cơ sở của Xi và Y một cách tƣơng ứng.
3) Sử dụng một phép kết nhập Agg ta sẽ chuyển đƣợc siêu mặt thực
Cr,m+1 trong bƣớc 2 thành đƣờng cong thực Cr,2 trong [0, a][0, b] với a =
Agg(d1, ..., dm) bằng cách: với mỗi i cố định, i = 1, ..., n.
a) Tính các giá trị aij = Xj(Aij), j = 1, ..., m.
b) Kết nhập ai = Agg(ai1, ..., aim),
c) Tính bi = Y(Bi).
Từ các giá trị ai, bi dễ dàng xác định đƣờng cong Cr,2. Cuối cùng, với
các giá trị đầu vào A11, ..., A1m cho trƣớc của các biến X1, ..., Xm, chúng ta sử
dụng phƣơng pháp nội suy tuyến tính thông thƣờng để tính giá trị đầu ra b0
tƣơng ứng với giá trị đầu vào a0 = Agg(X1(A11), ..., Xm(A1m)). Khi có giá trị
b0 chúng ta sẽ xác định lại giá trị ngôn ngữ.
1.2. Khả năng xấp xỉ hàm của phƣơng pháp HA-IRMd và ứng dụng
1.2.1. Khả năng xấp xỉ hàm
Với phƣơng pháp HA-IRMd vừa nêu, chúng ta thấy rằng việc giải bài
toán LLXX sẽ đƣợc chuyển về bài toán nội suy trên đƣờng cong thực. Trong
25
trƣờng hợp mô hình mờ gồm hai biến, sự phụ thuộc giữa chúng đƣợc xác định
bởi một hàm f cho trƣớc, liệu có tồn tại mô hình mờ gồm các luật sao cho
đƣờng cong ngữ nghĩa thu đƣợc bởi phƣơng pháp HA-IRMd trên mô hình này
là xấp xỉ f hay không?
Để trả lời câu hỏi trên, đầu tiên chúng ta xét mô hình mờ một đầu vào,
một đầu ra sau [5]:
If X = A1 then Y = B1
If X = A2 then Y = B2
. . . . . . . . . . . . . . . .
If X = An then Y = Bn
, trong đó X, Y là các biến ngôn ngữ, Ai, Bi (i = 1,…, n) là các nhãn ngôn ngữ.
Giả sử biến ngôn ngữ X xác định trên vũ trụ U = [u1, u2], biến ngôn ngữ
Y xác định trên vũ trụ V = [v1, v2], hàm g: U → V là hàm phi tuyến, liên tục,
thể hiện sự phụ thuộc của biến Y vào biến X và giả sử rằng AX = (X, GX, HX,
, , ), AY = (Y, GY, HY, , , ) là các ĐSGT tƣơng ứng của hai biến X,
Y. Bằng việc chuẩn hóa, chúng ta đƣa các miền U, V về đoạn [0,1], khi đó
đƣờng cong g đƣợc chuyển thành đƣờng cong f với f: [0,1] → [0,1]. Bây giờ
chúng ta cần xây dựng mô hình mờ M thể hiện sự phụ thuộc của biến ngôn
ngữ Y vào biến ngôn ngữ X sao cho đƣờng cong ngữ nghĩa tƣơng ứng với mô
hình M là xấp xỉ với đƣờng cong f.
Ta có định lý sau:
Định lý 1.5 [7]. Với bất kỳ đƣờng cong liên tục f: [0,1]→[0,1] và một
số ε > 0 bé tùy ý, bao giờ cũng xác định đƣợc mô hình mờ M sao cho nếu Cr
là đƣờng cong ngữ nghĩa tƣơng ứng với M đƣợc xác bởi hàm định lƣợng ,
thì ta có
)()(sup1,0
zfzCr
z
.
26
1.2.2. Ứng dụng việc xấp xỉ hàm trong xây dựng luật
Trong thực tế cuộc sống có rất nhiều quan hệ phụ thuộc lẫn nhau giữa
các đại lƣợng. Ví dụ nhƣ hệ số lƣơng phụ thuộc vào số năm công tác hay
năng suất cây trồng phụ thuộc vào điều kiện chăm sóc,…Sự phụ thuộc này có
thể ngầm hiểu nhƣ một quan hệ hàm. Tuy nhiên rất khó có thể xác định công
thức của các hàm đó. Chúng ta chỉ có thể biểu thị sự phụ thuộc này bởi các
câu hoặc các mệnh đề If-then. Ngƣợc lại, nếu sự phụ thuộc giữa các yếu tố
đƣợc biểu diễn dƣới dạng hàm hoặc từ các dữ liệu đo đạc thực nghiệm, chúng
ta lại hoàn toàn có thể xây dựng các luật để diễn đạt nó. Dƣới đây tác giả sẽ
trình bày phƣơng pháp xây dựng hệ luật từ tập các dữ liệu phụ thuộc giữa hai
đại lƣợng ở dạng một hàm cho trƣớc.
Bài toán xây dựng luật [5]: Cho đƣờng cong liên tục f: [0,1] → [0,1]
biểu thị sự phụ thuộc giữa hai biến ngôn ngữ X, Y và số ε > 0 bé tùy ý. Cần
xây dựng mô hình mờ M sao cho đƣờng cong ngữ nghĩa tƣơng ứng là xấp xỉ
với f.
Chúng ta thực hiện theo các bƣớc sau:
Bước 1. Xác định các ĐSGT AX = (X, GX, HX, , , ), AY = (Y, GY,
HY, , , ) cho biến X, Y, tức là xác định các tập GX, HX, GY, HY và độ đo
tính mờ của các phần tử trong các tập đó.
Bước 2. Chia đoạn [0,1] thành m phần bằng nhau (m phụ thuộc vào ε)
và xác định các điểm chia z0, z1,…, zm, z0 = 0, zm = 1. Tính giá trị hàm f tại các
điểm chia zi.
Bước 3. Gọi X1
, Y1
là hàm ngƣợc của X và Y một cách tƣơng ứng.
Với mỗi cặp giá trị (zi, f(zi)), i = 0,…, m, ta lần lƣợt bổ sung luật IF X =
X1
(zi) THEN Y = Y1
(f(zi)) vào mô hình mờ M. Cuối cùng ta thu đƣợc mô
hình mờ gồm (m +1) luật.
Dễ thấy, đƣờng cong ngữ nghĩa của mô hình mờ đƣợc xác định theo
27
các bƣớc trên là xấp xỉ với f (theo Định lý 1.5).
Một số lưu ý:
i) Rõ ràng với m càng lớn thì đƣờng cong ngữ nghĩa càng gần với
đƣờng cong f. Vì thế việc chọn giá trị m cho từng bài toán sẽ tùy thuộc độ
chính xác mà bài toán đó yêu cầu. Trong thực tế chúng ta chỉ dùng một số ít
các luật, tƣơng ứng với m tƣơng đối nhỏ và chấp nhận sai số xấp xỉ lớn. Hơn
nữa, để đơn giản chúng ta dùng các điểm chia xi ban đầu (trong phần chứng
minh Định lý 1.5) thay cho các mốc zi.
ii) Trong trƣờng hợp f là đƣờng cong tuyến tính từng khúc chúng ta có
thể chọn m tƣơng đối lớn, sau đó giản lƣợc bớt các luật bằng cách loại thứ i ra
khỏi cơ sở luật M nếu )()(
)()(
11
1
11
1
ii
ii
ii
ii
zfzf
zfzf
zz
zz, i = 1,…, m −1. Hay cách
tốt nhất để xây dựng cơ sở luật đối với đƣờng cong dạng này là các luật tƣơng
ứng với các điểm gấp khúc của đƣờng cong đó.
1.2.3. Phƣơng pháp lập luận tối ƣu dựa trên ĐSGT
Thay vì sử dụng các phƣơng pháp lập luận mờ nhƣ trong [40, 41, 54,
55, 69, 70] tác giả sử dụng hàm ĐLNN của ĐSGT để giải bài toán lập luận
xấp xỉ mờ đa điều kiện. Phƣơng pháp hiện tại sẽ khác với phƣơng pháp trong
[32] ở bƣớc chọn các tham số cho hàm ĐLNN. Lƣu ý rằng, trong phƣơng
pháp nội suy gia tử đã sử dụng trƣớc đây, các tham số của các ĐSGT đƣợc
chọn bởi trực giác. Bây giờ chúng ta sử dụng lại phƣơng pháp này nhƣng với
các tham số tối ƣu, tức là các tham số của hàm ĐLNN sẽ đƣợc chọn bằng giải
thuật di truyền và ta gọi ĐSGT với các tham số tối ƣu là ĐSGT tối ưu.
Tóm lại, độ đo tính mờ của các gia tử và các phần tử sinh, số lƣợng gia
tử trong ĐSGT sẽ quyết định giá trị ngữ nghĩa còn miền tham chiếu của các
biến sẽ quyết định các giá trị trong miền thực.
28
1.2.4. Hệ tham số của phƣơng pháp nội suy gia tử
Với mô hình mờ (1.1), ý tƣởng xây dựng phƣơng pháp giải bài toán lập
luận đa điều kiện nhƣ sau [6]:
Từ mô hình (1.1) mô tả sự phụ thuộc của Y vào X, chúng ta xem mệnh
đề if-then thứ i nhƣ là một điểm (Ai1, …, Aim, Bi) và do đó mô hình mờ đã cho
mô tả một siêu mặt ngôn ngữ CL trong X1…XmY, trong đó Xj = Dom(Xj)
và Y = Dom(Y) đƣợc xem nhƣ các ĐSGT. Vì vậy, bài toán lập luận đa điều
kiện trên trở thành bài toán “bài toán nội suy ngôn ngữ” tƣơng ứng với CL.
Phƣơng pháp nội suy gia tử bao gồm các bƣớc sau:
1) Định lượng ngữ nghĩa, ngữ nghĩa hóa và giải nghĩa: Xây dựng các
ánh xạ ĐLNN Xj và Y, để ánh xạ các giá trị ngôn ngữ trong Xj và Y vào
đoạn [0,1], một cách tƣơng ứng, với j = 1, .., m. Trong lý thuyết ĐSGT, chúng
ta sử dụng miền ngữ nghĩa là miền [0,1], nhƣng trong thực tế các ánh xạ này
có thể hình dung nhƣ sau:
X f
[a, b] g
[0,1]
trong đó X là miền ngôn ngữ của biến ngôn ngữ X, [a, b] là miền tham chiếu
của biến X, f đƣợc gọi là ánh xạ định lƣợng thực và g là ánh xạ 1–1 dùng để
ngữ nghĩa hóa. Khi đó, ta có thể xem hàm ĐLNN X = g o f, với phép toán
“o” là phép hợp thành hai ánh xạ. Ánh xạ g–1
đi từ đoạn [0,1] vào đoạn [a, b]
đƣợc gọi là ánh xạ giải nghĩa.
Quan trọng nhất trong các bƣớc là việc xác định các tham số của hàm
ĐLNN, cụ thể là độ đo tính mờ của các phần tử sinh và các gia tử ngôn ngữ
của các biến ngôn ngữ Xj và Y. Giả sử rằng ĐSGT của biến Xj là AXj = (Xj,
Gj, Hj, j) và AXj có kj gia tử, tức là |Hj| = kj, j = 1, 2, … m, ĐSGT của biến Y
là AY = (Y, G, H, ) với số gia tử trong tập H bằng k: |H| = k.
Hệ các tham số bao gồm:
29
– (m + 1) tham số của độ đo tính mờ của các phần tử sinh trong các
ĐSGT: j = fm(cj), với j = 1, 2, … m, và = fm(c
).
– kj tham số độ đo tính mờ của các gia tử trong Hj: j1, j2, …, j
jk , thứ
tự của chúng trong dãy là (hj,q, ..., hj,1, hj1,..., hjp) cho AXj, trong đó hj,1 <
hj,2 < ... < hj,q và hj1 < ...< hjp.
– k tham số độ đo tính mờ của các gia tử trong H: 1, 2, …, k, thứ tự
các gia tử đƣợc sắp theo dãy (hq, ..., h1, h1,..., hp) cho đại số AY, trong đó h1
< ... < hq và h1 < ...< hp.
2) Bộ nhớ kết hợp ngữ nghĩa (SAM – Semantic Associative Memory):
Sử dụng các ánh xạ Xj và Y, chuyển mô hình (1.2) (còn gọi là bộ nhớ kết
hợp mờ FAM – Fuzzy Associative Memory) sang bảng SAM, và nhƣ vậy
chúng ta xác định đƣợc một siêu mặt Cr,m+1 trong không gian [0,1]m+1
của
không gian thực (m + 1) chiều.
3) Phương pháp lập luận nội suy: Bài toán nội suy ngôn ngữ bây giờ
trở thành bài toán nội suy kinh điển trên siêu mặt số thực Cr,m+1, tức là với dữ
liệu đầu vào (X1(A1,1), …, Xm(A1,m)) trong không gian Rm, tính giá trị đầu ra
Y(B0) dựa vào lƣới điểm đƣợc xác định bởi n điểm (X1(Ai,1), …, Xm(Ai,m)), i
= 1, 2, …, n, vì thế, điểm (X1(A1,1), …, Xm(A1,m), Y(B1)) sẽ là điểm trong
không gian thực (m + 1) chiều nằm gần nhất có thể có đối với siêu mặt Cr,m+1.
Tại bƣớc này, chúng ta sử dụng:
– Chọn phép toán kết nhập trung bình có trọng số Agg với các trọng số
w1, …, wm [77] để kết nhập m thành phần đầu tiên của các điểm trong không
gian Cr,m+1 và thu đƣợc đƣờng cong Cr,2 trong không gian [0,1][0,1].
– Dùng phƣơng pháp nội suy cổ điển trên đƣờng cong Cr,2 để tính giá
trị đầu ra Y(B0) tƣơng ứng với giá trị đầu vào cho trƣớc.
30
1.3. Tổng quan về nâng cao độ tƣơng phản ảnh
1.3.1. Tăng cƣờng độ tƣơng phản ảnh dựa trên logic mờ
Trong [17], Cheng đã đề xuất một phƣơng pháp tăng cƣờng ĐTP mờ
trực tiếp thích ứng mới. Trong phƣơng pháp này hàm thành viên Sigma đƣợc
sử dụng để ánh xạ ảnh đầu vào từ miền không gian vào miền mờ. Trong khi
chuyển ảnh từ một không gian màu (RGB) vào không gian màu khác nhƣ
(HSV, HIS, YIQ) sắc độ không bị thay đổi chỉ thành phần cƣờng độ và độ
bão hoà bị thay đổi. Tuy nhiên, ảnh sau tăng cƣờng có thể không còn giữ
đƣợc sự trong trẻo. Để khắc phục vấn đề này, trong [63], Naik đã cố gắng giữ
các giá trị đƣợc biến đổi trong phạm vi của không gian mầu RGB.
Trong [71], hai kĩ thuật tăng cƣờng là tăng cƣờng ĐTP dựa trên luật mờ
và tăng cƣờng ĐTP sử dụng toán tử tăng cƣờng đƣợc trình bày với ảnh xám
ĐTP thấp. Trong kĩ thuật đầu tiên, hàm ứng với hệ mờ thu đƣợc bởi các luật
if-then đơn giản, và trong kĩ thuật thứ hai toán tử tăng cƣờng ĐTP mờ đóng
vai trò nhƣ công cụ cho việc tăng cƣờng ĐTP trong miền mờ. Sự phân tích so
sánh của các kĩ thuật này đƣợc thực hiện bởi việc tính chỉ số mờ và thời gian
xử lý. Giá trị thấp hơn của chỉ số mờ biểu thị ảnh tăng cƣờng tốt hơn.
Kết quả thực nghiệm cho thấy, lƣợc đồ xám của ảnh gốc và các ảnh
tăng cƣờng có các đặc trƣng cơ bản giống nhau, điều này không làm đƣợc
trong cân bằng lƣợc đồ xám [72]. Ngoài ra, tăng cƣờng ĐTP sử dụng kĩ thuật
toán tử tăng cƣờng có các giá trị chỉ số mờ thấp hơn khi so với kĩ thuật tăng
cƣờng ĐTP sử dụng luật mờ. Tuy nhiên, về thời gian xử lý, kĩ thuật tăng
cƣờng ĐTP dựa trên luật mờ yêu cầu thời gian ít hơn kĩ thuật tăng cƣờng sử
dụng toán tử tăng cƣờng.
1.3.2. Một số thuật toán tăng cƣờng theo tiếp cận mờ
1.3.2.1. Biểu diễn mờ của ảnh đơn kênh
31
Lý thuyết tập mờ đƣợc giới thiệu bởi Zadeh đề cập đến mô hình toán
học cho việc nghiên cứu về ảnh mới. Theo đó một ảnh I kích thƣớc M x N và
L lớp màu xám có thể đƣợc định nghĩa dƣới dạng một ma trận mờ, trong đó
mỗi một giá trị hàm biểu diễn mức độ của lớp màu, với l = 0, 1, … L-1. Với
ảnh I chúng ta có thể biểu diễn dƣới dạng tập mờ [28][31] nhƣ sau:
⋃ m = 1, 2, …, M và n = 1, 2, …, N (1.2)
Trong đó gmn là cƣờng độ của điểm ảnh (m, n) và giá trị thành viên của
nó μmn. Hàm thành viên đặc trƣng cho thuộc tính thích nghi của ảnh (ví dụ
thuộc tính biên, tối, kết cấu). Trong những năm gần đây, một số nhà nghiên
cứu đã áp dụng khái niệm mờ để phát triển các thuật toán mới cho việc tăng
cƣờng ảnh.
Ví dụ: Biểu diễn mờ ảnh RGB với toán tử INT.
: [0 ,1] [0 ,1]IN T
2
2
2 , 0 0 .5( ) ( )
1 2 (1 ) , 0 .5 1
x xx IN T x
x x
Khi đó hàm INT trên một tập mờ A và sinh ra một tập mờ A’ = INT(A),
hàm thành viên của A’ đƣợc định nghĩa nhƣ sau:
( ) ( )( )
2
' 2
2 ( ( )) , 0 ( ) 0 .5( )
1 2 (1 ( )) , 0 .5 ( ) 1
A A
A
A A
x xx
x x
Toán tử này làm giảm tính mờ của tập mờ A bằng việc tăng giá trị của
hàm ( ) nếu giá trị hàm ( ) lớn hơn 0.5 và ngƣợc lại, làm giảm tính mờ
của tập mờ A bằng việc giảm giá trị của hàm ( ) xuống nếu giá trị hàm
( ) nhở hơn 0.5.
32
Hình 1.3. Đồ thị toán tử INT
Trong biểu diễn mầu RGB, I={IR, IG, IB}, biểu diễn mờ của ảnh I là ma
trận độ thuộc I’={IR, IG, IB}
'
ij ij( , , ) ( IN T (r/255 .0 ),IN T (g /255 .0 ),IN T (b /255 .0 ))p r g b I p
(a)
(b)
(c)
(d)
Hình 1.4. (a) Ảnh gốc, (b), (d) biểu diễn mờ với toán tử INT của kênh R, G và B
tƣơng ứng
33
1.3.2.2. Biểu diễn mờ hóa ảnh với phân cụm mờ FCM
Trong thuật toán phân cụm mờ c-Means, mỗi điểm ảnh có thể là thành
viên của nhiều cụm với mức độ thuộc không nhƣ nhau. Thuật toán phân cụm
c-Means tiến hành với quá trình tối ƣu hoá lặp của sự cực tiểu hoá một hàm
mục tiêu mờ đƣợc định nghĩa tại công thức sau đây:
2
m
1 1
J ( ) d ( , ) m in
c n
m
ik k i
i k
x V
trong đó:
c: số cụm, n: số điểm ảnh,
µik: giá trị liên thuộc của điểm ảnh thứ k với tập thứ i
m: độ mờ của mỗi liên thuộc mờ, khi m tiệm cận đến 1 thì thuật toán
này tƣơng tự nhƣ phân cụm k-means mô tả trên đây.
xk: vector của điểm ảnh k, Vi: vector tâm của cụm i
d2(xk, Vi): khoảng cách Euclide giữa xk và Vi
Giá trị độ thuộc µik đƣợc ƣớc lƣợng bởi khoảng cách giữa điểm ảnh k
và trung tâm của cụm i, ràng buộc theo công thức sau:
1
1
0 1, i ,k
1, k
0 , i
ik
c
ik
i
n
ik
k
trong đó, µik: giá trị độ thuộc của điểm ảnh thứ k với tập thứ I, c: số cụm, n: số
điểm ảnh
Tâm của cụm Vi và giá trị độ thuộc µik có thể đƣợc tính theo các công
thức sau:
1
1
( )
V ,1
( )
n
m
ik k
k
i n
m
ik
k
x
i c
34
12
1
1 ,
( , ), 1 i c ,1 k n
( )
mc
k i
ik
j k j
d x V
d x V
Do đó, Jm đƣợc cực tiểu hoá bằng việc tính toán lặp qua hai công đoạn
trên đây. Bƣớc đầu tiên của quá trình lặp là khởi tạo giá trị cố định c, tham số
mờ m, ngƣỡng hội tụ ε và một tâm khởi tạo của mỗi cụm, sau đó tính µik và Vi
bằng việc sử dụng hai công thức trên. Quá trình lặp kết thúc khi sự thay đổi
của Vi giữa hai bƣớc lặp nhỏ hơn ε. Kết quả thu đƣợc là mỗi điểm ảnh đƣợc
phân vào một tập các liên thuộc của các cụm.
Khi sử dụng phân cụm mờ FCM với số cụm C, ta thu đƣợc C “ảnh độ
thuộc” cùng kích thƣớc với ảnh gốc.
(a)
(b)
(c)
(d)
35
(e)
(g)
Hình 1.5. Phân cụm FCM với C = 5 cụm, (a) ảnh gốc, (b)-(g) ảnh ma trận độ
thuộc cum số 1 {µi,j,1} -5 {µi,j,5}.
1.4. Một số thuật toán nâng độ sáng tối của điểm ảnh
Nguyên tắc của lƣợc đồ tăng cƣờng mờ đƣợc minh họa trong hình sau:
Hình 1.6. Nguyên tắc chính của tăng cƣờng ảnh mờ [29].
1.4.1. Toán tử tăng cƣờng
Phƣơng pháp này sử dụng toán tử tăng cƣờng để giảm tính mờ của ảnh
mà đƣa ra trong một sự tăng cƣờng ĐTP ảnh [68]. Thuật toán có thể đƣợc
phát biểu nhƣ sau:
Bước 1: Đặt các tham số Fe (Exponential fuzzifiers), Fd
(Denomination fuzzifiers), gmax (Maximum gray level) của hàm thành viên
Fe= 2 và
(1.3)
Bước 2: Định nghĩa hàm thành viên
( ) [
]
(1.4)
Bước 3: Thay đổi giá trị thành viên
{
[ ]
[ ]
(1.5)
36
Bước 4: Sinh mức xám mới
(
) ((( )
)) (1.6)
(a) Ảnh gốc
(b) Ảnh kết quả sinh bởi toán tử tăng
cƣờng [31]
(c) Dạng hàm biến đổi
(d) Ảnh gốc
(e) Kết quả sinh bởi toán tử tăng cƣờng
[31]
(g) Dạng hàm biến đổi
Hình 1.7. Một số thử nghiệm nâng cao ĐTP sử dụng toán tử tăng cƣờng.
1.4.2. Tăng cƣờng với toán tử Hyperbol
Ý tƣởng của lƣợc đồ xám với toán tử hyperbol, và lƣợc đồ xám với
toán tử hyperbol mờ đƣợc mô tả tƣơng ứng trong [75]. Do nhận thức độ sáng
37
của con ngƣời phi tuyến, thuật toán này thay đổi giá trị thành viên của các
mức xám bởi hàm logarit. Thuật toán có thể đƣợc phát biểu nhƣ sau:
Bước 1: Thiết lập dạng hàm thành viên.
Bước 2: Đặt giá trị của tham số mờ β.
Bước 3: Tính các giá trị thành viên μmn.
Bước 4: Thay đổi các giá trị thành viên bởi β.
Bước 5: Sinh mức xám mới, nhƣ mô tả ở dƣới.
Trong thuật toán này, dạng của hàm thành viên đƣợc thiết lập nhƣ tam
giác để đặc trƣng cho ranh giới, và giá trị của tham số mờ β nhƣ một ranh
giới. Sau đó, bằng việc tính giá trị thành viên μmn và thay đổi giá trị thành
viên bởi β, sinh giá trị mức xám mới g’mn bởi đẳng thức sau:
'
1
11 1
1
m ng
m ng L e
e
(1.7)
1.4.3. Tăng cƣờng dựa trên suy diễn hệ luật mờ (Fuzzy rule)
Dựa trên các luật cơ bản sau, thuật toán nâng cao ĐTP ảnh đã đƣợc
phát triển và thực hiện:
Nếu cƣờng độ điểm ảnh là tối thì kết quả tối hơn.
Nếu cƣờng độ điểm ảnh là xám thì kết quả là xám.
Nếu cƣờng độ điểm ảnh là sáng thì kết quả sáng hơn.
Hình 1.8. Ảnh kết quả sử dụng suy diễn luật if-then [31] cho ảnh ở hình 1.4.a
38
1.4.4. Một số độ đo chất lƣợng tăng cƣờng ảnh
Để đánh giá chất lƣợng ảnh, chúng ta có thể sử dụng phƣơng pháp trực
quan hay các chỉ số độ đo chất lƣợng. Để đo ĐTP của ảnh, chúng ta có thể sử
dụng một số độ đo nhƣ sau: Shannon Entropy H [65], Entropy mờ FH [26],
chỉ số tuyến tính mờ γ [71], độ đo chất lƣợng ảnh IQM v.v…
1.5. Thuật toán nâng cao độ tƣơng phản ảnh của Cheng
Trong [16] Cheng và cộng sự đã sử dụng hàm S-function để chuyển
một ảnh xám sang miền fuzzy, sau đó nghiên cứu nâng cao ĐTP của ảnh
trong miền fuzzy. ĐTP của điểm ảnh Cij với (i,j) là tâm của cửa sổ Wij đƣợc
xác định dựa trên giá trị trung bình mức xám không thuần nhất của điểm
ảnh (i, j) [17].
|
|
Phép nâng cao ĐTP trực tiếp của một ảnh xám đƣợc công bố trong [17]
có thể đƣợc tóm tắt nhƣ sau:
Giả sử gij là mức xám của một điểm ảnh I(i,j) của ảnh đa cấp xám I
kích thƣớc M × N, và Wij cửa sổ lân cận tại (i,j) kích thƣớc d × d. Thực hiện
tuần tự các bƣớc sau:
Đầu vào: Ảnh đa cấp xám I, kích thƣớc M x N, kích thƣớc cửa sổ d.
Bƣớc 1: Tính các tham số địa phƣơng, chuẩn hóa giá trị về đoạn [0,1],
gradient Eij, entropy Hij, trung bình độ lệch chuẩn Vij, và moment bậc 4 R4,ij:
1.1: Tính cƣờng độ biên ảnh:
e={eij} là giá trị cƣờng độ biên ảnh xám đầu vào bằng một toán tử xác
định ảnh biên nhƣ toán tử Sobel.
1.2: Giá trị trung bình, độ lệch chuẩn
= {ij}, v = {vij}, trong đó ij là giá trị trung bình mức xám, vij là độ
lệch chuẩn mức xám lấy tại lân cận điểm ảnh gij
39
ij( , ) W
ij 2
p q
p q
g
d
,
i j
2
ij
( , ) W
ij 2
p q
p q
g
vd
(1.8)
1.3: Tính giá trị entropy địa phƣơng
1
ij
lo g
2 lo g
L
k k
k
p p
hd
,
ij
2
# ( , ) W :p q
k
p q g kp
d
(1.9)
1.4: Tính moment bậc 4
i j
4
ij
( , ) W
4 ,ij 21
p q
p q
g
d
(1.10)
1.5: Chuẩn hóa về miền giá trị là đoạn [0,1]
i j
i j
i jm a x
eE
e ,
i j
i j
i j
,m a x
vV
v
i j
i jm a x
i j
hH
h ,
4 ,ij
4 ,
4 ,i jm a x
i jR
(1.11)
Bƣớc 2: Tính giá trị độ thuần nhất của điểm ảnh và giá trị mức xám
không thuần nhất
2.1: Tính giá trị đo độ thuần nhất tại điểm ảnh
i j
i j
i jm ax
H O
H O , trong đó
(1.12)
ij 4 ij ij 4 ,* * * 1 * 1 * 1 * 1
ij ij ij ij ij ijH O E V H R E V H R (1.13)
2.2: Tính giá trị mức xám không thuần nhất (non-homogeneity gray
value [17])
i j
i j
( , ) W
ij
( , ) W
(1 )
(1 )
p q p q
p q
p q
p q
g
(1.14)
Bƣớc 3: Tính giá trị ĐTP tại từng điểm ảnh và số mũ khuếch đại
3.1: Giá trị ĐTP
i j i j
i j
i j i j
gC
g
(1.15)
3.2: Số mũ khuếch đại
40
a x m in ij m in
ij m in
a x m in
*m
m
, trong đó
(1.16)
1
m in
a x 1
k
m
g g
g g
, m a x
1 , gk, g1 là các đỉnh của lƣợc đồ xám đƣợc
xác định theo [13]
(1.17)
3.3: Nâng ĐTP
i j'
i j i j
t
C C
, trong đó t{0.25, 0.5} là tham số [6] (1.18)
3.4: Tính giá trị mức xám mới tại từng điểm ảnh
i j
i j
i j
i j
'
i j i j
i j i j i j i j'
i ji j'
i j'
i j i j
i j i j i j i j'
i ji j
1 1,
1 1
1 1,
1 1
t
t
t
t
C Cg
C C
g
C Cg
C C
(1.19)
Đầu ra: Ảnh xám đã đƣợc nâng cao ĐTP I’.
Cũng trong [17] Cheng và cộng sự Dải động của mức xám:
Dựa trên lƣợc đồ xám của ảnh, trong [16, 17] nhận thấy đỉnh đầu tiên
của lƣợc đồ xám của ảnh liên quan đến vùng nền và mức xám lớn hơn đỉnh
sau cùng có thể là nhiễu. Vì vậy các đã đề xuất cách xác định dải động của
mức xám nhƣ sau:
Dải động mức xám là đoạn [a,c] ở đó:
a = min{(1 - f2)(g1 - Lmin) + Lmin,B1},
c = max{f2(Lmax - gk) + gk, B2} (1.20)
Trong đó B1, B2 đƣợc xác định:
a x1
m in m in
1is ( ) is ( )
mLB
i L i L
H i f H i
,
ax ax
2 m in
1is ( ) is ( )
m mL L
i B i L
H i f H i
(1.21)
Lmin, Lmax là giá trị mức xám nhỏ nhất và lớn nhất của ảnh, các hằng số
41
f1 = 0.01, f2 = 0.5 đƣợc xác định bằng thực nghiệm.
a x
1
a x
is ( )
is ( )
k
m i
i
m
H g
H gk
, k là số điểm cực đại địa phƣơng của lƣợc đồ xám,
Một đặc tính cơ bản của thuật toán trên [17] là luật sau đƣợc thỏa mãn
bởi phép nâng cao ĐTP:
Đặc tính của thuật toán [17]: Tại từng điểm ảnh, độ thuần nhất càng cao
thì mức độ nâng tƣơng phản càng thấp.
Phép nâng cao ĐTP của Cheng thỏa mãn luật: Tại từng điểm ảnh trên
đó tác động bƣớc 1-3, độ thuần nhất điểm ảnh càng cao thì mức độ nâng
tƣơng phản tại điểm ảnh đó càng thấp. (tạm ký hiệu là: RCE-rule of
contrast enhancement).
Do một biến đổi ảnh là đơn điệu tăng, thƣờng bảo toàn cƣờng độ biên
ảnh và giá trị entropy địa phƣơng nên luật RCE nói chung cũng thỏa mãn với
ảnh gốc ngay cả khi trong phép nâng cao ĐTP trực tiếp có sử dụng một biến
đổi ảnh.
1.6. Các chỉ số đánh giá
Để đảm bảo tính khách quan, khi đánh giá hiệu quả của các thuật toán
nâng cao ĐTP ngoài đánh giá bằng trực quan, các nghiên cứu thƣờng sử dụng
các chỉ số đánh giá khách quan ĐTP ảnh, cụ thể là:
(i) Chỉ số entropy [65] đƣợc lấy trung bình trên toàn bộ các điểm ảnh và
các kênh ảnh, chúng đƣợc cho nhƣ sau:
m ax
2
m in
( ) ( ) lo g ( ( ))
k
k
L
k k k
g L
E I p g p g
1
1 ,
( )
( )
K
k
k
a vg K
E I
E IK
, trong đó
(1.22)
# ( , )( )
d e f
k
k
I i j gp g
M N
và quy ƣớc 0*log2(0)=0.
42
Giá trị của chỉ số entropy cao thì có thể xem ảnh là giầu tính chi tiết. Chỉ
số entropy của ảnh kết quả càng cao thì khả năng là ảnh kết quả bảo toàn tốt
tính chi tiết của ảnh gốc.
(ii) Chỉ số đánh giá khách quan fuzzy-entropy [26] đƣợc lấy trung bình
trên toàn bộ các điểm ảnh và các kênh ảnh, chúng đƣợc cho nhƣ sau:
Giả sử k ,m in k ,m a x
[L , L ] ( ) [0 ,1]k k
g g là một phép mờ hóa nào đó
, ax
,m in
2 2( ) ( ( ) lo g ( ) (1 ( )) lo g (1 ( ))) * ( )
k m
k
L
k k
g L
H I g g g g p g
(1.23)
Dƣới đây chúng ta sẽ dùng phép mờ hóa tự nhiên:
, m in
, m ax , m in
( )
d e fk
k k
g Lg g
L L
(1.24)
Khi đó ta viết gọn H thay cho H, và ta có một độ đo fuzzy-entropy
trung bình của K kênh ảnh nhƣ sau:
1
1 ,
( )
( )
K
k
k
a v g K
H I
H IK
(1.25)
(iii) Chỉ số ĐTP trực tiếp
Chỉ số ĐTP trực tiếp đƣợc lấy trung bình trên toàn bộ các điểm ảnh của
một kênh ảnh Ik’ so với một kênh ảnh gốc Ik (Ik’ và Ik có cùng kích thƣớc M x
N), chúng đƣợc cho nhƣ sau:
'
, i j
'
i ,j , i j'
( , )
( , )( , ) ,
k k
k k
k k
I i j
I i jC M I I
M N
(1.26)
ở đây δk,ij là giá trị mức xám không thuần nhất tại điểm ảnh (i, j) của Ik. δk,ij
đƣợc tính trong lân cận d x d, tham số d thƣờng cố định (d = 3) nên trong định
nghĩa CM, tác giả bỏ qua không đề cập đến d nhƣ là một tham số của CM.
Nhận xét: Nói chung ta có,
' '
( , ) ( , )k k k k
C M I I C M I I
43
" ' " '( , ) ( , ) ( , ) ( , )
k k k k k k k kC M J I C M J I C M I I C M I I ở đây Ik, Jk, Ik’ và
Ik” là các kênh ảnh có cùng kích thƣớc. Nhận xét nhấn mạnh là phép nâng cao
ĐTP của ảnh biến đổi từ ảnh gốc thì chƣa chắc đã là phép nâng cao ĐTP của
ảnh gốc.
1.7. Tập dữ liệu thực nghiệm
Trong thực nghiệm chúng tôi đã sử dụng đa dạng các kiểu ảnh mầu, các
kênh mầu của ảnh vệ tinh. Các ảnh đa mầu đƣợc chọn điển hình từ loại ảnh
tối, ảnh sáng, ảnh có ĐTP các kênh là thấp, ảnh có ĐTP các kênh là cao
v.v... Các ảnh có thể có độ sáng thấp và chi tiết ảnh là không quan sát đƣợc rõ
bằng mắt.
Tập ảnh mầu đƣợc dùng để thể hiện trong khuôn khổ luận án này gồm
một số ảnh mầu thƣờng đƣợc sử dụng trong các bài báo khoa học về nâng cao
ĐTP ảnh, một ảnh viễn thám 3 kênh mầu Chàm, Lục, Đỏ của ảnh vệ tinh
LANDSAT ETM+ chụp khu vực huyện Lạc Thủy Hòa Bình ngày 15/02/2001
của Việt Nam, bộ dữ liệu ảnh TID2013 thông dụng (24 ảnh tự nhiên) đƣợc
thu thập từ [61] và 03 ảnh nghệ thuật của họa sỹ Dƣơng Quốc Định (xem
phần mục lục).
Kết luận chƣơng 1
Chƣơng này trình bày tổng quan về ĐSGT, phƣơng pháp lập luận dựa
trên ĐSGT, khả năng xấp xỉ hàm của phƣơng pháp HA-IRMd, ứng dụng xấp
xỉ hàm trong xây dựng hệ luật và phƣơng pháp lập luận tối ƣu dựa trên ĐSGT
cũng nhƣ hệ tham số của phƣơng pháp lập luận tối ƣu. Cũng trong chƣơng
này trình bày tổng quan về nâng cao ĐTP ảnh, một số thuật toán tăng cƣờng
theo tiếp cận mờ, biểu diễn mờ hóa ảnh, một số thuật toán nâng cao ĐTP của
điểm ảnh cũng nhƣ toán tử tăng cƣờng. Phần tiếp theo của chƣơng này, luận
án trình bày và phân tích thuật toán nâng cao ĐTP ảnh của Cheng.
44
CHƢƠNG 2.
BIẾN ĐỔI ẢNH ĐA KÊNH VÀ XÂY DỰNG HÀM BIẾN ĐỔI CHỮ S
THEO TIẾP CẬN ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO
ĐỘ TƢƠNG PHẢN ẢNH ĐA KÊNH
Trong [17] theo tiếp cận thuật toán của Cheng, thực nghiệm lại cho
thấy nếu không thực hiện biến đổi mờ hóa ảnh trƣớc khi nâng cao ĐTP ảnh
thì độ sáng của ảnh kết quả ít thay đổi. Phép biến đổi ảnh trong [16] chỉ sử
dụng một dải động mức xám dựa trên việc khảo sát tất cả các đỉnh của lƣợc
đồ xám. Việc chỉ sử dụng một dải động mức xám sẽ không bao quát hết đƣợc
sự biến đổi của lƣợc đồ xám nên trong nhiều trƣờng hợp ảnh bị mất chi tiết.
Hơn nữa, nâng cao ĐTP ảnh nói chung đều dẫn đến thiết kế một hàm
biến đổi mức xám dạng chữ S. Trong suy diễn hệ luật mờ, việc lựa chọn hàm
thuộc để tạo ra hàm biến đổi mức xám có dạng chữ S không phải là việc dễ
dàng. Thậm chí, khi đạt đƣợc hàm biến đổi mức xám dạng chữ S thì kết quả
có thể chƣa hợp lý. Trong [17], hàm chữ S đƣợc tạo ra không cân xứng và giá
trị độ xám của điểm ảnh đầu ra có thể nằm ngoài miền giá trị độ xám, ảnh kết
quả có thể mất chi tiết.
Trong chƣơng này luận án trình bày phƣơng pháp xây dựng phép biến
đổi mờ hóa ảnh đa kênh [CT 1], [CT 4] làm bƣớc tiền đề cho quy trình nâng
cao ĐTP ảnh, để thay đổi độ sáng của ảnh và khắc phục nhƣợc điểm làm mất
chi tiết ảnh trong phƣơng pháp biến đổi ảnh của [16].
Cũng trong chƣơng này luận án trình bày phƣơng pháp xây dựng hàm
biến đổi độ xám dạng chữ S dựa trên ĐSGT [CT 5] để cải tiến thuật toán của
Cheng, ứng dụng nâng cao ĐTP ảnh đa kênh.
Để xây dựng phƣơng pháp biến đổi mờ hóa ảnh đa kênh mới, trƣớc hết
tác giả đề xuất thay thế tiếp cận của Cheng sử dụng một dải động mức xám
dựa trên lƣợc đồ xám của kênh ảnh bằng nhiều dải động mức xám ứng với
45
từng kênh ảnh dựa trên lƣợc đồ xám mờ để thiết lập tham số của phép biến
đổi mờ hóa cho từng kênh ảnh. Các tham số này thiết lập một ràng buộc tự
nhiên của các phép biến đổi mờ hóa giữa các kênh ảnh.
Sau khi biến đổi ảnh cho mỗi kênh ảnh, tác giả xây dựng một toán tử
Hint để nâng cao ĐTP của từng điểm ảnh (của kênh ảnh đã đƣợc biến đổi) so
với mức xám “trung bình” xung quanh lân cận điểm ảnh. Toán tử Hint đƣợc
xây dựng dựa trên hệ luật ngôn ngữ khá tự nhiên. Lập luận ngôn ngữ đƣợc
nhúng vào ĐSGT với phép nội suy đƣờng cong dạng hàm mũ để tạo ra giá trị
biến đổi mức xám của điểm ảnh ứng với từng kênh ảnh (kênh ảnh đã đƣợc
biến đổi bằng một biến đổi ảnh). Toán tử tăng cƣờng Hint tạo ra từ một hàm
biến đổi mức xám dạng chữ S, đối xứng thỏa mãn luật nâng cao ĐTP RCE
của Cheng và có độ nâng cao tƣơng phản tốt hơn phƣơng pháp của Cheng.
2.1. Biến đổi ảnh đa kênh
2.1.1. Ƣớc lƣợng nhiều dải động mức xám dựa vào phân cụm mờ FCM
Phân cụm mờ FCM [14] đƣợc sử dụng hiệu quả trong một số nghiên cứu
về nâng cao ĐTP của ảnh một kênh.
Trong [68] đã trình bày một cách xác định dải động của miền giá trị mức
xám bằng cách sử dụng thuật toán phân cụm mờ FCM, khi đó các cụm ảnh có
tính chất đều hơn, và do đó việc xác định dải động mức xám là tƣơng đối dễ
dàng. Ngoài ra trong [56] cũng sử dụng FCM để phân đoạn lƣợc đồ xám và
nâng cao ĐTP theo bộ phận của lƣợc đồ xám.
Để có thể ƣớc lƣợng tự động dải động mức xám cho nhiều loại ảnh khác
nhau nhƣ ảnh tối, ảnh sáng, ảnh có ĐTP thấp và ảnh có ĐTP cao, chúng tôi đề
xuất sử dụng phân cụm mờ để ƣớc lƣợng dải động của mức xám của từng
kênh ảnh của ảnh đa kênh. Lƣu ý rằng trong một số biểu diễn màu nhƣ biểu
diễn màu RGB, các kênh ảnh là không độc lập mà có độ tƣơng quan cao, vì
thế cách làm ƣớc lƣợng dải động của từng kênh ảnh độc lập là không hoàn
46
toàn phù hợp trong trƣờng hợp tổng quát. Trong kỹ thuật của tác giả, do đặc
tính của thuật toán phân cụm mờ là thích hợp cho dữ liệu đầu vào dạng vector
số nên kỹ thuật sử dụng FCM sẽ có tính khái quát cao khi áp dụng cho các
kênh ảnh có sự tƣơng quan.
Sau khi phân cụm, việc ƣớc lƣợng dải động mức xám của từng cụm sẽ
dễ dàng hơn do tính đồng nhất cao của giá trị mức xám trong một cụm.
Với một tổ hợp K kênh ảnh của ảnh I (trong một biểu diễn màu), để
thuận tiện chúng ta ký hiệu 1 2 K1,
{I , I , ..., I }K
I , sử dụng thuật toán phân cụm
mờ FCM phân cụm 1, K
I thành C cụm, C ≥ 2. Thuật toán lặp FCM cực tiểu
hóa hàm mục tiêu:
( , )J V 2
2
, ,
, 1
1,( , ) m in
C
i j c c
i j c
KI i j V
(2.1)
với độ đo khoảng cách Ơcơlit, 2
1,
1
( , ) ( ( , ) ( ))
K
c k cK
k
I i j V I i j V k
và các ràng
buộc biến nhƣ sau:
(i) i , j, c[0 ,1] ,1 c C
(ii) C
i , j, c
c 1
1, 1 i M , 1 j N
(iii) i , j , c
i , j
, 1 c C0
(2.2)
Nhƣ vậy với FCM chúng ta nhận đƣợc bảng các giá trị độ thuộc từng
cụm cho từng điểm ảnh là , ,i j c , trong đó 1≤ c ≤ C, 1 ≤ i ≤ M và 1 ≤ j ≤ N.
2.1.2. Lƣợc đồ xám mờ với phân cụm FCM
Lƣợc đồ xám của kênh ảnh đã đƣợc sử dụng để ƣớc lƣợng một dải
động mức xám [64]. Do lƣợc đồ xám của kênh ảnh có sự thay đổi hình dạng
khá phức tạp nên công việc ƣớc lƣợng dải động mức xám dựa trên lƣợc đồ
xám là không dễ dàng. Trong mục này, luận án đề xuất việc xây dựng một
công cụ, gọi là lƣợc đồ xám mờ nhằm mục đích ƣớc lƣợng các dải động mức
47
xám hiệu quả hơn sau khi đã phân cụm tổ hợp kênh ảnh đầu vào bằng thuật
toán FCM. Chi tiết của phƣơng pháp đề xuất đƣợc trình bày dƣới đây.
Định nghĩa 2.1. Lƣợc đồ xám mờ.
Giả sử , ,i j c là bảng độ thuộc thỏa mãn ở công thức (2.2), lƣợc đồ
xám mờ theo từng cụm c chiếu lên kênh Ik của ảnh I (trong một biểu diễn
màu), 1 c C, 1 k K, ký hiệu là k
ch đƣợc xác định nhƣ sau:
1 2
i,j i ,j i ,j i ,j i ,j
, , , m in , m a x
( , ) , ,. . , :
, . . .K k
k
c i j c k k
i j g g g g g g
h g g L L
(2.3)
Nhận xét:
Khi K = 1, C = L1,max – L1,min + 1 và 1 1, m in
1, m a x 1, m in , ,
1, ( , ) 11, 1,
0i j c
I i j L cc L L
Thì 1 ,m in 1
1
1 1, m in 1, m ax(g ) ( ) ,
g L Ih H is g g L L
.
Mệnh đề 2.1. Tính chất của lƣợc đồ xám mờ:
(i) k ,m in k ,m ax
1, , 1, , [L ,L ] : 0 ( ) *k
ck K c C g h g M N
(ii) k ,m in k ,m ax
1
1, , L L : ( ) is ( )k
k
c I
c C
k K g h g H g
(iii) k ,m in k ,m ax
1 , L L
1, : ( ) *k
c
c C g
k K h g M N
Chứng minh:
(i) 1 2
, , i j i j i j i j i j1 ,11 ( , ) , ,. . , :
1 1 *K k
i j c
k
c
i M j Ni j g g g g g g
h g M N
(ii)
1 2
ij ij i j i j i j
1 2 1 2
ij ij i j i j i j i j i j i j i j i j
, ,
1 1 ( , ) , ,.., :
, ,
1( , ) , ,.., : ( , ) , ,.., :
( )
1 ( )
K k
k
K k K k
C
k
c i j c
c C c i j g g g g g g
C
i j c I
ci j g g g g g g i j g g g g g g
h g
H is g
(iii) k ,m ax
k ,m in k ,m ax k ,m in
L
1 , L L L
( ) H is ( ) *k
k
c I
c C g
h g g M N
48
Nhận xét: Tính chất (ii) của mệnh đề 2.1 đã chứng tỏ lƣợc đồ xám
thông thƣờng của kênh ảnh đã đƣợc khai triển thành tổng các lƣợc đồ xám mờ
trên một kênh ảnh. Vì vậy dù mỗi lƣợc đồ xám thông thƣờng có thể có hình
dạng phức tạp, nhiều đỉnh và thung lũng (valey), nhƣng lƣợc đồ xám mờ của
một cụm chiếu trên một kênh ảnh thì có hình dạng đơn giản hơn, tập trung
quanh một đỉnh (là thành phần của tâm cụm theo mỗi kênh ảnh).
(a)
(b)
(c)
(d)
Hình 2.1 . Ảnh gốc #3(a) lƣợc đồ xám kênh R (b), giá trị độ thuộc
{i,j,4}-cụm số 4/5 (c). lƣợc đồ xám mờ kênh R, cụm số 4/5 (d).
Sau khi xác định đƣợc lƣợc đồ xám mờ bằng FCM chúng ta có thể xác
định nhiều dải động và biến đổi mờ hóa từng kênh ảnh của ảnh đa kênh.
2.1.3. Ƣớc lƣợng nhiều dải động mức xám dựa vào lƣợc đồ xám mờ
Ƣớc lƣợng từng vùng mức xám tập trung của lƣợc đồ xám mờ. Đây là
nguyên lý để xác định đƣợc nhiều dải động mức xám của một kênh ảnh của
ảnh đa kênh.
49
Thuật toán 2.1. Ƣớc lƣợng C dải động mức xám của một cụm trong
một tổ hợp kênh ảnh sử dụng lƣợc đồ xám mờ.
Đầu vào: K kênh của ảnh I (trong một biểu diễn màu), 1 K1,
{ I ,...,I }K
I ,
tham số C , 2N C
, ngƣỡng fcut (fcut > 0, đủ nhỏ), M x N là kích thƣớc của
ảnh I.
Đầu ra: 1, , 1 ,
,1 , , 2 ,,
k c k ck K c C
B B
, trong đó ,m in ,1, ,2 , ,m ax
, 1, , 1,k k c k c k
L B B L c C k K
Bƣớc 1: Phân C cụm tập vector dữ liệu 1, , 1, , 1,
( , )i M j N kk K
I i j
bằng
thuật toán FCM chuẩn ta đƣợc 1
C
c cV
,
1 , , 1 , , 1 ,, ,
i M j N c Ci j c
, theo công thức (2.2).
Bƣớc 2: Xác định lƣợc đồ xám mờ 1, , 1 ,
k
cc C k K
h
theo công thức (2.3).
Bƣớc 3: 1, , 1,k K c C
, a x
,m in ,m in
,1 , k ,m in k ,m a xm in : [L ,L ] ( ) ( )
k m
k k
LB
k k
k c c c u t c
g L g L
B B B h g f h g
,m a x , a x
,m in
, 2 , ,1 , k ,m a xm in : [B + 1 ,L ] ( ) ( )
k k m
k
L L
k k
k c k c c cu t c
g B g L
B B B h g f h g
(2.4)
Trả về: 1, , 1 ,
,1 , , 2 ,,
k c k ck K c C
B B
Thuật toán 2.1 có độ phức tạp tồi nhất là O(M*N*L), trong đó L là tham
số số lần lặp tối đa của thuật toán FCM chuẩn.
Hình 2.2. lƣợc đồ xám của kênh V, cụm số 1 ảnh #4 (C = 5), trục hoành
biểu diễn giá trị xám, trục tung biểu thị tần suất
50
2.1.4. Biến đổi kênh ảnh
Sau khi đã xác định đƣợc nhiều dải động mức xám, chúng ta có thể xây
dựng cho mỗi kênh ảnh một phép biến đổi mức xám. Các phép biến đổi giữa
các kênh có sự ràng buộc với nhau do cùng đƣợc xây dựng trên bảng ma trận
3 chiều độ thuộc đầu ra của thuật toán FCM. Chi tiết việc xây dựng các phép
biến đổi ảnh đƣợc trình bày dƣới đây.
Định nghĩa 2.2. Phép biến đổi kênh ảnh của một tổ hợp kênh trong một
biểu diễn màu của ảnh đầu vào:
Xét K kênh của ảnh I, 1 K1,
{ I ,...,I }K
I trong một biểu diễn màu, C
, 2N C
là số cụm, 1, , 1 ,
,1 , , 2 ,,
k c k ck K c C
B B
là các dải động mức xám đƣợc
xác định nhờ thuật toán 2.1.
Với mỗi 1,k K , chúng ta xác định một biến đổi Fk cho kênh ảnh Ik:
,1 ,
, m a x , m in
1 , 2 , ,1 ,
, m in
( , )
( , )
C
k k c
k k
c k c k c
k k
I i j BL L c lip
B BF i j L
C
(2.5)
, trong đó 1, , 1, , 1,k K i M j N , clip(x) = min{max{x, 0}, 1} và [x] chỉ phần
nguyên của số thực x.
Nhận xét: Biến đổi ảnh Fk bảo toàn thứ tự, nghĩa là
, m in , m a x( , ) ( ', ') ( , ) ( ', ')
k k k k k kI i j I i j L F i j F i j L
Mệnh đề 2.2. Biến đổi ảnh Fk bảo toàn thứ tự, nghĩa là
, m in , m a x( , ) ( ', ') ( , ) ( ', ')
k k k k k kI i j I i j L F i j F i j L
Chứng minh:
Clip là hàm không giảm trên đoạn [0,1] do x1 ≤ x2 0 ≤ clip(x1) ≤
clip(x2) ≤ 1, nên nếu , m in , m a x( , ) ( ', ') ( , ) ( ', ')
k k k k k kI i j I i j L F i j F i j L (đpcm).
Nhận xét: Mệnh đề 2.2 nói lên tính chất ảnh kết quả sau khi biến đổi
bảo toàn chi tiết của kênh ảnh đầu vào trong miền giá trị mức xám, không xảy
51
ra trƣờng hợp các điểm ảnh có giá trị mức xám nhỏ sau khi biến đổi ảnh lại
biến thành các điểm ảnh có giá trị mức xám lớn.
2.1.5. Nâng cao độ tƣơng phản ảnh kết hợp với biến đổi ảnh
Kỹ thuật nâng cao ĐTP ảnh màu trong biểu diễn màu HSV đƣợc thực
hiện nhƣ sau:
Đầu tiên, ảnh RGB đầu vào đƣợc chuyển sang biểu diễn HSV.
Tiếp theo, thuật toán sẽ sử dụng ảnh 2 kênh {S, V} nhƣ một ảnh 2 kênh
đầu vào để thực hiện phép nâng cao ĐTP đƣợc thực hiện theo thuật toán 2.2
nhƣ dƣới đây.
Cuối cùng, hai kênh ảnh {S, V} mới là đầu ra thu nhận đƣợc sẽ kết hợp
với kênh H gốc của ảnh đầu vào để biến đổi ngƣợc từ biểu diễn màu HSV trở
về biểu diễn màu RGB. Đầu ra của biến đổi ngƣợc HSV sang RGB là ảnh kết
quả cuối cùng đƣợc trả về.
Thuật toán 2.2 đƣợc thể hiện bằng giả mã nhƣ sau:
Thuật toán 2.2. Nâng cao ĐTP ảnh màu trong biểu diễn mầu HSV sử dụng C
dải động mức xám
Đầu vào: Ảnh màu I trong biểu diễn màu RGB, kích thƣớc MxN. Tham
số C , 2N C
, ngƣỡng fcut (fcut > 0, đủ nhỏ), d (d x d là kích thƣớc cửa sổ).
Đầu ra: Ảnh màu RGB Inew, tùy chọn trả về: CMR, CMG, CMB, Eavg, Havg
Bƣớc 1: Gọi (IH, IS, IV) là biểu diễn màu của I trong không gian màu
HSV. Lƣợng hóa để coi các kênh IS, IV nhƣ là các ảnh đa cấp xám.
Bƣớc 2: Với dữ liệu đầu vào là tổ hợp kênh (IS, IV), tham số số cụm là C
và ngƣỡng fcut, gọi thuật toán 2.1 để ƣớc lƣợng các dải động mức xám theo
kênh IS, IV. (xem công thức (2.3), (2.4) và (2.1)).
Bƣớc 3: Xác định ảnh biến đổi FS, FV của kênh IS, IV tƣơng ứng theo
công thức (2.5), định nghĩa 2.2 với các dải động mức xám đƣợc ƣớc lƣợng từ
bƣớc 2 cho mỗi kênh S và kênh V.
52
Bƣớc 4: Tính tham số của [17] cho kênh FS, FV, cụ thể là các giá trị mức
xám không thuần nhất {δS,ij}, {δV,ij}, số mũ khuếch đại {S,ij}, {V,ij} tại từng
điểm ảnh của kênh FS và kênh FV.
Bƣớc 5: Tính ĐTP và xác định kênh ảnh xám mới của kênh FS và kênh
FV, , ,
,S S n ew V V n ew
F I F I nhƣ sau:
Với kênh FS và kênh FV: Tính ĐTP
i j
S ,i j
i j
( , ) ( ),
( , ) ( )
S S
S S
F i j FC
F i j F
i j
V ,ij
i j
( , ) ( )
( , ) ( )
V V
V V
F i j FC
F i j F
Tính giá trị mức xám mới của kênh S và V:
(2.6)
S ,ij
S ,i j
S ,i j
S ,i j
S ,ij
S ,i j S ,i j S ,i j
S ,i j
S ,n e w
S ,ij
S ,i j S ,i j S ,i j
S ,i j
1,
1
I ( , ) ,
1,
1
t
t
t
t
Cg
C
i j
Cg
C
V ,ij
V ,ij
S ,i j
V ,i j
V ,ij
V ,ij V ,ij V ,ij
V ,ij
V ,n e w
V ,ij
V ,ij V ,ij V ,ij
V ,ij
1,
1
I ( , )
1,
1
t
t
t
t
Cg
C
i j
Cg
C
(2.7)
Lƣu ý ở đây kênh S đƣợc đánh chỉ số k = 1, kênh V đánh chỉ số k = 2.
Bƣớc 6: Chuyển đổi ảnh (IH, IS,new, IV,new) trong biểu diễn màu HSV về
biểu diễn màu RGB, ta đƣợc ảnh Inew.
Bƣớc 7: Tùy chọn, tính các chỉ số khách quan CM{R,G,B}, Eavg và Havg
7.1: Tính tham số của [17] cho kênh IR, IG và IB của ảnh gốc I nhƣ đã
trình bày trong mục 1.5 (xem các công thức từ (1.8) đến (1.14) với kích thƣớc
cửa sổ dxd, cụ thể là các giá trị mức xám không thuần nhất {δR,ij}, {δG,ij}, và
{δB,ij} của kênh IR, IG và IB tƣơng ứng.
7.2: Tính CMR, CMG, CMB theo công thức (1.26):
53
7.3: Tính Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công thức (1.22).
Tính Havg = Havg{Inew,R, Inew,G, Inew,B} theo công thức (1.25).
Trả về: Inew, và các tùy chọn đƣợc trả về CMR, CMG, CMB, Eavg, Havg.
Thuật toán 2.2 có độ phức tạp tƣơng đƣơng thuật toán gốc [17].
Mô hình kiến trúc hệ thống đề xuất (Hình 2.3) đƣợc xây dựng và tƣơng
tác nhƣ sau:
Hình 2.3. Lƣu đồ xử lý của thuật toán đề xuất.
2.1.6. Thử nghiệm phép biến đổi mờ hóa ảnh sử dụng thuật toán 2.2.
Trong thử nghiệm này, trên từng kênh ảnh riêng rẽ R, G và B tác giả
thực hiện phép mờ hóa bằng biến đổi S-function đƣợc xây dựng trong [16].
Tính ij, δij và ij của kênh S và kênh V
đã đƣợc biến đổi
Tính các giá trị mức xám mới của
kênh S và kênh V
Chuyển đổi ngƣợc HSV về RGB
Kết thúc
Bắt đầu
Ảnh RGB đầu vào
Chuyển đổi RGB sang HSV
Biến đổi kênh S và V
54
Khi thực nghiệm Thuật toán 2.1, chúng tôi thực hiện đồng thời cho 3
kênh ảnh R, G và B. Các tham số f1, f2 để ƣớc lƣợng khoảng động mức xám
[B1,c,k B2,c,k] của từng cụm c ứng với kênh R, G và B, tham số fcut, số cụm C
đƣợc xác định dựa trên thực nghiệm. Qua quá trình thực nghiệm, chúng tôi
lựa chọn giá trị các tham số nhƣ: fcut = 0.005, số cụm C = 5.
Bảng 2.1: So sánh giá trị Havg trên kênh R, G và B của các ảnh là kết quả
của phép mờ hóa – biến đổi ảnh.
Ảnh Havg (thuật toán [16]) Havg (thuật toán đề xuất 2.2)
#1 0.4478 0.4950
#2 0.6931 0.7879
#3 0.5736 0.7200
#4 0.5822 0.7624
#5 0.6227 0.8157
#6 0.3374 0.3512
Bảng giá trị trên cho chúng ta thấy độ không chắc chắn của phép mờ
hóa sử dụng nhiều dải động mức xám của thuật toán đề xuất 2.2 cao hơn so
với phƣơng pháp sử dụng một dải động mức xám của [16]. Điều này cũng
phù hợp với trực quan khi quan sát các ảnh mờ hóa minh họa của #1 và #2.
(a)
(b)
Hình 2.4. Ảnh mờ hóa của #1 sử dụng [16] (a), sử dụng thuật toán 2.2 (b).
Trên hình ảnh mờ hóa của ảnh #1 sử dụng biến đổi của [16] (hình 2.4a),
chúng ta thấy rõ chi tiết ảnh ở các vùng đƣợc đánh dấu hình chữ nhật là bị
55
mất, trong khi đó ảnh biến đổi sử dụng thuật toán đề xuất 2.2 chi tiết ảnh đƣợc
giữ tốt hơn.
Quan sát các kênh G và B của ảnh biến đổi của ảnh #2 sau đây ta cũng
thấy độ chi tiết của ảnh biến đổi đối sử dụng [16] cũng bị suy giảm nhiều hơn
biến đổi ảnh dựa trên thuật toán 2.2 đã đề xuất.
(a)
(b)
Hình 2.5. Kênh B của ảnh biến đổi sử dụng [16] (a), sử dụng thuật toán (b).
(a)
(b)
Hình 2.6. Sử dụng biến đổi ảnh [16] cho ảnh #3(a), #5 (b).
Trên hình 2.6, các ảnh kết quả minh họa sử dụng [16] bị mất chi tiết
ảnh, xem ở các vùng chữ nhật đánh dấu.
56
Hình 2.7. Phép mờ hóa, cột bên trái [16], cột bên phải sử dụng thuật toán 2.2
57
2.2. Thiết kế hàm biến đổi độ xám dạng chữ S với tiếp cận mờ
Những tiếp cận sử dụng logic mờ để nâng cao ĐTP ảnh nói chung đều
dẫn đến thiết kế một hàm biến đổi mức xám dạng chữ S [16, 23, 67]. Hàm
liên tục đơn điệu tăng, giảm giá trị đầu vào khi đầu vào dƣới ngƣỡng, và
ngƣợc lại tăng giá trị đầu vào khi đầu vào ở trên ngƣỡng [68].
(a) Toán tử NINT [23]
(b) Đồ thị của hàm biến đổi mức xám
sinh bởi hệ luật mờ if-then [68]
(c) Đồ thị biến đổi mức xám của
[16]
(d) Ảnh kết quả sử dụng suy diễn luật
if-then [68] cho ảnh #5 (Phụ lục C)
Hình 2.8. Dạng hàm biến mức xám chữ S trong các phép NCĐTP.
(a) Ảnh gốc
(b) Ảnh kết quả sinh bởi toán tử tăng
cƣờng mờ [68]
58
(c) Dạng hàm biến đổi
(d) Ảnh gốc
(e) Kết quả sinh bởi toán tử tăng
cƣờng mờ [68]
(g) Dạng hàm biến đổi
Hình 2.9. Một số thử nghiệm nâng cao ĐTP cho ảnh mầu tiếp cận sử dụng
toán tử tăng cƣờng mờ [68]
2.2.1. Đánh giá việc xây dựng hàm biến đổi mức xám dạng chữ S
Việc chọn hàm thuộc trong suy diễn hệ luật mờ để tạo ra hàm biến đổi
mức xám dạng chữ S không phải là việc dễ dàng.
Xét hệ luật mờ
R1: If luminance in is dark then luminance out is darker
R2: If luminance in is bright then luminance out is brighter
R3: If luminance in is gray then luminance out is gray
Sử dụng bộ công cụ FIS của mathlab, chúng ta thu đƣợc kết quả sau:
59
(a) (b)
Hình 2.10. Hàm thuộc của 3 tập mờ dark, bright, gray (a) và của tập
mờ darker, brighter (b).
(a) Ảnh gốc (b) Ảnh kết quả sinh bởi luật if-then
R1,R2 và R3
(c) Dạng hàm biến đổi
Hình 2.11. Nâng cao ĐTP với suy diễn luật mờ if-then (a), luật mờ nâng
cao ĐTP (b) .
60
Ngay cả với việc đạt đƣợc hàm biến đổi mức xám có dạng chữ S thì kết
quả lập luận mờ của hệ luật {R1, R2 và R3} sử dụng các tập fuzzy có thể cho
kết quả chƣa hợp lý, nhƣ ví dụ thiết kế các hàm thuộc sau:
(a)
(b)
Hình 2.12.(a) Hàm thuộc của tập mờ dark, bright, gray và (b) hàm thuộc
của tập mờ darker, brighter.
(a) Ảnh gốc
(b) Ảnh kết quả sinh bởi luật
{R1,R2,R3}
(c) Dạng hàm biến đổi
Hình 2.13. Các hàm thuộc đƣợc thiết kế đã tạo ra hàm biến đổi hình chữ S.
Trong hình 2.13 b vùng đánh dấu chữ nhật cho thấy có hiện tƣợng nâng
cao quá mức (over-enhancement).
61
Trong phần tiếp theo tác giả sẽ đề xuất phƣơng pháp thiết kế hàm biến
đổi có đồ thị dạng chữ S (kiểu nhƣ S-function) sử dụng tiếp cận ĐSGT ứng
dụng cho việc nâng cao ĐTP theo phƣơng pháp trực tiếp.
2.2.2. Xây dựng toán tử tăng cƣờng dựa trên đại số gia tử
Định nghĩa 2.3. Bộ 3 (AX, AY, F) gọi là HA-intensification nếu:
(i) AX = (X, C, w, H, ), AY = (Y, C, w, H, ) với Dom(X) Dom(Y),
C = {c–, c
+}, c
– = low, c
+ = high, H = H
-H
+, H
- = {little}, H
+ = {very}, =
fm(c-), 1 - = fm(c
+), X = X(little), X = 1 - X = X(very), Y = Y(little),
Y = 1 - Y = Y(very), , X, Y [0,1], vX, vY là hàm định lƣợng ngữ nghĩa
của ĐSGT trên X và Y tƣơng ứng.
(ii) ( . o w )
1( o w )
Y
X
v v l
v l
(iii) Hàm F: [0,1][0,1] đơn điệu tăng thực sự, liên tục (suy ra hàm
ngƣợc của F cũng đơn điệu tăng thực sự, liên tục) và tăng tại ngƣỡng .
R1: Nếu x là 0 thì y là 0
R2: Nếu x là c- thì y là very c
-
R3: Nếu x là W thì y là W
R4: Nếu x là c+ thì y là very c
+
R5: Nếu x là 1 thì y là 1
Diễn giải trong miền giá trị số: (a) và (b) tƣơng đƣơng với:
F(0) = 0, F() = , F(1) = 1.
F(vX(c-)) = vY(v.c
-), tƣơng ứng F(vX(low)) = vY(v.low)
F(vX(c+)) = vY(v.c
+), tƣơng ứng F(vX(hight)) = vY(v.high)
Suy ra: 2
X YF ,
21 1 1 1
X YF
(c) tƣơng đƣơng với
( ) , : 0
( ) , : 1
F t t t t
F t t t t
62
Nhận xét:
(i) = X = Y = 0.5 X = Y = 0.5,
m =
2( e r o w )
0 .5( o w )
Y Y
X X
v v y l
v l
, FINT, ở đó
2
2
2 , 0 0 .5
( )
1 2 1 , 0 .5 1
s s
s
s s
x x
IN T x
x x
thì (AX, AY, INT) là một HA-intensification.
(ii) Khi m =
2
,Y
Y X
X
thì một hàm bậc 2, F có đồ thị là parabol đi qua 3 điểm (0; 0), (X, 2
Y), (,
) thì bộ 3 (AX, AY, F) không là HA-intensification.
Chứng minh:
( ) (1 ) ( ) , 0s
s s X s
X
xF x m x m x
F(0)=0. Do X =1-X, nên 2
X YF , F()=.
Do 2
,Y
Y X X
X
m
, nên F(xs) < 0 với ( )
01
X
s
mx
m
vậy (AX, AY, F) không là một HA-intensification.
Từ nhận xét trên ta thấy trong trƣờng hợp tổng quát không thể dùng S-
function để xây dựng một HA-intensification.
Mệnh đề 2.3: (AX, AY, F) là một HA-intensification, với F đƣợc xác
định nhƣ sau:
m =2
( e r o w )1
( o w )
Y Y
X X
v v y l
v l
( ) , 0( )
1 (1 ), 1
s s
s
s s
g x xF x
g x x
với hàm g(xs) xác định: 2
ax( ) , 0
ax
s
s s
s s
g x xx
ở đây
1
1
x
X
ma
m
Chứng minh:
63
0 , 0
( ) .0
1
s
s s s
s
x
ag x x x
ax
Dễ thấy g(0) = 0, 2
X Yg , g() = và g đơn điệu tăng trên đoạn [0,
], từ đó suy ra (AX, AY, F) là một HA-intensification.
Chúng ta sẽ thấy nhƣ dƣới đây ĐSGT có thể thiết kế rất nhanh chóng
toán tử tăng cƣờng dạng HA-intensification với một hàm biến đổi mức xám
dạng chữ S đơn giản cho hệ luật mờ:
R1: If luminance in is dark then luminance out is very dark
R2: If luminance in is bright then luminance out is very bright
R3: If luminance in is gray then luminance out is gray
Thật vậy, hệ luật R1-R3 của lập luận sử dụng tập mờ trên có thể xem
tƣơng ứng với 5 luật R1-R5 trong định nghĩa của toán tử HA-intensification.
Trên từng kênh ảnh Ik {R, G, B} của ảnh mầu RGB gốc, chúng ta thiết lập 2
ĐSGT AL1và AL2 nhƣ sau:
ALk,1= (Lk,1, C, w, H, ), AL2 = (Lk,2, C, w, H, ) với Dom(Lk,1)
Dom(Lk,2), C = {c–, c
+}, c
– = dark, c
+ = bright, H = H
-H
+, H
- = {little}, H
+
= {very}, k = fm(c-), 1 - k = fm(c
+), Lk,1 = L1(little), Lk,1 = 1 - Lk,1 = Lk,1
(very), Lk,2 = Lk,2(little), Lk,2 = 1 - Lk,2 = Lk,2(very), k, Lk,1, Lk,2 [0,1].
Thử nghiệm với Lk,1 = 0.4, Lk,2 = 0.4, k là ngƣỡng Otsu của kênh ảnh Ik.
Hàm Fk: [0,1] [0,1] ở đây sẽ sử dụng hàm tuyến tính từng khúc, có
đồ thị đi qua các mốc nội suy (0, 0), (k, k), (1, 1), (vIk,1(dark), vIk,2(V.dark)),
và (vIk,1(bright), vIk,2(V.bright))
Điều đặc biệt ở đây là đồ thị biến đổi là dạng chữ S đối xứng, điều này
khác biệt cơ bản với các đồ thị sinh bởi lập luận mờ sử dụng tập mờ nhƣ đã
trình bày ở Hình 2.16 và Hình 2.17.
64
(a) Ảnh kết quả phép nội suy HA-
IRMd cho ảnh #1
(b) Đồ thị hàm biến đổi mức xám kiểu
chữ S và đối xứng
Hình 2.14. Phép NCĐTP sử dụng HA-IRMd cho hệ luật {R1 -R5}
Định lý 2.1. Hint (về toán tử Hint)
m =
2( . o w )
1( o w )
Y Y
X X
v v l
v l
,
( , , )( ) , 0in t( )
1 (1 , , )(1 ), 1
c X s s
s
c X s s
g m x xH x
g m x x
(2.8)
với hàm gc(, X, m) (xs) xác định nhƣ sau:
=(X,m) =
1 1 1lo g lo g lo g
1 1 1
1 1 1lo g lo g lo g
1 1 1
X X X
X X X
X X X
X X X
m m m
m m m
,
1-+
( )
-1
+
s
s ss
c s
s ss
s
x
x xxg x
x xx
x
, 0s
x
(2.9)
hay ( )
( )
c s s
c s s
g x x
g x x
, 0s
x ,
Khi đó (AX, AY, Hint) là một HA-intensification, ngoài ra Hint thỏa
mãn:
[ , ]( 0 , ]
in t( ) in t( )a x m in
XX
s s
s s
H x H xm m
x x
, [ ,1 ][ , ]
1 in t(1 ) 1 in t(1 )a x m in
1 1XX
s s
s s
H x H xm m
x x
65
Hình 2.15: trƣờng hợp = 0.6;
x = 0.6 > m = 0.4.
Hình 2.16: trƣờng hợp = 0.6;
x= 0.5 < m = 0.8.
Chứng minh: xem phụ lục.
Nhận xét: Tham số X biểu diễn định lƣợng ngữ nghĩa của biến đầu vào
low thƣờng lấy trong khoảng [0.3, 0.7], khi X = m thì AX đồng nhất AY.
Các hàm g, gc ở Mệnh đề 2.3 và Định lý 2.1 đều thỏa các tính chất sau:
(i) Đơn điệu tăng, khả vi liên tục trên [0,1]
(ii) g(, X, m)(0) = 0, g(, X, m)() = ,
g(, X, m)( X) = mX
0 g(, X, m)(xs) xs, 0 xs .
(iii) g(, X, m1)(xs) g(, X, m2)(xs), 0 xs , 0 < m1 m2 <
[ , ]( 0 , ]
( , , ) ( ) ( , , ) ( )a x m in
XX
X s X s
s s
g m x g m xm m
x x
Hình 2.17. So sánh đồ thị của hàm biến đổi Cheng và Hint giữa mức xám đầu
vào-đầu ra đã chuẩn hóa về đoạn [0,1], độ sáng xung quanh = 0.6, βX = 0.6,
= 0.5, t = 0.5
66
Nhận xét: Phép nâng cao ĐTP theo công thức (2.7) thỏa mãn luật RCE
Phần tiếp theo tác giả đề xuất hai thuật toán để áp dụng toán tử tăng
cƣờng HINT để nâng cao ĐTP cho ảnh đa kênh. Chi tiết của thuật toán đƣợc
thể hiện nhƣ sau
Thuật toán 2.3: Nâng cao ĐTP ảnh đa kênh I = {I1, … IK} sử dụng Hint
Đầu vào: K kênh của ảnh I (trong một biểu diễn màu), 1 K1,
{I , ..., I }K
I ,
tham số C , 2N C
, M x N là kích thƣớc của ảnh I, 1 ... K, các tham số của
ĐSGT
Đầu ra: Ảnh I’ = {I’1, … IK
’}
Bƣớc 1: Phân ảnh I = {I1, … IK} thành C cụm sử dụng thuật toán phân
cụm FCM
Bƣớc 2: Tính lƣợc đồ xám mờ của từng kênh ảnh Ik, k = 1 … K sử dụng
công thức (2.3)
Bƣớc 3: Tính độ xám nâng cao trong đoạn [0, 1]
i j
1
1
2 1'
k ,i j i j ,c i j
m in a x , 0 ,1
in t , ,
N Cck
c
ck c k
X
lm
g HC
B
B B
(2.10)
Bƣớc 4: Kết thúc, trả lại ảnh nâng cao { '
k ,ijg * (Lk, max – Lk, min) + Lk, min,
1 ≤ k ≤ K }
Ở đây, ta đánh giá độ phức tạp theo kích thƣớc MxN của ảnh đầu vào.
Các yếu tố khác tham gia vào độ phức tạp của thuật toán nhƣ số cụm NC
đƣợc coi là hằng số. NK là số lần lặp của thuật toán lặp FCM chuẩn thì thuật
toán FCM có độ phức tạp là Ο(MN). Phép tính lƣợc đồ xám mờ của 3 kênh
ảnh R,G và B của ảnh đầu vào có độ phức tạp là O(MN). Phép tính giá trị
mức xám mới sử dụng biến đổi Hint có độ phức tạp là O(MN). Vậy độ phức
tạp thuật toán là O(MN).
67
2.2.3. Thực nghiệm
Khi thực nghiệm Thuật toán 2.3, chúng tôi chọn các tham số nhƣ sau:
- Các tham số f1, f2, fcut, số cụm C đƣợc lựa chọn bằng thực nghiệm,
giống nhƣ trong phần xây dựng phép biến đổi ảnh (phần 2.1.6): fcut = 0.005, số
cụm C = 5.
- Tham số kích thƣớc cửa sổ Wij tại điểm ảnh (i, j) dij = 3, tƣơng tự nhƣ
phƣơng pháp của Cheng.
- Tham số ĐSGT 1 ... K, với K là số kênh ảnh I, đƣợc chúng tôi lựa
chọn bằng kinh nghiệm của ĐSGT, thƣờng lấy trong đoạn [0.3, 0.7]. Trong
thực nghiệm này 1 =... = K = 0.6.
Để đảm bảo tính khách quan trong việc đánh giá hiệu quả của thuật
toán để xuất, ngoài đánh giá bằng trực quan, chúng tôi sử dụng các chỉ số
khách quan nhƣ chỉ số entropy, chỉ số fuzzy entropy (công thức 1.22 và công
thức 1.25, phần 1.6, chƣơng 1) và đề xuất sử dụng chỉ số ĐTP trực tiếp (công
thức 1.26, phần 1.6, chƣơng 1).
Kết quả các chỉ số Eavg, Havg, CM của thuật toán đề xuất khi thực hiện
trên 6 ảnh #1 - #6 (Phục lục C) và thuật toán gốc đƣợc đƣa ra trong Bảng 2.2
Bảng 2.2: Bảng kết quả so sánh các chỉ số khách quan giữa thuật toán
trong [17] và thuật toán đề xuất
Image CMR CMG CMB Eavg Havg
[17] Đề
xuất [17]
Đề
xuất [17]
Đề
xuất [17]
Đề
xuất [17]
Đề
xuất
#1 0.1292 0.3067 0.2011 0.4422 0.2550 0.5537 6.0405 6.7621 0.3523 0.4966
#2 0.0166 0.0503 0.0208 0.0982 0.0361 0.0579 7.3196 7.3506 0.8212 0.7707
#3 0.0175 0.0602 0.0209 0.0988 0.0566 0.1491 7.4822 7.6852 0.7999 0.7935
#4 0.0305 0.1002 0.0370 0.1464 0.0598 0.1876 7.4586 7.8066 0.8635 0.7929
#5 0.0179 0.0909 0.0315 0.1741 0.0368 0.1973 7.3038 7.6426 0.8519 0.8419
#6 0.0305 0.0373 0.0338 0.0441 0.0410 0.0548 3.5482 3.7398 0.2850 0.2923
68
Tƣơng tự, ảnh kết quả thực nghiệm của thuật toán [17] và thuật toán đề
xuất cho 6 ảnh #1 - #6 (Phục lục C) nhƣ trong các Hình 2.18 đến Hình 2.2:
Hình 2.18: Kết quả của [17] cho ảnh
#2
Hình 2.19: Kết quả của Hint sử
dụng FCM 5 cụm
Hình 2.20: Kết quả sử dụng Curvelet
[67]
Hình 2.21: Kết quả sử dụng Hint
với FCM 5 cụm
Qua Bảng 2.2 và Hình 2.18- Hình 2.21 là kết quả thực nghiệm của các
ảnh #1 - #6 đã thể hiện các chỉ số khách quan ĐTP trực tiếp trên từng kênh R,
G và B khi sử dụng thuật toán 2.3 đều cho kết quả cao hơn khi sử dụng thuật
toán [17]. Chỉ số khách quan Eavg khi áp dụng thuật toán 2.3 cũng cao hơn so
với áp dụng thủ tục 1. Cũng vậy, chỉ số khách quan Havg khi áp dụng thuật
toán 2.3, ngoài ảnh #1, đều có giá trị nhỏ hơn so với chỉ số ảnh kết quả khi áp
dụng thủ tục 1.
Bảng 2.3 là kết quả thử nghiệm so sánh phƣơng pháp của Cheng và Hint
trên 3 ảnh #1, #2, #6 và tập ảnh TID2013 (tác giả đã gộp cả ảnh #3 - #5 là ảnh
của TID2013).
69
Bảng 2.3. So sánh kết quả phép nâng cao ĐTP ảnh mở rộng của Hint (%) và
của Cheng áp dụng cho ảnh mầu RGB và HSV
Imag
e
CM Eavg Havg
R G B
RGB HSV RGB HSV RGB HSV RGB HSV RGB HSV
#1 09.38 144.24 06.02 072.19 04.14 062.04 2.27 12.23 2.410 34.13
#2 05.23 444.51 03.59 023.92 05.66 237.96 0.31 1.56 0.360 08.91
#3 05.97 185.63 06.57 163.06 12.30 142.50 1.20 9.96 1.460 15.17
I01 12.36 175.65 04.98 173.21 09.08 185.46 0.35 7.68 0.340 16.13
I02 11.70 304.68 03.89 198.28 02.99 118.42 4.95 7.24 0.050 01.36
I03 05.24 352.98 02.70 243.28 07.81 062.99 0.34 1.53 0.001 04.39
I04 02.48 457.80 03.88 425.58 05.00 491.01 0.01 5.93 0.110 09.16
I05 11.71 101.72 08.36 102.86 10.09 072.35 0.78 0.89 0.000 07.88
I06 01.67 198.47 01.37 159.40 12.16 115.31 0.45 1.58 0.610 09.12
I07 03.62 116.22 05.02 092.22 05.16 108.18 0.16 2.28 0.340 03.89
I08 17.42 111.34 01.34 114.43 08.58 171.62 0.25 0.03 1.100 09.81
I09 03.91 274.68 07.47 353.12 04.55 479.77 0.51 3.63 0.670 11.28
I10 08.97 438.25 08.66 432.32 07.87 806.81 0.62 4.61 0.980 08.05
I11 05.16 088.11 04.40 064.89 06.26 55.12 0.42 2.19 0.170 06.96
I12 09.05 365.97 07.43 609.36 09.92 400.39 0.71 3.68 0.290 05.83
I13 18.81 015.48 15.23 009.61 13.65 008.90 0.90 1.60 1.650 11.27
I14 02.54 232.72 08.37 220.46 05.77 141.94 0.32 0.56 0.360 07.07
I15 05.81 238.98 07.29 113.66 05.63 249.31 1.62 2.53 0.180 07.31
I16 07.75 248.07 07.60 272.16 09.37 376.76 1.04 5.59 1.010 07.84
I17 03.73 244.41 04.94 194.51 04.97 227.00 0.90 4.26 0.080 08.00
I18 11.00 148.29 09.46 119.31 06.63 088.34 1.41 2.11 0.120 04.16
I19 02.45 051.31 05.31 094.55 13.92 079.52 0.55 0.77 0.630 05.21
I20 10.32 360.89 04.92 365.57 00.71 402.51 0.00 2.32 0.130 01.82
I21 84.39 253.75 37.57 245.56 62.67 257.56 2.50 2.29 9.760 08.42
I22 07.99 198.12 04.73 240.05 05.40 274.03 0.16 0.37 0.770 16.00
I23 01.58 768.02 07.18 775.61 09.53 400.49 0.37 0.57 0.180 10.15
I24 08.97 100.52 06.18 140.23 06.27 280.08 1.00 5.07 0.630 08.16
Mean 10.341 245.215 6.716 222.941 9.485 233.199 0.843 3.230 -0.550 -5.413
70
Kết quả thực nghiệm với tập dữ liệu là 27 ảnh trên là những ảnh mầu có
độ sáng cao hoặc có ĐTP thấp nhƣ đã đề cập ở trên trong biểu diễn mầu RGB
và biểu diễn mầu HSV. Kết quả thực nghiệm đƣợc đánh giá bằng các chỉ số
khách quan CM, Eavg, Havg nhƣ Bảng 2.3. Kết quả bảng này cho thấy tỷ lệ
phần trăm số ảnh có chỉ số khách quan thuận lợi khi sử dụng toán tử Hint lớn
hơn khi sử dụng phƣơng pháp của Cheng 96% trong ba cột đầu, 100% trong
hai cột tiếp theo, 89% cho hai cột kết tiếp và 67% cho cột cuối cùng. Điều này
chứng minh rằng toán tử Hint tốt hơn phƣơng pháp của Cheng.
2.2.4. So sánh với kết quả của các phƣơng pháp gián tiếp
Để làm rõ hơn hiệu quả của toán tử Hint, tác giả so sánh kết quả thuật
toán nâng cao ĐTP ảnh áp dụng toán tử Hint với 5 phƣơng pháp nâng cao
ĐTP gián tiếp gần đây nhƣ ESIHE [42], RICE [43], GHMF [44] and ROHIM
[45]. Dữ liệu ảnh thực nghiệm vẫn gồm 27 ảnh và các chỉ số đánh giá khách
quan nhƣ chỉ số Eavg và chỉ số Havg, giống nhƣ phần trên. Kết quả nhƣ sau:
Bảng 2.4: Giá trị chỉ số Eavg và Havg của ảnh đầu ra khi áp dụng Hint và
bốn phƣơng pháp gián tiến của 27 ảnh trong biểu diễn mầu HSV, trong đó các
giá trị tốt nhất đƣợc in đậm
Imag
e
ID
Ra
w
ima
ges Eavg Havg Hint\
GHMF
(Havg) ESIHE RICE GHMF ROHIM Hint ESIHE RICE GHMF ROHIM Hint
#1 5.9395 6.6176 5.1207 6.7002 5.3846 6.6628 0.5211 0.2793 0.4523 0.6478 0.4574 -0.0051
#2 7.3154 7.4691 7.4358 7.1781 6.8435 7.4364 0.7946 0.7659 0.7019 0.5866 0.7479 -0.0460
#6 3.4443 3.4886 3.6743 3.2663 3.4442 4.1248 0.2632 0.2240 0.1636 0.3339 0.3288 -0.1652
I01 7.2409 7.5023 7.4543 7.6470 7.2075 7.8945 0.8007 0.8502 0.7129 0.8529 0.7453 -0.0324
I02 7.0231 6.9740 7.1843 6.7369 6.2869 7.5610 0.8248 0.6791 0.5130 0.5165 0.7330 -0.2200
I03 7.4847 7.4876 7.4834 7.2844 6.8306 7.6009 0.7554 0.7444 0.7042 0.5790 0.7643 -0.0601
I04 7.3092 7.4382 7.5612 7.1560 6.8622 7.7425 0.7876 0.8091 0.7627 0.5902 0.7734 -0.0107
I05 7.5728 7.6214 7.5884 7.2797 7.1495 7.6645 0.7343 0.6616 0.6163 0.6613 0.6707 -0.0544
I06 7.6130 7.7328 7.6934 7.4857 7.4825 7.7575 0.7258 0.7621 0.7238 0.7187 0.7286 -0.0048
I07 7.4536 7.5746 7.5646 7.3305 7.2661 7.6393 0.8095 0.8124 0.7817 0.7439 0.8285 -0.0468
I08 7.6508 7.7452 7.6566 7.4656 7.3609 7.6859 0.7252 0.7236 0.6881 0.7051 0.6980 -0.0099
I09 7.4954 7.6984 7.6397 7.4251 7.4188 7.7932 0.7597 0.8545 0.8034 0.8079 0.7843 0.0191
I10 7.3664 7.6917 7.5409 7.8570 7.1014 7.7312 0.7941 0.8718 0.7167 0.7065 0.8282 -0.1115
71
I11 7.3929 7.5068 7.4247 7.1441 7.2649 7.5803 0.7489 0.7069 0.6685 0.8193 0.7130 -0.0445
I12 7.4530 7.5553 7.5594 7.3350 7.2926 7.7387 0.7690 0.7879 0.7145 0.7896 0.7732 -0.0587
I13 7.5329 7.6081 7.6283 7.3750 7.3116 7.6849 0.7528 0.7501 0.7081 0.7788 0.7076 0.0005
I14 7.6961 7.7429 7.7889 7.5014 7.3843 7.7615 0.7521 0.7566 0.7024 0.6611 0.7468 -0.0444
I15 7.1638 7.3422 7.0858 6.7842 6.7314 7.3635 0.7224 0.5729 0.5075 0.7503 0.5981 -0.0906
I16 7.2633 7.5921 7.4561 7.8294 7.1905 7.6884 0.8147 0.8800 0.7290 0.8702 0.8417 -0.1127
I17 7.3354 7.3672 7.4038 7.7182 7.2719 7.6628 0.7002 0.6666 0.6439 0.7852 0.6816 -0.0377
I18 7.1717 7.4235 7.2446 6.8988 7.0403 7.3641 0.7904 0.6570 0.5954 0.8565 0.7002 -0.1048
I19 7.7222 7.8068 7.7969 7.5689 7.5784 7.7948 0.7692 0.7851 0.7580 0.7624 0.7860 -0.0280
I20 6.3135 6.3247 6.1416 5.7374 6.2451 6.2145 0.4733 0.4089 0.3367 0.4544 0.4429 -0.1062
I21 7.3067 7.5464 7.4677 7.2190 7.2245 7.5102 0.7913 0.8416 0.8111 0.8177 0.7996 0.0115
I22 7.4309 7.6705 7.6164 7.3454 7.3408 7.4774 0.7343 0.8006 0.7598 0.7919 0.7130 0.0468
I23 7.7178 7.7288 7.7859 7.5482 7.5328 7.6828 0.7451 0.7528 0.6995 0.7170 0.7194 -0.0199
I24 7.0790 7.3761 7.3259 7.7730 7.0280 7.4819 0.7726 0.8358 0.7264 0.8808 0.8100 -0.0836
Từ Bảng 2.4 ta thấy, phƣơng pháp của Hint có 17/27 ảnh đầu ra (tƣơng
ứng 63%), có giá trị Eavg cho kết quả thuận lợi. Tƣơng tự, giá trị Eavg cho kết
quả thuận lợi của các phƣơng pháp còn lại lần lƣợt là: ESIHE có 02/27 ảnh
(tƣơng ứng 7,4%), phƣơng pháp RICE có 03/27 ảnh (tƣơng ứng 11,1%),
phƣơng pháp GHMF có 04/27 ảnh (tƣơng ứng 14,3%), trong khi phƣơng pháp
ROHIM không cho kết quả nào.
Cũng từ Bảng 2.4 ta thấy, phƣơng pháp của GHMF có 16/27 ảnh đầu ra
(tƣơng ứng 59,3%), có giá trị Havg cho kết quả thuận lợi. Tƣơng tự, giá trị Havg
cho kết quả thuận lợi của các phƣơng pháp còn lại lần lƣợt là: ESIHE có
02/27 ảnh (tƣơng ứng 7,4%), phƣơng pháp RICE có 01/27 ảnh (tƣơng ứng
3,7%), phƣơng pháp ROHIM có 06/27 ảnh (tƣơng ứng 22,2%), trong khi
phƣơng pháp Hint có 02/27 ảnh (tƣơng ứng 7,4%).
Tuy nhiên, vì chỉ số Havg là giá trị toàn cục nên việc giảm giá trị của
Havg không phải lúc nào cũng đồng nghĩa với chất lƣợng ảnh đầu ra cao hơn,
điều này phụ thuộc vào tiêu chí thị giác của mắt ngƣời. Trên thực tế, hầu hết
các giá trị Havg của ảnh đầu ra theo phƣơng pháp GHMF nhƣ trong Bảng 2.4
là thuận lợi. Vì vậy, chúng tôi chọn giá trị Havg của ảnh đầu ra theo phƣơng
pháp Hint so sánh với phƣơng pháp GHMF, trong cột “Hint \ GHMF”.
72
Vì giới hạn không gian trình bày của luận án, chúng tôi lựa chọn hai
ảnh I02 và I24, là ảnh đầu tiên có giá trị Havg khác nhau giữa Hint và GHMF
lớn nhất đạt 0.22 và đạt trung bình0.0836, nằm trong khoảng [0.22,
0.0468] và ảnh I10 có giá trị Havg tốt nhất khi sử dụng toán tử ROHIM trong
[45], ảnh này giá trị Havg khác nhau giữa Hint và GHMF là - 0.1115, nằm
trong khoảng [0.2165,0.0051], nghĩa là ở mức độ trung bình. Đồng thời, giá
trị Eavg của ảnh I02 đạt 0.5130, của ảnh I24 đạt 0.7264 với phƣơng pháp
GHMF và giá trị Eavg của ảnh I10 đạt 0.7065 với phƣơng pháp ROHIM là các
giá trị tốt nhất trong số các trƣờng hợp còn lại để minh họa.
Ảnh gốc I02, I10 và I24 và các ảnh kết quả đầu ra tƣơng ứng của chúng
đƣợc trình bày trong Hình 2.22 – Hình 2.24. Theo nhận thức thị giác của con
ngƣời, ta thấy mầu sắc của các ảnh đầu ra của toán tử Hint trong hình Hình
2.22 – Hình 2.24 tự nhiên hơn và chi tiết hơn so với ảnh đầu ra của các toán
tử còn lại.
(a) Ảnh gốc I02
(b) ESIHE [ID1],
Havg = 0.8248
(c) RICE [ID4],
Havg = 0.6791
(d) GHMF [ID3]
Havg = 0.7042
(e) ROHIM [ID2]
Havg = 0.5790
(f) Hint,
Havg = 0.7330
Hình 2.22. Ảnh đầu ra của ảnh gốc I02 trong tập dữ liệu ảnh TID2013 là kết
quả của các toán tử đƣợc quan sát bằng mắt ngƣời
73
(a) Ảnh gốc I10
(b) ESIHE, Havg = 0.7941
(c) RICE, Havg = 0.8718
(d) GHMF, Havg = 0.7167
(e) ROHIM, Havg = 0.7065
(f) Hint, Havg = 0.8282
Hình 2.23. Ảnh đầu ra của ảnh gốc I10 trong tập dữ liệu ảnh TID2013 là kết
quả của các toán tử đƣợc quan sát bằng mắt ngƣời
(a) Ảnh gốc I24
(b) ESIHE, Havg = 0.7726
(c) RICE, Havg = 0.8358
(d) GHMF, Havg = 0.7264
(e) ROHIM, Havg = 0.8808
(f) Hint, Havg = 0.8100
Hình 2.24. Ảnh đầu ra của ảnh gốc I24 trong tập dữ liệu ảnh TID2013 là kết
quả của các toán tử đƣợc quan sát bằng mắt ngƣời
Từ các Hình 2.22 đến Hình 2.24 ta thấy ảnh đầu ra của toán tử Hint có
mầu sắc tƣơi và rõ ràng hơn so với các toán tử còn lại. Ngoài ra nhiều chi tiết
74
của ảnh đầu ra theo toán tử Hint cũng là rõ ràng hơn, đặc biệt tập trung vào
các khu vực đánh dấu của các ảnh trong hình. Có thể thấy rằng phƣơng pháp
đề xuất có thể có một số điểm mạnh của các phƣơng pháp tƣơng ứng. Điều
này cho thấy Hint, là một phƣơng pháp trực tiếp và có kỹ thuật mới thực sự
có thể đạt đƣợc sự cân bằng giữa các đặc điểm toàn cục và cục bộ khi thay đổi
ĐTP điểm ảnh của ảnh.
Hiệu quả của toán tử Hint so với các phƣơng pháp tƣơng ứng đã phân
tích ở trên cho thấy ƣu điểm của phƣơng pháp đề xuất.
(a) Ảnh gốc (b) ESIHE (c) RICE
(d) GHMF
(e) ROHIM
(g) Hint đề xuất
Hình 2.25. Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc Định sử
dụng các thuật toán gián tiếp và Hint
(a) Ảnh gốc
(b) ESIHE
(c) RICE
75
(d) GHMF
(e) ROHIM
(g) Hint đề xuất
Hình 2.26. Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc
Định sử dụng các thuật toán gián tiếp và Hint
(a) Ảnh gốc
(b) ESIHE
(c) RICE
(d) GHMF
(e) ROHIM
(g) Hint đề xuất
Hình 2.27. Kết quả nâng cao ảnh nghệ thuật của Họa sỹ Dƣơng Quốc Định
sử dụng các thuật toán gián tiếp và Hint
2.3. Kết quả khác
Tác giả cũng đã ứng dụng lƣợc đồ xám mờ để cài đặt một thuật toán
tƣơng tự phép cân bằng lƣợc đồ xám cổ điển.
Thuật toán 2.4. Mở rộng thuật toán HEQ cho ảnh đa kênh sử dụng lƣợc đồ
xám mờ.
76
Đầu vào: K kênh của ảnh I (trong một biểu diễn mầu), 1 K1,{ I ,...,I }
KI ,
tham số C , 2N C
, ngƣỡng fcut (fcut > 0, đủ nhỏ), M x N là kích thƣớc của
ảnh I.
Đầu ra: 1 K1,' { I' ,...,I' }
KI : K kênh ảnh sau khi cân bằng.
Bƣớc 1: Phân C cụm tập vector dữ liệu 1, , 1, , 1,
( , )i M j N kk K
I i j
bằng thuật
toán FCM chuẩn ta đƣợc 1
C
c cV
,
1 , , 1 , , 1 ,, ,
i M j N c Ci j c
, theo công thức (2.4).
Bƣớc 2: Xác định lƣợc đồ xám mờ 1, , 1 ,
k
cc C k K
h
theo công thức (2.13).
Bƣớc 3: , m in , m ax
1, , ,k k
k K g L L
,m in
,m a x
,m in
'
1
'
, m in , m a x , m in
( ')
( ')
' ( )
k
k
k
g
k
cC
g L
L
c k
c
g L
k k k k
h g
h g
I g L L LC
Trả về: 1,'
KI
77
Kết luận chƣơng 2
Chƣơng này luận án trình bày các đề xuất gồm:
Thứ nhất, luận án đề xuất một phƣơng pháp biến đổi ảnh mới sử dụng
nhiều dải động mức xám. Các dải động mức xám này đƣợc ƣớc lƣợng tự động
bằng thuật toán phân cụm FCM. Phƣơng pháp này đƣợc so sánh trực tiếp với
phƣơng pháp biến đổi sử dụng một hàm S-function với tham số hóa dựa trên
cực đại fuzzy entropy trong [16].
Thứ hai, luận án đề xuất phƣơng pháp xây dựng hàm biến đổi mức xám
dạng chữ S dựa trên một toán tử HA - toán tử Hint (toán tử tăng cƣờng của
ĐSGT). Đặc điểm này là rất quan trọng vì nó cho phép lần đầu tiên sử dụng
kiến thức chuyên gia để giải quyết bài toán tăng cƣờng ĐTP ảnh. Lý thuyết
của HA có thể cung cấp một mô hình toán học, tạo cơ sở để phát triển các
phƣơng pháp cho phép chuyển một hệ luật ngôn ngữ thành một hàm chữ S
trong miền số [Lmin, Lmax]2 bằng cách dựa vào thứ tự ngữ nghĩa của các biến
ngôn ngữ.
Hiệu quả của phƣơng pháp đề xuất đƣợc chứng minh bởi thực nghiệm
khi so sánh trực tiếp với phƣơng pháp của Cheng và bốn phƣơng pháp gián
tiếp: ESIHE (2014), RICE, GHMF (cả hai đƣợc công bố vào năm 2015) và
ROHIM (2017). Kết quả thử nghiệm thu đƣợc đƣợc đánh giá bởi các chỉ số
khách quan. Các phƣơng pháp đề xuất đều cho kết quả tốt hơn.
78
CHƢƠNG 3.
XÂY DỰNG ĐỘ ĐO THUẦN NHẤT MỚI THEO TIẾP CẬN
ĐẠI SỐ GIA TỬ VÀ ỨNG DỤNG NÂNG CAO
ĐỘ TƢƠNG PHẢN ẢNH ĐA KÊNH
Trong [17] theo thuật toán của Cheng và trong thuật toán 2.3 sử dụng
toán tử Hint của chúng tôi, giá trị thuần nhất của điểm ảnh ảnh hƣởng trực
tiếp đến giá trị ĐTP tại điểm ảnh (công thức (1.12), (1.13), (1.14), (1.15)),
cách tính số mũ khuếch đại của Cheng (công thức (1.16) và của Hint (công
thức (2.10) và ảnh hƣởng đến giá trị độ xám xung quanh từng điểm ảnh. Vì
vậy, nếu cải tiến đƣợc cách tính giá trị thuần nhất sẽ cải tiến đƣợc hiệu quả
nâng cao ĐTP ảnh trực tiếp.
Trong chƣơng này luận án trình bày về độ thuần nhất, đề xuất phƣơng
pháp xây dựng độ thuần nhất dựa trên một hệ luật ngôn ngữ, sau đó nhúng
phép lập luận sử dụng ĐSGT mà cụ thể là phép nội suy giải hệ luật mờ của
đại số gia tử. Ứng dụng độ thuần nhất mới vào quy trình nâng cao ĐTP ảnh
đa kênh [CT 2] và so sánh với phƣơng pháp xây dựng độ thuần nhất dựa trên
các toán tử t-norm [CT 3].
3.1. Xây dựng độ đo thuần nhất
3.1.1. Độ thuần nhất của Cheng
ĐTP trong [16, 17] đƣợc xây dựng qua ba bƣớc. Thứ nhất các đặc
trƣng địa phƣơng nhƣ gradient, entropy, độ lệch chuẩn trung bình và moment
bậc 4 tại từng điểm ảnh đƣợc tính và kết nhập thành một giá trị chỉ mức độ
thuần nhất của điểm ảnh. Thứ hai, từ giá trị độ thuần nhất của điểm ảnh, định
nghĩa mức độ sáng xung quanh điểm ảnh, đƣợc gọi là giá trị trung bình không
thuần nhất của điểm ảnh. Thứ ba, tính ĐTP giữa mức sáng của điểm ảnh và
giá trị trung bình không thuần nhất của điểm ảnh.
Nhƣ vậy, chất lƣợng ảnh đƣợc nâng cao ĐTP phụ thuộc vào giá trị
thuần nhất tại mỗi điểm ảnh, vì độ đo thuần nhất liên quan chính đến các
79
thông tin địa phƣơng của một ảnh và phản ánh tính đều của các vùng ảnh và
nó đóng vai trò quan trọng trong nâng cao chất lƣợng ảnh [17].
Trong [17] giá trị thuần nhất của điểm ảnh đƣợc kết nhập từ các giá trị
địa phƣơng Eij, Hij, Vij, R4,ij công thức sau:
ij ij ij 4 ,ij ij ij ij 4 ,ij* * * 1 * 1 * 1 * 1
ijH O E V H R E V H R (3.1)
Khi thử nghiệm với ảnh mầu, tác giả nhận thấy kết nhập theo công thức
(3.1) có thể tạo ra giá trị độ thuần nhất không trơn, do đó ảnh hƣởng đến độ
trơn của ảnh nâng cao ĐTP đầu ra.
(a)
(b)
Hình 3.1. Độ thuần nhất tính theo công thức gốc (3.1) (a) [17] Ảnh nâng
cao ĐTP kênh R,G và B sử dụng công thức (3.1) (b)
Hình 3.1.a chứng tỏ các giá trị độ thuần nhất tại các điểm ảnh của ảnh
#5 và ảnh kết quả của phép nâng cao của [17] khi dùng công thức gốc (3.1) là
không đủ trơn (hình 3.1.b ở các vùng đánh dấu ô chữ nhật).
Ở đây cần nhấn mạnh là các giá trị entropy địa phƣơng Hij rất nhạy với
nhiễu và sự thay đổi của giá trị mức xám, điều này đã làm cho phép kết nhập
theo công thức (3.1) có thể không hiệu quả.
(a)
(b)
Hình 3.2. {Hij}.(a) {Vij} (b) 3 kênh R, G và B với ảnh #5.
80
Thực tế giá trị độ thuần nhất của điểm ảnh là một giá trị mờ và chúng ta
có thể áp dụng lập luận mờ để thu nhận giá trị này.
Nếu các đặc trƣng địa phƣơng đƣợc i j i j,E H chuyển cho một tiếp cận
tính toán với từ (computing with words) thì công thức kết nhập dạng
i j i j,eh
T E H cần phản ánh luật mờ nhƣ sau:
Nếu g r a d ie n t là cao và e n tr o p y là cao thì độ thuần nhất là cao
Nếu g r a d ie n t là thấp và e n tr o p y là thấp thì độ thuần nhất là thấp
(Ký hiệu X là biến ngôn ngữ với giá trị ngữ nghĩa là phủ định giá trị
ngữ nghĩa của biến ngôn ngữ X)
3.1.2. Độ đo thuần nhất với toán tử t-norm
Tác giả đã thay thế công thức kết nhập (1) bởi công thức sau:
i j i j i j i j 4 , ijm ax * , *H O E H V R (3.2)
và nhận thấy rằng công thức (3.2) là phù hợp cho đa dạng ảnh mầu RGB (các
ảnh đã đƣợc nâng cao ĐTP khi sử dụng công thức (3.2) đều trơn).
(a)
(b)
Hình 3.3. Độ thuần nhất tính theo công thức (3.2) (a)
Ảnh nâng cao sử dụng công thức (3.2)(b)
Giá trị thuần nhất của điểm ảnh tính theo công thức (3.2) đã đƣợc
lƣợng hóa đơn giản, chỉ tại những vùng mà sự trực giác thấy rõ là không
thuần nhất, giá trị độ thuần nhất mới đƣợc lƣợng hóa có giá trị thấp.
Ngoài ra thử nghiệm với các ảnh mầu khác nhau cùng thuật toán của
[16, 17] cho từng kênh ảnh R, G và B tác giả cũng nhận thấy cả 2 công thức
81
(3.1) và công thức (3.2) cùng cho ảnh đầu ra của thuật toán [16] có sự tƣơng
phản mạnh ở vùng có độ thuần nhất thấp (chẳng hạn, vùng đôi mắt, xem hình
3.1.b và 3.3.b) và mức độ sáng của hình ảnh đƣợc nâng cao là nhƣ nhau.
Qua sự phân tích trên chúng ta có thể thấy phép kết nhập các đặc trƣng
địa phƣơng thích hợp (ảnh kết quả phải trơn) nên có dạng:
i j i j 4 , i j i j 4 ,i j
, , , , , ,i j i ji j i je h h rH O f E V H R T T E H T V R
(3.3)
Các đặc trƣng địa phƣơng Vij, R4,ij biến đổi chậm nên ở đây chủ yếu là
ảnh hƣởng của phép kết nhập i j i j,eh
T E H . Sử dụng một toán tử t-norm, chúng
ta xác định một độ đo thuần nhất địa phƣơng của ảnh nhƣ sau:
i j i j 4 ,i j o rm
a x , , * i ji jnH O m T E H V R
(3.4)
Mở rộng phép kết nhập ở công thức (3.2) chúng ta có thể sử dụng các
toán tử tập mờ t-norm thay cho toán tử nhân ở công thức này. Các toán tử t-
norm đảm bảo tính chất đơn điệu của phép kết nhập [22] nên có thể xây dựng
phép kết nhập các giá trị địa phƣơng cho việc ƣớc lƣợng độ đo thuần nhất địa
phƣơng của ảnh. Bảng dƣới đây là các dạng độ đo thuần nhất khác nhau sử
dụng các toán tử t-norm thông dụng [22].
Bảng 3.1. Các phép kết nhập giá trị địa phƣơng khác nhau.
Dạng i j 4 , iji ji j, , ,i jH O T E H V R Công thức
HO1 i j i j i j i j 4 , ijm ax * , *H O E H V R
HO2 (Aczel) i j i j 4 ,
i jm a x , , * i ji jA c ze l
H O T E H V R
0 .5
2 2lo g ( ) lo g ( )
( , )a b
A c ze lT a b e
HO3 (Dombi) i j i j 4 ,i j
m a x , , * i ji jD o m b iH O T E H V R
0 .52 2
1( , )
1 11
D o m b iT a b
a b
a b
82
HO4 (Frank) i j i j 4 ,i j
m a x , , * i ji jF ra n kH O T E H V R
( 1)( 1)( , ) lo g 1
1
a b
F ra n k
e eT a b
e
HO5 (Hamacher) i j i j 4 ,i j
m a x , , * i ji jH a m a ch e rH O T E H V R
( , )2 1
H a m a ch er
a bT a b
a b a b
HO6 (Yager) i j i j 4 ,i j e r
m a x , , * i ji jY a gH O T E H V R
0 .5
0 .50 .5
(a b )( , )
( ) (1 )(1 )Ya g er
T a b
a b a b
Nhận xét:
Các hàm 2
o r: [ 0 ,1] [ 0 ,1]
t n mT
cho ở bảng trên, bảo toàn thứ tự nghĩa là
o r o r, , ', ' [ 0 ,1] , ', ' ( , ) ( ', ')
t n m t n ma b a b a a b b T a b T a b
3.1.3. Xây dựng độ đo thuần nhất với tiếp cận ĐSGT
Chúng ta thấy luật “Nếu !entropy là lớn và !gradient là lớn, thì
homogeneity là lớn” biểu thị một quan hệ đơn điệu tăng. Nó chứng tỏ ngữ
nghĩa dựa trên thứ tự của từ là rất quan trọng, nó phản ánh quan hệ đơn điệu
với cùng các biến nhƣng trong miền giá trị số. ĐSGT cho phép lƣợng hóa bảo
toàn ngữ nghĩa thứ tự nhƣng điều này không đảm bảo khi các từ đƣợc biểu
diễn bằng các tập mờ. Phép lƣợng hóa của ĐSGT cho phép làm chủ ngữ
nghĩa của các từ một cách trực tiếp và tính toán ngữ nghĩa dễ dàng, cho phép
ngƣời chuyên gia phát biểu một hệ luật ngôn ngữ trong đó thay thế việc biểu
diễn các hàm thuộc bằng một phân hoạch bảo toàn thứ tự thích hợp của đoạn
[0, 1]. Phép lƣợng hóa của ĐSGT đƣợc xây dựng theo tiếp cận tiên đề dựa
trên ngữ nghĩa thứ tự và phép mờ hóa tự nhiên của các từ.
Từ những phân tích trên ta thấy độ đo thuần nhất đƣợc xây dựng dựa
trên hệ luật khá đơn giản và rõ ràng sau:
83
Giả sử G ( g ra d ie n t ), E ( e n tr o p y ) và T là các biến ngôn ngữ với miền ngữ
nghĩa giá trị số đƣợc chuẩn hóa về đoạn [0, 1] thì HMR(G , E ,T ) là một hệ
luật mờ cho G , E và T .
Bằng việc ứng dụng phương pháp lập luận ngôn ngữ khi bổ sung các
gia tử, minh họa với trường hợp đơn giản hai gia tử very và litle thì hệ luật
mờ HMR( G , E ,T ) được phát biểu như sau:
R1: If G là very hight AND E is hight Then T is very higt
R2: If G là very low AND E is low Then T is very low
R3: If G là hight AND E is very hight Then T is very hight
R4: If G là low AND E is very low Then T is very low
R5: If G là hight AND E is hight Then T is hight
R6: If G là low AND E is low Then T is low
R7: If G là little hight AND E is hight Then T is little hight
R8: If G là little low AND E is low Then T is little low
R9: If G là hight AND E is little hight Then T is little hight
R10: If G là low AND E is little low Then T is little low
R11: If G là very hight AND E is very hight Then T is very
very hight
R12: If G là very low AND E is very low Then T T is very
very low
(3.5)
Xây dựng hàm fSnorm cho hệ luật (3.5)
Sử dụng phƣơng pháp lập luận ĐSGT, ta có các bƣớc để tính kết quả
đầu ra khi cho biết đầu vào theo 3 bƣớc nhƣ sau:
Bƣớc 1: Thiết lập các ĐSGT và các tham số tính mờ tƣơng ứng
84
Ký hiệu AG = (G , C, w, H, ), AE = ( E , C, w, H, ) và AT = (T , C, w,
H, ), C = {c–, c
+}, c
– = low, c
+ = hight, H = H
- H
+, H
- = {little}, H
+ =
{very}, L ≡ little, V ≡ very.
Đặt ( ), ( ), (
), ( ),
( ), ( ), trong đó , , , , , (0, 1).
Mối quan hệ dấu của các gia tử đối với các gia tử khác đƣợc xác định
nhƣ Bảng 3.2 sau:
Bảng 3.2. Mối quan hệ dấu của các gia tử
V L
V + +
L - -
Từ bảng trên ta có: sign(Vc-) = sign(VIc
-) = sign(VI)sign(Ic
-) =
1*sign(Ic-) = -1, ở đây I là gia tử đơn vị, Ix=x với mọi x.
Bảng 3.3. Bảng giá trị độ đo tính mờ và SQM tƣơng ứng với AG, AE, AT
Tham số For G For E For T
U(c+) 1G
G 1E
E 1T
T
U (V) 1G G
1E E
1T T
v U (low) G G
E E
T T
vU(V.low) (very low) 2
G G 2
E E
2
T T
vU(L.low) (little low) ( ) + G G G
( ) + E E E
( )+T T T
vU(hight) 1GG
1 EE
1 TT
vU(V.hight) (very
hight)
21
GG 2
1EE
2
1 TT
vU(L.hight) (little
hight)
( ) - GG G
( ) - EE E
( )- TT T
vU(V.V.low) (very
very low)
3
G G 3
E E 3
T T
vU(V.V.hight) (very
very hight)
31
GG 3
1EE
31 TT
, trong đó U đóng vai trò của G , E và T .
85
Để tính các giá trị vX(x) cho một ĐSGT AX bất kỳ chúng ta cần lập
bảng sắp thứ tự của các gia tử nhấn và bảng dấu giữa các gia tử. Trong luận
án chỉ sử dụng hai gia tử nên chúng ta chỉ cần sử dụng các phép tính giá trị
định lƣợng ngữ nghĩa rất đơn giản của ĐSGT để chứng tỏ bảng trên là đúng.
Thật vậy, ta có:
( ) ( ) ( )U U U U U U U
v c fm c fm c
( . ) 1 ( ) ( . ) ( ) * ( )U U U U U U U U U U
S ig n L c L v L c v c v c
U U U U U
( ) ( ) (1 ) * 1 (1 ) * 1 *U U U UU U U U U U U U U
v c fm c
( . ) 1 ( ) ( . ) ( ) * 1 ( )U U U U U U U U U U
S ign L c L v L c v c v c
1 * U UU U U
Ngoài ra, chúng ta có mệnh đề sau:
Mệnh đề 3.1.
(i) 1
( . ) ( )k k
U U U Uv V c k N
(ii) 1
( . ) 1 ( )k k
U U U Uv V c k N
, ở đây ký hiệu Vk.x là phép nhấn k lần gia tử very lên x U
Chứng minh:
(i) Ta chứng minh bằng quy nạp theo k.
Khi k=0, ( ) ( ) ( )U U U U U U U
v c fm c fm c
. Vậy (i) đúng khi k=0.
Giả sử (i) đúng với k, tức là 1
( . ) ( )k k
U U U Uv V c
. Chúng ta cần chứng
minh (i) đúng với k+1 tức là 1 2
( . ) ( )k k
U U U Uv V c
Thật vậy,
1
{ V }
.( . ) 1, ( ) . . .
U
k k k
U U U U U U U
h H
s ig n V V c h v V c v V V c
86
1 2
. ( ) ( )k k k
U U U U U U U Uv V c
Vậy (i) là đúng.
(ii) Ta chứng minh bằng quy nạp theo k.
Khi k=0,
( ) ( ) (1 ) * 1 (1 ) * 1 *U U U UU U U U U U U U U
v c fm c
. Vậy (ii) đúng khi k=0.
Giả sử (ii) đúng với k, tức là 1
( . ) 1 ( )k k
UU U U
v V c
. Chúng ta cần
chứng minh (ii) đúng với k+1 tức là 1 2( . ) 1 ( )
k k
UU U U
v V c
Thật vậy,
{ V }
.( . ) 1, ( )
U
k
U U U
h H
S ig n V V c h
1 1 1. . 1 . 1 ( ) ( )
k k k k k
U UU U U U U U U U U Uv V c v V c v V c
1 1 21 (1 ) * ( ) 1 * ( ) 1 ( )
k k k
U U UU U U U U
Vậy (ii) là đúng.
Ví dụ: khi 0 .5 , 0 .5 , 0 .4U U
ta có bảng giá trị độ đo tính mờ
và SQM ứng với AG, AE, AT nhƣ sau:
Bảng 3.4. Bảng giá trị tính toán minh họa độ đo tính mờ và SQM tƣơng ứng
với AG, AE, AT
Tham số For G For E For T
U(c+) 0.6 0.6 0.6
U (V) 0.5 0.5 0.5
v U (low) 0.2 0.2 0.2
vU(V.low) (very low) 0.1 0.1 0.1
vU(L.low) (little low) 0.3 0.3 0.3
vU(hight) 0.7 0.7 0.7
87
vU(V.hight) (very hight) 0.85 0.85 0.85
vU(L.hight) (little hight) 0.55 0.55 0.55
vU(V.V.low) (very very low) 0.05 0.05 0.05
vU(V.V.hight) (very very hight) 0.925 0.925 0.925
Bƣớc 2:
2.1: Tính các SQM của các thành phần bên trái và bên phải hệ luật mờ
sử dụng bảng 3.3.
2.2: Với một toán tử “và” 2 ngôi AND: 2: [ 0 ,1] [0 ,1]A N D , AND(G , E
) = G * E , chúng ta có mảng các điểm nội suy bề mặt Snorm (ở đây m = 2) của
hệ luật (3.5) nhƣ sau:
Bảng 3.5. Bảng giá trị các mốc nội suy dựa trên toán tử AND
của hệ luật (3.5)
Chỉ số luật Các điểm nội suy (x,y)[0,1]2
x y
R1 AND ( ( ) ( )) ( )
R2 AND ( ( ) ( )) ( )
R3 AND ( ( ) ( )) ( )
R4 AND ( ( ) ( )) ( )
R5 AND ( ( ) ( )) ( )
R6 AND ( ( ) ( )) ( )
R7 AND ( ( ) ( )) ( )
R8 AND ( ( ) ( )) ( )
R9 AND ( ( ) ( )) ( )
R10 AND ( ( ) ( )) ( )
R11 AND ( ( ) ( )) ( )
R12 AND ( ( ) ( )) ( )
Từ đây có thể sử dụng một phép nội suy đơn giản fSnorm nhƣ phép tuyến
tính từng khúc trên các mốc nội suy.
88
Nhận xét:
Cho trƣớc cặp giá trị ngữ nghĩa đầu vào (G , E ) [0, 1]2, ta xác định
giá trị ngữ nghĩa đầu ra hT [0, 1] nhƣ sau: hT = fSnorm (AND(G , E ));
Hàm fSnorm cho hệ luật (3.5) đƣợc xây dựng nhƣ trên đƣợc ký hiệu là
THA, AND hay gọn hơn THA khi đã cho trƣớc toán tử AND.
Mệnh đề 3.2. Hàm 2: [ 0 ,1] [ 0 ,1]
H AT bảo toàn thứ tự nghĩa là
, , ', ' [ 0 ,1] , ', ' ( , ) ( ', ')H A H A
a b a b a a b b T a b T a b
Chứng minh: Do
(i) AND bảo toàn thứ tự.
(ii) Các SQM Gv , E
v và Tv bảo toàn thứ tự trên G , E và T (xem
Định nghĩa 1.2 và Định nghĩa 1.3)
Suy ra THA bảo toàn thứ tự tại các mốc nội suy (xem bảng 3.5)
Do fSnorm đƣợc tạo thành từ phép nội suy tuyến tính từng khúc giữa các
mốc nội suy, nên bảo toàn thứ tự THA trên [0, 1]2 .
Sử dụng THA, chúng ta xác định một độ đo thuần nhất địa phƣơng của
ảnh nhƣ sau:
i j i j 4 ,i j
, , * i ji jH AH O T T E H V R
(3.6)
Kỹ thuật xây dựng độ đo thuần nhất sử dụng ĐSGT đƣợc thực hiện
theo thuật toán 3.1 nhƣ sau:
Thuật toán 3.1. Xác định độ thuần nhất tại mỗi điểm ảnh HA-HRM.
Đầu vào: Ảnh đa cấp xám I, có kích thƣớc M x N.
Tham số: g, gr, ep, ep, ho, ho (0, 1) của ĐSGT AGr, AEp và
AHo
Đầu ra: Bảng giá trị độ thuần nhất tại mỗi điểm ảnh.
Bƣớc 1: Tính gradient, entropy, độ lệch chuẩn và mô men bậc 4 chuẩn
hóa về đoạn [0, 1] các giá trị này.
89
For mỗi điểm ảnh gij
1.1: Tính Eij, Hij, Vij, R4,ij dùng công thức (1.11)
1.2: Tính 1ijij
E E , 1ijij
H H , 1ijij
V V , 4 ,4 ,
1ijij
R R
Bƣớc 2: Với toán tử AND, xây dựng hàm THA cho hệ luật HRM(AGr,
AEp, AHo) của các biến ngôn ngữ Gr( g ra d ie n t ), Ep( e n tr o p y ) và
Ho(homogeneity) với các tham số độ đo mờ g, gr, ep, ep, ho, ho (0,1).
Bƣớc 3: Tính độ thuần nhất tại từng điểm ảnh
3.1: For mỗi điểm ảnh gij
Tính ,i j i ji j H A
E H T E H
Tính 4 ,ij ij
ax , * i ji jH O m E H V R
3.2: Chuẩn hóa
For mỗi điểm ảnh gij-
Tính i j
i j
i j
=m a x { }
H O
H O
Trả về: {βij}
Thuật toán 1 có độ phức tạp O(M*N).
(a)
(b)
Hình 3.4. Các giá trị nhất của kênh V của ảnh #5 sử dụng [18] (a), giá
trị thuần nhất sử dụng ĐSGT (b)
3.2. Nâng cao độ tƣơng phản ảnh mầu với độ đo thuần nhất đề xuất
Trƣớc tiên đề xuất xây dựng một biến đổi ảnh F của từng kênh ảnh
xám của tổ hợp kênh ảnh đầu vào. Khi đó ĐTP đƣợc tính theo công thức:
90
i j i j
i j
i j i j
( ) ( )
( ) ( )
F g FC
F g F
(3.7)
ở đây ta đồng nhất biến đổi F với ảnh {F(i,j)}.
Nhƣ trong chƣơng 2, tác giả cũng sử dụng một phép phân cụm FCM để
ƣớc lƣợng nhiều dải động mức xám của từng kênh ảnh và xây dựng một biến
đổi ảnh ứng với từng kênh. Ở đây khác với chƣơng 2, tác giả đề xuất sử dụng
hàm S-function thay cho hàm clip để xây dựng một biến đổi ảnh
Với mỗi 1,k K , chúng ta xác định một biến đổi Fk cho kênh ảnh Ik nhƣ
sau:
, m a x , m in ,1 , , , 2 ,
1
, m in
( , ) ; , ,
( , )
C
k k k k c k c k c
c
k k
L L S fu n c tio n I i j B V B
F i j LC
(3.8)
, trong đó 1, , 1, , 1,k K i M j N , [x] chỉ phần nguyên của số thực x.
Nhận xét: Biến đổi ảnh Fk bảo toàn thứ tự….
Sử dụng độ đo thuần nhất HA-HRM đƣợc xây dựng trong thuật toán
3.1, kỹ thuật nâng cao ĐTP ảnh mầu trong biểu diễn mầu HSV đƣợc thực
hiện theo thuật toán 3.2 nhƣ sau:
Thuật toán 3.2. Nâng cao ĐTP ảnh mầu HSV sử dụng độ đo thuần
nhất HA-HRM.
Đầu vào: Ảnh I trong biểu diễn mầu RGB, kích thƣớc M x N. Tham số
C , 2N C
, ngƣỡng fcut (fcut > 0, đủ nhỏ), d (d x d là kích thƣớc cửa sổ).
Đầu ra: Ảnh mầu RGB Inew, và tùy chọn trả về:
Giá trị tƣơng phản trung bình CMR, CMG, CMB, Giá trị Eavg, Havg
Bƣớc 1: Gọi (IH, IS, IV) là biểu diễn mầu của I trong không gian mầu
HSV. Lƣợng hóa để coi các kênh IS, IV nhƣ là các ảnh đa cấp xám.
91
Bƣớc 2: Với dữ liệu đầu vào là tổ hợp kênh (IS, IV), tham số số cụm là
C và ngƣỡng fcut, thực hiện phân cụm FCM để ƣớc lƣợng C dải động mức
xám [Bk,1,c, Bk,2,c] với k{S, V} (xem công thức (2.4)).
Bƣớc 3: Xác định ảnh biến đổi FS, FV của kênh IS, IV tƣơng ứng theo
công thức (2.5).
Bƣớc 4:
4.1: Tính các giá trị thuần nhất của FS, FV dựa trên ĐSGT sử dụng HA-
HRM.
4.2: Tính tham số của [17] cho kênh FS, FV với kích thƣớc cửa sổ d x d,
cụ thể là các giá trị mức xám không thuần nhất {δFS, ij}, {δFV, ij}, số mũ khuếch
đại {FS,ij}, {FV,ij} tại từng điểm ảnh của kênh FS và kênh FV (công thức
(1.14), và (1.16)).
Bƣớc 5: Tính ĐTP và xác định kênh ảnh xám mới của kênh FS và kênh
FV, , ,
,S S n ew V V n ew
F I F I nhƣ sau:
Với kênh FS FS(IS) và kênh FV FV(IV): Tính ĐTP
S ,i j i j
S ,i j
S ,i j i j
( ) ( ),
( ) ( )
S S
S S
F g FC
F g F
V ,ij i j
V ,i j
V ,i j i j
( ) ( )
( ) ( )
V V
V V
F g FC
F g F
(3.9)
Tính giá trị mức xám mới của kênh S và V:
S ,ij
S ,i j
S ,i j
S ,i j
S ,ij
S ,i j S ,i j S ,i j
S ,i j
S ,n e w
S ,ij
S ,i j S ,i j S ,i j
S ,i j
1,
1
I ( , )
1,
1
t
t
t
t
Cg
C
i j
Cg
C
(3.10)
92
V ,ij
V ,ij
S ,i j
V ,i j
V ,ij
V ,ij V ,ij V ,ij
V ,ij
V ,n e w
V ,ij
V ,ij V ,ij V ,ij
V ,ij
1,
1
I ( , )
1,
1
t
t
t
t
Cg
C
i j
Cg
C
Lƣu ý: kênh S đƣợc đánh chỉ số k = 1, kênh V đƣợc đánh chỉ số k = 2.
Bƣớc 6: Chuyển ảnh (IH, IS,new, IV,new) trong biểu diễn mầu HSV về biểu
diễn mầu RGB, ta đƣợc ảnh Inew.
Bƣớc 7: Bƣớc tùy chọn, tính các chỉ số CM{R,G,B}, Eavg và Havg.
7.1: Tính tham số của [17] cho kênh IR, IG và IB của ảnh gốc I với kích
thƣớc cửa sổ dxd, cụ thể là các giá trị mức xám không thuần nhất {δR,ij},
{δG,ij}, và {δB,ij} của kênh IR, IG và IB tƣơng ứng (công thức (1.14) và (1.16)).
7.2: Tính CMR, CMG, CMB theo công thức (1.12), cụ thể là:
, , i j
i j , , i j
( , )
( , )
*
n ew R R
n ew R R
R
I i j
I i jC M
M N
, , i j
i j , , i j
( , )
( , )
*
n ew G G
n ew G G
G
I i j
I i jC M
M N
, , i j
i j , , i j
( , )
( , )
*
n ew B B
n ew B B
B
I i j
I i jC M
M N
7.3: Tính: Eavg = Eavg{Inew,R, Inew,G, Inew,B} theo công thức (1.8),
Havg = Havg{Inew,R, Inew,G, Inew,B} theo công thức (1.9).
Trả về: Inew,
Và các tùy chọn đƣợc trả về CMR, CMG, CMB, Eavg, Havg.
Không tính đến thuật toán FCM và phép nội suy giải hệ lập luận mờ
(3.5) của ĐSGT, thuật toán 3.2 có độ phức tạp tƣơng đƣơng thuật toán gốc
[17]. Mô hình kiến trúc hệ thống đề xuất đƣợc xây dựng nhƣ hình 3.5:
93
Hình 3.5. Lƣu đồ xử lý của thuật toán đề xuất.
3.3. Thực nghiệm
3.3.1. Tính độ thuần nhất kênh ảnh
Các tham số sử dụng trong phép biến đổi mờ hóa ảnh đƣợc lựa chọn
nhƣ trong phần 2.1.6, chƣơng 2, cụ thể: fcut = 0.005, C = 5.
Các giá trị tham số ĐSGT của các biến ngôn ngữ Gr, Ep, Ho thiết kế độ
đo thuần nhất đƣợc cho bằng thực nghiệm nhƣ bảng sau:
Bảng 3.6. Các tham số cơ sở của ĐSGT Agr, Aep và Aho.
Tham số For Gr ( g ra d ie n t ) For Ep ( e n tr o p y ) For Ho ( h o m o g en e ity )
U(c-1
) 0.5 0.5 0.5
U(little) 0.5 0.5 0.5
Tính giá trị sáng xung quanh, ĐTP và số mũ
khuếch đại của S và V.
Tính các giá trị mức xám mới của kênh S và
kênh V
Chuyển đổi ngƣợc HSV về RGB
Kết thúc
Bắt đầu
Ảnh RGB đầu vào
Chuyển đổi RGB sang HSV
Tính các giá trị thuần
nhất δRij,, δGij,, δB,ij
Biến đổi kênh S
và V
94
, trong đó U đóng vào của các biến ngôn ngữ Gr, Ep và Ho.
Các tham số , ,U U
đƣợc lựa chọn bằng thực nghiệm nhƣ sau:
0 .5 , 0 .5 , 0 .4U U
.
3.3.2. Đánh giá độ đo HA-HRM
Khi đánh giá kết quả của tác giả so với độ đo gốc đƣợc công bố trong
[17], vì [17] chỉ đƣợc phát biểu ứng dụng cho ảnh đa cấp xám, trong khi thuật
toán của tác giả đƣợc phát biểu cho ảnh mầu, ngoài đánh giá bằng trực quan
tác giả cũng sử dụng các chỉ số khách quan Eavg, Havg và CM để đánh giá,
tƣơng tự nhƣ trong Chƣơng 2.
3.4. Các kết quả và luận giải
Trong phần này tác giả trình bày thử nghiệm nâng cao ĐTP sử dụng
biến đổi ảnh trên kênh ảnh S và V) trong biểu diễn mầu HSV.
Trong thử nghiệm này, tác giả thực hiện kiểm tra hiệu quả của độ đo
HA-HRM đề xuất sử dụng phép phân cụm FCM xác định tham số cho phép
biến đổi ảnh trong công thức (2.5). Các bƣớc đƣợc thực hiện nhƣ sau:
- Đầu tiên, chuyển biểu diễn mầu RGB sang biểu diễn mầu HSV của
ảnh đầu vào. Phân cụm dữ liệu mức xám tổ hợp kênh S và kênh V với tham
số đƣợc chọn nhƣ trong thử nghiệm A (số cụm C = 5 v.v…). Trên từng kênh
ảnh S và kênh V riêng rẽ ƣớc lƣợng {B1,c,k, B2,c,k} (k{S, V}) và thực hiện
biến đổi ảnh cho kênh S và kênh V tƣơng ứng sử dụng hàm biến đổi FS, FV
(công thức (2.5)).
- Thứ hai, xác định giá trị ĐTP theo thuật toán 3.2 và các bƣớc liên
quan cho kênh ảnh S và V đã biến đổi ở bƣớc thứ nhất với kích thƣớc cửa sổ
3x3 và tham số t = 0.25 (1.10).
95
- Thứ ba, tổng hợp lại các kênh ảnh H gốc, kênh S và kênh V đã nâng
cao ĐTP, sau đó biến đổi ngƣợc từ biểu diễn mầu HSV sang biểu diễn mầu
RGB.
- Cuối cùng, tính giá trị mức xám không thuần nhất tại từng điểm ảnh
ứng với các kênh ảnh R, G và B (các giá trị này đƣợc dùng để tính độ đo
tƣơng phản trung bình trên từng kênh R, G và B).
Giá trị trung bình ĐTP trực tiếp CM trên kênh R, G và B trong biểu
diễn mầu RGB ảnh đầu vào đƣợc tính với ảnh giá trị mức xám trung bình
không thuần nhất của từng kênh R, G và B của ảnh RGB gốc và ảnh kết quả
đầu ra khi sử dụng thuật toán 2 với các HOk, k = 1…6 và phƣơng pháp đề
xuất (HA-HRM) thể hiện ở các bảng 3.7-3.11.
Bảng 3.7. Giá trị chỉ số CMR cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ảnh #1 #2 #3 #4 #5 #6
HO1 0.3692 0.1806 0.1688 0.2002 0.2132 0.1494
HO 2 0.3687 0.1805 0.1687 0.1993 0.2144 0.1494
HO 3 0.3687 0.1805 0.1687 0.1993 0.2144 0.1450
HO 4 0.3688 0.1805 0.1687 0.1992 0.2144 0.1493
HO 5 0.3687 0.1805 0.1686 0.1993 0.2144 0.1451
HO 6 0.3691 0.1806 0.1687 0.1997 0.2160 0.1454
HA-HRM 0.3889 0.1813 0.1802 0.2065 0.2161 0.1505
Bảng 3.8. Giá trị chỉ số CMG cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ ảnh #1 #2 #3 #4 #5 #6
HO 1 0.3780 0.1815 0.1703 0.2016 0.2142 0.1503
HO 2 0.3773 0.1814 0.1701 0.2007 0.2154 0.1503
96
HO 3 0.3773 0.1814 0.1701 0.2007 0.2154 0.1458
HO 4 0.3774 0.1814 0.1701 0.2006 0.2154 0.1502
HO 5 0.3774 0.1814 0.1701 0.2006 0.2154 0.1459
HO 6 0.3778 0.1814 0.1702 0.2011 0.2168 0.1463
HA-HRM 0.4000 0.1822 0.1814 0.2080 0.2170 0.1623
Bảng 3.9. Giá trị chỉ số CMB cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ảnh #1 #2 #3 #4 #5 #6
HO 1 0.4200 0.1851 0.1869 0.2126 0.2148 0.1498
HO 2 0.4192 0.1851 0.1868 0.2118 0.2160 0.1498
HO 3 0.4192 0.1851 0.1868 0.2118 0.2160 0.1451
HO 4 0.4194 0.1850 0.1869 0.2117 0.2160 0.1497
HO 5 0.4193 0.1851 0.1868 0.2118 0.2160 0.1453
HO 6 0.4197 0.1851 0.1869 0.2121 0.2176 0.1457
HA-HRM 0.4418 0.1860 0.2048 0.2194 0.2177 0.1626
Bảng 3.10. Giá trị chỉ số Eavg cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ảnh #1 #2 #3 #4 #5 #6
HO 1 6.1126 7.2722 7.3154 7.5641 7.3993 4.2105
HO 2 6.1129 7.2712 7.3127 7.5456 7.4098 4.2174
HO 3 6.1123 7.2698 7.3122 7.5464 7.4076 4.2051
HO 4 6.1175 7.2684 7.3144 7.5462 7.4167 4.2228
HO 5 6.1101 7.2758 7.3096 7.5631 7.4168 4.2165
HO 6 6.1094 6.8158 6.9599 7.3155 7.2337 4.2239
HA-HRM 6.1509 7.3862 7.5124 7.6307 7.5833 4.3675
97
Bảng 3.11. Giá trị chỉ số Havg cho từng ảnh và các phƣơng pháp kết nhập
để tạo giá trị thuần nhất
Độ đo/ ảnh #1 #2 #3 #4 #5 #6
HO 1 0.3999 0.6943 0.7198 0.7640 0.7891 0.4599
HO 2 0.4022 0.6944 0.7201 0.7648 0.7909 0.4606
HO 3 0.4021 0.6944 0.7201 0.7648 0.7909 0.4424
HO 4 0.4023 0.6944 0.7201 0.7648 0.7909 0.4612
HO 5 0.4020 0.6944 0.7201 0.7645 0.7909 0.4420
HO 6 0.4017 0.6944 0.7200 0.7646 0.7904 0.4414
HA-HRM 0.3984 0.6943 0.7197 0.7610 0.7907 0.4501
Bảng 3.7 đến bảng 3.11 của kết quả thực nghiệm của các ảnh #1 - #6 đã
thể hiện các chỉ số khách quan ĐTP trực tiếp trên từng kênh R, G và B khi sử
dụng phép kết nhập 4 đặc trƣng địa phƣơng HO7 đều cho kết quả cao hơn khi
sử dụng các HOk, k = 1…6. Chỉ số khách quan Eavg khi áp dụng thuật cũng
cao hơn với HA-HRM. Cũng vậy, chỉ số khách quan Havg khi áp dụng HA-
HRM, ngoài ảnh #5 và ảnh #6, đều có giá trị nhỏ hơn so với chỉ số ảnh kết
quả khi áp dụng HOk, k = 1…6. Đây là những chứng cứ khách quan thể hiện
hiệu quả của độ đo thuần nhất dựa trên ĐSGT so với các phép xây dựng sử
dụng toán tử t-norm.
(a)
(b)
98
(c)
(d)
(e)
(g)
(h)
(k)
(l)
(m)
99
(n)
(p)
Hình 3.6. Thử nghiệm cho ảnh #1 - #6. Ảnh kết quả (cột bên trái ) khi sử
dụng [17], (cột bên phải) sử dụng thuật toán 3.2 với HO7 đề xuất.
Hình 3.7. Ảnh kết quả sử dụng thuật toán 2 với phép kết nhập gốc [17]
ij 4 ,* * *
ij ij ij ijH O E V H R cho ảnh #1 và ảnh kết quả không trơn.
100
Kết luận chƣơng 3
Chƣơng này phân tích phƣơng pháp xây dựng độ đo thuần nhất địa
phƣơng của ảnh theo phƣơng pháp của Cheng, chỉ ra những hạn chế của
phƣơng pháp này khi áp dụng vào quy trình nâng cao ĐTP, đồng thời đề xuất
02 đóng góp mới cho phƣơng pháp xây dựng độ đo thuần nhất địa phƣơng
của ảnh, cụ thể:
Thứ nhất, tác giả đã đề xuất phƣơng pháp mới xây dựng độ đo thuần
nhất địa phƣơng của ảnh khi sử dụng lập luận mờ với thuật toán dựa trên
ĐSGT để kết nhập các giá trị địa phƣơng nhƣ gradient, entropy, độ lệch chuẩn
trung bình và moment bậc 4 so với cách kết nhập của [17].
Thứ hai, tác giả cũng đã đề xuất phƣơng pháp mới khác xây dựng độ đo
thuần nhất địa phƣơng của ảnh khi sử dụng lập luận mờ với thuật toán dựa
trên các toán tử t-norm để kết nhập các giá trị địa phƣơng gradient, entropy,
độ lệch chuẩn trung bình và moment bậc 4 so với cách kết nhập của [17];
Chƣơng này cũng trình bày đề xuất một thuật toán mới theo phƣơng
pháp nâng cao ĐTP trực tiếp cho ảnh mầu trong biểu diễn mầu HSV dựa trên
độ đo thuần nhất mới đã đƣợc xây dựng bằng ĐSGT. So sánh hiệu quả nâng
cao ĐTP ảnh khi áp dụng các phƣơng pháp xây dựng độ đo thuần nhất đề
xuất.
Kết quả thực nghiệm đã chứng tỏ rằng các kỹ thuật đã đề xuất của tác
giả đã làm việc tốt với đa dạng ảnh mầu. Độ đo thuần nhất đề xuất hoạt động
hiệu quả hơn các độ đo sử dụng các toán tử kết nhập mờ t-norm thông dụng.
Ảnh nâng cao ĐTP cũng trơn, tăng đƣợc độ sáng toàn bộ ảnh.
101
KẾT LUẬN
Từ những hạn chế trong phƣơng pháp của Cheng nhƣ:
(1) Dùng phép biến đổi ảnh của Cheng có thể làm mất chi tiết của ảnh
gốc và độ sáng ảnh đầu ra của phép nâng cao ĐTP của cheng ít thay đổi;
(2) Hàm biến đổi mức xám trong của Cheng không đối xứng và giá trị
độ xám của điểm ảnh đầu ra có thể nằm ngoài miền giá trị độ xám.
(3) Phép xây dựng độ đo thuần nhất địa phƣơng của ảnh khi áp dụng
vào nâng cao ĐTP ảnh, ảnh kết quả có thể không trơn.
Luận án đã đề xuất 3 vấn đề nghiên cứu mới là:
(1) Xây dựng phép biến đổi mờ hóa ảnh áp dụng cho ảnh đa kênh làm
bƣớc tiền đề cho quy trình nâng cao ĐTP nhằm thay đổi độ sáng của ảnh kết
quả. Phép biến đổi ảnh bảo toàn thứ tự và không làm mất chi tiết ảnh.
(2) Xây dựng hàm biến đổi độ xám dạng chữ S dựa trên hệ luật ngôn
ngữ và giải hệ luật bằng ĐSGT (toán tử Hint) để cải tiến thuật toán của
Cheng, ứng dụng nâng cao ĐTP ảnh đa kênh.
(3) Xây dựng độ thuần nhất theo tiếp cận đại số gia tử áp dụng vào quy
trình nâng cao ĐTP ảnh đa kênh.
Tuy nhiên, luận án còn một số hạn chế:
(1) Hệ luật ngôn ngữ mới dừng lại ở 05 luật, số gia tử mới dừng lại ở
02 gia tử, mặc dù đƣợc chứng minh là có ích nhƣng vẫn rất đơn giản;
(2) Vấn đề ảnh hƣởng của các yếu tố nhƣ phƣơng pháp nội suy, giá trị
các tham số mờ….đến hiệu quả nâng cao ĐTP ảnh chƣa đƣợc xét đến;
(3) Yếu tố độ phức tạp của thuật toán cũng chƣa đƣợc xem xét.
Từ những hạn chế trên, hƣớng nghiên cứu tiếp theo của luận án là:
(1) Nghiên cứu mở rộng số luật trong hệ luật ngôn ngữ, số lƣợng gia tử;
(2) Nghiên cứu sự ảnh hƣởng của các yếu tố liên quan nhƣ phƣơng
pháp nội suy, các giá trị tham số mờ;
(3) Nghiên cứ cải thiện tốc độ tính toán.
102
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ
[CT 1] Nguyễn Văn Quyền, Trần Thái Sơn, Nguyễn Tân Ân, Ngô
Hoàng Huy, Đặng Duy An, Một phƣơng pháp mới để nâng cao độ tƣơng phản
ảnh mầu theo hƣớng tiếp cận trực tiếp, Tạp chí Công nghệ Thông tin và
Truyền thông, Tập V-1 số 17(37), 06-2017, trang 59-74.
[CT 2] Nguyễn Văn Quyền, Ngô Hoàng Huy, Nguyễn Cát Hồ, Trần
Thái Sơn, Xây dựng độ đo thuần nhất và nâng cao độ tƣơng phản ảnh mầu
theo tiếp cận trực tiếp dựa trên ĐSGT”, Tạp chí Công nghệ Thông tin và
Truyền thông, Tập V-2 số 18(38), 12-2017, trang 19-32.
[CT 3] Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Hoàng
Xuân Trung, Tạ Yên Thái, Xây dựng độ đo thuần nhất cho ảnh mầu dựa trên
các toán tử t-norm, Tạp chí Nghiên cứu khoa học và công nghệ quân sự, số
49, 06-2017, trang 117-131.
[CT 4] Nguyễn Văn Quyền, Nguyễn Tân Ân, Đoàn Văn Hòa, Hoàng
Xuân Trung, Tạ Yên Thái, Phƣơng pháp xây dựng một histogram mở rộng
cho ảnh đa kênh và ứng dụng, Tạp chí Nghiên cứu khoa học và công nghệ
quân sự, số 50, 08-2017, trang 127-137.
[CT 5] Nguyễn Văn Quyền, Nguyễn Tân Ân, Trần Thái Sơn, Thiết kế
hàm biến đổi độ xám dạng chữ S tăng cƣờng độ tƣơng phản ảnh sử dụng
ĐSGT, Kỷ yếu hội thảo quốc gia về nghiên cứu Cơ bản và Ứng dụng công
nghệ thông tin lần thứ 10 (Fair 10), tháng 8 năm 2017, trang 884-897.
103
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Nguyễn Cát Hồ, Nguyễn Văn Long (2003), “Làm đầy đại số gia tử trên
cơ sở bổ sung các phần tử giới hạn”, Tạp chí Tin học và Điều khiển học,
Tập 19(1), tr. 62–71.
[2] Nguyễn Cát Hồ, Trần Thái Sơn (1995), “Về khoảng cách giữa các giá trị
của biến ngôn ngữ trong đại số gia tử”, Tạp chí Tin học và Điều khiển
học, Tập 11(1), tr. 10-20.
[3] Nguyễn Cát Hồ (2008), “Cơ sở dữ liệu mờ với ngữ nghĩa đại số gia tử”,
Bài giảng trường Thu - Hệ mờ và ứng dụng, Viện Toán học Việt Nam.
[4] Nguyễn Cát Hồ, Phạm Thanh Hà (2007), “Giải pháp kết hợp sử dụng đại
số gia tử và mạng nơron RBF trong việc giải quyết bài toán điều khiển
mờ”, Tạp chí Tin học và Điều khiển học, Tập 25(1), tr. 17-32.
[5] Dƣơng Thăng Long (2010), Một phương pháp xây dựng hệ mờ dạng luật
với ngữ nghĩa dựa trên đại số gia tử và ứng dụng trong bài toán phân
lớp, Luận án tiến sĩ Toán học, Viện Công nghệ Thông tin - Viện Khoa
học và Công nghệ Việt Nam.
[6] Trần Thái Sơn, Nguyễn Thế Dũng (2005), “Một phƣơng pháp nội suy
giải bài toán mô hình mờ trên cơ sở đại số gia tử”, Tạp chí Tin học và
Điều khiển học, Tập 21(3), tr. 248-260.
[7] Lê Xuân Việt (2008), Định lượng ngữ nghĩa các giá trị của biến ngôn
ngữ dựa trên đại số gia tử và ứng dụng, Luận án Tiến sĩ Toán học, Viện
Công nghệ Thông tin - Viện Khoa học và Công nghệ Việt Nam.
[8] Lê Xuân Vinh (2006), Về một cơ sở đại số và logíc cho lập luận xấp xỉ
và ứng dụng, Luận án Tiến sĩ Toán học, Viện Công nghệ Thông tin -
Viện Khoa học và Công nghệ Việt Nam.
104
Tiếng anh
[9] S. S. Agaian, S. Blair and K. A. Panetta (2007), “Transform coefficient
histogram-based image enhancement algorithms using contrast entropy”,
IEEE Trans. Image Processing, vol. 16, no. 3, pp. 741-758.
[10] Aditi M., Irani S. (2006), “Contrast Enhancement of Images using
Human Contrast Sensitivity”, Applied perception in graphics and
visualization, 11, pp. 69-76.
[11] Aman T., Naresh K. (2014), “Performance Analysis of Type-2 Fuzzy
System for Image Enhancement using Optimization”, International
Journal of Enhanced Research in Science Technology & Engineering,
Vol. 3 Issue 7, pp. 108-116.
[12] Arici T., Dikbas S., and Altunbasak Y. (2009), “A Histogram Modification
Framework and Its Application for Image Contrast Enhancement,” IEEE
Transactions on Image Processing, vol. 18, no. 9, pp.1921-1935.
[13] A. Beghdadi, A.L. Negrate (1989), “Contrast enhancement technique
based on local detection of edges”, Comput. Vision Graphics Image
Process. 46, pp.162–174.
[14] Bezdek, James C (2013), “Pattern recognition with fuzzy objective
function algorithms”, Springer Science & Business Media.
[15] A.O. Boudraa and E. H. S. Diop (2008), “Image contrast enhancement
based on 2D teager-kaiser operator”, Proc. of the IEEE International
Conference on Image Processing, pp. 3180-3183.
[16] Cheng H.D, Huijuan Xu (2000), “A novel fuzzy logic approach to
contrast enhancement”, Pattern Recognition 33, pp. 809-819.
[17] Cheng H.D., Mei Xue, Shi X, J. (2003), “Contrast enhancement based on
a novel homogeneity measurement”, Pattern Recognition 36, pp. 2687–
2697.
105
[18] L. Dash, B. N. Chatterji (1991), “Adaptive contrast enhancement and de-
enhancement”, Pattern Recognition 24, pp. 289–302.
[19] A. P. Dhnawan, G. Buelloni, R. Gordon (1986), Enhancement of
mammographic features by optimal adaptive neighborhood image
processing, IEEE Trans. Med. Imaging 5, pp. 8–15.
[20] Fachao L., Lianquin S., Shuxin L. (2004), “A general model of fuzziness
measure”, in: Proc. 2004 Int. Conf. on Machine Learning and
Cybernetic 3, pp. 1831–1835.
[21] R. C. Gonzalez and R. E. Woods, Digital Image Processing, Prentice
Hall, New Jersey, 2008.
[22] M. M. Gupta, J. Qi (1991), “Theory of t-norms and fuzzy inference
methods”, Fuzzy Sets and Systems 40, pp:431-450.
[23] Hanmandlu M., Devendra Jha, Rochak (2003), “Color image enhancement
by fuzzy intensification”, Pattern Recognition Letters 24, pp.81–87.
[24] Hanmandlu M., Devendra Jha (2006), “An Optimal Fuzzy System for
Color Image Enhancement”, IEEE Transactiong on Image Processiong,
Vol. 15, No.10, pp. 2956-2966.
[25] Hanmandlu M., Om Prakash Verma, Nukala Krishna Kumar and
Muralidhar Kulkami (2009), “A Novel Optimal Fuzzy System for Color
Image Enhancement Using Bacterial Foraging”, IEEE Transactions on
Instrumentation and Measurement, Vol. 58, No. 8, pp. 2867-2879.
[26] Hasanien A.E., Badr A. (2003), “A Comparative Study on Digital
Mamography Enhancement Algorithms Based on Fuzzy Theory”,
Studies in Informatics and Control, Vol.12, No.1, pp. 21-31.
[27] Hashemi, S., Kiani, S., Noroozi, N., & Moghaddam, M. E (2010), “An
image contrast enhancement method based on genetic algorithm”,
Pattern Recognition Letters, 31(13), pp. 1816–1824.
106
[28] Ho N. C., Wechler W. (1990), “Hedge algebra: An algebraic approach to
structures of sets of linguistic truth values”, Fuzzy Sets and Systems 35,
pp. 281–293.
[29] Ho N. C., Wechler W. (1992), “Extended algebra and their application to
fuzzy logic”, Fuzzy Sets and Systems 52, pp. 259–281.
[30] Ho N. C., Lan V. N. and Viet L. X. (2008), “Optimal hedge-algebras-
based controller: Design and application”, Fuzzy Sets and Systems,
vol.159, pp.968-989.
[31] Ho N. C., Khang T. D., Nam H. V., Chau N. H. (1999), “Hedge algebras,
linguistic–valued logic and their application to fuzzy reasoning”,
International Journal of Uncertainty, Fuzziness and Knowledge–Based
Systems, 7(4), pp. 347–361.
[32] Ho N. C., Nam H. V. (1999), “Ordered Structure-Based Semantics of
Linguistic Terms of Linguistic Variables and Approximate Reasoning”,
AIP Conf. Proc. on Computing Anticipatory Systems, CASYS’99, 3th
Inter. Conf., pp. 98–116.
[33] Ho N. C., Lan V. N. (2006), “Hedges Algebras: An algebraic approach
to domains of linguistic variables and their applicability”, ASEAN J. Sci.
Technol. Development, 23(1), pp. 1–18.
[34] Ho N. C. (2007), “A topological completion of refined hedge algebras
and a model of fuzziness of linguistic terms and hedges”, Fuzzy Sets and
Systems 158 (4), pp. 436–451.
[35] Ho N. C., Long N. V. (2007), “Fuzziness measure on complete hedge
algebras and quantifying semantics of terms in linear hedge algebras”,
Fuzzy Sets and Systems, 158(4), pp. 452–471.
[36] Huang K.Q., Wang Q., Wu Z.Y. (2006), “Natural color image
enhancement and evaluation algorithm based on human visual system”,
Comput. Vis. Image Underst, 103, pp. 52–63.
107
[37] Balasubramaniam Jayaram, Kakarla V.V.D.L. Narayana, V. Vetrivel,
“Fuzzy Inference System based Contrast Enhancement”, EUSFLAT-LFA
2011.011.
[38] John S., Hanmandlu M., Vasikarla S. (2005), “Fuzzy based arameterized
Guassian Edge Detector Using Global and Local Properties”,
International Conference on Information Technology, 02, pp. 101–106.
[39] Kim J-Y, Kim L-S, Hwang S.-H (2001), “An advanced contrast
enhancement using partially overlapped sub-block histogram equalization”,
IEEE Trans. Circuits Syst. Video Technol.11(4), pp:475–484.
[40] Kiszka J. B., Kochanska M. E., Sliwinska D. S. (1985), “The inference
of some fuzzy implication operators on the accuracy of a fuzzy model”,
Part I, Fuzzy Sets and Systems 15, pp. 111–128.
[41] Koczy L. T., Hirota K. (1993), “Interpolative reasoning with insufficient
evidence in sparse fuzzy rules bases”, Infor. Science 71, pp. 169–201.
[42] K. Singh, R. Kapoor (2014), "Image enhancement using exposure based
sub image histogram equalization", Pattern Recogn. Lett. 36, pp:10–14.
[43] K. Gu, G. Zhai, M. Liu, Q. Xu, X. Yang, and W. Zhang (2013),
"Brightness preserving video contrast enhancement using S-shaped
transfer function," in Proc. IEEE Vis. Commun. Image Process., pp. 1-6.
[44] K. Gu, G. Zhai, S. Wang, M. Liu, J. Zhou, and W. Lin (2015), "A general
histogram modification framework for efficient contrast enhancement," in
Proc. IEEE Int. Symp. Circuits and Syst., pp. 2816-2819.
[45] K. Gu, G. Zhai, W. Lin, and M. Liu (2016), "The analysis of image
contrast: From quality asessment to automatic enhancement," IEEE
Trans. Cybernetics, vol. 46, no. 1, pp. 284-297.
[46] Yu-Ren Lai, Kuo-Liang Chung, Chyou-Hwa Chen, Guei-Yin Lin, Chao-
Hsin Wang (2012), “Novel mean-shift based histogram equalization using
textured regions”, Expert Systems with Applications 39, pp:2750–2758.
108
[47] Yu-Ren Lai, Kuo-Liang Chung, Guei-Yin Lin, Chyou-Hwa Chen (2012),
“Gaussian mixture modeling of histograms for contrast enhancement”,
Expert Systems with Applications 39, pp:6720–6728.
[48] Yu-Ren Lai, Kuo-Liang Chung, Guei-Yin Lin, Chyou-Hwa ChenN
(2012), “Gaussian mixture modeling of histograms for contrast
enhancement”, Expert Systems with Applications 39, pp: 6720–6728.
[49] S. Lee (2007), “An efficient content-based image enhancement in the
compressed domain using Retinex theory”, IEEE Trans. Circuits and
Systems for Video Technology, vol. 17, no. 2, pp:199-213.
[50] Lior S.(2006), “Human Perception-based Color Segmentation Using
Fuzzy Logic”, IPCV, pp. 496-502.
[51] Manglesh K., Shweta S., Priya B. (2005), “An efficient algorithm for
Image Enhancement”, Indian Journal of Computer Science and
Engineering (IJCSE), pp. 118-123.
[52] Matinfar H.R., Sarmadian F., Alavi P. S.K., Heck R.J. (2007),
“Comparison of object-oriented and pixel-based classification on
Lansadsat7, Etm+ Spectral Bands (Case Study: Arid Region of Iran)”,
American-Eurasian J. Agric. & Environ, pp.448-456.
[53] Meshoul S., Batouche M. (2002), “Ant colony system with extremal
dynamics for point matching and pose estimation”, International
Conference on Pattern Recognition, pp. 823–826.
[54] Mizumoto M., Extended fuzzy reasoning (1985), “Approximately
reasoning in Expert systems”, Elsevier Science Publishers B. V, (North
Holland), pp. 71–85.
[55] Mizumoto M. (1985), “Fuzzy inference with “if…then…else…” under
new compositional rules of inference”, Management Decision Support
Systems Using Fuzzy Sets and Possibility Theory (ed. by J.Kacprzyk and
R.R.Yager), Verlag TUV Rheinland, W.Germany, pp. 229–239.
109
[56] M. Shakeri, M.H. Dezfoulian ∗, H. Khotanlou, A.H. Barati, Y. Masoumi
(2017), “Image contrast enhancement using fuzzy clustering with
adaptive cluster parameter and sub-histogram equalization”, Digital
Signal Processing 62, pp. 224-237
[57] Naik, S.K., Murthy, C.A. (2003), “Hue-preserving color image
enhancement without gamut problem”, IEEE Trans. Image Process.
12(12), pp.1591–1598.
[58] Nock, Richard (2004), "Statistical Region Merging" IEEE Transactions
on Pattern Analysis and Machine Intelligence, 26 (11), pp. 1–7.
[59] Om P. V., Puneet K., Hanmandlu M., Sidharth C. (2011), “High
dynamic range optimal fuzzy color image enhancement using Artificial
Ant Colony System”, Applied Soft Computing, pp. 394-404.
[60] Palanikumar S., Sasikumar M., J. Rajeesh (2012), “Entropy Optimized
Palmprint Enhancement Using Genetic Algorithm and Histogram
Equalization”, International Journal of Genetic Engineering, pp. 12-18.
[61] Ponomarenko N. Ponomarenko, L. Jin, O. Ieremeiev, V. Lukin, K.
Egiazarian, J. Astola, B. Vozel, K. Chehdi, M. Carli, F.Battisti, C.-C. Jay
Kuo (2015), “Image database TID2013: Peculiarities, results and
perspectives, Signal Processing”, Image Communication, vol. 30, pp.57-77
[62] Pei, S.C., Zeng, Y.C., Chang, C.H. (2004), “Virtual restoration of
ancient Chinese paintings using color contrast enhancement and Lacuna
texture synthesis”, IEEE Trans. Image Process. 13(3), pp. 416–429.
[63] Sarode M.K.V, Ladhake S.A., Deshmukh P.R. (2008), Fuzzy system for
color image enhancement, World Academy of Science, Engineering &
Technology, 48, pp. 311-316.
[64] M. J. Soha and A. A. Schwartz (1978), “Multi-dimensional histogram
normalization contrast enhancement,” in Proc. 5th Canada. Symp..
Remote Sensing, pp.86–93.
110
[65] Jaynes E.T. (1957), Information Theory and Statistical Mechanics,
Physical Review, pp. 620-630.
[66] Jean-Luc Starck, Fionn Murtagh, and David L. Donoho (2003), “Gray
and Color Image Contrast Enhancement by the Curvelet Transform”,
IEEE Transactions on Image Processing, Vol. 12, No. 6.
[67] Sheeba Jenifer, S.Parasuraman, Amudha Kadirvelu (2016), “Contrast
enhancement and brightness preserving of digital mammograms using
fuzzy clipped contrast-limited adaptive histogram equalization
algorithm”, Applied Soft Computing, Volume 42, pp.167-177
[68] Shen-Chuan Tai, Ting-Chou Tsai, Yi-Ying Chang, Wei-Ting Tsai and
Kuang-Hui Tang (2012), “Contrast Enhancement through Clustered
Histogram Equalization”, Research Journal of Applied Sciences,
Engineering and Technology 4(20), pp.3965-3968.
[69] Shi Y., Mizumoto M. (1997), “Reasoning conditions on Koczy’s
interpolative reasoning method in sparse fuzzy rules bases”, Part II,
Fuzzy Sets and Systems 87, pp. 47–56.
[70] Shi Y., Mizumoto M., Wu Z. Q. (1995), “Reasoning conditions on
Koczy’s interpolative reasoning methods in sparse fuzzy rules bases”,
Fuzzy Sets and Systems 75, pp. 63–71.
[71] Subba R. K., Raju C. N., and Maddala L. B. (2011), “Feature Extraction
for Image Classification and Analysis with Ant Colony Optimization
Using Fuzzy Logic Approach, Signal and image processing”, An
International Journal (SIPIJ), 2(4), pp.137-143.
[72] Sudhavani G., Srilakshmi M., Rao P. V. (2014), “Comparison of Fuzzy
Contrast Enhancement Techniques”, International Journal of Computer
Applications, Volume 95– No.22, pp.26-31.
[73] Tang B., Sapiro G., Caselles V. (2001), “Color image enhancement via
chromaticity diffusion”, IEEE Trans. Image Process., pp. 701–707.
111
[74] Tao C.W., Taur J.S., Jeng J.T., and Wang W.Y. (2009), “A Novel Fuzzy
Ant Colony System for Parameter Determination of Fuzzy Controllers”,
International Journal of Fuzzy Systems, 11(4), pp.298-307.
[75] Tizhoosh H. R., Fochem M., “Image Enhancement with Fuzzy
Histogram Hyperbolization”, Proceedings of EUFIT’95, vol. 3, 1995,
pp. 1695-1698.
[76] Wadud, M. A. A., Kabir, M. H., Dewan, M. A. A., & Chae, O. (2007),
“A dynamic histogram equalization for image contrast enhancement”,
IEEE Transactions on Consumer Electronics, 53(2), pp.593–600.
[77] Yager R. R. (1994), “Aggregation operators and fuzzy systems
modelling”, Fuzzy Sets and Systems 67, pp. 129–145.
[78] Yu D., Ma L. H., Lu H.Q. (2007), “Normalized SI correction for hue-
preserving color image enhancement”, International Conference on
Machine Learning and Cybernetics, pp. 1498–1503.
[79] Zadeh L. A. (1975), “The concept of linguistic variable and its
application to approximate reasoning”, Inform. Sci. 8, pp. 199–249.
[80] Zimmermann H.J. (1991), Fuzzy sets theory and its applications, 2nd
Ed., Kluwer Acad. Pub., USA.
112
PHỤ LỤC
A/ ĐẠI SỐ GIA TỬ
I. Chứng minh (AX, AY, Hint) là một HA-intensification
. 1 1
1 1
m
m
m
với ,m (0,1).
Thật vậy: Xét hàm
( ) 1 (1 ) 1 (1 )m m
g m m 1 1
1 1 0m mg
m
( ) (0 ) 0 0 1, 0 1g g m
Vậy 1 1
1 1
m
m
m
b. Nếu chọn sao cho 1 1
1 1
m
m
thì 1 1
1 1
m
< m
Khi đó x, < x 1, ta có
1 1
1 1
x m x
x m x
x, < x 1 và 1 1 1
1 1 1
m x x x
m x x x
x, 0 < x <
Thật vậy:
Ta chứng minh 1
1ln
1( )
1ln
1
m x
m xf x
x
x
là hàm giảm trên (0,1) khi 0 < m <1.
Do
2
1
21
1
m x
mm x
x m x
;
2
1
21
1
x
x
x x
2 2 21
2
2 2 2
2 1 11 ln 1 ln
1 11ln 1 1
1
f x m xm x m x
x x m xxm x x
x
Xét 2 2 2
2
1 1( ) 1 ln 1 ln
1 1
x m xf x m x m x
x m x
, 2
( 0 ) 0f
21 1
2 ln ln1 1
f x m xm x m
x x m x
Do 0 <mx < x <1, 1 1 1ln ln ln
1 1 1
x m x m xm
x m x m x
20
f
x
2
( ) 0f x x (0,1) 1( )f x giảm trên (0,1) (đpcm)
Từ đó suy ra điều phải chứng minh.
113
B. MỘT SỐ KỸ THUẬT LIÊN QUAN ĐẾN XỬ LÝ ẢNH
I. Mô hình mầu
Mô hình màu là một mô hình toán học dùng để mô tả các màu sắc trong thực
tế đƣợc biểu diễn dƣới dạng số học. Trên thực tế có rất nhiều mô hình màu khác
nhau đƣợc mô hình để sử dụng vào những mục đích khác nhau. Trong bài này tôi
giới thiệu về ba mô hình màu cơ bản hay đƣợc nhắc tới và ứng dụng nhiều, đó là hệ
mô hình màu RGB, HSV và CMYK.
1.1. Mô hình màu RGB
RGB là mô hình màu rất phổ biến đƣợc dùng trong đồ họa máy tính và nhiều
thiết bị kĩ thuật số khác. Ý tƣởng chính của mô hình màu này là sự kết hợp của 3
màu sắc cơ bản: màu đỏ (R, Red), xanh lục (G, Green) và xanh lơ (B, Blue) để mô
tả tất cả các màu sắc khác.
Nếu nhƣ một ảnh số đƣợc mã hóa bằng 24bit, nghĩa là 8 bit cho kênh R, 8 bit
cho kênh G, 8 bit cho kênh B, thì mỗ kênh này màu này sẽ nhận giá trị từ 0-255.
Với mỗi giá trị khác nhau của các kênh màu kết hợp với nhau ta sẽ đƣợc một màu
khác nhau, nhƣ vậy ta sẽ có tổng cộng 255x255x255 = 1.66 triệu màu sắc. Ví dụ:
màu đen là sự kết hợp của các kênh màu (R, G, B) với giá trị tƣơng ứng (0, 0, 0)
màu trắng có giá trị (255, 255, 255), màu vàng có giá trị (255, 255, 0), màu tím đậm
có giá trị (64, 0, 128) ...Nếu ta dùng 16bit để mã hóa một kênh màu (48bit cho toàn
bộ 3 kênh màu) thì dải màu sẽ trãi rộng lên tới 3*2^16 = ... Một con số rất lớn.
Mô hình màu RGB
114
1.2. Mô hình màu CMYK
CMYK là mô hình màu đƣợc sử dụng phổ biến trong ngành công nghiệp in ấn.
Ý tƣởng cơ bản của hệ mô hình này là dùng 4 màu sắc cơ bản để phục vụ cho việc
pha trộn mực in. Trên thực tế, ngƣời ta dùng 3 màu là C=Cyan: xanh lơ, M =
Magenta: hồng xẫm, và Y = Yellow: vàng để biểu diễn các màu sắc khác nhau. Nếu
lấy màu hồng xẫm cộng với vàng sẽ ra màu đỏ, màu xẫm kết hợp với xanh lơ sẽ cho
xanh lam ... Sự kết hợp của 3 màu trên sẽ cho ra màu đen, tuy nhiên màu đen ở đây
không phải là đen tuyệt đối và thƣờng có độ tƣơng phản lớn, nên trong ngành in, để
tiết kiệm mực in ngƣời ta thêm vào màu đen để in những chi tiết có màu đen thay vì
phải kết hợp 3 màu sắc trên. Và nhƣ vậy ta có hệ màu CMYK. Chữ K ở đây là để kí
hiệu màu đen (Black), có lẽ chữ B đã đƣợc dùng để biểu diễn màu Blue nên ngƣời
ta lấy chữ cái cuối K để biểu diễn màu đen?
Nguyên lý làm việc của hệ màu này nhƣ sau: Trên một nền giấy trắng, khi mỗi
màu này đƣợc in lên sẽ loại bỏ dần đi thành phần màu trắng. Ba màu C, M, Y khác
nhau in theo những tỉ lệ khác nhau sẽ loại bỏ đi thành phần đó một cách khác nhau
và cuối cùng cho ta màu sắc cần in. Khi cần in màu đen, thay vì phải in cả 3 màu
ngƣời ta dùng màu đen để in lên. Nguyên lý này khác với nguyên lý làm việc của hệ
RGB ở chỗ hệ RGB là sự kết hợp của các thành phần màu, còn hệ CMYK là sự loại
bỏ lẫn nhau của các thành phần màu.
Mô hình màu CYMK
115
1.3. Mô hình màu HSV
HSV là mô hình màu đƣợc dùng nhiều trong việc chỉnh sửa ảnh, phân tích ảnh
và một phần của lĩnh vực thị giác máy tính. Hệ mô hình này dựa vào 3 thông số H =
Hue: màu sắc, S = Saturation: độ đậm đặc, sự bảo hòa, V = value: giá trị cƣờng độ
sáng để mô tả màu sắc.
Mô hình màu này thƣờng đƣợc biểu diễn dƣới dạng hình trụ hoặc hình nón.
Theo đó, đi theo vòng tròn từ 0 -360 độ là trƣờng biểu diễn màu sắc(Hue).
Trƣờng này bắt đầu từ màu đỏ đầu tiên (red primary) tới màu xanh lục đầu tiên
(green primary) nằm trong khoảng 0-120 độ, từ 120 - 240 độ là màu xanh lục tới
xanh lơ (green primary - blue primary). Từ 240 - 360 là từ màu đen tới lại màu đỏ.
Theo nhƣ cách biểu diễn mô hình màu theo hình trụ nhƣ trên, đi từ giá trị độ
sáng (V) đƣợc biểu diễn bằng cách đi từ dƣới đáy hình trụ lên và nằm trong khoảng
từ 0 -1. Ở đáy hình trụ V có giá trị là 0, là tối nhất và trên đỉnh hình trụ là độ sáng
lớn nhất (V = 1). Đi từ tâm hình trụ ra mặt trụ là giá trị bão hòa của màu sắc (S). S
có giá trị từ 0 - 1. 0 ứng với tâm hình trụ là chỗ mà màu sắc là nhạt nhất. S = 1 ở
ngoài mặt trụ, là nơi mà giá trị màu sắc là đậm đặc nhất.
Nhƣ vậy với mỗi giá trị (H, S, V) sẽ cho ta một màu sắc mà ở đó mô tả đầy đủ
thông tin về máu sắc, độ đậm đặc và độ sáng của màu đó.
1.4. Chuyển đổi từ RGB sang HSV
Hàm RGB_HSV_Conversion
H: Sắc độ màu [0-360] với màu đỏ tại điểm 0
116
S: Độ bão hòa [0-1]
V: Giá trị cƣờng độ sáng [0-1]
{
//Xác định giá trị cƣờng độ sáng
V= max(R,G,B)
//Xác định độ bão hòa
Temp= min(R,G,B)
If V=0 than
S= 0
Else
S= (V-Temp)/V
End
//Xác định sắc màu
IF s=0 THEN
H= Undefined
Else
Cr= (V-R)/(V-Temp);
Cg= (V-G)/(V-Temp);
Cb= (V-B)/(V-Temp);
// Màu nằm trong khoảng giữa vàng (Yellow) và đỏ tía (Magenta)
If R=V then
H= Cb-Cg
// Màu nằm trong khoảng giữa xanh tím (cyan) và vàng (yellow)
If G= V then
H= 2+Cr-Cb
// Màu nằm trong khoảng giữa đỏ tƣơi (magenta) và xanh (cyan)
If B=V then
H= 4+ Cg – Cr
H= 60*H // Chuyển sang độ
//Loại các giá trị âm
If H < 0 then
H= H+360
117
}
1.5. Chuyển đổi từ HSV sang RGB
Hàm HSV_RGB_Conversion()
H: Sắc độ màu [0-360] với màu đỏ tại điểm 0
S: Độ bão hòa [0-1]
V: Giá trị cƣờng độ sáng [0-1]
{
//Kiểm tra trƣờng hợp ánh sáng không màu
If S=0 then
If H=Undifined then
R= V
G= V
B= V
Endif
Else
If H=360 then
H= 0
Else
H= H/60
endif
I= Floor(H)
F= H-I
M= V*(1-S)
N= V*(1-S*F)
K= V*(1-S*(1-F))
//(R,G,B)=(V,K,M) R= V; C= K; B= M
If I=0 then
(R,G,B)=(V,K,M);
If I=1 then
(R,G,B)=(N,V,M);
If I=2 then
(R,G,B)=(M,V,K);
118
If I=3 then
(R,G,B)=(M,N,V);
If I=4 then
(R,G,B)=(K,M,V);
If I=5 then
(R,G,B)=(V,M,N);
} II. Phép căn bằng lƣợc đồ xám của ảnh một kênh
Phép cân bằng lƣợc đồ xám của một kênh ảnh là phép biến đổi mức xám để lƣợc đồ
xám đƣợc hiệu chỉnh cân đối bằng nhau.
m in m ax m in m ax( , ) [ , ] 1 ,1 ( , ) [ , ] 1 ,1I I i j L L i M j N Ieq Ieq i j L L i M j N
m in'
m in m a x m in
( ')
1, , 1, : ( , ) ( , )
g
Id e f
g L
H is g
i M j N g I i j Ie q i j L L LM N
, trong đó
( ) # { (i,j) ( , ) }I
H is g I i j g , [x] ký hiệu là phần nguyên của số thực x.
(a) Ảnh gốc.
Ảnh sau khi cân bằng
Lƣợc đồ xám kênh R
Lƣợc đồ xám kênh R
119
Lƣợc đồ xám kênh G
Lƣợc đồ xám kênh G
Lƣợc đồ xám kênh B
Lƣợc đồ xám kênh B.
Hình A.1. Cân bằng lƣợc đồ xám áp dụng cho từng kênh của ảnh mầu
III. Các phƣơng pháp phát hiện biên ảnh trực tiếp
1. Kỹ thuật phát hiện biên Gradient
Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ
thay đổi giá trị của điểm ảnh, ta có:
Trong đó, dx, dy là khoảng cách (tính bằng số điểm) theo hƣớng x và y.
* Nhận xét:
Vì ảnh số là tín hiệu rời rạc nên khi tính toán chúng ta xấp xỉ đạo hàm
bằng các kỹ thuật nhân chập, chẳng hạn khi lấy dx = dy = 1 chúng ta xấp xỉ
Với dx = dy = 1, ta có:
dy
yxfdyyxffy
y
yxf
dx
yxfydxxffx
x
yxf
),(),(),(
),(),(),(
120
yxfyxfy
f
yxfyxfx
f
,1,
,,1
Do đó, mặt nạ nhân chập theo hƣớng x là A= 11 và hƣớng y là
B =
1
1
2. Kỹ thuật Prewitt
Kỹ thuật sử dụng 2 mặt nạ nhập chập xấp xỉ đạo hàm theo 2 hƣớng x
và y là:
Hx = (
), Hy = (
)
3. Kỹ thuật Sobel
Tƣơng tự nhƣ kỹ thuật Prewitt kỹ thuật Sobel sử dụng 2 mặt nạ nhân
chập theo 2 hƣớng x, y là:
Hx = (
), Hy = (
)
B/ LÝ THUYẾT TẬP MỜ
I. Định ngĩa toán tử t-norm
Định nghĩa toán tử t-norm [22]. Giả sử hàm số T:[0, 1] x [0, 1] [0, 1], T là một
t-norm nếu và chỉ nếu:
Với mọi x, y, z [0, 1]:
(1.1) T(x, y) = T(y, x) (giao hoán),
(1.2) T(x, y) T(x, z), nếu y z (đơn điệu),
(1.3) T(x, T(y, z)) = T(T(x, y), z) (kết hợp),
(1.4) T(x, 1 ) = x .
t-norm T gọi là thỏa mãn điều kiện Archimed, nếu
(1.5) T(x, y) là liên tục,
(1.6) T(x, x) < x x (0, 1).
Một t-norm thỏa mãn điều kiện Archimed thì
121
(1.7) T(x', y') < T(x, y), thì x ' <x, y' <y, x', y', x, y (0, 1).
II. Thuật toán phân cụm FCM
Thuật toán phân cụm mờ đƣợc Bezdek [2] đề xuất dựa trên độ thuộc ukj của
phần tử dữ liệu Xk từ cụm j. Hàm mục tiêu đƣợc xác định nhƣ sau: 2
1 1
m in
N C
m
kj j
k j
kI VJ u
(12)
+ m là số mờ hóa + C là số cụm, N là số phần tử dữ liệu, r là số chiều của dữ liệu. + ukj là độ thuộc của phần tử dữ liệu Xk từ cụm j.
+ Xk ∈ Rr là phẩn tử thứ k của X X1, X2, ..., X N .
+ Vj là tâm của cụm j. Khi đó ràng buộc của (1) là:
1
1
C
k j
j
u
, [0 ,1]kj
u k 1, N (2)
Sử dụng phƣơng pháp Lagrange, xác định đƣợc tâm của cụm dựa vào (3) và
độ thuộc dựa vào (4) từ hàm mục tiêu (1):
1
1
C
m
k j k
k
C
m
k j
k
j
u X
u
V
(3)
1
1
1
1
C
i
k j
m
k j
k i
u
VX
VX
Khi đó thuật toán Fuzzy C-means nhƣ sau:
Input: Tập dữ liệu X gồm N phần tử trong không gian r chiều; số cụm C;
mờ hóa m; ngƣỡng ; số lần lặp lớn nhất Maxstep
Ountput Ma trận U và tâm cụm V.
Bƣớc
1 t = 0
2 ( ); ( 1, ; 1, )
t
k ju random k N j C thỏa mãn điều kiện (2)
3 Repeat
4 t = t + 1
5 Tính ( ); ( 1, )
t
jV j C bởi công thức (3)
6 Tính ( ); ( 1, ; 1, )
t
k ju k N j C theo công thức (4)
7 Until
( ) ( 1)t tU U
hoặc t > Maxstep
122
C/ TẬP DỮ LIỆU ẢNH
I. Tập dữ liệu
#I01: Kích thƣớc 512x384
#I02: Kích thƣớc 512x384
#I03: Kích thƣớc 512x384, cũng ký hiệu là #3
#I04: Kích thƣớc 512x384, cũng ký hiệu là #5
#I05: Kích thƣớc 512x384
#I06: Kích thƣớc 512x384
#I07: Kích thƣớc 512x384, cũng ký hiệu là #4
#I08: Kích thƣớc 512x384
123
#I09: Kích thƣớc 512x384
#I10: Kích thƣớc 512x384
#I11: Kích thƣớc 512x384
#I12: Kích thƣớc 512x384
#I13: Kích thƣớc 512x384
#I14: Kích thƣớc 512x384
#I15: Kích thƣớc 512x384
#I16: Kích thƣớc 512x384
124
#I17: Kích thƣớc 512x384
#I18: Kích thƣớc 512x384
#I19: Kích thƣớc 512x384
#I20: Kích thƣớc 512x384
#I21: Kích thƣớc 512x384
#I22: Kích thƣớc 512x384
#I23: Kích thƣớc 512x384
#I24: Kích thƣớc 512x384
125
#6: Kích thƣớc 512x384
#2: Kích thƣớc 256x384
#1: Kích thƣớc 256x384