nâng cao chất lượng ảnh trong miền không gian
Post on 28-Dec-2015
462 Views
Preview:
DESCRIPTION
TRANSCRIPT
Trang 1
ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA ĐIỆN-ĐIỆN TỬ
BỘ MÔN VIỄN THÔNG ---------------o0o---------------
BÁO CÁO ĐỒ ÁN MÔN HỌC 1
TÌM HIỂU NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH
TRONG MIỀN KHÔNG GIAN
SVTH : Nguyễn Tuấn Quang
MSSV : 41002596
GVHD : T.S. Võ Trung Dũng
Tp. Hồ Chí Minh, tháng 12 năm 2013
Trang 2
ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập – Tự do – Hạnh phúc.
-----✩----- -----✩----- Số: ______ /BKĐT Khoa: Điện – Điện tử Bộ Môn: Viễn Thông
NHIỆM VỤ ĐỒ ÁN MÔN HỌC 1
1. HỌ VÀ TÊN : Nguyễn Tuấn Quang MSSV: 41002596
2. NGÀNH: ĐIỆN TỬ - VIỄN THÔNG LỚP : DD10DV05 Đề tài: TÌM HIỂU NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH TRONG MIỀN KHÔNG GIAN
3. Nhiệm vụ (Yêu cầu về nội dung và số liệu ban đầu):
............................................................................................................................. ................
.............................................................................................................................................
............................................................................................................................. ................
.............................................................................................................................................
............................................................................................................................. ................
............................................................................................................................. ................
4. Ngày giao nhiệm vụ đồ án: ...............................
5. Ngày hoàn thành nhiệm vụ: ...................................
6. Họ và tên người hướng dẫn: Phần hướng dẫn
................................................................. .....................................
................................................................. .....................................
Nội dung và yêu cầu Đồ án đã được thông qua Bộ Môn. Tp.HCM, ngày…... tháng….. năm 2013 CHỦ NHIỆM BỘ MÔN NGƯỜI HƯỚNG DẪN CHÍNH PHẦN DÀNH CHO KHOA, BỘ MÔN: Người duyệt (chấm sơ bộ): ....................... Đơn vị: ............................................................... Ngày bảo vệ: .................................................... Điểm tổng kết: ................................................ Nơi lưu trữ đồ án: ………..............................
Trang 3
Phần Mở đầu
Lời nói đầu
Từ khi máy tính cá nhân được phổ biến thì xử lý ảnh cũng phát triển theo. Sự phát triển như vũ bão
của công nghệ đã và đang mang một lợi thế to lớn đối không chỉ xử lý ảnh mà mọi khía cạnh, lĩnh vực
của cuộc sống. Trong những năm gần đây, khi được các nhà phân tích đánh giá là thời kì “hậu PC” thì
smartphone lên ngôi. Sự xuất hiện của smartphone cùng các ứng dụng chỉnh sửa vô cùng dễ dàng và
thân thiện đã khiến việc xử lý hình ảnh đơn giản hơn bao giờ hết. Chỉ vài cú tap màn hình là bạn đã
có thể được một bức ảnh đã xử lý màu sắc, tương phản như ý muốn. Xử lý ảnh đóng góp vai trò không
hề nhỏ trong cuộc sống hiện nay vì nó không chỉ phục vị cho nhu cầu cá nhân mà còn cho mục đích
nghiên cứu khoa học.
Với sự phát triển đó Xử lý ảnh là lĩnh vực đang rất được quan tâm và là môn học yêu thích của rất
nhiều bạn sinh viên. Do sự phát triển nhanh chóng, đa dạng của Xử lý ảnh nên tài liệu này sẽ trình bày
những nét tổng quát nhất về nó và tập trung chủ yếu về vấn đề Chỉnh sửa và nâng cao chất lượng
ảnh trong miền không gian.
Lịch sử hình thành của xử lý ảnh
Một trong những ứng dụng đầu tiên của xử lý ảnh đã được áp dụng vào ngành công nghiệp báo chí,
khi đó người ta đã gửi những bức ảnh từ London qua New York bằng cáp ngầm. Việc giới thiệu hệ
thống truyền hình ảnh Bartlane trong những năm đầu thập kỉ 20 của thế kỷ trước đã giúp giảm thiểu
thời gian truyền hình ảnh. Nếu trước kia người ta phải mất cả tuần để truyền thì khi đó bằng việc áp
dụng truyền bằng cáp ngầm chỉ mất chưa đầy 3 tiếng đồng hồ. Ở thời điểm đó đây của là một điều kỳ
diệu. Những thiết bị in ấn chuyên ngành sẽ mã hóa hình ảnh cho cáp truyền và sau đó sẽ được tái cấu
trúc tại đầu cuối (nơi nhận). Có thể nói rằng ảnh số nói chung và xử lý ảnh số nói riêng đã được khai
sinh vào những năm đầu của thập niên 20. [1]
Một số vấn đề nảy sinh trong việc gia tăng chất lượng hiển thị của hình ảnh liên quan tới việc chọn
lựa dây truyền in hay sự phân bố của mức đậm nhạt của hình ảnh. Hệ thống Bartlane ban đầu được
mã hóa với 5 mức xám khác nhau. Sau đó được cải tiến thành 15 mức vào năm 1929.
Trong những năm 60 của thế kỷ trước xử lý ảnh đã được áp dụng vào công cuộc chinh phục không
gian bằng cách xử lý ảnh được gửi từ những tàu thám hiểm vũ trụ.
Song song với sự phát triển ứng dụng xử lý ảnh trong ngành khoa học không gian thì những kỹ thuật xử lý ảnh cũng được áp dụng vào trong y khoa những năm cuối 60 đầu 70. Có thể kể đến 2 ứng dụng nổi bật của xử lý ảnh trong y khoa thời đó là CAT (computerized axial tomography: chụp cắt lớp trục xử dụng máy tính) hay còn được gọi với tên quen thuộc là CT (computerized tomography: chụp cắt lớp xử dụng máy tính). Chụp hình CT là công trình nghiên cứu khoa học đạt giải Nobel Y học của 2 nhà khoa học là Sir Godfrey N. Hounsfield và Giáo sư Allan M. Cormack. Từ những năm 60 cho tới nay, lĩnh vực xử lý ảnh đã phát triển chóng mặt. Ngoài việc được ứng dụng trong y khoa và trong khoa học không gian… xử lý ảnh được áp dụng cho rất nhiều lĩnh vực khác nhau.
Trang 4
MỤC LỤC
Các đề mục chính bao gồm
Phần I: TỔNG QUAN VỀ XỬ LÝ ẢNH
Nội dung phần này gồm:
I.1 Xử lý ảnh là gì và ứng dụng của nó? Trang 5- trang 7
I.2 Các khái niệm cơ bản Trang 7- trang 12
Phần này cung cấp cho chúng ta cái nhìn tổng thể về xử lý ảnh, các khái niệm cơ bản và các ứng dụng
tiêu biểu của nó.
Phần II: XỬ LÝ ẢNH TRONG MIỀN KHÔNG GIAN
II.1 Giới thiệu Trang 13-trang 15
II.2 Các phương pháp xử lý ảnh trong miền không gian
II.2.1 Một số biến đổi mức xám cơ bản Trang 16-trang 24
II.2.2 Xử lý ảnh thông qua histogram Trang 25-trang 35
Phần này cung cấp cho những giải thuật để xử lý ảnh thông qua điểm hay histogram. Ngoài ra sẽ có
những ví dụ ứng dụng thực tế bằng Matlab.
II.3 Tổng hợp Trang 36
Phần này cung cấp cho ta cái nhìn tổng hợp về các ý, mục đích của các phương pháp XLA đã được
trình bày ở những phần trên
Phần III: CÁI NHÌN VỀ TƯƠNG LAI CỦA XỬ LÝ ẢNH Trang 37-trang 38
Những ứng dụng đang được nghiên cứu để áp dụng vào tương lai của xử lý ảnh.
Phần IV: LỜI KẾT
Định hướng nghiên cứu trong tương lai, lời cảm ơn và chú thích những tài liệu, hình ảnh và thông tin
tham khảo trong tài liệu này.
Trang 39- trang 40
Trang 5
Phần I: TỔNG QUAN VỀ XỬ LÝ ẢNH
I.1 Xử lý ảnh là gì và ứng dụng của nó?
I.1.1 Tìm hiểu về xử lý ảnh
Xử lý ảnh (XLA) là một vấn đề rộng lớn, thường gồm nhiều công đoạn xử lý bằng toán học phức tạp
nhưng ý tưởng của việc XLA hoàn toàn đơn giản. Mục đích cuối cùng của XLA là sử dụng dữ liệu có
trong ảnh đưa vào máy tính để máy hiểu, nhận biết và biên dịch những thông tin mà ta cần khai thác. Các kỹ thuật nâng cao chất lượng ảnh làm cho chất lượng hình ảnh được cải thiện (có thể là về mặt
thẩm mỹ hay cung cấp thông tin). Một cách tổng quát thì nâng cao chất lượng ảnh thì được sử dụng
để khai thác các chi tiết trong bức hình, hoặc làm nổi bật một số khía cạnh thú vị nào đó. Khi XLA thì
có nhiều hơn 1 thông số trạng thái được chỉnh sửa. Nâng cao chất lượng ảnh có thể được áp dụng
trong các ngành khoa học, kỹ thuật khác nhau. Ngoài điều kiện chiếu sáng thì chất lượng của một bức
hình bị ảnh hưởng bởi nhiễu bên trong và sự nhiễu loạn của môi trường như là áp suất môi trường
xung quanh và độ biến thiên của nhiệt.
Các phương pháp nâng cao độ tương phản của hình ảnh bị hạn chế do mức xám của nó trải dài trên
một vùng lớn và nhiều mức độ. Một thuật toán thích ứng tốt phải đảm bảo thích nghi với sự phân bố
cường độ hình ảnh ngay cả trên toàn cục lẫn cục bộ. Bằng cách tách riêng khu vực mịn và chi tiết của
hình ảnh, thuật toán được áp dụng cho từng phần để tránh tăng cường quá nhiều nhiễu. Trong hầu
hết các trường hợp, chất lượng hình ảnh bị ảnh hưởng bởi môi trường không khí và môi trường nước,
do đó nâng cao hình ảnh được yêu cầu. Nâng cao chất lượng hình ảnh đã góp phần vào sự tiến bộ
nghiên cứu trong nhiều lĩnh vực. Một số mảng trong nâng cao chất lượng hình ảnh được ứng dụng
rộng rãi được nêu dưới đây.
Các phương pháp nâng cao chất lượng ảnh có thể chia thành 2 nhóm chính là: phương pháp trong
miền không gian và phương pháp trong miền tần số, trong đó:
- Phương pháp miền không gian: Cách tiếp cận của nó là tác động trực tiếp đến những điểm ảnh (pixel) có trong hình.
- Phương pháp miền tần số: dựa trên việc điều chỉnh, tác động biến đổi Fourier nâng cao chất
lượng hình ảnh của hình ảnh.
Quá trình xử lý ảnh là quá trình tác động vào ảnh đầu vào để thu nhận ảnh đầu ra như mong muốn.
Các công đoạn của xử lý ảnh có thể được tóm tắt bằng lược đồ sau.
Con người nhận biết sự vật xung quanh qua các giác quan, trong đó mắt là cơ quan quan trọng nhất
vì nó mang đến hơn 60% lượng thông tin. Với sự phát triển vượt bậc của phần cứng máy tính và các
ngôn ngữ lập trình ngày càng thân thiện kéo theo sự phát triển của đồ họa và xử lý ảnh một cách
nhanh chóng. Công việc xử lý ảnh đóng vai trò trung gian giữa môi trường xung quanh-máy tính-
người.
a) Thu nhận ảnh: Các thiết bị thu nhận ảnh bao gồm camera, scanner… Các thiết bị này có thể cho ảnh đen trắng hay màu. Thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thông dụng Raster và Vector. Các thiết bị thu nhận ảnh Raster thông thường là camera, các thiết bị thu nhận ảnh
Thu nhận ảnh Kỹ thuật số hóaXử lý ảnh bằng các thuật toán
Biểu diễn ảnh đầu ra và lưu
trữ
Trang 6
Vector thông thường qua các cảm biến hay được ảnh chuyển đổi từ ảnh Raster. Nhìn chung các hệ thống thu nhận ảnh thực hiện quá trình gồm 2 công đoạn:
• Cảm biến: biến đổi năng lượng quang học thành năng lượng điện. • Tổng hợp năng lượng điện thành ảnh.
b) Kỹ thuật số hóa: sau khi ảnh được chụp sẽ được lượng tử hóa để thành thông tin dưới dạng
nhị phân nhằm mục đích chỉnh sửa dựa trên thuật toán đại số dễ dàng lưu trữ và chỉnh sửa.
c) Xử lý bằng các thuật toán: có thể là có thuật toán dựa trên miền tần hay miền không gian.
Tùy vào mục đích khai thác thông tin trong ảnh khác nhau mà người ta sử dụng thuật toán
chuyên biệt khác nhau.
d) Thu nhận ảnh đầu ra và lưu trữ: sau khi ảnh đã qua xử lý chúng ta cần xuất ra các thiết bị
ngoại vi (màn hình, máy chiếu, máy in) để con người có thể nhìn thấy được. Ảnh trên máy tính
là kết quả thu nhận theo các phương pháp số hoá trong các thiết bị kỹ thuật khác nhau. Lưu
trữ cho các mục đích về sau. Quá trình lưu trữ ảnh nhằm 2 mục đích:
• Tiết kiệm bộ nhớ. • Giảm thời gian xử lý.
Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn và xử lý ảnh.
I.1.2 Ứng dụng của xử lý ảnh
Mục đích chính của việc điều chỉnh, nâng cao chất lượng là để xử lý hình ảnh nhằm thu được kết quả
áp dụng cho các ứng dụng chuyên biệt khác nhau. Ví dụ như:
1. Trong pháp y, nâng cao chất lượng hình ảnh được sử dụng để xác định, thu thập chứng
cứ và giám định. Hình ảnh thu được từ phát hiện dấu vân tay, video an ninh phân tích và điều tra hiện
trường vụ án được tăng cường để giúp đỡ trong việc xác định thủ phạm và bảo vệ nạn nhân.[2]
2. Trong khoa học khí quyển, nâng cao chất lượng hình ảnh được sử dụng để giảm tác động
của mây mù, sương mù và thời tiết hỗn loạn cho các đài quan sát khí tượng. Nó giúp cho việc phát hiện hình dạng và cấu trúc của các đối tượng từ xa trong cảm biến môi trường. Hình ảnh vệ tinh trải
qua công đoạn phục hồi hình ảnh và nâng cao để loại bỏ nhiễu.[3]
3. Trong vũ trụ học phải đối mặt với những thách thức do ô nhiễm ánh sáng và nhiễu có thể
được giảm thiểu tối đa bằng nâng cao chất lượng hình ảnh. Đối với làm nét thời gian thực và nâng cao
độ tương phản, một số máy ảnh có sẵn chức năng của nâng cao chất lượng hình ảnh được tích hợp.
Hơn nữa, rất nhiều phần mềm, cho phép chỉnh sửa hình ảnh như vậy để cung cấp kết quả tốt hơn và
sống động.[4]
4. Trong hải dương học nghiên cứu các hình ảnh cho thấy đặc tính thú vị của dòng nước,
nồng độ trầm tích, địa mạo và các mẫu địa hình. Những đặc tính này có thể quan sát rõ ràng hơn trong
hình ảnh kỹ thuật số được tăng cường để khắc phục vấn đề mục tiêu di động, thiếu ánh sáng và môi
trường xung quanh che khuất.[5]
5. Hình ảnh y tế sử dụng kỹ thuật nâng cao chất lượng hình ảnh để giảm nhiễu và tăng độ
sắc nét chi tiết để cải thiện thông tin cung cấp của hình ảnh. Vì chỉ cần 1 chi tiết nhỏ cũng đóng một
vai trò quan trọng trong chẩn đoán và điều trị bệnh, nên làm nổi bật các tính năng quan trọng trong
khi hiển thị hình ảnh y tế là cần thiết. Điều này làm cho nâng cao chất lượng hình ảnh trở thành một
công cụ trợ giúp cần thiết để xem khu vực giải phẫu trong MRI, siêu âm và chụp X-quang.[6]
Từ những ví dụ trên ta có thể thấy rằng việc xử lý hậu kì cho ảnh rất quan trọng, nó đáp ứng được rất
nhiều nhu cầu của các lĩnh vực không chỉ trong khoa học mà còn trong đời sống thường ngày. Chính
Trang 7
sự đa dạng đó đã tạo nên các kiểu gia giảm ảnh khác nhau nhằm phục vụ các mục đích khác nhau. Sẽ
không hợp lý nếu bạn áp dụng cách hiệu chỉnh ảnh trong lĩnh vực y học vào lĩnh vực thiên văn, kết
quả ra không được như mong đợi. Có thể nói rằng việc hiệu chỉnh hình ảnh là mảng vấn đề thú vị và
trực quan nhất trong xử lý ảnh.
I.2 Các khái niệm cơ bản
Để nắm bắt các kiến thức về XLA ta cần hiểu được những khái niệm cơ bản sau.
I.2.1 Ảnh
Ảnh là tập hợp của nhiều điểm ảnh (pixel), mỗi điểm ảnh được đặc trung bởi 1 mức xám (gray level)
hay một dấu hiệu nào đó tại một vị trí không gian xác định. Ảnh có thể xem như một hàm có n biến
không gian, vì thế có thể coi ảnh là đa chiều trong xử lý ảnh, có thể là 2 chiều, 3 chiều… Trong xử lý
ảnh, hình ảnh là kỹ thuật số và rời rạc.
I.2.2 Điểm ảnh
Điểm ảnh (pixel) là phần tử cấu tạo nên ảnh. Điểm ảnh được hiểu như 1 dấu hiệu hay cường độ sáng tại một tọa độ xác định trong không gian. HÌnh ảnh được xem như là 1 tập hợp các điểm với cùng kích thước nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo 2 mô hình cơ bản là raster và vector.
I.2.2.1 Mô hình Raster Đây là cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh được biểu diễn dưới dạng ma trận các điểm ảnh thu nhận qua các thiết bị như camera, scanner. Tuỳ theo yêu cầu thực thế mà mỗi điểm ảnh được biểu diễn qua 1 hay nhiều bit. Mô hình Raster thuận lợi cho hiển thị và in ấn. Ngày nay công nghệ phần cứng cung cấp những thiết bị thu nhận ảnh Raster phù hợp với tốc độ nhanh và chất lượng cao cho cả đầu vào và đầu ra.
I.2.2.2 Mô hình Vector Kiểu biểu diễn ảnh này ngoài mục đích tiết kiệm không gian lưu trữ dễ dàng cho hiển thị và in ấn còn đảm bảo dễ dàng trong lựa chọn sao chép di chuyển tìm kiếm… Trong mô hình vector người ta sử dụng hướng giữa các vector của điểm ảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu ảnh vector được thu nhận trực tiếp từ các thiết bị số hoặc được chuyển đổi từ ảnh Raster thông qua các thuật toán. I.2.3 Nhiễu:
Là những tín hiệu thông tin không mong muốn, gây cản trở cho quá trình xử lý ảnh. Để thu được kết
quả chính xác hơn ta cần loại bỏ nhiễu.
I.2.4 Mức xám (Gray level)
Là giá trị có thể có của các điểm ảnh, ví dụ: Đối với hệ màu Gray 8 bit có giá trị từ 0-255 (28-1). Mức
xám đầu vào trong tài liệu này sẽ được kí hiệu là r, còn đầu ra là s.
Trang 8
I.2.5 Histogram và ứng dụng của nó
I.2.5.1 Khái niệm cơ bản
Histogram là biểu đồ thể hiện độ sáng tương đối của một bức hình từ đen thuần khiết đến trắng thuần
khiết, để biểu diễn mức độ sáng này trong xử lý ảnh người ta quy ước biến r với giá trị trong khoảng
[0, L-1].
Hình ảnh ở trên biểu diễn độ xám (gray level) của các pixel có trong hình. Từ trái qua phải là 3 vùng
khác nhau là Tối (Shadows), Trung bình (Midtones) và Sáng (Highlights). 3 phân vùng sẽ thể hiện các
pixel có độ xám tương ứng. Hình dáng của Histogram phụ thuộc vào tông màu của cảnh vật và độ phơi
sáng.
I.2.5.2 Phát biểu về mặt kỹ thuật
Histogram của ảnh số với mức độ xám trong khoảng từ [0, L-1] là một hàm rời rạc h (rk) = nk trong đó
rk là mức độ xám và nk là số điểm ảnh có mức độ xám tương ứng. Trong thực tế người ta còn có hàm
p (rk) = nk/n cho k= [0, L-1] và n là tổng số điểm ảnh trong hình. Nói cách khác hàm p(rk) sẽ cho ta
biết được xác suất của rk. [7]
Một trong những khái niệm quan trọng trong xử lý ảnh là histogram. Histogram của ảnh I là số điểm
ảnh có giá trị g mức xám, được kí hiệu là h(g). Ví dụ ta có ma trận I (g) như sau:
I = [
1 0 2 31 2 4 50 3 2 14 2 2 1
]
Thì bảng giá trị của h(g) sẽ là:
g 0 1 2 3 4 5 h(g) 2 4 4 3 2 1
Nói theo góc độ thống kê thì Histogram có thể coi như tuần suất xuất hiện của một biến cố. Việc nghiên
cứu Histogram có ý nghĩa rất quan trọng trong XLA, nó giúp chúng ta tiếp cận hình ảnh một cách trực
quan và dễ dàng.
I.2.5.3 Cách lấy Histogram của một hình ảnh bằng Matlab
Ta dùng cú pháp a_hist= imhist (a_gray), ví dụ cụ thể:
Độ sáng tăng
Số p
ixel
tăn
g
Tối Trung bình Sáng
Hình I.1 Hình ảnh của một
histogram.
Trang 9
Ta sẽ thu được kết quả như sau
Histogram được coi như cơ bản trong cách các kĩ thuật xử lý ảnh số trong miền không gian số. Việc
tác động đến histogram sẽ rất hữu ích trong việc hiệu chỉnh ảnh. Ngoài việc hiệu chỉnh ảnh Histogram
còn giúp một công cụ đắc lực trong việc nén và phân chia ảnh. Nhưng trong đây, phần hiệu chỉnh ảnh
sẽ là trọng tâm được trình bày.
I.2.5.4 Cách đọc Histogram:
Hình (I.3) đến hình (I.7) miêu tả một số hình minh họa kèm theo histogram của nó. Trong ví dụ là
hình ảnh một bông hoa với các biến đổi ánh sáng và độ tương phản khác nhau để ta có thể xem xét sự
biến đổi Histogram của chúng.
img = imread ('akita3.jpg');
img_gray = rgb2gray (img);
subplot(1,2,1);imshow(img_gray);
subplot(1,2,2);imhist(img_gray);
Hình I.2.a Hình I.2.b
Hình I.2 Thể hiện kết quả sau
khi ta lấy histogram sử dụng
Matlab
Hình I.2.a Hình ảnh gốc
Hình I.2.b Histogram của hình
(I.2.a)
Hình I.3 Histogram của hình
ảnh gốc
Trang 10
Từ nhận hình ảnh minh họa trên ta có thể nhận thấy rằng:
- Những ảnh hài hòa về sáng, tối và độ tương phản thường có phân bố ít ở 2 miền tối, sáng và
nhiều ở cùng trung bình.
Hình I.4 Histogram của hình
ảnh độ tương phản cao
Hình I.5 Histogram của hình
ảnh có độ tương phản thấp
Hình I.6 Histogram của hình
ảnh quá sáng
Hình I.7 Histogram của hình
ảnh quá tối
Trang 11
- Những hình có độ tương phản cao là hình có mức xám tập trung nhiều ở 2 vùng tối và sáng nhưng lại ít ở vùng trung bình. Ngược lại so với hình có độ tương phản cao thì hình có độ
tương phản thấp lại có điểm ảnh tập trung nhiều với biên độ lớn ở miền trung bình và rất ít ở
2 miền tối và sáng.
- Những hình sáng quá sẽ có biểu đồ xám chỉ tập trung những điểm ảnh ở vùng sáng và 2 vùng khác sẽ rất ít. Trái lại với bức ảnh bị quá tối sẽ chỉ tập trung ở vùng tối còn 2 vùng khác thì rất
ít.
Chúng ta có thể tóm tắt qua bảng sau
Loại hình ảnh Shadow Midtone Highlight Chuẩn + ++ + Tương phản cao ++ + ++ Tương phản thấp + ++ + Quá sáng + +++ Quá tối +++ +
Trong đó:
+ Mật độ bình thường
++ Mật độ nhiều
+++ Mật độ rất nhiều
Tuy nhiên chúng ta cần lưu ý rằng histogram còn bị ảnh hưởng bởi quang cảnh, nền xung quanh. Các
ví dụ ngoại lệ sẽ cho chúng ta cái nhìn bao quát hơn về việc đọc Histogram.
Hình I.8 Histogram của ảnh
gấu trắng Bắc cực với
quang cảnh xung quang là
băng đá và tuyết phủ trắng.
Hình I.9 Histogram của ảnh
con báo đang nằm trên cành
cây trong một khung cảnh
hoang hồn buông xuống.
Trang 12
Nhận xét:
- Hình (I.8) Histogram của ảnh gấu trắng Bắc cực với quang cảnh xung quang là băng đá và tuyết phủ trắng. Ta nhận thấy trong hình là quang cảnh ở Bắc Cực với nhiều tuyết và băng bao
phủ, nếu dựa vào histogram ta sẽ nhầm tưởng rằng đây là hình quá sáng và mất câng bằng
trong phân bố màu sắc.
- Hình (I.9) Histogram của ảnh con báo đang nằm trên cành cây trong một khung cảnh hoang
hồn buông xuống. Ta nhận thấy histogram ở hình này tập trung chủ yếu trong 2 vùng là sáng
và tối, nếu theo cảm tính thông thường ta sẽ dễ nhầm tưởng đây là hình có độ tương phản quá cao.
- Hình (I.10) Histogram của ảnh Cầu Rồng ở Đà Nẵng, ảnh được chụp trong khung cảnh buổi
tối. Nếu chỉ dựa vào Histogram ta sẽ dễ bị đánh lừa đây là bức ảnh bị quá tối và mất cân bằng
về màu sắc.
I.2.6 Điều chỉnh mức xám
Để xử lý một hình ảnh ta cần tác động đến các điểm ảnh, mà mức xám chính là giá trị biểu hiện cho
từng điểm ảnh. Tóm lại, muốn xử lý ảnh ta phải chỉnh mức xám bằng một cách thức cụ thể nào đó. Thông thường có 2 hướng tiếp cận:
- Giảm số mức xám: thực hiện bằng cách nhóm các mức xám với nhau thành một bó. Trường hợp mức xám chỉ có 2 giá trị thì đây chính là ảnh đen trắng (Black and White: BW).
- Tăng mức xám: thực hiện nội suy ra các mức xám trung gian bằng phép toán nội suy. Ứng
dụng: tăng độ mịn cho ảnh.
Hình I.10 Histogram của ảnh
Cầu Rồng ở Đà Nẵng, ảnh
được chụp trong khung cảnh
buổi tối.
Trang 13
Phần II:
CÁC PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG HÌNH ẢNH
II.1 Giới thiệu
Có 2 phương pháp chính đó là: nâng cao chất lượng ảnh trong miền không gian và tần số.
II.1.1 Nâng cao chất lượng ảnh trong miền không gian:
Ta tác động trực tiếp lên các điểm ảnh. Cường độ của các điểm ảnh được tính một các đơn giản qua
công thức sau:
g(x,y)=T[f(x,y)]
Trong đó f(x,y) là ảnh đầu vào, g(x,y) là ảnh đầu ra và T là thuật toán tác động lên f(x,y).[8]
II.1.2 Nâng cao chất lượng hình ảnh trong miền tần số:
Ta dựa trên việc tác động biến đổi Fourier của hình ảnh. Trước tiên ảnh sẽ được biến đổi về miền tần
số, sau đó thông qua các thuật toán ta sẽ tác động đến hàm truyền F của hình ảnh. Các bước xử lý hoàn
toàn ta sẽ dùng biến đổi F ngược để biến hàm truyền thành hình ảnh đầu ra.
Các thuật toán nâng cao chất lượng hình ảnh được thực hiện để điều chỉnh độ sáng hình ảnh, độ tương
phản hoặc phân phối các mức xám. Trong miền tần số thì khái niệm về lọc thì dễ dàng hơn để hình
dung. Vì vậy, nâng cao chất lượng hình ảnh của f(x, y) có thể được thực hiện trong miền tần số, dựa
trên DFT của F(u, v).
Các hoạt động nâng cao được thực hiện để điều chỉnh độ sáng hình ảnh, độ tương phản hoặc phân
phối các cấp độ màu xám. Trong miền tần số khái niệm về lọc sẽ dễ dàng hơn để hình dung. Vì vậy,
nâng cao hình ảnh của f (x, y) có thể được thực hiện trong miền tần số, dựa trên DFT của F(u, v). Trong
miền tần số nâng cao hình ảnh có thể được thực hiện như sau:
a) Tính toán F(u, v), DFT của hình ảnh đầu vào.
b) Nhân F(u, v) với một hàm lọc H(u, v)
G(u, v) = H(u,v) F(u, v).
c) Tính ngược DFT của kết quả bằng cách áp dụng Fourier biến đổi ngược.
d) Tìm được phần thực sự của biến đổi nghịch DFT.
Trong đó G(u,v) là ảnh đầu ra, F(u,v) là ảnh đầu vào và H(u,v) là hàm truyền. [9]
II.2 Xử lý ảnh trong miền không gian
II.2.1 Khái quát
Khái niệm miền không gian được định nghĩa là tập hợp của các điểm ảnh cấu thành nên hình ảnh.
Phương pháp miền không gian là kỹ thuật tác động trực tiếp lên điểm ảnh.
Trang 14
Nguyên lý chính của việc định nghĩa vùng lân cận tại 1 điểm có tọa độ (x,y) là một hình phụ/phụ
ảnh/hạ ảnh (sub-image) hình vuông hay hình chữ nhật ở chính giữa (x,y). Hình dưới đây sẽ biểu diễn
điều này.
Trung tâm của ảnh phụ sẽ chạy từ pixel này đến pixel khác theo thứ từ từ trái qua phải và từ trên
xuống dưới. Thuật toán T sẽ áp dụng cho mỗi vùng (x,y) để tìm đầu ra g. Dạng đơn giản nhất của T là
khi vùng lân cận có kích thước 1x1 (có nghĩa là một điểm ảnh). Trong trường hợp này, g chỉ phụ thuộc
vào giá trị của f tại (x, y), và T trở thành một hàm truyền mức xám có dạng:
s = T(r)
Trong đó r và s là 2 biến thể hiện mức xám của f(x,y) và g(x,y). Gọi m là một mức nào đó nếu T(r) có
dạng như trong hình (II.2) thì nó sẽ tạo ra một ảnh có độ tương phản cao hơn bằng cách làm đậm hơn
những mức xám trên m và nhạt hơn những mức xám dưới m, đây là phương pháp kéo dãn độ tương
phản. Đặc biệt ở hình (II.2 b) ta thấy s đã được xác định bằng 0 nếu r<m và ngược lại s sẽ bằng 1, đây
có thể hiểu là phép biến đổi ảnh thành ảnh nhị phân. Ánh xạ của T(r) được gọi là hàm ngưỡng. Bởi vì
trong quá trình nâng cao chất lượng ảnh mỗi điểm sẽ phụ thuộc vào mức xám của chính nó nên ta còn
gọi đây là phương pháp xử lý điểm.
Hình II.1 Một ví dụ về vùng lân cận.
Hình gốc
Ảnh f(x, y)
Hình II.2 Hàm biến đổi
mức xám làm tăng độ
tăng phản.
Sáng<
->Tối
Sáng<->Tố
i
Tối<-> Sáng Tối<-> Sáng
Hình II.2 a Hình II.2 b
Trang 15
Có rất nhiều khác biệt giữa các phương pháp nhân tố (elementary) và thử sai (heuristic) được dùng
trong nâng cao chất lượng hình ảnh. Tuy nhiên chúng ta không thể đánh giá phương pháp nào là tốt
hơn vì thực tế những phương pháp khác nhau sẽ phát huy tác dụng riêng của nó. Trong tài liệu này
chỉ đề cập những vấn đề mà cả con người và máy tính đều có thể nhận thức được. Các phương pháp
được nêu ra sẽ tập trung vào xử lý ảnh trong miền không gian với 2 phần chính là:
- Phần II.2.2.1: Các thao tác xử lý điểm
- Phần II.2.2.2: Xử lý ảnh thông qua Histogram
Hình II.3 Hình ảnh chụp X-quang
của người. Đây là một ví dụ thể
hiện tác động của nâng cao chất
lượng hình ảnh lên ảnh. [a]
Trang 16
II.2.2 Các phương pháp XLA trong miền không gian
II.2.2.1 Một số biến đổi mức xám cơ bản (các thao tác xử lý điểm)
Chúng ta bắt đầu nghiên cứu các kỹ thuật nâng cao hình ảnh bằng cách thảo luận về hàm chuyển đổi
mức xám. Đây là một trong những điều cơ bản nhất của các kỹ thuật nâng cao hình ảnh. Giá trị của
điểm ảnh, trước và sau khi xử lý, sẽ được ký hiệu là r và s. Như đã nêu trong phần trước, các giá trị
này có liên quan với nhau bằng công thức s = T(r) , trong đó T là một chuyển đổi ánh xạ một giá trị
pixel r thành một giá trị pixel s . Vì chúng ta đang xét tín hiệu số, giá trị của hàm biến đổi thường được
lưu trữ trong một mảng một chiều và các ánh xạ từ r sang s được thực hiện thông qua tra cứu bảng.
Cho một môi trường 8-bit, một bảng tra cứu có giá trị T có 256 mức.
Thao tác trong miền không gian dễ dàng hơn khi ta xét một vùng lân cận. Trong trường hợp này T
chính là hàm biến đổi mức xám hay một thao tác xử lý điểm
Xem xét hình (II.4) cho thấy có ba loại hàm biến đổi sử dụng thường xuyên để nâng cao hình ảnh đó
là tuyến tính (biến đổi âm ảnh và đồng nhất), logarit (biến đổi log và nghịch đảo log), và hàm mũ (biến đổi bậc thứ n và biến đổi căn bậc n). Hàm đồng nhất là trường hợp tầm thường, trong đó cường độ
đầu ra giống hệt cường độ đầu vào.
II.2.2.1.1 Âm ảnh
Thao tác đơn giản và dễ thực hiện nhất trong xử lý ảnh số là tạo ra ảnh âm bản. Giá trị mức xám của
hình ảnh sẽ được đảo ngược lại. Âm bản của một hình ảnh có mức xám trong khoảng [0, L-1], thu
được từ việc biến đổi dùng công thức sau:
Mức xám ảnh đầu vào, r
Mứ
c xá
m đ
ầu r
a, s
Hình II.4 Một số hàm biến đổi mức
xám cơ bản được sử dụng trong
nâng cao chất lượng ảnh
Âm ảnh
BĐ hàm log
BĐ hàm nghịch
đảo log
Đồng
nhất
Căn bậc n
Mũ n
Trang 17
S=L-1- r (Phương trình II.1)
Để dễ hình dung ta xét ví dụ sau: Cho một ảnh có kích thước RxC với R là số hàng và C là số cột. I(R,C)
là ảnh ban đầu và N(R,C) là ảnh âm bản, thì N được tính như sau:
N(r, c) = 255 – I(r, c) trong đó 0 ≤ r ≤ R và 0 ≤c ≤ C
Chúng ta có thể nhận thấy rằng giá trị của mỗi pixel ảnh gốc là dưới 255. Ảnh qua xử lý có giá trị đối
lại so với ảnh ban đầu.
Đảo ngược mức xám của một hình ảnh theo cách này tạo ra một ảnh âm bản. Loại xử lý này phù hợp để tăng cường chi tiết màu trắng hoặc xám ẩn trong vùng tối của hình ảnh, đặc biệt là khi các khu vực
màu tối chiếm ưu thế về số lượng. Một ví dụ được thể hiện trong hình (II.5). Hình (II.5 a) là ảnh chụp
X quang tuyến vú đã được kỹ thuật số hóa cho thấy một tổn thương nhỏ.
Hình II.5 a Hình II.5 b
Ta thấy rằng mặc dù thực tế là các nội dung trực quan là như nhau trong cả hai hình ảnh, nhưng sẽ dễ
dàng hơn nhiều khi phân tích các mô vú ở hình ảnh tiêu cực trong trường hợp này.
II.2.2.1.2 Biến đổi dùng ngưỡng
Biến đổi dùng ngưỡng hay nói ngắn gọn là biến đổi ngưỡng thường được dùng trong một số mảng
vấn đề mà chúng ra muốn nổi bật một vật thể.
Nguyên lý của việc lấy ngưỡng rất đơn giản, có thể viết như sau:
Hình II.5 Hình ảnh
chụp một khối ung
thư vú ở người [b]
Hình II.5. a thể hiện
ảnh gốc
Hình II.5.b là ảnh âm
bản của nó
Biến đổi ngưỡng
Hình II.6 Một ví dụ minh
họa cho việc dùng biến
đổi ngưỡng.[c]
Trang 18
𝑠 = {1 (𝑛ế𝑢 𝑟 > 𝑛𝑔ưỡ𝑛𝑔)
0 (𝑛ế𝑢 𝑟 ≤ 𝑛𝑔ưỡ𝑛𝑔) (Phương trình II.2)
Với r là mức xám ảnh gốc và s là mức xám ảnh sau khi biến đổi.
Một ứng dụng tiêu biểu của biến đổi ngưỡng đó là nhận diện biển số xe (LPR: License Plate
Recognition). Trong Matlab để thực hiện lấy ngưỡng ta dùng hàm graythresh với cú pháp level =
graythresh (I). Ví dụ sau đây sẽ minh họa cụ thể:
Qua ví dụ ta có thể thấy sau khi dùng phép biến đổi ngưỡng thì biển số trở nên dễ nhìn hơn, điều này
đặc biệt có ý nghĩa đối với các cảm biến ánh sáng giúp chúng có thể nhận biết được các kí tự trên biển
số xe. LPR được ứng dụng trong các bãi giữ xe nhằm mục đích an ninh hay trên các tuyến đường nhằm
phát hiện biển số những xe vi phạm pháp luật.
Ngoài ra biến đổi ngưỡng có thể ứng dụng làm công cụ đắc lực trong việc nhận diện chữ quang học
(ORC: Optical Character Recognition). Ý tưởng của ORC là khi chụp một bức ảnh ta sẽ xử lý bằng thuật
toán lấy ngưỡng, những ký tự trong hình sau khi được lấy ngưỡng sẽ trở nên rõ ràng hơn và cảm biến
sẽ dễ nhận diện chữ hơn. Ví dụ sau đây sẽ cho ta thấy:
Hình II.7 Ứng dụng của biến đổi
ngưỡng trong việc nhận diện
biển số xe.
Hình II.7.a Hình ảnh gốc.
Hình II.7.b Hình ảnh sau khi
được biến đổi ngưỡng. H II.7.a H II.7.b
I = imread('Bien_so_xe.jpg'); level = graythresh(I); BW = im2bw(I,level); subplot(1,2,1);imshow(I); subplot(1,2,2);imshow(BW);
Trang 19
Nhận xét: Hình (II.8) đã cho chúng ta thấy một ứng dụng của việc tạo ngưỡng. Sau khi lấy ngưỡng các
kí tự xuất hiện trong ảnh sẽ rõ ràng hơn và dễ nhận biết hơn.
II.2.2.1.3 Biến đổi dùng hàm log
Dạng chung của biến đổi dùng hàm log được biểu diễn dưới dạng số học như sau:
s=c.log (1+r)
Trong đó c là một hằng số và người ta cho r≥ 0. Hình dạng của đường cong hàm log trong hình (II.4)
cho thấy sự biến đổi này ánh xạ một phạm vi hẹp của các giá trị màu xám ở mức độ thấp trong hình
ảnh đầu thành một phạm vi rộng hơn của đầu ra. Ngược lại cũng đúng với các giá trị đầu vào cao hơn.
Chúng ta sẽ sử dụng một chuyển đổi loại hình này để mở rộng các giá trị điểm ảnh tối trong một hình
ảnh trong khi nén các mức xám giá trị cao hơn.
Bất kỳ đường cong có hình dạng chung của hàm log như hình (II.4) sẽ thực hiện giãn/nén mức xám
trong một hình ảnh. Trong thực tế, biến đổi hàm mũ được thảo luận trong phần tiếp theo linh hoạt
hơn trong vấn đề này. Tuy nhiên, hàm log có đặc tính quan trọng là nó nén dải động của hình ảnh với
sự biến đổi lớn trong giá trị điểm ảnh.
II.2.2.1.4 Biến đổi hàm mũ
II.2.2.1.4.1 Lý thuyết
Hình II.8 Một ví dụ về việc sử
dụng ngưỡng trong việc
nhận. Hình II.8 a Hình ảnh sau lấy
ngưỡng
Hình II.8 b Hình ảnh ban đầu
Trang 20
Biến đổi hàm mũ có dạng cơ bản là
s = cr ^𝜸(Phương trình II.3)
Trong đó: c và 𝛾 là hằng số dương.
Đôi khi phương trình (II.3) được viết như sau s= c(r+𝜺)^𝜸 do có một khoảng chênh lệch 𝜀. Tuy nhiên
𝜀 thường bị bỏ qua đây vì là vấn đề của canh chuẩn màn hình.
Đồ thị của s theo r với 𝛾 có giá trị khác nhau như ta thấy ở hình(II.8). Như trong trường hợp của biến
đổi hàm log, các đường cong hàm mũ với các giá trị của 𝛾 ánh xạ một phạm vi hẹp của đầu vào có giá
trị đậm vào một phạm vi rộng lớn hơn của giá trị đầu vào, với điều ngược lại là đúng.
Không giống như các hàm log, chúng ta nhận thấy đây là một họ của các đường cong biến đổi có thể
thu được từ 𝛾 khác nhau. Theo phán đoán, chúng ta thấy trong hình (II.8) các đường cong được tạo
ra với giá trị của 𝛾 > 1 có hình dạng đối xứng với những đường cong tạo ra với các giá trị của 𝛾 <1 qua
đường thẳng 𝛾=1.
Các thiết bị sử dụng để chụp ảnh, in ấn, và màn hình hiển thị đáp ứng theo một định luật hàm mũ .
Theo quy ước, số mũ trong phương trình hàm mũ được gọi là gamma(𝛾) (do đó chúng ta sử dụng
biểu tượng này trong phương trình (II.3). Quá trình sử dụng để chỉnh sửa hàm mũ này được gọi là
chỉnh sửa gamma.
Ví dụ: ống tia cathode (CRT) có một đáp ứng cường độ-điện áp đó là một hàm mũ, với số mũ khác
nhau từ khoảng 1,8 đến 2.5. Tham chiếu đến các đường cong khi 𝛾 = 2,5 trong hình (II.8), chúng ta
thấy rằng hệ thống hiển thị như vậy sẽ có xu hướng tạo ra hình ảnh có màu đậm hơn dự định. Hiệu
ứng này được minh họa trong hình (II.9).
Hình II.8 Đồ thị của hàm
s=cr^ γ với các giá trị γ khác
nhau và với c=1.
Mứ
c xám n
gõ ra s
Mức xám ngõ vào r
Trang 21
Theo dự đoán, ngõ ra màn hình xuất hiện đậm hơn đầu vào như hình (II.9 b). Chỉnh sửa gamma trong
trường hợp này là hiển nhiên. Chúng ta cần xử lý trước các hình ảnh đầu vào trước khi nhập vào màn
hình bằng cách thực hiện việc chuyển đổi s=r1/2.5=r0.4 kết quả được hiển thị trong hình (II.9 c). Khi
nhập vào cùng một màn hình, chỉnh sửa gamma đầu vào này tạo ra một đầu ra đó là gần như hình ảnh
ban đầu như được thể hiện trong hình (II.9 d). Một phân tích tương tự sẽ áp dụng cho các thiết bị hình
ảnh khác như máy quét và máy in. Sự khác biệt duy nhất sẽ là giá trị gamma phụ thuộc vào thiết bị.
Hiệu chỉnh gamma đóng vai quan trọng nếu cần hiển thị một hình ảnh chính xác trên màn hình máy
tính. Hình ảnh không được chỉnh sửa đúng có thể bị lóa hoặc quá tối. Việc cố gắng để tái tạo màu sắc
chính xác cũng đòi hỏi một số kiến thức về chỉnh sửa gamma vì giá trị khác nhau của sự điều chỉnh
gamma không chỉ thay đổi độ sáng, mà còn là tỷ lệ của màu đỏ, màu xanh da trời và màu xanh lá (R-
G-B).
Hiệu chỉnh gamma đã ngày càng trở nên quan trọng trong những năm gần đây. Ta có thể lấy ví dụ
như sử dụng hình ảnh kỹ thuật số cho các mục đích thương mại qua Internet. Hình ảnh được tạo ra
cho một trang web phổ biến sẽ được xem bởi hàng triệu người, phần lớn trong số họ sẽ có màn hình
với các thiết lập khác nhau. Một số hệ thống máy thậm chí tích hợp sẵn chỉnh sửa gamma bên trong.
Với những hạn chế, một cách tiếp cận hợp lý khi lưu trữ hình ảnh trong một trang web là xử lý trước
những hình ảnh với một gamma đại diện cho một "trung bình" các loại màn hình và hệ thống máy
tính.
II.2.2.1.4.2 Ứng dụng của biến đổi hàm mũ
Ví dụ 1 Câng cao độ tương phản bằng cách sử dụng biến đổi hàm mũ
Ngoài điều chỉnh gamma, biến đổi hàm mũ còn có thể biến đổi tương phản.
Hình II.9
(a) Nêm tuyến tính của hình ảnh màu
xám.
(b) Đáp ứng của màn hình theo nêm
tuyến. tính
(c)Nêm chỉnh sửa gamma.
(d) Ngõ ra của màn hình.
Hình ảnh được hiển thị
trên màn hình
Màn hình
Chỉnh sửa gamma
Màn hình
Hình ảnh được hiển thị
trên màn hình
H II.9 a
H II.9 c
H II.9 b
H II.9 d
Trang 22
Gãy xương có thể nhìn thấy gần trung tâm theo chiều dọc của cột sống , khoảng ¼ từ đỉnh của hình
ảnh. Vì hình ảnh được đưa ra khá tối nên điều ta cần làm là làm dãn vùng tối đó ra. Điều này có thể
được thực hiện với sự chuyển đổi hàm mũ với một số mũ thập phân.
Chúng ta nhận thấy rằng: khi 𝛾 giảm 0,6-0,4 thì hình ảnh trở nên chi tiết hơn và có thể nhìn thấy rõ
hơn. Khi 𝛾 giảm còn 0,3 hình rõ nét hơn một chút, nhưng bắt đầu giảm độ tương phản, đặc biệt là
trong nền. Bằng cách so sánh tất cả các kết quả, chúng ta thấy rằng việc tăng cường tốt nhất cho độ
tương phản và chi tiết là cho 𝛾 = 0,4. Giá trị của 𝛾 = 0,3 là một giới hạn xấp xỉ dưới, nếu giảm hơn nữa
thì tương phản trong hình ảnh đặc biệt này sẽ giảm đến một mức độ không thể chấp nhận.
Ví dụ 2 Một minh họa khác của biến đổi hàm mũ
Hình II.10 Cho thấy một hình ảnh cộng
hưởng từ (MR) của cột sống ngực trên một
người với một khớp bị gãy và chấn thương
tủy sống qua các phép biến đổi với gamma
khác nhau.
(a) hình ảnh cộng hưởng từ (MR) của một
người bị gãy cột sống.
(b), (c), (d) là kết quả của việc áp dụng biến
đổi trong phương trình (II.3) với c = 1 và
gamma = 0,6, 0,4, và 0,3 tương ứng.
(Hình ảnh gốc cho ví dụ này là do Bác sĩ
David R. Pickens, Khoa X Quang và Khoa
học phóng xạ, Trung tâm Y tế Đại học
Vanderbilt cung cấp).
H II.10 a
H II.10 c
H II.10 b
H II.10 d
Trang 23
Hình (II.11 a) cho thấy mặt đối lập của hình (II.10 a). Những hình ảnh được tăng cường bây giờ xuất
hiện quá sáng, để giải quyết điều này ta cần nén mức xám.
Nhận xét
- Kết quả xử lý hình (II.11 a) với gamma = 3.0, 4.0, và 5.0 được thể hiện trong hình (II.11 b) đến
(II.11 d). Kết quả thu được với giá trị gamma 3.0 và 4.0, càng tăng lên thì mức tương phản
càng cao, ảnh rõ nét hơn.
- Kết quả thu được với gamma = 5,0 có các khu vực quá tối, trong đó một số chi tiết bị mất.
Những vùng tối bên trái của con đường chính trong góc phần tư phía trên bên trái là một ví
dụ cho điều này.
II.2.2.1.5 Hàm biến đổi phân đoạn tuyến tính
Một phương pháp khác là sử dụng hàm phân đoạn tuyến tính. Ưu điểm chính của hàm phân đoạn
tuyến tính là có thể được tùy biến linh hoạt. Trong thực tế, một số biến đổi quan trọng có thể
được thiết lập chỉ bằng hàm phân đoạn. Những bất lợi chính của hàm phân đoạn là đặc điểm kỹ
thuật của nó yêu cầu người dùng nhập vào các thông số nhiều hơn đáng kể.
Kéo giãn tương phản
Một trong những hàm phân đoạn tuyến tính đơn giản nhất là biến đổi kéo giãn tương phản. Hình
ảnh tương phản thấp có thể là kết quả của việc chiếu sáng kém, các bộ cảm biến hình ảnh có dải
động kém, hoặc thậm chí thiết lập sai khẩu độ ống kính trong quá trinh chụp hình. Ý tưởng đằng
sau kéo giãn tương phản là tăng dải động các mức xám của hình ảnh được xử lý. Hình (II.12 a)
cho thấy một sự thay đổi điển hình được sử dụng cho kéo giãn tương phản. Vị trí các điểm (r1,s1)
và (r2,s2) quyết định hình dạng của hàm biến đổi.
Hình II.11 Hình ảnh một thành phố
qua các phép biến đổi với gamma
khác nhau
(a) hình ảnh trên không của một
thành phố.
(b) - (d) Kết quả của việc áp dụng biến
đổi trong phương trình (II.3) với c = 1
và γ= 3.0, 4.0, và 5.0, tương ứng.
(Hình ảnh gốc cho ví dụ do NASA cung
cấp).[d]
H II.11 a
H II.11 c
H II.11 b
H II.10 d
Trang 24
Từ đồ thị trong hình (II.12 a) ta có thể thấy:
- Nếu r1 = r2 và s1 = s2, việc chuyển đổi là một hàm tuyến tính tạo ra mức xám không có thay đổi.
- Nếu r1 = r2, s1 = 0 và s2 = L -1, việc chuyển đổi sẽ trở thành một hàm tạo ngưỡng tạo ra một
hình ảnh nhị phân, như minh họa trong hình (II.12 d).
- Giá trị giữa của (r1, s1) và (r2, s2) tạo ra mức độ khác nhau của sự lây lan mức xám của hình
ảnh đầu ra, làm ảnh hưởng đến độ tương phản của nó. Nói chung: r1≤r2 và s1≤ s2 được giả
định để các hàm là đơn trị và đơn điệu tăng. Điều kiện nhằm đảm bảo không tạo ra các thành
phần có mức xám “lạ” trong hình ảnh xử lý.
Nhận xét
- Hình (II.12 b) cho thấy một hình ảnh 8-bit với độ tương phản thấp.
- Hình (II.12 c) cho thấy kết quả kéo giãn tương phản thu được bằng cách thiết lập (r1, s1) = (rmin, 0) và (r2, s2) = (rmax, L- 1) trong đó rmin và rmax biểu thị mức tối thiểu và mức tối đa mức
xám trong hình ảnh. Hàm biến đổi kéo giãn tương phản tuyến tính từ phạm vi ban đầu của nó
với đầy đủ trong khoảng [0, L- 1].
- Cuối cùng, hình (II.12 d) cho thấy kết quả của việc sử dụng hàm tạo ngưỡng, với r1 = r2 = m, với m là mức xám trung bình trong ảnh gốc.
Hình II.12 Hình ảnh kính
hiển vi điện tử quét phấn
hoa, phóng đại khoảng 700
lần.
(a) Dạng của hàm biến đổi.
(b) Một hình ảnh tương
phản thấp.
(c) Kết quả của sự kéo giãn
tương phản.
(d) Kết quả của việc tạo
ngưỡng.
(Hình ảnh gốc của Tiến sĩ
Roger Heady, Trường
Nghiên cứu khoa học sinh
học, Đại học Quốc gia
Australia, Canberra, Úc)[e]
H II.12 a H II.12 b
H II.12 c H II.12 d
Mứ
c xám đ
ầu ra, s
Mức xám đầu vào, r
Trang 25
II.2.2.2 Xử lý ảnh thông qua histogram
Xử lý biểu đồ mức xám (histogram) được sử dụng trong nâng cao chất lượng hình ảnh, các thông tin
vốn có trong histogram cũng có thể được sử dụng trong ứng dụng xử lý ảnh khác nhau như phân chia
và nén hình ảnh. Một histogram đơn giản biểu diễn tần suất của mỗi mức xám có giá trị từ 0 đến 255.
Trong đó 0 là mức xám thấp nhất biểu cho màu tối và 255 là mức xám cao nhất biểu diễn cho màu tối.
Xử lý histogram là bước đầu tiên trong tiền xử lý. Cân bằng histogram (histogram equalization: HE)
và thay đổi histogram theo yêu cầu là hai phương pháp được sử dụng phổ biến để thay đổi histogram của một hình ảnh. Histogram là một hàm rời rạc đại diện cho tần số xuất hiện của tất cả các mức xám
trong hình ảnh. Biểu đồ được cho là:
h (rk) = nk/N(Phương trình II.4)
Trong đó rK là cường độ mức xám và nk là số pixel có mức xám tương ứng với mỗi giá trị rk.
II.2.2.2.1 Cân bằng Histogram
II.2.2.2.1.a Trình bày lý thuyết
Cân bằng histogram là một kỹ thuật phổ biến để tăng cường sự diện mạo của hình ảnh. Giả sử chúng
ta có một hình ảnh mà chủ yếu là tối thì biểu đồ của nó sẽ bị lệch về phía bên trái của thang đo màu
xám và tất cả các chi tiết hình ảnh được nén vào vùng tối của biểu đồ. Nếu chúng ta kéo mức xám ở
vùng tối để tạo ra một histogram phân bố đồng đều hơn thì hình ảnh sẽ trở nên rõ rang và hài hòa
hơn.
Cân bằng histogram kéo dài biểu đồ trên toàn bộ quang phổ của các điểm ảnh (0 - 255). Nó làm tăng
độ tương phản của hình ảnh và có thể được áp dụng để bình thường hóa sự chiếu sáng. Quá trình này
khá đơn giản và với từng cấp độ sáng j trong hình ảnh ban đầu, ta sẽ có giá trị mức xám mới của điểm
ảnh (k) được tính như trong phương trình sau:
𝒌 = ∑ (𝒋𝒊=𝟎
𝑵𝒊
𝑻) (Phương trình II.5)
Trong đó K là tổng số điểm ảnh trong hình ảnh có độ sáng bằng hoặc nhỏ hơn j, và T là tổng số điểm
ảnh. Mục đích chính của cân bằng biểu đồ là tìm hàm biến đổi mức xám T để chuyển đổi hình ảnh f
nhờ đó mà biểu đồ của T (f) "cân bằng".
Cho phương trình sau s=T(r) trong đó r là mức độ xám [0, 1] (0 là đen nhất và 1 là sáng nhất). Qua
phép biến đổi T ra luôn có 1 giá trị của s tương ứng với 1 giá trị r. Để thỏa điều kiện ta tìm được mỗi
s từ 1 giá trị của r tương ứng thì cần thỏa 2 điều kiện sau:
- T (r) có giá trị duy nhất và tăng đồng nhất trên khoảng r= [0, 1]. - T(r) = [0, 1] với r= [0, 1].
Chú giải: Điều kiện đầu tiên T(r) có giá trị duy nhất nhằm hàm nghịch T-1 tồn tại, và điều kiện tăng
đồng nhất nhằm đảm bảo thứ từ tăng dần từ đen->trắng trong hình ảnh ngõ ra. Điều kiện thứ 2 nhằm
đảo bảo hình ngõ ra sẽ có chung khoảng mức xám đồng nhất với đầu vào.
Ta biết rằng mức xám trong một ảnh có thể coi như một biến ngẫu nhiên trong khoảng [0, 1]. Để diễn
tả thích hợp nhất cho sự phân bố của biến ngẫu nhiên này người ta dùng Hàm mật độ xác suất (PDF:
Trang 26
Probability Density Function). Cho pr(r ) và ps(s) thể hiện PDF của biến ngẫu nhiên r và s. Nếu pr(r)
và T(r) biết trước và T-1(s) thỏa điều kiện (a) thì ta sẽ có công thức liên hệ giữa pr và ps như sau:
ps (s)=pr(r)|𝒅𝒓
𝒅𝒔|(Phương trình II.6)
Ngoài ra ta còn có:
s = T(r) =∫ 𝒑𝒓(𝒘)𝒅𝒘𝒓
𝟎(Phương trình II.7)
Trong đó ∫ 𝑝𝑟(𝑤)𝑑𝑤𝑟
0 được xem là hàm phân bố tích lũy của biến biến ngẫu nhiên r (CDF: cumulative
distribution function)
Cho hàm T(r) chúng ta có thể tìm p(s) bằng các bước sau:
- Bước 1:
𝒅𝒔
𝒅𝒓=
𝒅𝑻(𝒓)
𝒅𝒓
= 𝒅
𝒅𝒓[∫ 𝒑𝒓(𝒘)𝒅𝒘]
𝒓
𝟎
=𝒑𝒓(𝒓)(Phương trình II.8)
- Bước 2:
𝒑𝒔(𝒔) = 𝒑𝒓(𝒓) |𝒅𝒓
𝒅𝒔|
=𝒑𝒓(𝒓) |𝟏
𝒑𝒓(𝒓)|
= 1 (0≤ 𝒔 ≤1) (Phương trình II.9)
Để tìm ngược lại từ s->r ta dùng hàm biến đổi ngược sau
rk = T-1(sk) và k=[1,L-1] (Phương trình II.10)
II.2.2.2.1.b Mô phỏng
Khi chúng ta vẽ hàm phân bố CDF của một bức hình ta dễ dàng nhận thấy CDF không phải là một
đường thẳng. Điều này đồng nghĩa giá trị của điểm ảnh phân bố không đồng đều (bởi vì CDF là tích
phân của PDF). Những bức ảnh trong tự nhiên đa phần không có CDF phẳng. Rất nhiều thiết bị, ứng
dụng trong đời sống có được lợi ích từ việc có CDF phẳng. Quá trình phẳng hóa CDF được gọi là cân
bằng Histogram. Hình ảnh sau sẽ minh họa quá trình phẳng hóa CDF.
Trang 27
Trong Image Processing Toolbox của Matlab có hàm histeq thực hiện cân bằng Histogram
Ví dụ: Muốn cân bằng Histogram 1 hình ta sẽ dùng lệnh sau:
Ví dụ minh họa:
img=imread('akita3.jpg');
img_gray=rgb2gray(img);
img_hist=imhist(img_gray);
img_equa=histeq(img_gray);
subplot(1,2,1);imshow(img_gray);
subplot(1,2,2);imshow(img_equa)
Hình gốc
Sau khi CB Hist.
Hình II.13 CDF của hình ảnh trước và sau khi cân
bằng histogram. [f]
CDF của hình ảnh
Trang 28
Từ hình ảnh minh họa ta dễ dàng có thể nhận thấy:
- Về kỹ thuật: sau khi cân bằng histogram ta có thể thấy phân bố mức xám trong 3 miền khá đồng đều.
- Về thẩm mỹ: Hình ảnh có độ chi tiết hơn và độ tương phản của hình cao hơn. Những vùng sáng thì sáng hơn, những vùng tối thì tối hơn.
Hình II. 14 Ví dụ về việc sử dụng hàm histeq trong Matlab
a. Ảnh gốc.
b. Histogram của ảnh gốc.
c. Ảnh sau khi cân bằng histogram.
d. Histogram của ảnh sau khi cân bằng histogram.
Hình II.14 a Hình II.14 c
Hình II.14 b Hình II.14 d
Trang 29
Một phiên bản cải tiến của Cân bằng Histogram là Cân bằng Histogram thích ứng. Nguyên lý của
bộ lọc này là chia hình ảnh thành nhiều ô nhỏ rồi sau đó áp dụng cân bằng Histogram vào mỗi ô nhỏ
đó. Bước cuối cùng là nội suy để ra kết quả.
Trong bộ xử lý ảnh của Matlab có hàm adapthisteq. Hàm này sẽ giới hạn mức độ tương phản được
phép thay đổi nên hàm này còn có tên là Cân bằng Histogram giới hạn tương phản tương thích
(Contrast-limited Adaptive Histogram Equalization: CLAHE) [10]. CLAHE sẽ chỉnh hình theo một cách
khác lạ nhưng lại có hiệu quả đặc biệt trong một số trường hợp. Cụ thể ví dụ dưới đây:
Nhận xét:
Từ hình (II.15) ta có thể thấy rằng qua CLAHE ta thu được kết quả hình ảnh có độ tương phản cao
hơn, có độ sắc nét rất cao và chi tiết hơn. Ta có thể ap dụng CLAHE vào trong linh vưc y sinh nhiên
cứu về các vi sinh vật nhỏ bé cần độ chi tiết cao.
II.2.2.2.2 Thay đổi Histogram theo yêu cầu
II.2.2.2.1 a Trình bày lý thuyết
Trong phần trình bày trước về cân bằng Histogram như là một phương pháp chỉnh sửa ảnh bằng việc
tự động xác định hàm truyền để tạo ra hình ảnh sau xử lý có histogram đồng nhất và CDF thẳng dốc.
Tuy nhiên phương pháp này không hẳn không có hạn chế, như trong ví dụ sau:
Hình II.15 a Hình II.15 b
Hình II.15 Hình ảnh bào tử nấm được phóng đại dưới kính hiển
vi điện tử. Ví dụ minh họa khi sử dụng hàm adapthisteq [g]
a. Hình ảnh gốc.
b. Hình ảnh sau khi cân bằng histogram thích ứng.
Trang 30
Bức tranh chụp cảnh hoang hôn bên trái rất đẹp và màu hài hòa nhưng khi qua xử lý ảnh dùng hàm
Histeq thì ra 1 ảnh không như mong muốn và mất hẳn tính thẩm mỹ.
Phần này sẽ trình bày về phương pháp tạo ra hình ảnh dựa trên histogram đã được định hình. Phương
pháp này có tên là Thay đổi histogram theo yêu cầu.
Sự hình thành của phương pháp thay đổi histogram theo yêu cầu được tóm tắt qua các bước sau:
Bước 1: Tìm histogram của ảnh đầu vào pr(r) và xác định biến đổi cân bằng của nó
s=T(r) = (L-1)∫ 𝒑𝒓(𝒘)𝒅𝒘𝒓
𝒐(Phương trình II.11)
Bước 2: Sử dụng PDF pz(r) của ảnh đầu ra để tìm hàm truyền
G (z) = (L-1) ∫ 𝒑𝒛(𝒕)𝒅𝒕𝒛
𝒐(Phương trình II.12)
Bước 3: Tìm hàm truyền nghịch đảo z=G-1(s), ánh xạ từ s qua z
z = G-1[T(r)] = G-1(s) (Phương trình II.13)
Bước 4: Tìm ảnh đầu ra bằng việc cân bằng ảnh đầu vào, sau đó cân bằng từng pixel, thực hiện
ánh xạ ngược để tìm điểm ảnh đầu ra tương ứng.
Chúng ta cần lưu ý thêm rằng ngay cả trong trường hợp rời rạc thì hàm nghịch của G là G-1 cũng phải
thỏa 2 điều kiện sau:
- Đơn điệu (luôn tăng hoặc giảm). - Đơn trị.
Hình II.16 a Hình II.16 b
Hình II.16 Một ví dụ về việc thất bại khi dùng cân bằng
histogram
a. Hình ảnh gốc
b. Hình ảnh sau khi cân bằng histogram
Trang 31
Hai điều kiện trên nhằm mục đích không có giá trị nào trong Histogram đã được match Pz (z) trong
phương trình sau bằng 0
Vk = G (zk) = ∑ 𝒑𝒛𝒌𝒊=𝒐 (𝒛𝒊) = sk Với k = [0, L-1] (Phương trình II.14)
Thay đổi histogram theo yêu cầu giúp chúng ta tương ứng phân bố thang màu xám của 1 ảnh này (ảnh
làm mẫu) cho một ảnh khác. Hình minh họa sau đây sẽ cho ta thấy điều này
II.2.2.2.2 b Mô phỏng Matlab
Ý tưởng chính của thuật toán xử lý ảnh Thay đổi histogram theo yêu cầu trong Matlab là làm CDF
của hình ảnh muốn chỉnh sửa theo CDF tương tự như hình mẫu. Việc cân bằng Histogram cũng là 1 ví
dụ của thay đổi histogram theo yêu cầu nhưng ở đây CDF là 1 đường thẳng. Thay đổi histogram theo
yêu cầu có tác dụng làm sao chép tông màu của hình mẫu. Nó cũng có thể làm khớp độ sáng của 2
hình của cùng 1 khung cảnh với cảm biến khác nhau. Thay đổi histogram theo yêu cầu có thể hoạt
động thông qua 1 bảng tra (look-up). Khi cho CDF của ảnh mẫu, máy sẽ so sánh CDF của những pixel
của 2 hình từ đó tạo ra CDF tương ứng. Điều này cực kì hữu ích trong chỉnh sửa ảnh, thử tưởng tượng
xem: nếu bạn có hàng trăm tấm hình cùng 1 khung cảnh và bạn muốn chỉnh sửa thì điều đầu tiên bạn
cần làm là chỉ chỉnh 1 hình sau đó làm khớp histogram này với các hình khác. Công việc diễn ra chỉ
trong vài cú click chuột thay vì chỉnh sửa từng hình.
Có rất nhiều phần mềm chỉnh sửa có khả năng làm thay đổi histogram theo yêu cầu, nổi bật là
Photoshop trên nền tảng Windows và OS, bên hệ điều hành mở Linux cũng có phần mềm tương tự
nhưng miễn phí là Gimp. Trong phần trình bày này sẽ dùng Matlab để minh họa để có thể trình bày
hết đặc tính kỹ thuật về phép biến đổi này.
Hình II.17 Một ví dụ minh họa về
việc sử dụng thay đổi histogram
theo yêu cầu[h]
a. Hình ảnh đối chiếu
(histogram của hình này
được làm chuẩn).
b. Hình ảnh được thay đổi
histogram theo hình (a).
Trang 32
Sau đây là một đoạn mã Matlab thực hiện chức năng thay đổi histogram theo yêu cầu của 2 hình đen
trắng. Trong Matlab để thực hiện match 2 histogram với nhau ta dùng hàm imhistmatch.
Ví dụ minh họa
input = imread ('Polar_Bear_-_Alaska.jpg');
input_gray= rgb2gray (input);
output = imread('03470-Leopard-up-a-tree-at sunset.jpg');
output_gray = rgb2gray (output);
img_adjusted = imhistmatch (output, input);
subplot (1,3,1);imshow(input);
subplot (1,3,2);imshow(output);
subplot (1,3,3);imshow(img_adjusted);
Hình II.18 Một ví dụ về việc sử dụng hàm imhistmatch trong Matlab
a. Hình ảnh muốn chỉnh sửa
b. Hình ảnh đối chiếu
c. Hình ảnh sau khi thay đổi histogram theo hình đối chiếu
Hình a’, b’, c’ là histogram của các hình a, b, c.
Hình a’ Hình b’ Hình c’
Hình a Hình b Hình c
Trang 33
Nhận xét: Hình (II.18 a) là quang cảnh Bắc cực được bao bởi phủ tuyết, có độ sáng cao nên histogram vùng sáng sẽ nhiều, trong khi hình (II.18 b) chụp trong quang cảnh hoàng hôn sẽ có vùng tối nhiều. Khi ta lấy hình (II.18 b) làm mẫu cho (II.18 a) thì tạo ra 1 hình (II.18 c) có độ tương phản rất cao, mặt đất bị tuyết bao phủ có thể quan sát dễ dàng. Từ những nhận xét trên ta có thể thấy được những ứng dụng của thay đổi histogram theo yêu cầu là: chỉnh sửa hình ảnh nhanh chóng khi đã có 1 hình mẫu.
II.2.2.2.3 Nâng cao chất lượng cục bộ
Các phương pháp xử lý histogram được thảo đề cập trong hai phần trước mang tính toàn cục, nghĩa
là điểm ảnh được sửa đổi bởi một hàm chuyển đổi mức xám cấp toàn bộ hình ảnh. Mặc dù cách tiếp cận toàn cục phù hợp để nâng cao tổng thể, nhưng có những trường hợp ta chỉ cần thiết để tăng cường
thông tin chi tiết trên những vùng nhỏ trong một số hình ảnh. Số điểm ảnh trong các khu vực này có
thể có ảnh hưởng không đáng kể đến toàn cục của bức ảnh. Giải pháp là để đưa ra hàm chuyển đổi
dựa trên phân phối mức xám tính trong vùng lân cận[11]. Ví dụ sau sẽ minh họa
Nhận xét:
Hình (II.19 b) cho thấy tăng cường nhiễu đáng kể, cộng thêm vào đó là tương phản tương nhẹ. Lưu ý
rằng không có chi tiết cấu trúc mới đã được đưa ra bằng phương pháp này. Tuy nhiên, cân bằng
histogram cục bộ sử dụng một vùng lân cận 7x7 tiết lộ sự hiện diện của hình vuông nhỏ bên trong các
hình vuông màu lớn hơn. Các ô vuông nhỏ là quá gần trong mức xám những người lớn hơn, và kích
thước của chúng quá nhỏ để ảnh hưởng đến cân bằng histogram toàn cục đáng kể. Cũng lưu ý các kết
cấu nhiễu tốt hơn trong hình (II.19 c) là kết quả của chế biến địa phương sử dụng các vùng lân cận
tương đối nhỏ.
II.2.2.2.4 Sử dụng phương pháp thống kê histogram để nâng cao chất lượng hình ảnh
Hình II.19 Một ví dụ minh họa về việc nâng cao chất lượng ảnh cục bộ [i]
- Hình a: Ảnh gốc, đã được làm mờ để giảm nhiễu.
- Hình b: Kết quả của việc cân bằng Histogram toàn cục.
- Hình c: Kết quả của việc cân bằng Histogram cục bộ sử dụng vùng lân cận có kích thước 7x7 pixel.
-
Hình a Hình b Hình c
Trang 34
Thay vì việc sử dụng trực tiếp histogram của ảnh vào nâng cao chất lượng hình ảnh, ta có thể sử dụng
các thông số mang tính thống kê được tìm trong histogram. Đặt r là biến rời rạc biểu thị mức xám
trong khoảng [0, L-1] và đặt p(ri) biểu thị các thành phần biểu đồ bình thường hóa tương ứng với giá
trị thứ i của r. Như đã nêu trước đó trong phần này, chúng ta có thể xem p(ri) như một ước tính xác
suất xuất hiện của mức xám ri.[12]
µn(r) = ∑ (𝒓𝒊 − 𝒎)𝒏𝒑(𝒓𝒊)𝑳−𝟏𝒊=𝟎 (Phương trình II.15)
Trong đó, m chính là giá trị mức xám trung bình của ri được cho bởi công thức
m= 𝟏
𝑴𝑵∑ 𝑴−𝟏
𝒙=𝟎 ∑ 𝒇(𝒙, 𝒚)𝑵−𝟏𝒚=𝟎 (Phương trình II.16)
Nếu n=2 thì Pt 4.1 sẽ thành
µ2(r) = ∑ (𝒓𝒊 − 𝒎)𝟐𝟐𝒑(𝒓𝒊)𝑳−𝟏𝒊=𝟎 (Phương trình II.17)
Phương sai được tính bằng công thức σ2=𝟏
𝑴𝑵∑ ∑ [𝒇(𝒙, 𝒚) − 𝒎]𝟐𝑵−𝟏
𝒚=𝟎𝑴−𝟏𝒙=𝟎
Phương trình 4.3 chính là phương sai của r, được kí hiệu là σ2 (r). Chúng ta quan tâm chủ yếu đến giá
trị trung bình m là thước đo của mức độ xám trung bình trong một hình ảnh, và phương sai (hoặc độ
lệch chuẩn) là thước đo tương phản trung bình. Độ lệch chuẩn được tính toán một cách đơn giản là
căn bậc hai của phương sai.
Chúng ta xem xét hai chức năng chính của giá trị trung bình và phương sai cho các mục đích nâng
cao chất lượng hình ảnh.
- Các trung bình toàn bộ và phương sai được tính trong toàn bộ hình ảnh và hữu ích cho điều
chỉnh cường độ và độ tương phản tổng thể hình ảnh.
- Một công dụng khác và mạnh mẽ hớn là trong nâng cao cục bộ, nơi trung bình cục bộ và
phương sai được sử dụng làm cơ sở để thực hiện thay đổi phụ thuộc vào đặc điểm hình ảnh
trong một khu vực được xác định trước về mỗi điểm ảnh trong hình ảnh.
Cho (x, y) là tọa độ của một điểm ảnh trong một hình ảnh, và cho S(x,y) biểu thị một khu vực ảnh/ ảnh
phụ (subimage) theo kích thước quy định, tâm tại (x, y). Từ phương trình (4.2) giá trị trung bình của
các điểm ảnh trong S(x,y) có thể được tính bằng cách sử dụng biểu thức sau
mSx,y = ∑ 𝒓𝒔,𝒕. 𝒑(𝒔,𝒕)∈𝑺𝒙,𝒚 (𝒓𝒔,𝒕) (Phương trình II.18)
Trong đó r s,t là mức xám tại tọa độ (s,t) trong vùng lân cận p(r s,t) là thành phần được bình thường
hóa histogram trong vùng lân cận tương ứng với mức xám tại mỗi điểm. Tương tự như vậy từ pt (4.3)
ta có phương sai của các pixel trong vùng S(x,y) được cho bởi
σ2Sx, y = ∑ [𝒓𝒔,𝒕 − 𝒎𝑺𝒙,𝒚]
𝟐. 𝒑(𝒓𝒔,𝒕)(𝒔,𝒕)∈𝑺𝒙,𝒚 (Phương trình II.19)
Như trình bày ở 2 phương trình tính m và 𝜎2 chúng ta có thể xác định phương sai (cho toàn hình ảnh)
và giá trị trung bình và phương sai cục bộ (cho ảnh phụ).
Trung bình cục bộ là một thang đo mức xám trong vùng lân cận S(x, y) và phương sai (hoặc độ lệch
chuẩn) là một thang đo của độ tương phản trong vùng lân cận. Một khía cạnh quan trọng của xử lý
hình ảnh bằng cách sử dụng trung bình cục bộ và phương sai là sự linh hoạt đủ khả năng trong việc
phát triển kỹ thuật nâng cao chất lượng hình ảnh đơn giản, nhưng lại mạnh mẽ dựa trên các biện pháp
Trang 35
thống kê có giới hạn và có thể dự đoán tương ứng với diện mạo hình ảnh. Chúng ta minh họa những
đặc điểm này bằng một ví dụ.
Hình II.20 Hình ảnh bóng đèn dây
tóc được phóng đại 130 lần. [k]
Hình II.21 Hình được xử lý nhờ sử dụng phương pháp thống kê histogram
a. Hình ảnh được hình thành nhờ việc tìm các trung bình cục bộ có trong hình (II.20) dùng
phương trình (II.18).
b. Hình ảnh thu được từ việc tìm độ lệch chuẩn cục bộ có trong hình (II.20) dùng phương
trình (II.19).
c. Hình ảnh thu được từ việc sử dụng các hằng số nhân để tạo hình ảnh được nâng cao
chất lượng.
Hình a Hình b Hình c
Trang 36
II.3 Tổng hợp:
Xử lý ảnh bằng các thuật toán đại số giúp chúng ta có nhiều cách tiếp cận đa dạng trong việc chỉnh
sửa ảnh để đạt được như mong muốn. Có nhiều phương pháp và mỗi phương pháp sẽ có lợi điểm và
yếu điểm riêng, vậy nên việc chọn lựa phương pháp hợp lý là điều rất quan trọng.
- Âm ảnh giúp chúng ta phát hiện những chi tiết trắng ẩn chứa trong nền màu đen, điều này rất
ý nghĩa trong Y khoa.
- Biến đổi hàm mũ thì có ý nghĩa trong việc điều chỉnh tương phản của hình.
- Biến đổi hàm log hữu ích trong việc tăng thêm chi tiết ở vùn tối của hình ảnh. Một hình ảnh bị
lóa thì khu vực mức xám tập trung nhiều sẽ được tìm thấy khi ta cho γ>1.
- Histogram cung cấp những thông tin khá hữu ích về một bức ảnh. Cân bằng histogram thực hiện việc tăng độ tương phản bằng cách phân bổ lại các mức xám sao cho trải dài các biên độ
xám từ 1-255.
- Thay đổi histogram theo yêu cầucho phép ta chỉnh sửa 1 bức bình dựa trên 1 bức hình chuẩn (đã được chỉnh sửa) một cách nhanh chóng. Nguyên lý là tưởng ứng histogram của ảnh xử lý
với ảnh mẫu dùng để đối chiếu.
Trong tài liệu này không hề đề cập đến chi phí tính toán nên ta chỉ xem xét ứng dụng của các phép biến đổi mà thôi. Bởi vì theo lý thuyết mỗi phương pháp đều có những điểm mạnh và điểm yếu nên
trong thực tế người ta thường kết hợp nhiều phương pháp thông qua nhiều quá trình chỉnh sửa để
thu được hình mong muốn.
Trang 37
Phần III:
NHÌN VỀ TƯƠNG LAI CỦA XỬ LÝ ẢNH
Hãy tưởng tượng bạn đang du lịch ở nước ngoài nhưng bạn không hề biết ngôn ngữ nước đó, bạn sẽ
gọi thực đơn như thế nào? Hay bạn đang đi mua sắm giữa muôn ngàn sản phẩm với nhãn hiệu khác
nhau, đâu là nhãn hiệu được mọi người tin dùng? Rất đơn giản, chúng ta chỉ cần lấy điện thoại ra,
chụp hình và phần việc còn lại của điện thoại sẽ là dịch ra ngôn ngữ của bạn. Những điều này đã được
Google làm với ứng dụng Google Goggle và Google Translate và đang được hoàn thiện, trong tương
lai không xa ứng dụng của việc lấy thông tin từ hình ảnh sẽ phổ biến và tiện dụng rất nhiều.
Trong lĩnh vực y khoa, khi kết nối máy tính với não bộ thì những hình ảnh trong giấc mơ của bạn sẽ
được hiện lên rõ ràng và lưu lại, thật là tuyệt phải không nào? Công nghệ luôn phát triển và xử lý ảnh
đang trên đà phát triển vượt bậc với những ứng dụng có ý nghĩa thực tế.
Chúng ta có thể hiểu đơn giản quá trình xử lý ảnh là phân tích các khía cạnh đa dạng của hình ảnh dựa
trên các thuật toán. Rất nhiều ngành, lĩnh vực đã “vay mượn” sức mạnh từ xử lý ảnh, đó là Trí tuệ
nhân tạo và Máy có khả năng học hỏi.
Tại trường Nam California (USC), xử lý ảnh đã giúp Giáo sư Gérard Medioni và các sinh viên của ông
tạo ra điều kỳ tích đó là giúp người mù “nhìn” thấy được. Người khiếm thị sẽ được mặc một chiếc áo
vest và mang kính đen. Khi mà người đó di chuyển hệ thống sẽ tạo ra bản đồ 3D của môi trường xung
quanh và camera gắn trên kính đen sẽ giúp phát hiện chướng ngại vật. Bên trong áo vest sẽ có động
cơ nhỏ, khi hệ thống báo rằng người đó cần đi qua trái thì động cơ bên trái sẽ rung lên. Một khi hệ
thống này được phát triển nó sẽ thay đổi cuộc đời hàng triệu người trên thế giới, nó không chỉ giúp
người khiếm thị tránh vật mà còn giúp họ đọc báo, xem biển báo…như những người bình thường
khác. Có rất nhiều công nghệ được sử dụng trong sáng chế này nhưng xử lý ảnh đóng vai trò quan
then chốt nhất.[13]
Trong điều tra tội phạm người ta thường dùng dấu vân tay để tra vào cơ sở dữ liệu xem ai là kẻ tình
nghi, ngoài ra nhận diện mặt người cũng được áp dụng triệt để. Xử lý ảnh đã giúp công tác điều tra
tội phạm được dễ dàng và chính xác hơn.
Xử lý ảnh đã thay đổi diện mạo của thế giới qua những bức ảnh. Việc đó thể hiện qua những bức ảnh
được chụp. Qua những công đoạn xử lý ảnh, ta sẽ có những bức ảnh đầy tính nghệ thuật và cho ta một
cái nhìn khá mới mẻ về cuộc sống xung quanh ta. Bạn có thể lưu trữ những giây phút hạnh phúc thông
qua những bức ảnh và có thể làm vui vẻ hơn bằng việc xử lý ảnh theo ý thích. “Khoảng 10-15 năm
nữa, xử lý ảnh sẽ có mặt trong mọi ngóc ngách cuộc sống”-Tiến sĩ Richard Baraniuk, giảng viên tại đại
học Rice, Mỹ đã nhận xét.
Triển vọng phát triển của XLA là vô tận và có thể từ ngay bây giờ. Thị trường những bức ảnh trong y
khoa sẽ đạt con số 13 tỷ đô la Mỹ trong năm 2014 nhờ vào việc sử dụng hệ thống hình ảnh y tế 3D. Người ta ước tính thị trường tìm kiếm hình ảnh trên mạng sẽ chiếm 30% so với tổng lượng tìm kiếm
trong vòng 3 năm nữa.
Cái nhìn về tương lai
- Người khuyết tật: Công nghệ robot có ứng dụng XLA sẽ hỗ trợ người khiếm thị có thể “nhìn” thấy được nhờ được cảnh báo bởi các cảm biến và động cơ rung.
Trang 38
- An ninh quốc gia: Robot quân sự với khả năng quan sát tốt sẽ hỗ trợ đắc lực cho quân đội ở những địa hình, trận chiến nguy hiểm. Máy bay không người lái dùng để trinh thám sẽ là “đôi
mắt” của quân đội.
- Giao thông: sẽ có lúc bạn nhìn lên trời và thấy hàng ngàn drone (robot bay) đang bay trên
trời, chúng được dùng để vận chuyển hàng hóa, chở người hay phục vụ an ninh. Làm sao
chúng có thể hoạt động được? Đó là nhờ đóng góp lớn của XLA, giúp drone có thể quan sát và
định hướng.
- Điều tra tội phạm: phần mềm thông minh có thể tìm kiếm kẻ tình nghi giữa hàng ngàn, hàng triệu bức ảnh, video chỉ trong 1 đến 2 phút.
- Chăm sóc sức khỏe: ảnh 3D có thể giúp bác sĩ thực hiện cuộc phẫu thuật từ xa, điều này có ý nghĩa vô cùng to lớn đối với những nơi hẻo lánh hay trong những trường hợp nguy cấp.
- Nhiếp ảnh: Camera sẽ thông minh hơn. Ví dụ như ý tưởng camera Lytro của Valley, có thể
chụp trước rồi lấy nét sau một cách đơn giản và dễ dàng nhờ vào các ma trận camera nhỏ.
Trang 39
Phần IV
LỜI KẾT
Trong thời gian có hạn nên trong tài liệu này chỉ trình bày những cái nhìn tổng quát nhất về các
phương pháp xử lý ảnh thông dụng và dĩ nhiên không tránh khỏi những thiếu sót. Sau khi trình bày
các phương pháp trên tôi cảm thấy thích thú nhất với các ứng dụng của phương pháp lấy ngưỡng.
Nếu tiếp tục nghiên cứu sâu hơn tôi sẽ chọn cho mình đề tài về những ứng dụng thực tiễn của lấy
ngưỡng trong lĩnh vực trí tuệ nhân tạo và nhận diện kí tự.
Cảm ơn sự hướng dẫn chu đáo và nhiệt tình của Thầy Võ Trung Dũng cũng như các Thầy Cô các bộ
môn đã cung cấp các kiến thức, kĩ năng chuyên môn giúp tôi hoàn thành tài liệu này một cách khoa
học và bài bản nhất.
Tài liệu tham khảo:
[1] Rafael C. Gonzalez và Richard E.Woods, sách “Digital Image Processing” tái bản lần thứ 2, chương 01 trang 3–4, 2002.
[2] H. K. Sawant, Mahentra Deore, bài viết “A Comprehensive Review of Image Enhancement Techniques” trong sách “International Journal of Computer Technology and Electronics Engineering (IJCTEE) Volume 1, Issue 2” ISSN 2249-6343.
[3] H. K. Sawant, Mahentra Deore, bài viết “A Comprehensive Review of Image Enhancement Techniques” trong sách “International Journal of Computer Technology and Electronics Engineering (IJCTEE) Volume 1, Issue 2” ISSN 2249-6343.
[4] H. K. Sawant, Mahentra Deore, bài viết “A Comprehensive Review of Image Enhancement Techniques” trong sách “International Journal of Computer Technology and Electronics Engineering (IJCTEE) Volume 1, Issue 2” ISSN 2249-6343.
[5] H. K. Sawant, Mahentra Deore, bài viết “A Comprehensive Review of Image Enhancement Techniques” trong sách “International Journal of Computer Technology and Electronics Engineering (IJCTEE) Volume 1, Issue 2” ISSN 2249-6343.
[6] H. K. Sawant, Mahentra Deore, bài viết “A Comprehensive Review of Image Enhancement Techniques” trong sách “International Journal of Computer Technology and Electronics Engineering (IJCTEE) Volume 1, Issue 2” ISSN 2249-6343.
[7] Rafael C. Gonzalez và Richard E.Woods, sách “Digital Image Processing” tái bản lần thứ 2, chương 03 trang 88, 2002.
[8] Rafael C. Gonzalez và Richard E.Woods, sách “Digital Image Processing” tái bản lần thứ 2, chương 03 trang 76, 2002.
[9] H. K. Sawant, Mahentra Deore, bài viết “A Comprehensive Review of Image Enhancement Techniques” trong sách “International Journal of Computer Technology and Electronics Engineering (IJCTEE) Volume 1, Issue 2” ISSN 2249-6343.
[10] Trong bài viết của Nick Loomis trong bài viết “Histogram Adjustments in MATLAB – Part II –
Equalization” tại trang web imageprocessingblog.com.
Trang 40
[11] Rafael C. Gonzalez và Richard E.Woods, 3.3.3 “Local Enhancement” trang 103, sách “Digital
Image Processing” tái bản lần thứ 2, chương 01 trang 3–4, 2002.
[12] Raman Maini và Himanshu Aggarwal, trong bài viết “A Comprehensive Review of Image
Enhancement Techniques”.
[13] Trong bài viết “How image processing will change your world in future” của Rituparna Chatterjee
tại địa chỉ http://articles.economictimes.indiatimes.com/2011-10-18/news/30295919_1_google-
image-image-processing-image-search
Tranh ảnh tham khảo
[a] Ảnh do Raman Maini và Himanshu Aggarwal cung cấp trong bài viết “A Comprehensive Review of Image Enhancement Techniques”.
[b] Ảnh do Hệ thống Y tế Mỹ cung cấp.
[c] Ảnh do Raman Maini và Himanshu Aggarwal cung cấp trong bài viết “A Comprehensive Review of Image Enhancement Techniques”.
[d] Hình ảnh gốc cho ví dụ này là do Bác sĩ David R. Pickens, Khoa X Quang và Khoa học phóng xạ, Trung tâm Y tế Đại học Vanderbilt cung cấp.
[d] Hình ảnh gốc cho ví dụ do NASA cung cấp.
[e] Hình ảnh gốc của Tiến sĩ Roger Heady, Trường Nghiên cứu khoa học sinh học, Đại học Quốc gia Australia, Canberra, Úc.
[f] Hình ảnh trong bài viết của Nick Loomis trên trang web http://imageprocessingblog.com/histogra m-adjustments-in-matlab-part-ii-equalization.
[g] Hình ảnh trong bài viết của Nick Loomis trên trang web http://imageprocessingblog.com/histogra m-adjustments-in-matlab-part-ii-equalization.
[h] Ảnh do Raman Maini và Himanshu Aggarwal cung cấp trong bài viết “A Comprehensive Review of Image Enhancement Techniques”.
[i] Ảnh do Rafael C. Gonzalez và Richard E.Woods, sách “Digital Image Processing” tái bản lần thứ 2, chương 03, 2002.
[k] Ảnh gốc do Mr. Michael Shaffer, bộ môn Địa vật lý, Đại học Oregon, Eugene cung cấp.
top related