khoa công nghệ thông tin i h ự ải pháp giám sát m ng d a...

7
Khoa Công nghThông tin Trường Đại học Đà Lạt 1 Đề tài nghiên cu khoa hc sinh viên 2010 Xây Dng Gii Pháp Giám Sát Mng Da Trên Mã Ngun MVũ Minh Quan 0710328 - Đỗ Văn Quyền 0712392 - Đặng Đình Lành 0712372 - Bùi Long Anh Quân 0712390. Lớp CTK31, Khoa Công nghệ Thông tin, Trường Đại học Đà Lạt Giáo viên hướng dẫn: Ths. Trần Thống. Email:[email protected] Tóm tt Trong bài báo này, chúng tôi tp trung nghiên cu vvấn đề giám sát hoạt động ca mt hthng mng da trên phn mm mã ngun mNagios chy trên hđiều hành mCentOS. Đồng thời, chúng tôi cũng tìm hiu vvai trò và cách thc hot động ca các giao thc htrgiám sát mạng như SNMP. Cui cùng, chúng tôi đưa ra mt gii pháp hoàn chnh nhm giám sát hoạt động mt hthng mng da theo mô hình mng doanh nghip, hthng này có khnăng giám sát hoạt động ca htng mạng cũng như các dịch vmng bng cách sdng gii pháp tích hp da trên Nagios, Solarwinds. Tkhóa SNMP, Nagios, Monitoring, Configuration, Solarwinds. I. GII THIU Cùng vi sphát trin ca công nghthông tin, sđầu tư cho htng mng trong mi doanh nghiệp ngày càng tăng cao, dẫn đến vic qun trscmt hthng mng gp rt nhiu khó khăn. Đi cùng với nhng li ích khi phát trin htng mạng như băng thông cao, khối lượng dliu trong mng ln, đáp ứng được nhu cu của người dùng, hthng mng phi đối đầu vi rt nhiu thách thức như các cuộc tn công bên ngoài, tính sn sàng ca thiết b, tài nguyên ca hthống,… Mt trong nhng gii pháp hu hiu nhất để gii quyết vấn đề này là thc hin vic gii pháp giám sát mng, da trên nhng thông tin thu thập được thông qua quá trình giám sát, các nhân viên qun trmng có thphân tích, đưa ra nhng đánh giá, dbáo, gii pháp nhm gii quyết nhng vấn đề trên. Để thc hin giám sát mng có hiu qu, mt chương trình giám sát phải đáp ứng được các yêu cu sau: phải đảm bo chương trình luôn hoạt động, tính linh hot, chức năng hiệu quả, đơn giản trong trin khai, chi phí thp. Hin nay, có khá nhiu phn mm htrvic giám sát mng có hiu qunhư Nagios, Zabbix, Zenoss, Cacti,… Trong bài báo này, chúng tôi đề cập đến Nagios, mt phn mm mã ngun mvi nhiu chức năng mạnh mcho phép qun lý các thiết b, dch vtrong hthng mng. Mc tiêu ca chúng tôi trong bài báo này là giúp cho mi người có cái nhìn tng quan vmt hthng giám sát mng hoàn chnh, đồng thời đưa ra mt gii pháp cthđối vi mt hthng mng dành cho doanh nghip. Bài báo này được viết theo cấu trúc như sau: Giám sát mng là gì, cn giám sát nhng gì trong hthng mng, tm quan trng ca hoạt động giám sát mng. Cơ chế và cách thc hoạt động ca giao thc htrgiám sát mng SNMP. Gii thiu, triển khai và đánh giá gii pháp. Kết luận và hướng phát trin II. GIÁM SÁT MNG A. Giám sát mng Là mt thut ngdùng để chvic sdng liên tc mt hthng (có thlà một chương trình hoặc mt thiết b) để theo dõi tt ccác hoạt động ca các thiết b, các dch vtrong mt hthng mng. B. Cn giám sát nhng gì và ti sao? Đối vi hthng mạng, điều quan trng nht là nắm được nhng thông tin chính xác nht vào mi thời điểm. Nhng thông tin cn nm bt khi giám sát mt hthng mng bao gm: Tính sn sàng ca thiết b(Router, Switch, Server,…): nhng thiết bgicho mng hoạt động Các dch vtrong hthống (dns, ftp, http,…): những dch vnày đóng vai trò quan trọng trong mt công ty, tchc, nếu các dch vnày không được đảm bào hot động bình thường và liên tc, nó sảnh hưởng nghiêm trọng đến công ty, tchức đó. Tài nguyên hthng: Các ng dụng đều đòi hỏi tài nguyên hthng, vic giám sát tài nguyên sđảm bo cho chúng ta có nhng can thip kp thi, tránh nh hưởng đến hthng. Lưu lượng trong mng: nhằm đưa ra những gii pháp, ngăn ngừa hiện tượng quá ti trong mng. Các chức năng về bo mt: nhằm đảm bo an ninh trong hthng. Nhiệt độ, thông tin vmáy ch, máy in: giúp tránh những hư hng xy ra. Tạo file log: thu được nhng thông tin vnhng thay đổi trong hthng. C. Tm quan trng ca hoạt động giám sát mng

Upload: doantuyen

Post on 06-Mar-2018

218 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Khoa Công nghệ Thông tin i h ự ải Pháp Giám Sát M ng D a ...docshare01.docshare.tips/files/15136/151363715.pdf · mềm mã nguồn mở với nhiều chức năng mạnh

Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt

1 Đề tài nghiên cứu khoa học sinh viên 2010

Xây Dựng Giải Pháp Giám Sát Mạng Dựa Trên

Mã Nguồn Mở

Vũ Minh Quan 0710328 - Đỗ Văn Quyền 0712392 - Đặng Đình Lành 0712372 - Bùi Long Anh Quân 0712390. Lớp CTK31, Khoa Công nghệ Thông tin, Trường Đại học Đà Lạt

Giáo viên hướng dẫn: Ths. Trần Thống. Email:[email protected]

Tóm tắt – Trong bài báo này, chúng tôi tập trung nghiên cứu về

vấn đề giám sát hoạt động của một hệ thống mạng dựa trên phần

mềm mã nguồn mở Nagios chạy trên hệ điều hành mở CentOS.

Đồng thời, chúng tôi cũng tìm hiểu về vai trò và cách thức hoạt

động của các giao thức hỗ trợ giám sát mạng như SNMP. Cuối

cùng, chúng tôi đưa ra một giải pháp hoàn chỉnh nhằm giám sát

hoạt động một hệ thống mạng dựa theo mô hình mạng doanh

nghiệp, hệ thống này có khả năng giám sát hoạt động của hạ tầng

mạng cũng như các dịch vụ mạng bằng cách sử dụng giải pháp

tích hợp dựa trên Nagios, Solarwinds.

Từ khóa – SNMP, Nagios, Monitoring, Configuration,

Solarwinds.

I. GIỚI THIỆU

Cùng với sự phát triển của công nghệ thông tin, sự đầu tư

cho hạ tầng mạng trong mỗi doanh nghiệp ngày càng tăng cao,

dẫn đến việc quản trị sự cố một hệ thống mạng gặp rất nhiều

khó khăn. Đi cùng với những lợi ích khi phát triển hạ tầng

mạng như băng thông cao, khối lượng dữ liệu trong mạng lớn,

đáp ứng được nhu cầu của người dùng, hệ thống mạng phải

đối đầu với rất nhiều thách thức như các cuộc tấn công bên

ngoài, tính sẵn sàng của thiết bị, tài nguyên của hệ thống,…

Một trong những giải pháp hữu hiệu nhất để giải quyết vấn đề

này là thực hiện việc giải pháp giám sát mạng, dựa trên những

thông tin thu thập được thông qua quá trình giám sát, các nhân

viên quản trị mạng có thể phân tích, đưa ra những đánh giá,

dự báo, giải pháp nhằm giải quyết những vấn đề trên.

Để thực hiện giám sát mạng có hiệu quả, một chương trình

giám sát phải đáp ứng được các yêu cầu sau: phải đảm bảo

chương trình luôn hoạt động, tính linh hoạt, chức năng hiệu

quả, đơn giản trong triển khai, chi phí thấp.

Hiện nay, có khá nhiều phần mềm hỗ trợ việc giám sát

mạng có hiệu quả như Nagios, Zabbix, Zenoss, Cacti,…

Trong bài báo này, chúng tôi đề cập đến Nagios, một phần

mềm mã nguồn mở với nhiều chức năng mạnh mẽ cho phép

quản lý các thiết bị, dịch vụ trong hệ thống mạng.

Mục tiêu của chúng tôi trong bài báo này là giúp cho mọi

người có cái nhìn tổng quan về một hệ thống giám sát mạng

hoàn chỉnh, đồng thời đưa ra một giải pháp cụ thể đối với một

hệ thống mạng dành cho doanh nghiệp.

Bài báo này được viết theo cấu trúc như sau:

Giám sát mạng là gì, cần giám sát những gì trong hệ

thống mạng, tầm quan trọng của hoạt động giám sát

mạng.

Cơ chế và cách thức hoạt động của giao thức hỗ trợ

giám sát mạng SNMP.

Giới thiệu, triển khai và đánh giá giải pháp.

Kết luận và hướng phát triển

II. GIÁM SÁT MẠNG

A. Giám sát mạng

Là một thuật ngữ dùng để chỉ việc sử dụng liên tục một hệ

thống (có thể là một chương trình hoặc một thiết bị) để theo

dõi tất cả các hoạt động của các thiết bị, các dịch vụ trong một

hệ thống mạng.

B. Cần giám sát những gì và tại sao?

Đối với hệ thống mạng, điều quan trọng nhất là nắm được

những thông tin chính xác nhất vào mọi thời điểm. Những

thông tin cần nắm bắt khi giám sát một hệ thống mạng bao

gồm:

Tính sẵn sàng của thiết bị (Router, Switch, Server,…):

những thiết bị giữ cho mạng hoạt động

Các dịch vụ trong hệ thống (dns, ftp, http,…): những

dịch vụ này đóng vai trò quan trọng trong một công ty,

tổ chức, nếu các dịch vụ này không được đảm bào hoạt

động bình thường và liên tục, nó sẽ ảnh hưởng nghiêm

trọng đến công ty, tổ chức đó.

Tài nguyên hệ thống: Các ứng dụng đều đòi hỏi tài

nguyên hệ thống, việc giám sát tài nguyên sẽ đảm bảo

cho chúng ta có những can thiệp kịp thời, tránh ảnh

hưởng đến hệ thống.

Lưu lượng trong mạng: nhằm đưa ra những giải pháp,

ngăn ngừa hiện tượng quá tải trong mạng.

Các chức năng về bảo mật: nhằm đảm bảo an ninh

trong hệ thống.

Nhiệt độ, thông tin về máy chủ, máy in: giúp tránh

những hư hỏng xảy ra.

Tạo file log: thu được những thông tin về những thay

đổi trong hệ thống.

C. Tầm quan trọng của hoạt động giám sát mạng

Page 2: Khoa Công nghệ Thông tin i h ự ải Pháp Giám Sát M ng D a ...docshare01.docshare.tips/files/15136/151363715.pdf · mềm mã nguồn mở với nhiều chức năng mạnh

Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt

2 Đề tài nghiên cứu khoa học sinh viên 2010

Hình 1: Ví dụ về số lượng các tham số cần giám sát trong

mô hình mạng

Giả sử một quản trị viên đang quản lý một hệ thống mạng

của công ty bao gồm 10 Server. Trong mỗi Server, quản trị

viên đó phải lần lượt kiểm tra 8 tham số. Như vậy, mỗi ngày,

phải kiểm tra 80 tham số, việc đó tiêu tốn khoảng thời gian

khá lớn. Nếu hệ thống mạng có nhiều thiết bị hơn nữa, việc

kiểm tra từng tham số như vậy là không khả quan, vì vậy, việc

sử dụng một hệ thống giám sát là cần thiết. Sử dụng hệ thống

giám sát, chúng ta có thể tiết kiệm khá nhiều thời gian, thay vì

tốn 10 tiếng để kiểm tra toàn bộ, chúng ta chỉ tốn khoảng 10

phút.

Hơn nữa, khi biết được những sự cố xảy ra trong mạng,

chúng ta có thể khắc phục được những sự cố đó một cách kịp

thời, đồng thời đưa ra được những chính sách hợp lý trong

việc giới hạn truy cập, quản lý băng thông, bảo trì, nâng cấp

hệ thống,… Những hoạt động đó giúp cho việc quản trị mạng

trở nên dễ dàng, có hiệu quả, nâng cao hiệu suất công việc.

III. GIAO THỨC SNMP

Giao thức SNMP[1] (System Network Management

Protocol) là giao thức được sử dụng để hỗ trợ cho việc giám

sát các thiết bị mạng cũng như các thiết bị khác trong trung

tâm dữ liệu (Data Center). Giao thức SNMP là một phần trong

bộ giao thức TCP/IP. Trong môi trường data center, mỗi

Server được cài đặt agent giao tiếp với nhau thông qua giao

thức SNMP để quảng bá trạng thái của mỗi thiết bị. Thiết bị

manager (Monitoring Server) tập trung dữ liệu từ nhiều nút.

Giao thức SNMP gồm 3 thành phần chính:

1) Các thiết bị – là nơi mà agent được cài đặt.

2) Các agent – được cài đặt trên thiết bị.

3) Monitoring Server – Phần mềm nhận dữ liệu giám sát

từ agent.

Dữ liệu có thể được tập hợp bằng cách sử dụng các phương

thức GetRequest, SetRequest,GetNextRequest, Response,

Trap… Có nghĩa là hệ thống giám sát có thể yêu cầu 1 giá trị

từ Server “get” hoặc có thể thiết lập “trap”.

Hình 2: Cấu trúc PDU của giao thức SNMP

Giao thức SNMP hoạt động ở tầng 7 của mô hình OSI (tầng

Application) và sử dụng UDP port 161 để giao tiếp vì giao

thức SNMP không cần hồi báo và chỉ sử dụng cho mục đích

giám sát.

Cấu trúc cơ bảncủa PDU trong giao thức SNMP(Hình 2)

bao gồm IP header, UDP header, version, community

type,requestid, error status, error index, variable bindings.

Có 3 phiên bản chính của giao thức SNMP. Phiên bản 1

[RFC 1065, 1066, 1067, 1156] có vấn đề trong bảo mật và

chứng thực. Lỗi đó được khắc phục ở phiên bản 2 [RFC

1213]. Trong phiên bản 3, giao thức SNMP được cải tiến để

có thể cấu hình từ xa [RFC 3411, 3418].

Hình 3: Sơ đồ hoạt động của giao thức SNMP

IV. NAGIOS

A. Giới thiệu về chương trình Nagios

Là 1 phần mềm mã nguồn mở, là một ứng dụng rất mạnh

cho việc giám sát mạng. Nó phù hợp với các hệ thống mạng

lớn và nhỏ. Ưu điểm lớn nhất của Nagios là tính mở của

chương trình, ta có thể cấu hình Nagios theo nhiều cách, đồng

thời có thể mở rộng theo nhu cầu của người sử dụng. Nagios

giúp cho việc phát hiện và giải quyết vấn đề xảy ra trong hệ

thống được tiến hành một cách hiệu quả nhất.

Nagios[3] hoạt động bằng cách kiểm tra xem một máy chủ

hoặc dịch vụ có hoạt động tốt không và lưu trữ trạng thái của

nó. Trạng thái của một dịch vụ có một trong bốn giá trị OK,

WARNING, CRITICAL, UNKNOWN. Điều quan trọng là nó

thật sự xác định được tình trạng hiện tại.Để tránh phát hiện

tạm thời và ngẫu nhiên vấn đề, Nagios sử dụng trạng thái tạm

thời và cố định mô tả tình trạng hiện tại của một máy chủ lưu

trữ hoặc dịch vụ.

Để xử lý tình huống khi một dịch vụ ngưng hoạt động trong

một thời gian rất ngắn, hoặc các kiểm tra tạm thời khôngthành

công, người ta đưa ra trạng thái tạm thời. Khi trạng thái của

một kiểm tra là UNKNOWN, hoặc khác các trạng thái trước

đó, Nagios sẽ tiến hành kiểm tra lại các máy chủ, dịch vụ

nhiều lần để đảm bảo rằng thay đổi là cố định trong một

khoảng thời gian dài. Số lần kiểm tra được cấu hình trong

phần định nghĩa các dịch vụ. Nagios giả định rằng các kết quả

mới là một trạng tạm thời. Sau khi tiến hành kiểm tra nhiều

lần mà trạng thái không đổi, thì nó được coi là một trạng thái

cố định.

Mỗi Host và Service được định nghĩa số thử kiểm tra sẽ được

thực hiện trước khi nó có thể được giả định rằng thay đổi là

vĩnh viễn. Điều này cho phép linh hoạt trong việc kiểm tra các

sự cố. Thiết lập số lượng kiểm tra một sẽ gây ra các thay đổi

được coi là khó khăn ngay lập tức. Sau đây là một minh họa

cho trạng thái tạm thời và cố định, giả sử số lần kiểm tra là 3

ta sẽ có:

Hình 4: Sơ đồ mô tả cách thức Nagios thông báo các

trạng thái

Page 3: Khoa Công nghệ Thông tin i h ự ải Pháp Giám Sát M ng D a ...docshare01.docshare.tips/files/15136/151363715.pdf · mềm mã nguồn mở với nhiều chức năng mạnh

Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt

3 Đề tài nghiên cứu khoa học sinh viên 2010

Tính năng này cho phép bỏ qua sự cố ngưng hoạt động

trong thời gian ngắn của một dịch vụ.Nó cũng rất hữu ích để

thực hiện các kiểm tra định kỳ ngay cả khi mọi thứ hoạt động

tốt.

Các chức năng chính của Nagios:

Các chức năng của Nagios rất linh hoạt, nó có thể được cấu

hình để theo dõi cơ sở hạ tầng CNTT theo cách ta muốn. Nó

cũng có một cơ chế để tự động phản ứng với các vấn đề, và

một hệ thống cảnh báo mạnh. Tất cả điều này được dựa trên

một hệ thống định nghĩa các đối tượng rõ ràng:

Commands: được định nghĩa về cách Nagios cần

thực hiện các loại kiểm tra, chúng là một lớp trừu

tượng cho phép ta nhóm các hoạt động tương tự lại

với nhau.

Time-periods:là ngày và thời gian kéo dài mà trong

đó một hoạt động nên hay không nên được thực hiện.

Ví dụ: thứ 2 đến thứ 6 9:00-17:00.

Contacts và Contact groups: là những người cần

được cảnh báo, cùng với thông tin về cách thức và

thời gian họ cần được cảnh báo. Contacts có thể được

nhóm lại thành Contact groups.

Host: là những máy vật lý, cùng với thông tin về việc

ai sẽ được liên lạc, làm thế nào kiểm tra phải được

thực hiện, và khi nào. Host có thể được nhóm lại

thành các Host group, mỗi host có thể là một thành

viên của nhiều Host group.

Services: là các chức năng khác nhau hoặc các tài

nguyên cần được giám sát, cùng với thông tin về

những người cần được liên lạc, làm thế nào kiểm tra

phải được thực hiện, và khi nào. Service có thể được

nhóm lại thành các service group, mỗi service có thể

là một thành viên của nhiều service group.

Host và service escalation: định nghĩa khoảng thời

gian được chỉ ra mà sau đó người phụ trách nên được

cảnh báo của các sự kiện nào đó - ví dụ một máy chủ

quan trọng là ngưng hoạt hơn 4 giờ nên cảnh báo cho

quản trị viên để họ bắt đầu theo dõi các vấn đề.

B. Đề xuất giải pháp, triển khai mô hình

Hình 5: Mô hình mạng cần giám sát

Để tiến hành kiểm tra và đánh giá hoạt động của một hệ

thống giám sát, chúng tôi xây dựng một mô hình mạng mô

phỏng hoạt động của hệ thống một mạng doanh nghiệp như

trong Hình 5. Hệ thống này được cài đặt và thử nghiệm tại

phòng thực hành mạng khoa CNTT. Hệ thống bao gồm: 1

Router 2621XM Series, 2 Switch 3560 Catalyst Series, 4

Server: 1 DNS Server, 1 FTP Server, 1 Web Server kết hợp

Mail Server, 1 Server có nhiệm vụ chạy phần mềm giám sát

Nagios.

Những mục tiêu cần giám sát trong mô hình:

Hạ tầng: Theo dõi Router, Switch, End User

o PING: Kiểm tra kết nối từ Server chạy

Nagios đến các thiết bị cần giám sát.

o CPU load: Kiểm tra tải CPU của thiết bị.

o IOS version: Kiểm tra phiên bản hệ điều

hành.

o Interface Table: Kiểm tra trạng thái các port,

gồm 2 trạng thái Up hoặc Down.

o Memory: Kiểm tra tình trạng bộ nhớ đang

được sử dụng của thiết bị.

o Port Bandwidth: Kiểm tra băng thông được

sử dụng của port.

o Port Link Status: Kiểm tra trạng thái liên kết.

o Nhiệt độ: Kiểm tra mức nhiệt độ của thiết bị.

o Uptime: Khoảng thời gian chạy của thiết bị

tính từ lúc bật.

Dịch vụ

o DNS: Kiểm tra dịch vụ phân giải tên miền.

o HTTP: Kiểm tra dịch vụ Web.

o POP3: Kiểm tra dịch vụ WINS.

o FTP: Kiểm tra dịch vụ truyền dữ liệu.

Quá trình triển khai:

Cấu hình IP cho các thiết bị, thiết lập tất cả kết nối

giữa các thiết bị như trong mô hình.

Cài đặt các dịch vụ như DNS, FTP, HTTP,… cho các

Server cần giám sát.

Cài đặt chương trình NSClient trên các thiết bị cần

giám sát.

Hình 6: Thư mục chứa các file cfg để định nghĩa

thiết bị, dịch vụ

Cài đặt chương trình Nagios dựa trên hệ điều hành mã

nguồn mở CentOS trong Nagios Server.

Page 4: Khoa Công nghệ Thông tin i h ự ải Pháp Giám Sát M ng D a ...docshare01.docshare.tips/files/15136/151363715.pdf · mềm mã nguồn mở với nhiều chức năng mạnh

Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt

4 Đề tài nghiên cứu khoa học sinh viên 2010

Cài đặt các plugin cần thiết để hỗ trợ chương trình

Nagios như MRTG, Check Table Interface, Check

Temp,…

Tiến hành cấu hình cho chương trình Nagios.

Định nghĩa các thiết bị, các dịch vụ cần giám sát thông

qua các file config của Nagios như Switch.cfg,

windows.cfg,…(Hình 6).

Định nghĩa các host hoặc thiết bị cần giám sát dựa trên

địa chỉ IP của thiết bị (Hình 7).

Hình 7: Định nghĩa 1 host cần giám sát.

Định nghĩa các dịch vụ cần giám sát trên các thiết

bị(Hình 8).

Hình 8: Định nghĩa 1 dịch vụ cần giám sát.

Sau đó, tiến hành giám sát các thiết bị dựa vào giao diện

web. Các bước tiến hành giám sát bao gồm:

Sử dụng tài khoản admin của Nagios, đăng nhập vào

giao diện web (Hình 9).

Hình 9: Giao diện đăng nhập của Nagios.

Giám sát tổng quan về tình trạng chung của hệ thống

mạng(Hình 10): Giám sát số lượng các host đang up

hoặc down, số lượng các Warning, Problems, Critical,

Pending, OK… Dựa vào các tham số đó, chương trình

Nagios tự động đánh giá và đưa ra cảnh báo về tình

trạng của các thiết bị, các dịch vụ như Host Health,

Service Health.

Hình 10: Tổng quát về tình trạng của hệ thống mạng

Xem danh sách tất cảcác thiết bị đang được giám sát,

tình trạng của thiết bị(Hình 11).

Hình 11: Danh sách tất cả các thiết bị được giám sát

Thông tin giám sát tổng quan tất cả các thiết bị, chi tiết

từng dịch vụ giám sát theo danh sách (Hình 12).

Hình 12: Thông tin chi tiết về thiết bị, dịch vụ.

Phân loại theo nhóm: Phân loại các nhóm dựa vào loại

thiết bị, mô hình này bao gồm 2 nhóm: nhóm các thiết

Page 5: Khoa Công nghệ Thông tin i h ự ải Pháp Giám Sát M ng D a ...docshare01.docshare.tips/files/15136/151363715.pdf · mềm mã nguồn mở với nhiều chức năng mạnh

Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt

5 Đề tài nghiên cứu khoa học sinh viên 2010

bị Router, Switch và nhóm các Server, trong mỗi nhóm,

chương trình Nagios liệt kê chi tiết danh sách từng thiết

bị thuộc mỗi nhóm, trạng thái liên kết, số cảnh

báo(Hình 13).

Hình 13: Danh sách các nhóm và chi tiết thiết bị của

từng nhóm

Chức năng lập lịch cảnh báo: Cho phép chúng ta lập

lịch tiến hành giám sát (Hình 14, 15).

Hình 14: Danh sách các thiết bị và dịch vụ để chúng ta lựa

chọn cho quá trình lập lịch

Hình 15: Quá trình lập lịch

Chức năng Event Log ghi lại tất cả các cảnh báo về thời

gian, dịch vụ, thiết bị xảy ra trong hệ thống(Hình 16).

Đây là thành phần rất quan trọng của chương trình

Nagios, dựa vào đó, người quản trị có thể giải quyết sự

cố trong mạng.

Hình 16: Event Log

C. Khắc phục sự cố mạng

Sau khi triển khai hoàn chỉnh giải pháp, toàn bộ hệ thống

bao gồm hạ tầng và dịch vụ mạng đã được giám sát, theo dõi

thông qua Nagios. Khi có bất kì vấn đề gì xảy ra, chương trình

Nagios sẽ đưa ra những cảnh báo tương ứng để người quản trị

có thể phát hiện sự cố và nhanh chóng khắc phục.

Những sự cố thường xảy ra trong mạng bao gồm: thiết bị

mất kết nối, quá tải đường truyền, thiếu tài nguyên, 1 ứng

dụng nào đó của Server xảy ra lỗi,…

Giả sử, trong mô hình trên, chúng ta nhận được thông báo

về 1 số lỗi xảy ra trong hệ thống. Nếu không triển khai giám

sát mạng, người quản trị phải dựa vào những triệu chứng để

đưa ra những dự đoán về nguyên nhân phát sinh lỗi. Nhưng

sau khi đã triển khai chương trình Nagios, những gì người

quản trị cần làm là đăng nhập vào giao diện web của chương

trình Nagios và xem qua các thông tin về các thiết bị, dịch vụ

được giám sát.

Trong trường hợp này, người quản trị phát hiện được 2 sự

cố xảy ra trong mạng:

Hình 17: Sự cố về dịch vụ DNS

Sự cố đầu tiên xảy ra ở DNS Server, vì 1 lý do gì đó,

dịch vụ DNS không hoạt động, hệ thống sẽ xuất cảnh

báo CRITICAL (Hình 17).

Hình 18: Sự cố về thiết bị Switch Distribution 1

Sự cố thứ 2 là về tình trạng tài nguyên bộ nhớcủa của

Switch bị đầy.

Dựa vào những thông báo này, người quản trị có thể đưa ra

những giải pháp như kiểm tra lại dịch vụ chạy trên Server,

nâng cấp hệ thống,… để giải quyết vấn đề.

Ngoài ra, để tối ưu hóa quá trình giám sát mạng, đồng

thời giảm thiểu những thiệt hại có thể xảy ra khi hệ thống gặp

sự cố, giúp người quản trị có thể nhanh chóng phát hiện ra khi

hệ thống trục trặc, chương trình Nagios có chức năng tự động

gửi những cảnh báo khi sự cố phát sinh đến mail hoặc điện

thoại của người quản trị. Những cảnh báo này có độ chi tiết

Page 6: Khoa Công nghệ Thông tin i h ự ải Pháp Giám Sát M ng D a ...docshare01.docshare.tips/files/15136/151363715.pdf · mềm mã nguồn mở với nhiều chức năng mạnh

Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt

6 Đề tài nghiên cứu khoa học sinh viên 2010

khá cao, nó chỉ rõ trạng thái và vấn đề xảy ra trong hệ thống,

nhờ vậy, người quản trị biết phải làm gì.

Hình 19: Những mail cảnh báo về sự cố mạng

D. Đánh giá chương trình Nagios

Sau khi tiến hành triển khai chương trình Nagios để giám

sát mô hình mạng như trên, chúng tôi đưa ra những đánh giá

tổng quát về chương trình:

Ưu điểm:

o Là phần mã nguồn mở, miễn phí.

o Cung cấp giao diện đồ họa đẹp mắt, thân thiện

đối với người dùng.

o Tính mở rộng cao.

o Có khả năng theo dõi định kì theo thời gian đã

được cấu hình trước.

o Ít tốn tài nguyên hệ thống.

o Có cơ chế tự động cảnh báo cho người quản trị

khi có sự cố xảy ra.

o Tự động tạo các báo cáo theo lịch biểu ấn định.

o Độ ổn định cao khi giám sát hệ thống mạng.

o Đặc biệt Nagios có khả năng giám sát phân tán

nên có thể hỗ trợ tối đa 100 000 node.

Nhược điểm:

o Không có khả năng tự động nhận biết các thiết

bị giám sát trong mạng mà cần phải định nghĩa

trên Nagios Server.

o Cần phải cài đặt từng plugin riêng cho từng

dịch vụ giám sát, chính điều này khiến cho việc

cấu hình Nagios trở nên khá phức tạp.

o Một số thiết bị mới chưa thể giám sát được, ví

dụ như Access Point, …

o Triển khai khó vì phải thực hiện trên CentOS.

E. So sánh với một số công cụ khác để rút ra sự khác biệt

Giới thiệu và triển khai OrionNetwork Performance

Monitor [5] trên thiết bị phần cứng Cisco.

Orion Network Performance Monitor (Orion NPM) cung

cấp khả năng phát hiện lỗi toàn diện và quản lý hiệu suất

mạng mà quy mô với sự tăng trưởng nhanh và mở rộng mạng

lưới với các nhu cầu giám sát mạng của bạn, cho phép bạn thu

thập và xem tính khả dụng theo thời gian thực và số liệu thống

kê lịch sử trực tiếp từ trình duyệt web của bạn. Có khả năng

theo dõi, thu thập và phân tích dữ liệu từ thiết bị định tuyến,

chuyển mạch, tường lửa, máy chủ, và bất cứ thiết bị hỗ trợ

SNMP, là một các giải pháp cho các chuyên gia công nghệ

thông tin để giám sát trên bất kì các hệ thống lớn của mạng

mà không cần lo tới kích thước của mạng.

Orion NPM sẽ theo dõi các thông số quan trọng sau đây:

o Độ sẵn sàng của mạng.

o Công suất sử dụng băng thông.

o Các bộ đệm được sử dụng và các lỗi xảy ra.

o Tình trạng CPU và bộ nhớ đang sử dụng.

o Các interface bị lỗi hoặc từ chối truyền dữ liệu.

o Độ trễ của mạng.

o Giám sát từng node, interface, trạng thái.

o Dung lượng sử dụng.

Hình 20:Kết quả giám sát thử nghiệm trên Router Cisco

Hình 21: Thông tin chi tiết về thiết bị và biểu đồ đánh giá

trạng thái hoạt động của Router

Các

Tiêu

Chí

Các chức

năng

Nagios SolarWinds

Về

triển

khai

Cài đặt

đơn giản,

nhanh

chóng.

Cài đặt phức

tạp và tốn

nhiều thời

gian.

Cấu hình đơn

giản, cài đặt

nhanh chóng qua

IIS.

Khả năng

mở rộng.

Có khả năng

giám sát cho

những hệ

thống lớn, giới

hạn ở khoảng

100.000 node.

Có khả năng mở

rộng giám sát

cho bất kì kích

thước nào của hệ

thống mạng.

thuật

quản lí

Quản lý

tập trung.

Hỗ trợ theo

dõi toàn bộ hệ

thống một

cách tập trung,

Tương tự như

Nagios.

Page 7: Khoa Công nghệ Thông tin i h ự ải Pháp Giám Sát M ng D a ...docshare01.docshare.tips/files/15136/151363715.pdf · mềm mã nguồn mở với nhiều chức năng mạnh

Khoa Công nghệ Thông tin – Trường Đại học Đà Lạt

7 Đề tài nghiên cứu khoa học sinh viên 2010

trực quan,chi

tiết qua giao

diện web.

Thông tin

hiển thị.

Các thông tin

hiển thị vẫn

còn hạn chế.

Thông tin hiển

thị tương đối rõ

ràng, đầy đủ cho

người quản trị.

Hiệu

quả

giám

sát

Độ ổn

định khi

hoạt động

của công

cụ.

Hoạt động ổn

định khi giám

sát những hệ

thống mạng

lớn.

Hoạt động ổn

định cho các hệ

thống lớn đến rất

lớn, không phụ

thuộc vào kích

cỡ của mạng.

Tính

chính xác.

Cung cấp

thông tin

chính xác cho

người quản trị

biết khi có sự

cố xảy ra.

Tương tự như

Nagios

Khả năng

giám sát

với các

loại thiết

bị và dịch

vụ.

Giám sát hầu

hết các thiết bị

và dịch vụ phổ

biến.

Có khả năng

giám sát nhiều

loại thiết bị mới

hơn như Access

Point… mà

Nagios chưa làm

được.

Khả năng

cảnh báo.

Cung cấp các

cảnh báo cho

người dùng

thông qua

Email, SMS,

syslog.

SNMP, Orion

NPM thu thập

thông tin trong

một cơ sở dữ

liệu SQL và

report lên giao

diện web.

Giao diện

quản lí.

Cung cấp

thông tin giám

sát qua giao

diện web rất

trực quan.

Tương tự như

Nagios.

Bảo trì,

sửa chữa.

Rất phức tạp

vì Nagios

không hỗ trợ

cấu hình qua

giao diện web.

Đơn giản vì nó

hỗ trợ cấu hình

toàn bộ qua giao

diện web.

Chi

phí

đầu tư

Hoàn toàn

miễn phí đối

với phiên bản

mã nguồn mở.

Phải đăng kí và

trả phí để sử

dụng.

Bảng 1.So sánh hai công cụ Nagios core với Orion NPM

V. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Từ các công cụ được giới thiệu và triển khai ở trên chúng tôi

rút ra một số lợi ích từ việc giám sát hệ thống mạng tự động

bằng các phần mềm giám sát như sau:

Xác định nhanh nguyên nhân cốt lõi của vấn đề một

cách nhanh chóng và dễ dàng. Giảm thiểu công sức

tìm kiếm,di chuyển của nhân viên quản trị mạng.

Tạo ra sự hài lòng của người dùng trong mạng nội bộ.

Tự động gởi cảnh báo qua SMS hoặc email giúp

nhân viên quản trị mạng có thể khắc phục sự cố

nhanh chóng, kịp thời thông qua các kết nối từ xa

bằng internet… Đảm bảo hệ thống mạng của danh

nghiệp hoạt động liên tục và ổn định.

Tự động tạo các báo cáo qua lịch biểu ấn định.

Người sử dụng có thể tạo ra nhiều mẫu báo cáo khác

nhau.

Xác định các xu hướng xảy ra trong tương lai. Tối ưu

hóa và định mức đầu tư đúng mức, đúng chỗ vào hạ

tầng của hệ thống mạng.

Tất cả các yếu tố bên trên dẫn đến việc có thể tiết

kiệm được chi phí, ngân sách đầu tư.

Bên cạnh các phần mềm nhìn chung, khi quản trị hệ thống

mạng, việc giám sát đóng vai trò rất quan trọng. Nó ảnh

hưởng lớn đến hiệu quả kinh doanh của doanh nghiệp hiện

nay. Hiện nay, có rất nhiều phần mềm mạnh hỗ trợ hiệu quả

cho quá trình giám sát mạng như Nagios, CACTI, Zenoss,

Zabbix,…Việc lựa chọn phần mềm phụ thuộc vào quy mô

mạng mà chúng ta quản trị. Và đặc biệt có thể kết hợp một số

phần mềm với nhau để tăng cường hiệu quả của việc giám sát

mạng hiện nay.

Và chúng ta cũng có khá nhiều thiết bị phần cứng hỗ trợ

cho việc giám sát mạng, sự kết hợp giữa phần cứng và phần

mềm sẽ cho hiệu quả cao nhất, mang lại sự tối ưu.

Đề tài có thể phát triển bằng cách mở rộng giải pháp kết

hợp với một số thành phần khác như tường lửa, IPS, IDS

nhằm tăng cường khả năng giám sát và bảo vệ hệ thống mạng.

Bài báo được thực hiện theo đăng kí đề tài nghiên cứu khoa

học sinh viên năm 2010-2011của sinh viên khoa CNTT với sự

hướng dẫn khoa học của giáo viên Ths. Trần Thống.

VI. TÀI LIỆU THAM KHẢO

[1] Use of open source technologies for enterprise

Server monitoring using SNMP, Anshul Kaushik,

2010.

[2] Nagios 3 Enterprise Network Monitoring Including

Plug-Ins and Hardware Devices, Max Schubert

Derick, Derrick Bennett, John Strand, Jonathan

Gines, 2008.

[3] Learning Nagios 3.0, Wojciech Kocjan,2008.

[4] Luận văn tốt nghiệp “Tìm hiểu triển khai giải pháp

giám sát mạng”, Lương Võ Công Khoa, 2010.

[5] SolarWinds, Orion Network Performance Monitor

Quick Start Guide, 2011.