giải pháp bóc - ueb.vnu.edu.vn filedựa trên yêu cầu và mục đích sử dụng,...
TRANSCRIPT
Slide 1 of 15 | 4th Updatestay simple, stay creative
Giải pháp bóc
tách thông tin
(IDD.eNews)
stay simple, stay creative
Slide 2 of 15 | 4th Updatestay simple, stay creative
Tổng quan về IDD.eNews
IDD.eNews là giải pháp bóc tách thông tin trên nền Internet, cho phép khách
hàng có thể cập nhật LIÊN TỤC và TỰ ĐỘNG thông tin từ bất kì website
nào có mặt trên Internet
Khách hàng tùy chọn nguồn dữ liệu cho mình, từ đó giúp nâng cao hiệu
suất sử dụng cũng như tìm kiếm thông tin trong doanh nghiệp
Lọc thông tin theo từ khóa giúp cho khách hàng lấy được chính xác nguồn
thông tin mình mong muốn
Slide 3 of 15 | 4th Updatestay simple, stay creative
Chuyên biệt hóa nguồn thông tin:
Cho phép các doanh nghiệp thu thập được những nguồn thông tin
chuyên biệt, tùy theo lĩnh vực kinh doanh cũng như nhu cầu sử dụng
thông tin của mình.
Nâng cao hiệu suất sử dụng thông tin:
Nhờ việc chuyên biệt hóa nguồn thông tin thu được, các nhân sự trong
tổ chức có thể dễ dàng tìm ra thông tin cần thiết cho mình thay vì phải
loay hoay giữa một biển thông tin trên internet như hiện nay.
Tạo nguồn dữ liệu cho các hệ thống khác:
• Hệ thống website tin tức
• Hệ thống các sàn giao dịch
• Hệ thống đánh giá các cơ hội và rủi ro trong kinh doanh
IDD.eNews » Mục đích xây dựngIDD.eNews » Mục đích xây dựng
Slide 4 of 15 | 4th Updatestay simple, stay creative
Dựa trên yêu cầu và mục đích sử dụng, IDD.eNews được xây
dựng trên nền tảng web giúp cho việc thu thập thông tin diễn ra
nhanh chóng cũng như giúp cho người dùng có thể truy cập
nguồn dữ liệu tại bất cứ đâu
IDD.eNews » Nền tảng kĩ thuậtIDD.eNews »
Công nghệ sử dụng :
ASP.NET
C#
Microsoft SQL Server 2005
Slide 5 of 15 | 4th Updatestay simple, stay creative
IDD.eNews » Tính năng hệ thống
Bóc tách dữ liệu
Blacklist
Quản trị người dùng
Thêm nguồn dữ liệu
Hiển thị dữ liệu
cho phép thêm vào không giới
hạn các nguồn thông tin mới
dùng cho việc tách lọc
hiển thị dữ liệu thu thập được
theo từ khóa đặt sẵn hoặc người
dùng thêm vào
cho phép lấy thông tin tự
động, theo định kì tại các
website
lọc tin, không lấy dữ liệu có
các từ nằm trong blacklist
cho phép phân quyền việc sử
dụng nguồn thông tin
Slide 6 of 15 | 4th Updatestay simple, stay creative
IDD.eNews » Tính năng hệ thống » Bóc tách dữ liệuIDD.eNews » Tính năng hệ thống » Bóc tách dữ liệuIDD.eNews » Tính năng hệ thống » Bóc tách dữ liệu
Không giống như việc lấy tin tự động dựa vào RSS, IDD.eNews có thể
lấy thông tin từ bất cứ website nào (không nhất thiết web đó phải hỗ trợ
RSS), từ đó giúp người dùng chủ động trong việc lấy thông tin cho mình.
IDD.eNews có thể lấy thông tin tại :
Các site tin tức, báo điện tử (vnn.vn, dantri.com.vn, vnmedia.vn, …)
Các forum, diễn đàn (muare.vn, 5giay.vn, …)
Các sàn giao dịch, trang rao vặt (bất động sản, ôtô, …)
Các shop bán hàng
Bạn có thể tùy biến việc bóc tách dữ liệu cho từng nguồn dữ liệu riêng
biệt như: cho chạy tự động trong khoảng thời gian đặt sẵn, thực hiện
bằng tay, chỉ cho phép lấy dữ liệu từ những nguồn nào, …
Module “Bóc tách dữ liệu” được xây dựng hoàn toàn độc lập, giúp cho
việc nâng cấp thêm các nguồn lấy dữ liệu mới trong tương lai trở nên dễ
dàng, tiết kiệm chi phí
Slide 7 of 15 | 4th Updatestay simple, stay creative
IDD.eNews » Tính năng hệ thống » Bóc tách dữ liệu
IDD.eNews sử dụng cơ chế đọc các trang HTML từ các hệ thống website
bên ngoài để lấy thông tin nên bên cạnh những ưu điểm rất nổi trội, nó
vẫn còn có một vài nhược điểm.
Ưu điểm :
Có thể lấy tin tại bất kì website nào
Có thể lấy chính xác một đoạn tin tức trên cả một trang tin tức xác
định
Có thể mở rộng việc lấy tin tức tại rất nhiều website ở những lĩnh
vực khác nhau, không bị phụ thuộc vào loại hình website nào
Nhược điểm :
Mỗi khi website nguồn thay đổi cấu trúc HTML cần phải viết lại
module lấy dữ liệu tại website đó
Slide 8 of 15 | 4th Updatestay simple, stay creative
IDD.eNews » Tính năng hệ thống » Hiển thị dữ liệu
Slide 9 of 15 | 4th Updatestay simple, stay creative
IDD.eNews » Tính năng hệ thống » Blacklist
Tính năng blacklist cho phép bạn có thể loại bỏ được việc lọc những nguồn
tin chứa những từ khóa không mong muốn
Khi bạn cần lọc tất cả các tin bán nhà tại trang www.batdongsan.com.vn
và bạn muốn loại bỏ tất cả các tin liên quan đến những từ khóa như:
“Môi giới”
“Trung gian”
Số điện thoại quen thuộc của một bên môi giới không đáng tin cậy
….
Bạn có thể thêm, bớt, thay đổi các từ khóa trong mục blacklist
Bạn còn có thể tùy biến từng từ khóa blacklist cho từng trang riêng biệt,
giúp cho việc lọc thông tin chính xác hơn
Slide 10 of 15 | 4th Updatestay simple, stay creative
IDD.eNews được xây dựng với một hệ thống lõi (core component) và sau đó
là việc cài đặt mở rộng các trang nguồn thông tin muốn lọc tin (extension
modules) vào hệ thống. Với cơ chế này IDD.eNews giúp khách hàng tiết
kiệm tối đa chi phí trong bối cảnh các nguồn thông tin liên tục thêm mới và
cập nhật nhanh chóng như hiện nay.
Lợi ích của tính năng “Thêm nguồn dữ liệu”:
- Tiết kiệm tối đa chi phí, chỉ thêm vào các nguồn dữ liệu thực sự cần
thiết
- Đối với các trang nguồn dữ liệu đã có sẵn, chi phí cho những site này
là rất nhỏ
- Khả năng mở rộng không giới hạn các nguồn dữ liệu thêm vào
IDD.eNews » Tính năng hệ thống » Thêm nguồn dữ liệu
Slide 11 of 15 | 4th Updatestay simple, stay creative
Tính năng “Quản trị người dùng” giúp việc quản lý nguồn tin trở nên đơn
giản và chính xác
Cho phép ai được vào hệ thống để sử dụng nguồn tin tức
Khóa quyền truy cập tin tức của người dùng nào đó
Cho phép chính xác người dùng nào được đọc nguồn tin tức nào. VD:
người dùng A chỉ được phép đọc tin tức lọc về từ www.vnn.vn, người
dùng B được phép đọc tin lọc về từ www.vnn.vn và www.raovat.vn, ….
Với tính năng này, người quản trị hệ thống có thể định hình cũng như phân
quyền một cách chính xác các nguồn tin cho người dùng, từ đó giúp tăng
hiệu suất sử dụng nguồn thông tin trong doanh nghiệp
IDD.eNews » Tính năng hệ thống » Quản trị người dùng
Slide 12 of 15 | 4th Updatestay simple, stay creative
Rất đơn giản, nếu bạn :
Có nhu cầu xây dựng một trang tin tức tổng hợp và bạn muốn lấy thông
tin từ tất cả các site tin tức khác, diễn đàn, …
Xây dựng một sàn giao dịch ô tô và bạn muốn thu thập tin tức về việc
mọi người đăng bán ô tô trên các forum, trang rao vặt một cách sớm
nhất
Là một công ty chuyên về xuất khẩu (may mặc, chè, café, hạt điều, … )
thì việc cập nhật thông tin liên tục về các nhu cầu, số liệu thống kê tại thị
trường nước ngoài là cực kì cần thiết
Hay chỉ đơn giản bạn muốn tổng hợp tất cả các email trên các site rao
vặt, tuyển dụng, forum, …. để tạo list mail quảng bá cho công ty mình
Doanh nghiệp nào nên sử dụng IDD.eNews ?
LÀM SAO ĐỂ BIẾT BẠN CÓ NÊN DÙNG IDD.eNews ?
IDD.eNews » Phạm vi ứng dụng
Slide 13 of 15 | 4th Updatestay simple, stay creative
Quy Trình Triển Khai IDD.eNews được
thực hiện rất nhanh chóng và đơn giản.
Chú ý: Đối với các nguồn tin tức đã có sẵn, việc triển khai chi diễn
ra trong vòng 5-7 ngày. Đối với các nguồn tin tức mới, thời gian
triển khai sẽ lâu hơn.
IDD.eNews » Quy trình triển khai
Bước 1: Trao đổi về nhu cầu thu thập tin tức của khách hàng
Bước 2: Lên danh sách các trang nguồn cần lọc thông tin
Bước 3: Lên báo giá chi tiết và thời gian triển khai
Bước 4: Tiến hành thực hiện giải pháp
Bước 5: Triển khai
Bước 6: Chạy thử nghiệm
Bước 7: Tư vấn, bảo trì sản phẩm
Slide 14 of 15 | 4th Updatestay simple, stay creative
Liên hệ
Trụ sở chính
Phòng 702, Tòa nhà CT3-3, Mễ Trì Hạ, Từ Liêm, Hà Nội (nằm trên đường
Phạm Hùng, đối diện tòa nhà Keangnam).
Tel: (04) 3787 6915
Fax: (04) 3787 6915
Email: [email protected]
Website: www.idd.vn