giải pháp bóc - ueb.vnu.edu.vn filedựa trên yêu cầu và mục đích sử dụng,...

15
Slide 1 of 15 | 4 th Update stay simple, stay creative Giải pháp bóc tách thông tin (IDD.eNews) stay simple, stay creative

Upload: others

Post on 15-Oct-2019

5 views

Category:

Documents


0 download

TRANSCRIPT

Slide 1 of 15 | 4th Updatestay simple, stay creative

Giải pháp bóc

tách thông tin

(IDD.eNews)

stay simple, stay creative

Slide 2 of 15 | 4th Updatestay simple, stay creative

Tổng quan về IDD.eNews

IDD.eNews là giải pháp bóc tách thông tin trên nền Internet, cho phép khách

hàng có thể cập nhật LIÊN TỤC và TỰ ĐỘNG thông tin từ bất kì website

nào có mặt trên Internet

Khách hàng tùy chọn nguồn dữ liệu cho mình, từ đó giúp nâng cao hiệu

suất sử dụng cũng như tìm kiếm thông tin trong doanh nghiệp

Lọc thông tin theo từ khóa giúp cho khách hàng lấy được chính xác nguồn

thông tin mình mong muốn

Slide 3 of 15 | 4th Updatestay simple, stay creative

Chuyên biệt hóa nguồn thông tin:

Cho phép các doanh nghiệp thu thập được những nguồn thông tin

chuyên biệt, tùy theo lĩnh vực kinh doanh cũng như nhu cầu sử dụng

thông tin của mình.

Nâng cao hiệu suất sử dụng thông tin:

Nhờ việc chuyên biệt hóa nguồn thông tin thu được, các nhân sự trong

tổ chức có thể dễ dàng tìm ra thông tin cần thiết cho mình thay vì phải

loay hoay giữa một biển thông tin trên internet như hiện nay.

Tạo nguồn dữ liệu cho các hệ thống khác:

• Hệ thống website tin tức

• Hệ thống các sàn giao dịch

• Hệ thống đánh giá các cơ hội và rủi ro trong kinh doanh

IDD.eNews » Mục đích xây dựngIDD.eNews » Mục đích xây dựng

Slide 4 of 15 | 4th Updatestay simple, stay creative

Dựa trên yêu cầu và mục đích sử dụng, IDD.eNews được xây

dựng trên nền tảng web giúp cho việc thu thập thông tin diễn ra

nhanh chóng cũng như giúp cho người dùng có thể truy cập

nguồn dữ liệu tại bất cứ đâu

IDD.eNews » Nền tảng kĩ thuậtIDD.eNews »

Công nghệ sử dụng :

ASP.NET

C#

Microsoft SQL Server 2005

Slide 5 of 15 | 4th Updatestay simple, stay creative

IDD.eNews » Tính năng hệ thống

Bóc tách dữ liệu

Blacklist

Quản trị người dùng

Thêm nguồn dữ liệu

Hiển thị dữ liệu

cho phép thêm vào không giới

hạn các nguồn thông tin mới

dùng cho việc tách lọc

hiển thị dữ liệu thu thập được

theo từ khóa đặt sẵn hoặc người

dùng thêm vào

cho phép lấy thông tin tự

động, theo định kì tại các

website

lọc tin, không lấy dữ liệu có

các từ nằm trong blacklist

cho phép phân quyền việc sử

dụng nguồn thông tin

Slide 6 of 15 | 4th Updatestay simple, stay creative

IDD.eNews » Tính năng hệ thống » Bóc tách dữ liệuIDD.eNews » Tính năng hệ thống » Bóc tách dữ liệuIDD.eNews » Tính năng hệ thống » Bóc tách dữ liệu

Không giống như việc lấy tin tự động dựa vào RSS, IDD.eNews có thể

lấy thông tin từ bất cứ website nào (không nhất thiết web đó phải hỗ trợ

RSS), từ đó giúp người dùng chủ động trong việc lấy thông tin cho mình.

IDD.eNews có thể lấy thông tin tại :

Các site tin tức, báo điện tử (vnn.vn, dantri.com.vn, vnmedia.vn, …)

Các forum, diễn đàn (muare.vn, 5giay.vn, …)

Các sàn giao dịch, trang rao vặt (bất động sản, ôtô, …)

Các shop bán hàng

Bạn có thể tùy biến việc bóc tách dữ liệu cho từng nguồn dữ liệu riêng

biệt như: cho chạy tự động trong khoảng thời gian đặt sẵn, thực hiện

bằng tay, chỉ cho phép lấy dữ liệu từ những nguồn nào, …

Module “Bóc tách dữ liệu” được xây dựng hoàn toàn độc lập, giúp cho

việc nâng cấp thêm các nguồn lấy dữ liệu mới trong tương lai trở nên dễ

dàng, tiết kiệm chi phí

Slide 7 of 15 | 4th Updatestay simple, stay creative

IDD.eNews » Tính năng hệ thống » Bóc tách dữ liệu

IDD.eNews sử dụng cơ chế đọc các trang HTML từ các hệ thống website

bên ngoài để lấy thông tin nên bên cạnh những ưu điểm rất nổi trội, nó

vẫn còn có một vài nhược điểm.

Ưu điểm :

Có thể lấy tin tại bất kì website nào

Có thể lấy chính xác một đoạn tin tức trên cả một trang tin tức xác

định

Có thể mở rộng việc lấy tin tức tại rất nhiều website ở những lĩnh

vực khác nhau, không bị phụ thuộc vào loại hình website nào

Nhược điểm :

Mỗi khi website nguồn thay đổi cấu trúc HTML cần phải viết lại

module lấy dữ liệu tại website đó

Slide 8 of 15 | 4th Updatestay simple, stay creative

IDD.eNews » Tính năng hệ thống » Hiển thị dữ liệu

Slide 9 of 15 | 4th Updatestay simple, stay creative

IDD.eNews » Tính năng hệ thống » Blacklist

Tính năng blacklist cho phép bạn có thể loại bỏ được việc lọc những nguồn

tin chứa những từ khóa không mong muốn

Khi bạn cần lọc tất cả các tin bán nhà tại trang www.batdongsan.com.vn

và bạn muốn loại bỏ tất cả các tin liên quan đến những từ khóa như:

“Môi giới”

“Trung gian”

Số điện thoại quen thuộc của một bên môi giới không đáng tin cậy

….

Bạn có thể thêm, bớt, thay đổi các từ khóa trong mục blacklist

Bạn còn có thể tùy biến từng từ khóa blacklist cho từng trang riêng biệt,

giúp cho việc lọc thông tin chính xác hơn

Slide 10 of 15 | 4th Updatestay simple, stay creative

IDD.eNews được xây dựng với một hệ thống lõi (core component) và sau đó

là việc cài đặt mở rộng các trang nguồn thông tin muốn lọc tin (extension

modules) vào hệ thống. Với cơ chế này IDD.eNews giúp khách hàng tiết

kiệm tối đa chi phí trong bối cảnh các nguồn thông tin liên tục thêm mới và

cập nhật nhanh chóng như hiện nay.

Lợi ích của tính năng “Thêm nguồn dữ liệu”:

- Tiết kiệm tối đa chi phí, chỉ thêm vào các nguồn dữ liệu thực sự cần

thiết

- Đối với các trang nguồn dữ liệu đã có sẵn, chi phí cho những site này

là rất nhỏ

- Khả năng mở rộng không giới hạn các nguồn dữ liệu thêm vào

IDD.eNews » Tính năng hệ thống » Thêm nguồn dữ liệu

Slide 11 of 15 | 4th Updatestay simple, stay creative

Tính năng “Quản trị người dùng” giúp việc quản lý nguồn tin trở nên đơn

giản và chính xác

Cho phép ai được vào hệ thống để sử dụng nguồn tin tức

Khóa quyền truy cập tin tức của người dùng nào đó

Cho phép chính xác người dùng nào được đọc nguồn tin tức nào. VD:

người dùng A chỉ được phép đọc tin tức lọc về từ www.vnn.vn, người

dùng B được phép đọc tin lọc về từ www.vnn.vn và www.raovat.vn, ….

Với tính năng này, người quản trị hệ thống có thể định hình cũng như phân

quyền một cách chính xác các nguồn tin cho người dùng, từ đó giúp tăng

hiệu suất sử dụng nguồn thông tin trong doanh nghiệp

IDD.eNews » Tính năng hệ thống » Quản trị người dùng

Slide 12 of 15 | 4th Updatestay simple, stay creative

Rất đơn giản, nếu bạn :

Có nhu cầu xây dựng một trang tin tức tổng hợp và bạn muốn lấy thông

tin từ tất cả các site tin tức khác, diễn đàn, …

Xây dựng một sàn giao dịch ô tô và bạn muốn thu thập tin tức về việc

mọi người đăng bán ô tô trên các forum, trang rao vặt một cách sớm

nhất

Là một công ty chuyên về xuất khẩu (may mặc, chè, café, hạt điều, … )

thì việc cập nhật thông tin liên tục về các nhu cầu, số liệu thống kê tại thị

trường nước ngoài là cực kì cần thiết

Hay chỉ đơn giản bạn muốn tổng hợp tất cả các email trên các site rao

vặt, tuyển dụng, forum, …. để tạo list mail quảng bá cho công ty mình

Doanh nghiệp nào nên sử dụng IDD.eNews ?

LÀM SAO ĐỂ BIẾT BẠN CÓ NÊN DÙNG IDD.eNews ?

IDD.eNews » Phạm vi ứng dụng

Slide 13 of 15 | 4th Updatestay simple, stay creative

Quy Trình Triển Khai IDD.eNews được

thực hiện rất nhanh chóng và đơn giản.

Chú ý: Đối với các nguồn tin tức đã có sẵn, việc triển khai chi diễn

ra trong vòng 5-7 ngày. Đối với các nguồn tin tức mới, thời gian

triển khai sẽ lâu hơn.

IDD.eNews » Quy trình triển khai

Bước 1: Trao đổi về nhu cầu thu thập tin tức của khách hàng

Bước 2: Lên danh sách các trang nguồn cần lọc thông tin

Bước 3: Lên báo giá chi tiết và thời gian triển khai

Bước 4: Tiến hành thực hiện giải pháp

Bước 5: Triển khai

Bước 6: Chạy thử nghiệm

Bước 7: Tư vấn, bảo trì sản phẩm

Slide 14 of 15 | 4th Updatestay simple, stay creative

Liên hệ

Trụ sở chính

Phòng 702, Tòa nhà CT3-3, Mễ Trì Hạ, Từ Liêm, Hà Nội (nằm trên đường

Phạm Hùng, đối diện tòa nhà Keangnam).

Tel: (04) 3787 6915

Fax: (04) 3787 6915

Email: [email protected]

Website: www.idd.vn

Slide 15 of 15 | 4th Updatestay simple, stay creative

stay simple, stay creative