software specification - intelligist...- การน าข อม ลเข...

12
SOFTWARE SPECIFICATION INTELLIGIST PLATFORM Version 1.0 November 8, 2017

Upload: others

Post on 10-Jan-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

SOFTWARE SPECIFICATION

INTELLIGIST PLATFORM

Version 1.0

November 8, 2017

Page 2: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 1 of 12

Introduction

1.1. Purpose of the Document เอกสารนี้อธิบายการท างานของ INTELLIGIST PLATFORM (Self-service Platform) ซึ่งเป็น Platform ส าหรับ ใช้

เป็นเครื่องมือในการจัดท าข้อมูลที่มีความหลากหลาย (structure, unstructured) ให้สามารถบูรณาการกันได้อย่างง่าย มีเครื่องมือที่ช่วยจัดการข้อมูล (Mapping, Cleaning, Extract, Reshape) ซึ่งข้อมูลเหล่านี้จะถูกน าไปสร้างรายงาน สร้าง Dashboard ต่อไป ช่วยลดเวลาของเจ้าหน้าที่หรือบุคลากรขององค์กรในการรวบรวมข้อมูลต่างๆ ช่วยเพิ่มประสิทธิภาพในการใช้งานโปรแกรม BI เพื่อวิเคราะห์ วิจัย และน ามาซึ่งกระบวนการช่วยในการตัดสินใจของผู้บริหารได้อย่างถูกต้องแม่นย า ลดภาระค่าใช้จ่ายที่เกี่ยวกับการลงทุนฮาร์ดแวร์

ทั้งนี้การพัฒนา INTELLIGIST PLATFORM ต้องรองรับเทคโนโลยี Big Data และการให้บริการในเชิงพานิชย์ เน้นเปน็ Platform ที่ใช้งานง่าย เพื่อเข้าถึงกลุ่มผู้ใช้งานท่ีไม่ต้องมีทักษะด้าน IT 1.2. Scope of the Development Project

ขอบเขตของ INTELLIGIST PLATFORM จะสามารถมีคุณลักษณะดังนี้ 1.2.1 สามารถน าเข้าข้อมูลจากแหล่งข้อมูลต่างได้ดังนี้ Share Drive, Local Drive, Web Page, Data Base 1.2.2 สามารถน าเข้าข้อมูลจากไฟล์ประเภทต่าง ๆ ได้ดังนี้ Excel file, PDF File, CSV File, Web Service, Jason

File 1.2.3 สามารถท า Data Preparation (Mapping, Cleaning) 1.2.4 สามารถท า Data Transformation (Extract, Reshape) 1.2.5 สามารถท า Data Integration เพื่อให้ได้ Data Set ของข้อมูลที่ต้องการ 1.2.6 สามารถท ารายงาน และ Dashboard ได้ 1.2.7 สามารถท า Analytic (Text Search, Machine leaning, Social Search) ได้ 1.2.8 มีฟังก์ช่ันสนับสนุน Account Manager การ login การลงทะเบียนผู้ใช้งาน 1.2.9 สามารถก าหนดสิทธ์ ผู้ดูแลระบบ และผู้ใช้งานทั่วไป รวมถึงการให้สิทธ์ การเข้าถึงข้อมูล การดูรายงาน และ

Dashboard

Page 3: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 2 of 12

รูปแสดงการท างานของ INTELLIGIST PLATFORM

1.3. Product Perspective

1.3.1. Design Method ระบบนี้จะแบ่งออกเป็น 2 ส่วนหลัก คือ

1.3.1.1. การออกแบบในส่วนของ Database จะใช้สถาปัตยกรรมของ Hadoop Ecosystem 1.3.1.2. การออกแบบในส่วนของ Module การท างานต่างๆ ของระบบ จะใช้สถาปัตยกรรมแบบ

Microservices โดยแยกเอา Module มาสร้างเป็น service ไว้คอยเรียกใช้งานผ่าน API 1.3.2. User Interfaces

ผู้ใช้งานจะเข้าใช้งานที่หน้าจอที่เป็น UI ผ่านทาง Web Browser โดยรองรับ Internet Explorer, Chrome และ FireFox

1.3.3. Hardware Interfaces ระบบนี้จะท าการประมวลผลบนระบบคลาวด์ (Cloud Computing)

1.3.4. Software Interfaces ระบบนี้จะท างานบน UNIX platform โดยเลือกใช้ระบบปฏิบัติการ CentOS 7

1.4. Product Functions

1.4.1. Login – ฟังก์ชันการลงช่ือเข้าใช้งานในระบบ 1.4.2. Register – ฟังก์ชันการลงทะเบียน เพื่อขอเข้าใช้งานระบบ 1.4.3. User Maintenance – ฟังก์ชันดูแลข้อมูลผู้ใช้งานในระบบ 1.4.4. Keyword Search – ฟังก์ชันการค้นหาค าสืบค้นด้วย GUI

Page 4: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 3 of 12

1.4.5. Data Connection – ฟังก์ชันการเช่ือมต่อกับฐานข้อมูล Big Data 1.4.6. Metadata – ฟังก์ชันการดูแลก ากับข้อมูลในการน าเข้าฐานข้อมูล เพื่อน าไปวิเคราะห์ข้อมูลหรือเรียกดูข้อมูลได้ 1.4.7. Report – ฟังก์ชันการแสดงข้อมูลในรูปแบบรายงาน และกราฟ 1.4.8. Data Visualization – ฟังก์ชันการแสดงข้อมูลด้วย Dashboard เช่น การแสดงผลเป็น Executive Summary

Dashboard ท าเรียกดูรายงานพร้อมกันผ่าน Web Browser ได้ และ Dashboard แสดงผลแบบ Interactive ซึ่งสามารถใช้งานร่วมกับ Big Data ได้

1.4.9. Data Analytics Desktop – ฟังก์ชันการวิเคราะห์ข้อมูลทางสถิติทั้งเบื้องต้นและการวิเคราะห์ข้อมูล เชิงลึก สามารถรองรับการวิเคราะห์ข้อมูล ทั้งการเขียนภาษาโปรแกรม เช่น R , Python และการเขียนด้วย Workflow และสามารถใช้งานร่วมกับ Big Data ได้

1.4.10. Security and Permissions – ฟังก์ชันการเช่ือมต่อความปลอดภัยจาก SafeNet และการจัดการสิทธ์ิการเข้าใช้งานระบบ

2. Overview of Modules / Components 2.1. Structure and Relationships

2.1.1. Big Data

Structure

Page 5: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 4 of 12

3. Detailed Description of Components 3.1. Big Data Component

Ingestion : ส่วนของการดึงข้อมูลเข้าสู่ HDFS Flume Sqoop

HDFS Data Storage : ส่วนของการเก็บข้อมูล HDFS YARN

Data ETL Processing : ส่วนของการท า ETL ข้อมูล Spark

Data Service : ส่วนของการน าข้อมูลออกจาก HDFS และน าไปใช้ Hive Impala

การท างานของระบบ - ระบบท าการดึงข้อมูลจาก Data Source (Oracle, SQL Server และ Files Server) เข้ามาในระบบโดย

ใช้ Flume และ Sqoop - หลังจากนั้นระบบจะน าข้อมูลเก็บลงยัง Database HDFS - เมื่อน าข้อมูลไปใช้ ข้อมูลจะถูกส่งไปท า ETL ก่อน โดยใช้ PySpark หลังจากนั้นระบบจะส่งข้อมูลไปยัง

Hive - เมื่อข้อมูลมาเก็บที่ Hive ระบบจะมีการท า API ไว้ให้เรียกข้อมูลจาก Hive เอาไปใช้งาน

3.2. Web Application

Core Component - Login : ฟังก์ชันการลงช่ือเข้าใช้งานในระบบ

- User ต้องท าการ Login ก่อนเข้าใช้งานระบบ โดยการกรอกข้อมูล Username และ password - หลังจากนั้นจะตรวจสอบความปลอดภัย โดยให้ยืนยันตัวตนอีกครั้ง รายละเอียดเพิ่มเติมอยู่ใน Security

and Permissions - สามารถยืนยันตัวตนของผู้ใช้งานด้วยรหัสส่วนบุคคลผ่านระบบ Active Directory ได้

Page 6: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 5 of 12

ตัวอย่างหน้าจอ Login

- Register : ฟังก์ชันการลงทะเบียน เพื่อขอเข้าใช้งานระบบ

- User ท าการกรอก E-mail ที่จะใช้ในการ Register เข้ามาในระบบ - หลังจากนั้นระบบจะส่งหน้าจอให้กรอกข้อมูลผ่านทาง E-mail - เมื่อกรอกข้อมูลเสร็จระบบจะส่งข้อมูลไปยังหน้าจอ Approval (หน้าจอ Approval อยู่ในส่วนของ

Security and Permissions) - หลังจากอนุมัติแล้ว User ถึงจะ Login เข้าใช้งานระบบได้ ตามสิทธ์ิที่ได้รับ - สามารถสร้างกลุ่มผู้ใช้งาน การก าหนดสิทธ์ิการเข้าใช้งาน

ตัวอย่างหน้าจอ Register

- Keyword Search : คือ การค้นหาค าสืบค้นด้วย GUI สามารถสนับสนุนการค้นหาค าสืบค้น เพื่อน าไปข้อมูล

ไปวิเคราะห์ได้อย่างมีประสิทธิภาพ

Page 7: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 6 of 12

- Metadata : คือการก าหนด data source และ ตารางเวลาในการโหลดข้อมูลจากแหล่งข้อมูลต้นทางต่างๆ มีหน้าจอ Workbench ช่วยให้สามารถท างานได้งานในหน้าจอเดียว

- สามารถน าเข้าข้อมูลที่อยู่ในรูปแบบมีโครงสร้างข้อมูล เช่น MS Excel, CSV File เป็นต้น สามารถน าเข้าข้อมูลโดยผ่านหน้าจอได้ (GUI) หรือ Advance Scripting ได้

- สามารถส่งข้อมูลออกได้ในรูปแบบต่างๆ เช่น MS Excel, CSV File, Image File เป็นต้น - การน าข้อมูลเข้าและการส่งออกข้อมูล รองรับข้อมูลทั้งภาษาไทยและภาษาอังกฤษ

หน้าจอ Meta data

หน้าจอ Workbench

- Report and Dashboard : ฟังก์ชันการแสดงข้อมูลในรูปแบบรายงาน และกราฟ

- ระบบสามารถเลือกแสดงผลแบบกราฟ และตาราง ได้ - ระบบป้องกันการคลิกขวา และการ Copy ข้อมูลที่หน้าจอได้

Page 8: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 7 of 12

- ระบบสามารถเลือกแสดงเฉพาะบางรายการข้อมูลได้ โดยจะมีการ Default ค่าเริ่มต้นของการแสดงข้อมูลไว้ให้

- สามารถสั่งพิมพ์ได้ โดยต้องแสดงลายน้ าเป็นช่ือของ User ที่ท าการ Login ด้วยทุกหน้า - สามารถเรียกใช้ Dashboard API ของ Tableau ได้ - สามารถเรียกใช้ API ของ D3.js ได้

- Upload Monitoring : ดูสถานการณ์ท างานของแต่ละ Data Source - Data Preparation : ส าหรับท า ETL - Integration : ส าหรับ บูรณาการข้อมูล - Data Visualization :

- รวบรวมและวิเคราะห์ข้อมูลที่มีโครงสร้างและกึ่งโครงสร้างได้ พร้อมรองรับและสนับสนุนการวิเคราะห์ข้อมูลทั้งไม่มีโครงสร้างได้ในอนาคต

- สามารถสร้างการเช่ือมต่อฐานข้อมูล (Connection Database) จากระบบงานต่าง ๆ ของธนาคารไ ด้ เ ช่ น Oracle , MySQL , ODBC, JDBC,DB2 , Microsoft SQL Server, Microsoft Access, Microsoft Excel ได้อย่างน้อย รวมถึงการรองรับไฟล์ข้อมูลบนเครื่องคอมพิวเตอร์ส่วนตัว (Local Files) เช่น Spreadsheet/Microsoft Excel, Text File , PDF, XML, CSV ได้อย่างน้อย โดยใช้งานรวมกันผ่านจุดเดียวหรือหน้าจอเดียว เพ่ือเช่ือมโยง/น าข้อมูลมาใช้วิเคราะห์ร่วมกัน

- สามารถเช่ือมโยง/รับข้อมูลจากแหล่งข้อมูลต่าง ๆ ได้ในหน้าจอเดียวกัน เพื่อรวบรวมข้อมูลเข้าด้วยกัน และสร้างเงื่อนไขในการเช่ือมโยงข้อมูลระหว่างกันได้

- สนับสนุนการเช่ือมโยง/รับข้อมูลได้ในรูปแบบทันที (Real-time) หรือ Near Real-time และระบุเวลา (Schedule/Snapshot) ได้

- สามรถเตรียมข้อมูล (Data Preparation) ให้มีความถูกต้องสมบูรณ์ก่อนน าไปวิเคราะห์โดยไม่เปลี่ยน/แก้ไข/ส่งผลกระทบต่อข้อมูลต้นทางจากระบบอื่น ซึ่งจะต้องจัดการกับข้อมูล เช่น ข้อมูลที่สูญหายไป (Missing Value), ข้อมูลที่ไม่ถูกต้อง(Incomplete Data), ข้อมูลผิดพลาด(Error), ข้อมูลที่ไม่สอดคล้องกัน(Inconsistent Data), ข้อมูลว่าง (Null) อย่างน้อย โดยใช้วิธีการเตรียมข้อมูลดังนี้

a) รวบรวมข้อมูลหลายแห่งมารวมไว้ท่ีเดียวกัน (Data Integration) b) คัดกรองและเลือกข้อมูล (Data Selection and Filtering) c) แปลงข้อมูล (Data Transformation)

- ก าหนดและแก้ไขชนิดของข้อมูลได้ (Data type) หรือเป็นแบบ Automatic Type - สามารถรองรับการสร้างรายงานและแก้ไขรายงาน (Visualization) ได้อย่างน้อย 10 รายงาน

โดยไม่ส่งผลกระทบต่อประสิทธิภาพของเครื่องมือ/ระบบ โดยมีฟังก์ชันหลัก ดังน้ี o สนับสนุนการเรียกใช้ข้อมูลด้วยการลากละวาง (Drag and Drop) o สร้างข้อมูลใหม่ระดับ Column เพื่อค านวณและใช้สถิติเบื้องต้น (Calculated

Filed) ผ่ านหน้าจอ GUI เ ช่น Summarize , Count , Maximum , Minimum , Median , Percentage , Average , YTD Total , Growth rate , YoY Growth ได้เป็นอย่างน้อย

o สร้างชุดข้อมูลใหม่ เพื่อใช้ประกอบการวิเคราะห์ข้อมูลเพิ่มเติม เช่น Table , Data set เป็นอย่างน้อย

o วิเคราะห์ข้อมูลด้วยสถิติทั้งเบื้องต้นและขั้นสูงได้ เช่น Mean , Count , Maximum , Minimum , Median , Percentage , Summarization , Time series Analysis , Average , YTD Total , Growth rate , YoY Growth , Trend line ได้ เป็นอย่างน้อย

o ก าหนด Layout ของ Dashboard ที่ต้องการได้ด้วยตนเอง

Page 9: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 8 of 12

o สร้าง แก้ไขและเปลี่ยนแปลง Dashboard ด้วยมุมมองของข้อมูล (Views) ที่หลากหลายและเรียกใช้ข้อมูลได้หลายมิติ (Dimensions) โดยในแต่ละ Dashboard จะไม่จ ากัดจ านวน Views และน าเสนอในหนึ่งหน้าจอได้

o สร้างการน าเสนอข้อมูลของ Dashboard/View ได้หลายรูปแบบ Graph , Chart , Pivot Table , Histogram , Scatter , Table ได้ เป็นอย่ างน้อย โดยการสร้ าง Dashboard/View ในแต่ละครั้งจะต้องแนะน าการน าเสนอข้อมูลที่เหมาะสมให้อัตโนมัติ รวมถึงสามารถเปลี่ยนประเภทและตกแต่ง (Customized) การน าเสนอได้ทันที โดยไม่ต้องเลือกข้อมูลใหม่

o สามารถบันทึก Dashboard/Views ที่สร้างขึ้นเป็นเวอร์ชั่น หรือ duplicate ได้ o Views ที่สร้างขึ้นส าหรับ Dashboard หนึ่งๆ จะต้องสามารถน าไปใช้งานกับ

Dashboard อื่นๆได้โดยไม่ต้องสร้าง Views ใหม ่o สามารถลบ Dashboard/Views และลบเฉพาะบาง Views ใน Dashboard ได้ o สามารถก าหนดเง่ือนไขของการค้นหา (Selector/Filter) ในแต่ละ Dashboard ได

ไม่จ ากัดจ านวน o มีปฏิสัมพันธ์ (Interaction) ระหว่างมุมมองภายใน Dashboard เดียวกัน o เรียกดูข้อมูล /Views บนแต่ละ Dashboard เป็นล าดับช้ันได้ (Drill-Down , Roll-

Up) o สามารถเปรียบเทียบข้อมูลเป็นรายวัน สัปดาห์ เดือน ไตรมาสและปีได้เป็นอย่างน้อย o ค้นหาและจัดเรียงข้อมูลได้ โดยข้อมูลที่น าเสนอบน Dashboard/Views จะต้อง

เปลี่ยนแปลงข้อมูลตามเง่ือนไขให้อัตโนมัติในทุกล าดับช้ันของข้อมูลการค้นหา/จัดเรียง

o สามารถค้นหา Dashboard หรือเนื้อหาภายใน Dashboard ได้ด้วยการใช้ค า (Keyword) และไม่ต้องเขียนโปรแกรมในการค้นหาเพิ่มเติม

o มีฟังก์ช่ันการใช้สีในข้อมูลบน Dashboard เพื่อจ าแนกข้อมู,ที่น าเสนอ - สามารถเผยแพร่ Dashboard ให้กับกลุ่มผู้ใช้งานที่เป็น Views เรียกดูผ่าน Web Browser ได้

ตามสิทธ์ิการเข้าใช้งานในแต่ละ Dashboard - กลุ่มผู้ ใ ช้งานเครื่องมือ Data Visualization and Dashboard Creation และการเข้าถึง

รายงาน/ข้อมูล โดยก าหนดความสามารถของแต่ละกลุ่มผู้ใช้งาน ดังนี้ a) กลุ่มผู้ใช้งานท่ีเป็น Creation ที่ท าการสร้าง Data Visualization b) กลุ่มผู้ใช้งานท่ีเป็น Viewers ต้องมีความสามารถพ้ืนฐาน ดังนี้

- เข้าถึงและเรียกดูรายงาน (Visualization / Dashboard) ได้ตามสิทธิ์ผู้ใช้งาน (Viewers/Users) ที่ก าหนดไว้ ผ่าน Web Browser เช่น Google Chrome , Internet Explorer Version 8 ขึ้นไป , Firefox เวอร์ช่ันล่าสุด , Safari ได้เป็นอย่างน้อย

- - สามารถค้นหา Dashboard หรือ เนื้อหาภายใน Dashboard ได้ด้วยการใช้ค า (Keyword)

- - รองรับการเข้าถึงและเรียกดู Dashboard ผ่านอุปกรณ์เคลื่อนที่ (Smart Device) เช่น Smartphone , Tablet

- สามารถรองรับการใช้งานพร้อมกันได้ในระดับที่ไม่ส่งผลกระทบต่อประสิทธิภาพของเครื่องมือ/ระบบ

- สามารถบันทึกการเข้าถึงและเรียกดูของ Viewers/Users ในแต่ละ Dashboard เป็น Log Files ที่สามารถติดตามการใช้งานได้ โดยจัดเก็บในรูปแบบของรายงาน หรือ Text File เป็นอย่างน้อย

Page 10: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 9 of 12

- Data Analytics Desktop : รองรับการวิ เคราะห์ข้อมูลด้วย Machine Learning หรือการวิ เคราะห์วิทยาศาสตร์ข้อมูล (Data Science) โดยใช้ภาษา R และ/หรือ ภาษา Python หรืออ่ืนๆ

- รองรับการวิเคราะห์ร่วมกับ Big Data Hadoop ได้ - รองรับการเขียน Model การวิเคราะห์ข้อมูลที่เป็นในแบบ Work Flow หรือ การใช้ Advanced

Scripting ได้ทั้งภาษา R และ/หรือ ภาษา Python - รองรับการวิเคราะห์ข้อมูลทั้งมีโครงสร้างและกึ่งโครงสร้างได้ รวมถึงข้อมูลที่ไม่มีโครงสร้างได้ - รองรับการวิเคราะห์ Data Analytics ให้ท างานร่วมกันได้ระหว่างการใช้ Workflow และการใช้

Advanced Scripting - รองรับและสนับสนุนการวิเคราะห์ข้อมูลด้วยการท าวิทยาศาสตร์ข้อมูล (Data Science) และ

Machine Learning โดยใช้ภาษา R และ/หรือภาษา Python เป็นอย่างน้อย รวมถึงการวิเคราะห์ข้อมูลร่วมกับ Hadoop ได้

- สามารถรวบรวมและวิเคราะห์ข้อมูลที่มีโครงสร้างและกึ่งโครงสร้างได้ พร้อมรองรับและสนับสนุนการวิเคราะห์ข้อมูลที่ไม่มีโครงสร้างได้ในอนาคต

- รองรับการน าเข้าข้อมูลจาก Database ของระบบงานต่างๆของธนาคารได้ เช่น Oracle, MySQL , ODBC , JDBC , DB2 , Microsoft SQL server , Microsoft Access , Microsoft Excel ไ ด้ เ ป็ นอย่างน้อย รวมถึงการรับข้อมูลเข้าจากไฟล์ข้อมูลบนเครื่องคอมพิวเตอร์ส่วนตัว (Local Files) เช่น Spreadsheet/ Microsoft Excel, CSV ได้เป็นอย่างน้อย โดยใช้งานร่วมกันผ่านหน้าจอเดียว เพื่อการเช่ือมโยง/น าข้อมูลมาใช้วิเคราะห์ร่วมกัน

- สามารถสร้าง Data Flow/ Flow-based Programming / Workflow ส าหรับการวิเคราะห์ข้อมูลได้ด้วยการใช้ Object, Node หรือ Module ส าเร็จรูปของเครื่องมือโดยไม่จ าเป็นต้องเขียนโปรแกรม ซึ่งสนับสนุนตั้งแต่การรวบรวมข้อมูล วิเคราะห์ข้อมูลจนกระทั่งส่งออกข้อมูลเพื่ อใช้งานต่อไปได้

- สามารถเตรียมข้อมูล (Data Preparation) ให้มีความถูกต้องสมบูรณ์ก่อนน าไปใช้วิเคราะห์โดยไม่เปลี่ยน/แก้ไข/ส่งผลกระทบกับข้อมูลตน้ทางจากระบบงานอ่ืน ซึ่งจะต้องจัดการกับข้อมูล เช่น ข้อมูลที่สูญหายไป(Missing Value) , ข้อมูลที่ไม่ถูกต้อง(Incomplete Data) , ข้อมูลผิดพลาด(Error) , ข้อมูลที่ไม่สอดคล้องกัน (Inconsistent Data) , ข้อมูลที่มีค่าว่าง(Null) เป็นอย่างน้อย โดยใช้วิธีในการเตรียมข้อมูลดังนี้

a) รวบรวมข้อมูลหลายแหล่งมารวมไว้ท่ีเดียวกัน (Data Integration) b) คัดกรองและเลือกข้อมูล (Data Selection and Filtering) c) แปลงข้อมูล (Data Transformation)

- วิเคราะห์ข้อมูลทางสถิติเบื้องต้นและขั้นสูง พร้อมทั้งการสร้างแบบจ าลอง (Model) ที่สนับสนุนการวิ เคราะห์ทั้ งในรูปแบบ Descriptive Analytics และ Predictive Analytics ได้ เ ช่น Mean, Percentage, Summarization, Standard Deviation, Correlation, Regression, Association Rule, Classification, Clustering, Time series Analysis, Anomaly Detection เป็นอย่างน้อย

- สามารถสร้างผลการวิเคราะห์ทางสถิติและน าเสนอข้อมูลในรูปแบบ Data Visualization ที่สามารถก าหนดรายละเอียดได้เบื้องต้น เช่น Graph, Chart, Pivot Table, Histogram, Scatter, Table ได้อย่างน้อย

- สามารถรองรับการใช้งานพร้อมกันได้ในระดับที่ไม่สงผลกระทบต่อประสิทธิภาพของเครื่องมือ/ระบบ

- Management Console : ส าหรับ Set ค่า Configuration Master ต่างๆเช่น Calendar, ช่ือประเทศ , ตัว

ย่อ,หน่วยวัด, สกุลเงิน

Page 11: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 10 of 12

- Security and Permissions : ฟังก์ชันการเช่ือมต่อความปลอดภัยจาก SafeNet และการจัดการสิทธิ์การเข้าใช้งานระบบ - Security

ระบบจะต้องเชื่อมต่อระบบความปลอดภัยจาก SafeNet โดยแยกออกเป็น 2 ส่วน คือ 1. กรณีใช้ใบรับรองฯ (Certificate) ระบบจะต้องตรวจสอบใบรับรองว่ายังไม่หมดอายุ 2. กรณีใช้งานผ่านอุปกรณ์ Token Key ระบบต้องแสดง Popup เพื่อให้ป้อนรหัสผ่าน เมื่อป้อน

รหัสผ่านแล้ว ระบบจะต้องตรวจสอบใบรับรองว่ายังไม่หมดอายุ ถึงจะสามารถใช้งานได้

ตัวอยา่ง Popup Confirm Certificate

- Permissions ระบบ จะแบ่ง User การใช้งานออกเป็น 2 กลุ่ม ได้แก่

1. Administrator 2. User

การท างานของ Permissions Management จะเริ่มจากการสร้าง Project, Users, Groups และ Dataset การท างานของ Permissions Management จะประกอบด้วย Project, Users, Groups และ Dataset

Project : ส าหรับแยก Users หรือ Groups และ Datasets ไว้เป็น Project ของแต่ละงาน User ที่ไม่ได้อยู่ใน Project ก็จะไม่เห็นข้อมูล

Users : ส าหรับสร้าง User Login เข้าใช้งานระบบ โดยจะมีวิธีการสร้าง 2 วิธี คือ สร้างโดย Administrator และจากการลงทะเบียนทาง E-mail แต่การลงทะเบียนทาง E-mail จะต้องมีการอนุมัติ (Approval) ก่อน

Groups : ส าหรับสร้าง Group เพื่อง่ายต่อการใช้งาน ไม่ต้อง Control ทีละ User Datasets : ส าหรับสร้าง Dataset เพื่อเอาไปผูกกับสิทธิ์การดูข้อมูล และเรียกใช้

ข้อมูล API

Projects

Groups

Users

Datasets

Permissions Layer

Page 12: SOFTWARE SPECIFICATION - Intelligist...- การน าข อม ลเข าและการส งออกข อม ล รองร บข อม ลท งภาษาไทยและภาษาอ

INTELLIGIST PLATFORM Software Design Specification Vesion 1.0

.

© Intelligist Company Limited All rights reserved. Page 11 of 12

Start

ProjectsGroups Users

Create Group?

Dataset

End

Add Users?

Add Dataset?Add Users?

Y

Y

Y

YN

N

N

N

Process Flow for Permissions Management

ในส่วนของ Dataset จะมีหน้าจอ Dataset Configuration ส าหรับผูกสิทธิ์การดูข้อมูล Dataset

ตัวอย่างหน้าจอ Permissions Management