บทที่ 7 ฐานข้อมูลและเทคโนโลยี ... ·...

Post on 11-Jan-2020

7 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

บทท 7ฐานขอมลและเทคโนโลยฐานขอมล

หวขอเรยนรในบทน1. ขอมลในระบบคอมพวเตอร

⁻ ขอมลมลฐาน

⁻ ขอมลโครงสราง

2. โครงสรางขอมล

3. ฐานขอมล• ประเภทของการจ าลองฐานขอมล

⁻ ฐานขอมลล าดบชน - ฐานขอมลเครอขาย

⁻ ฐานขอมลเชงสมพนธ - ฐานขอมลเชงวตถ

• ประโยชนและขอจ ากดของฐานขอมล

4. เทคโนโลยฐานขอมล– คลงขอมล - การประมวลผลเชงวเคราะหแบบออนไลน– เหมองขอมล

ขอมลในระบบคอมพวเตอร หมายถง ขอมลทผานการจดใหอยในรปแบบทระบบคอมพวเตอรสามารถน าไปประมวลผลได ขอมลทสามารถใชในระบบคอมพวเตอร ไดแก

ขอมลตวเลข (Numeric Data)

ขอมลตวอกษร (Text Data)

ขอมลเสยง (Audio Data)

ขอมลภาพ (Image Data)

ขอมลภาพเคลอนไหว (Video Data)

โดยทวไปขอมลในระบบคอมพวเตอรแบงไดเปน 2 รปแบบ ไดแก ขอมลมลฐาน (element data) และขอมลโครงสราง (structure data)

ขอมลในระบบฐานขอมล

7.1.1 ขอมลมลฐาน

ขอมลมลฐาน เปนหนวยของขอมลทมการจดเกบในระบบคอมพวเตอร โดยทวไปแบงไดเปน 2 ชนดคอ

• ชนดท 1 เปน ขอมลทสามารถน าไปค านวณได ไดแก ขอมลทเปนตวเลขซงสามารถน ามาใชในการค านวณผลลพธตาง ๆ ได เชน ขอมลตวเลข แทน อาย ความสง น าหนก เงนเดอน เปนตน

• ชนดท 2 เปน ขอมลทไมสามารถน าไปค านวณได ไดแก ขอมลทเปนตวอกขระซงใหความหมายอยางใดอยางหนง ไมสามารน าไปค านวณได เชน ขอมลทเปนตวอกษรแทน ชอ นามสกล ทอย เปนตน

7.1.2 ขอมลโครงสราง

ขอมลโครงสราง เปนขอมลทอยมรปแบบเปนโครงสราง ประกอบดวย ขอมลมลฐานหลาย ๆ ขอมลทมความสมพนธกนมารวมกน ซงอาจจะเปนกลมขอมลทใหความหมายใดความหมายหนง เชน โครงสรางขอมลของนกศกษาประกอบดวยขอมลมลฐานไดแก รหสนกศกษา ชอสกล อาย เพศ หมเรยน และทอย เปนตน

โครงสรางขอมล (data organization)

โครงสรางขอมล หมายถง รปแบบหรอวธการในการจดระเบยบขอมลเพอใหสามารถจดการกบขอมลโดยใชระบบคอมพวเตอรได การจดเกบขอมลในระบบคอมพวเตอรจะ มการจดโครงสรางของขอมลเปนแบบล าดบชน(hierarchy) โดยเรมจากหนวยทเลกไปยงหนวยทใหญ โดยมรายละเอยดตอไปน

• บต (bit) หมายถง หนวยของขอมลทมขนาดเลกทสดทจดเกบในระบบคอมพวเตอร และคอมพวเตอรสามารถประมวลผลไดซงแทนดวยสญลกษณ 0 และ 1

• ไบต (byte) หมายถง การจดเกบขอมล 1 อกขระ ซงอาจจะเปนตวอกษร A ถง Z เปนตวเลข 1 ถง 9 หรอสญลกษณตาง ๆ เชนเครองหมาย + , - , * เปนตน

• ฟลด (field) หมายถง เขตขอมลซงเปนการจดเกบขอมลรวมกนตงแต 1 อกขระหรอ 1 ไบตขนไป ทงนเพอใหไดความหมายอยางใดอยางหนงตามทผ ใชตองการ เชน ฟลดชอ ฟลดนามสกล ฟลดทอย เปนตน

โครงสรางขอมล (data organization) (ตอ)

• เรคคอรด (record) หมายถง ระเบยนขอมล เปนการจดเกบขอมลหลายๆฟลดทสมพนธกนเพอใหเกดความหมายทสมบรณมากขน สามารถบงชถงขอมลหรอคณสมบตของสงใดสงหนง เชน เรคคอรดขอมลสนคา ประกอบดวยฟลดรหส ฟลดชอสนคา และฟลดราคาสนคา เปนตน

• แฟมขอมล (file) หมายถง การจดเกบขอมลหลายๆ เรคคอรดหรอหลายๆระเบยนขอมลทสมพนธกนมความเกยวเนองกนท าใหเกดเปนกลมขอมลขนาดใหญขน เชนแฟมขอมลสนคา ประกอบดวยเรคคอรดขอมลสนคาทงหมด จ านวน 10,000 รายการ

• ฐานขอมล (database) หมายถง การน าแฟมขอมลหลายๆ แฟมขอมลทมความสมพนธกนและมความเกยวเนองกนมาจดเกบไวรวมกนเปนกลมขอมลทมขนาดใหญขน เชน ฐานขอมลสนคาคงคลงประกอบดวย แฟมขอมลสนคา แฟมขอมลการเบกสนคา และแฟมขอมลการรบสนคา เปนตน

ตวอยางโครงสรางของขอมล

ฐานขอมลฐานขอมล หมายถง กลมของขอมลทมความสมพนธกน น ามาเกบรวบรวมเขาไวดวยกน

อยางมระบบ เพอใหสามารถใชขอมลเหลานนรวมกนไดอยางรวดเรวและมประสทธภาพ เชน ฐานขอมลในบรษทแหงหนงอาจประกอบไปดวย แฟมขอมลหลายแฟม ซงแตละแฟมตางกมความสมพนธกน ไดแก แฟมขอมลของพนกงาน แฟมขอมลแผนกในบรษท แฟมขอมลขายสนคา แฟมขอมลสนคา เปนตน

ขอมลทถกจดเกบเปนฐานขอมล นอกจากจะตองเปนขอมลทมความสมพนธกนแลว ยงจะตองเปนขอมลทใชสนบสนนการด าเนนงานอยางใดอยางหนงขององคกร ดงนนจะเรยกฐานขอมลทจดท าขนเพอสนบสนนการด าเนนงานอยางใดอยางหนงวา “ระบบฐานขอมล (Database System)” โดยระบบฐานขอมลจะรวมถงวธการในการรวบรวมขอมลเพอใชในองคกรโดยใหมจดการขอมลทเปนมาตรฐานเดยวกน สามารถใชขอมลรวมกนได และสามารถควบคมขอมลได

7.3.1 ประเภทของการจ าลองฐานขอมลแบบจ าลองฐานขอมลเปนโครงสรางทแสดงใหเหนถงการจดระเบยบ การม

ปฏสมพนธกนภายในของระบบขอมล ซงแบบจ าลองทเปนทรจกม 4 ประเภท ไดแก

ฐานขอมลล าดบชน (Hierarchical Database)

ฐานขอมลเครอขาย (Network Database)

ฐานขอมลเชงสมพนธ (Relational Database)

ฐานขอมลเชงวตถ (Object Oriented Database)

ฐานขอมลล าดบชน

โครงสรางของฐานขอมลชนดนจะท าการเกบขอมลในแฟมขอมลเปนเซกเมนต (Segment) และในแผนผงตนไมจะเรยกแตละเซกเมนตวา โหนด (Node) โหนดทอยระดบลางจะเรยกวา โหนดลก (Child Node) สวนทอยระดบบนกวาเรยกวา โหนดพอแม (Parent Node) และโหนดทอยบนสดเรยกวาโหนดราก (Root Node) ซงในระดบบนสดมไดเพยงโหนดเดยวเทานน

โครงสรางของฐานขอมลแบบล าดบชนกระทรวง

กรม

กอง

แผนก

หนวย

กระทรวง

กรม กรม

กอง กอง กอง

แผนก แผนก

หนวย หนวย หนวย

ฐานขอมลเครอขายฐานขอมลเครอขาย เปนฐานขอมลทมลกษณะโครงสรางคลายกบ

ฐานขอมลแบบล าดบชน แตโครงสรางของฐานขอมลเครอขาย จะมความสมพนธเปนอยางอนดวย เชน ความสมพนธแบบ กลมตอหนง (Many-to-One) หรอ กลมตอกลม (Many-to-Many) ดงนนแบบจ าลองชนดนจงท าใหโหนดแตละโหนดมพอแมไดมากกวา 1 โหนด

โครงสรางของฐานขอมลเครอขาย

ฐานขอมลเชงสมพนธฐานขอมลเชงสมพนธเปนแบบจ าลองทแสดงความสมพนธของ

ขอมลในรปแบบตาราง 2 มต โดยแตละแถวจะใชเกบขอมล 1 เรคคอรด สวนคอลมน (Column) จะใชเกบคาของฟลดตางๆ ของขอมล นอกจากฐานขอมลเชงสมพนธใชแสดงความสมพนธของขอมลในตารางเดยวกนแลว ยงใชแสดงความสมพนธกบตารางอนทมความเกยวของกนดวย

โครงสรางของฐานขอมลเชงสมพนธ

ฐานขอมลเชงวตถฐานขอมลเชงวตถอาศยแนวคดของเทคโนโลยเชงวตถในการจดเกบและ

จดการขอมล โดยการมองขอมลทกชนดใหเปนวตถ (Objects) ซงแตละวตถหากมคณลกษณะเหมอนกน กจะจดใหอยในคลาส (Class) เดยวกน และคลาสทมความสมพนธกน สามารถถายทอดลกษณะ (Inheritance) กนลงมาอยางเปนล าดบชน (Hierarchy) ได ดวยคณลกษณะเชงวตถนเอง ทท าใหระบบจดการขอมลเชงวตถ (Object-Oriented Database Management System : OODBMS) สามารถจดการกบวตถขอมลไดโดยตรง จงท าใหการด าเนนการกบขอมลในฐานขอมลจงรวดเรวและแกไขงายขน

โครงสรางของฐานขอมลเชงวตถ

ประโยชนและขอจ ากดของระบบฐานขอมลในการน าระบบฐานขอมลมาใชในองคกรนอกจากจะชวยในการจดเกบ

ขอมลทมจ านวนมากใหสามารถน าไปใชงานไดสะดวกแลว ยงมประโยชนของระบบฐานขอมลดานอนๆ ดงตอไปน 1. ลดความซ าซอนของขอมล (Data Redundancy)

2. แกปญหาความขดแยงกนของขอมล (Data Inconsistency)

3. สามารถรกษาความถกตองของขอมลได (Data Integrity)

4. ก าหนดระบบรกษาความปลอดภย (Data Security) ใหกบขอมลได

5. สามารถควบคมการเขาถงขอมลจากผใชขอมลหลายคนในเวลาเดยวกนได(Concurrency Control)

6. ขอมลเปนอสระจากโปรแกรมทใชขอมลนน (Data Independence)

ประโยชนและขอจ ากดของระบบฐานขอมลนอกจากประโยชนรวมถงขอดของระบบฐานขอมลทกลาวไปแลวนน ระบบ

ฐานขอมลมขอจ ำกดในการน าไปใชงาน ดงตอไปน 1. มตนทนสง เนองจากการตองใชทรพยากรเพมขน ไมวาจะเปนตนทนทางดาน

อปกรณฮารดแวร ซอฟตแวร หรอบคลากรทมความรความเขาใจดานเทคโนโลยการจดการฐานขอมล

2. มความซบซอน เนองจากซอฟตแวรในการจดการระบบฐานขอมลประกอบไปดวยฟงกชนตางๆ มากมาย มความซบซอนสง

3. มความเสยงตอการหยดชะงกของระบบ เนองจากขอมลทจดเกบในระบบฐานขอมลมลกษณะการเกบแบบศนยรวม ดงนนหากอปกรณทใชเกบฐานขอมลเกดปญหาจะท าไมสามารถใชงานฐานขอมลไดทงหมด

4. การสญเสยขอมลอาจเกดขนได ถาไมมระบบส ารองขอมลทดพออาจท าใหสญเสยขอมลทงหมดได เมอเกดปญหากบอปกรณทใชเกบฐานขอมล

เทคโนโลยฐานขอมลปจจบนมการคดคนหลกการหรอเทคโนโลยทางดานฐานขอมล ซงประกอบ

ไปดวยการเขาถงขอมล การวเคราะหขอมล การจดเกบและการจดการขอมลตางๆ เพอใชในการสนบสนนการท างานของผใชงานรวมถงชวยใหสามารถจดการกบขอมลไดอยางรวดเรวและแมนย า ซงในหวขอนไดแนะน าเทคโนโลยฐานขอมลทส าคญไวดงตอไปน

– คลงขอมล (Data Warehouse)

– การประมวลผลเชงวเคราะหแบบออนไลน (Online Analytical Processing: OLAP)

– เหมองขอมล (Data Mining)

คลงขอมล (Data Warehouse)

คลงขอมล หมายถง หลกการ หรอ วธการเพอการรวมระบบสารสนเทศเพอการประมวลผลรายการขอมลทเกดขนในแตละวนในแตละสายงาน มารวมเขาเปนหนวยเดยวกน เพอสนบสนนกระบวนการตดสนใจของผตดสนใจใหมประสทธภาพมากยงขน คลงขอมลถอเปนฐานขอมลประเภทหนงแตเนองจากวตถประสงคของการใชงานแตกตางออกไป ท าใหมลกษณะส าคญหลายอยาง ทแตกตางจากระบบฐานขอมลทใ ชในการด าเนนกจกรรมทางธรกจโดยทวไป

ลกษณะส าคญของคลงขอมล ประกอบดวย

1. การแบงโครงสรางตามเนอหา (Subject oriented) หมายถง คลงขอมลถกออกแบบมาเพอมงเนนไปในแตละเนอหาทสนใจ

2. การรวมเปนหนง (Integration) หมายถง การรวบรวมขอมลจากหลายฐานขอมลปฏบตการเขาดวยกน และท าใหขอมลมมาตรฐานเดยวกน

3. ความสมพนธกบเวลา (Time Variant) หมายถง ขอมลในคลงขอมลจะตองจดเกบโดยก าหนดชวงเวลาเอาไว โดยจะสมพนธกบการด าเนนธรกจของหนวยธรกจนน เพราะในการตดสนดานการบรหารจ าเปนตองมขอมลเปรยบเทยบในแตละชวงเวลา

4. ความเสถยรของขอมล (Nonvolatile) หมายถง ขอมลในคลงขอมลจะไมเปลยนแปลงบอย ไมวาจะเปนการเพมเตมขอมลใหม หรอการปรบปรงแกไขขอมลเดมทบรรจอยแลว ผ ใชท าไดเพยงการเขาถงขอมลเทานน

คลงขอมล (Data Warehouse) (ตอ)

การประมวลผลเชงวเคราะหแบบออนไลน(Online Analytical Processing: OLAP)

OLAP คอ กระบวนการประมวลผลขอมลทางคอมพวเตอร ทชวยใหผ ใชสามารถวเคราะหในมตตางๆ ของขอมล (Multidimensional Data Analysis) ไดงายขน

เหมองขอมล (Data Mining)

การท าเหมองขอมล เปนการวเคราะห คนหาความสมพนธ การสกดหารปแบบและความสมพนธของขอมลจากฐานขอมลขนาดใหญหรอคลงขอมล เทคนคทน ามาใชในการท าเหมองขอมลแยกเปน 4 กลม ไดแก

การจ าแนกประเภท (Classification)

การจดกลม (Clustering)

การหากฎความสมพนธ (Association Rule)

การน าเสนอขอมลในรปกราฟก (Visualization)

โดยมรายละเอยดดงตอไปน

1. การจ าแนกประเภท

การจ าแนกประเภทเปนเทคนคในการจ าแนกกลมขอมลดวยคณลกษณะตางๆ ทไดมการก าหนดไวแลว เทคนคประเภทนเหมาะกบการสรางแบบจ าลองเพอการพยากรณคาขอมลในอนาคต (Predictive Modeling) จากการจ าแนกกลมขอมลตวอยางทจดเตรยมไวแลว หรอเรยกวาการเรยนรแบบมผสอน (Supervised Learning) ตวอยางเชน การพยากรณคะแนนสนเชอของลกคาใหมโดยอาศยขอมลดานการเงนและพฤตกรรมของลกคาเดมทงทมระดบคะแนนสนเชอในระดบตางๆ

2. การจดกลม

การจดกลมเปนเทคนคทใชในการจดกลมขอมลทมลกษณะคลายกนไวในกลมเดยวกน โดยทไมมการจดกลมขอมลตวอยางไวลวงหนาหรอเรยกวา การเรยนรแบบไมมผสอน (Unsupervised Learning)ตวอยางเชน การจดกลมนกเรยนจ านวน 100 คน ออกเปนสองกลมโดยพจารณาจากผลการเรยน

3. การหากฎความสมพนธ

การหากฎความสมพนธเปนเทคนคทใชคนพบองคความรหรอสารสนเทศใหม ดวยการเชอมโยงขอมลหรอกลมขอมลทเก ดขนในเหตการณเดยวกนเขาดวยกน ตวอยางเชน การคนพบกฎความสมพนธของการซอสนคาของลกคาในรานคา พบวาลกคาทซอผงซกฟอกแลวสวนใหญจะซอน ายาลางจาน ดงนนทางรานอาจน ากฎความสมพนธทไดไปใชในการจดวางสนคา ท าใหลกคาสะดวกในการเลอกซอ

4. การน าเสนอขอมลในรปกราฟก

การน าเสนอขอมลในรปกราฟกเปนเทคนคทใชเพอน าเสนอขอมลใหผ ใชสามารถคนพบองคความรไดจากการแสดงผล ดงนนจงตองมการพฒนารปแบบการแสดงผลใหสามารถเหนไดชดเจน โดยก าหนดสทสอความหมาย หรอการแสดงผล 3 มต เพอใหเหนลกษณะของกลมขอมลทงหมดได ตวอยางเชน การน าเสนอขอมลชวงเวลาในการใชงานโทรศพทดวยแผนภม จะแสดงใหเหนปรมาณผใชโทรศพทในแตละชวงเวลาไดอยางชดเจน และสามารถน าไปใชในพจารณาโปรโมชนพเศษบางชวงเวลาได

สรปในบทนไดน าเสนอความรพนฐานเกยวกบขอมลในระบบคอมพวเตอร ซงการจดเกบนนม

การจดเกบแบบล าดบชน จากหนวยขอมลทเลกทสดคอบต ทมคาไดเพยง 0 หรอ 1 ไปยงหนวยทใหญทสดนนคอฐานขอมล ซงสามารถท าการพฒนาโดยใชแบบจ าลองฐานขอมลไดหลายแบบตามความเหมาะสม โดยแบบจ าลองฐานขอมลประกอบดวย ฐานขอมลล าดบชน ฐานขอมลเค รอขาย ฐานขอมลเชงสมพนธ และฐานขอมลเชงวตถ ซงสามารถน ามาใชงานไดตามลกษณะของขอมลทตองการจดเกบ และเมอขอมลทจดเกบมจ านวนมากขน ท าใหการใชเรยกใชงานรวมถงการจดการขอมลท าไดยากจงจ าเปนตองน าเทคโนโลยฐานขอมลอนมาชวยใหการด าเนนการดงกลาวมประสทธภาพมากขน ไมวา จะเปน เทคโนโลยคลงขอมลทมเครองมอทสามารถจดการขอมลทมจ านวนมากและมความแตกตางกนได การประมวลผลเชงวเคราะหแบบออนไลนทชวยในการน าเสนอขอมลในมตทหลากหลาย งายในการน าไปใชสนบสนนการตดสนใจ การท าเหมองขอมลทมเทคนคในการสกดหาสารสนเทศทถกซอนไว ซงนอกจากนยงมเทคโนโลยทางดานฐานขอมลอนทสามารถน ามาใชประโยชนกบระบบสารสนเทศตางๆ ไดอก

top related