Database
ข้อดีของการใช้ฐานข้อมูล Database
- สามารถจัดเก็บข้อมูลได้จำนวนมาก ทำให้ประหยัดเนื้อที่ในการจัดเก็บเอกสารที่เป็นกระดาษ เนื่องจากฐานข้อมูลมีการจัดเก็บข้อมูลในสื่ออิเล็กทรอนิกส์ที่มีขนาดเล็ก
- สามารถแชร์ข้อมูลซึ่งกันและกันได้
- มีการรวมข้อมูลไว้ที่ส่วนกลาง ทำให้ลดวามซ้ำซ้อนของข้อมูล และเพิ่มความถูต้องของข้อมูล
- มีความยืดหยุ่นในการใช้งานข้อมูล
ประโยชน์ที่ได้รับจากฐานข้อมูล Database
- มีการใช้ข้อมูลขององค์กรเพื่อเสริมกลยุทธ์
- เพิ่มความปลอดภัยของข้อมูล เช่น สามารถกำหนดสิทธิ์ของผู้เข้าถึงข้อมูลแต่ละชนิดได้
- ลดความไม่ถูกต้องของข้อมูลและความซ้ำซ้อนของข้อมูล
Data Life Cycle Process
วงจรชีวิตของข้อมูล
แบ่งออกเป็น 5 ช่วงหลัก และมีกระบวนการย่อย ซึ่งสามารถอธิบายได้ดังนี้
1. Data Sources and Databases
เป็นแหล่งที่มาของข้อมูลที่มาทำการจัดเก็บในฐานข้อมูล ประกอบด้วย
1.1 ข้อมูลที่เก็บได้มาทั้งภายในและภายนอก จะมีกระบวนการส่งต่อข้อมูลไปยัง data warehouse
1.2 Data Warehouse เป็น คลังข้อมูลขนาดใหญ่ ซึ่งจะเป็นกระบวนการจัดเตรียมสารสนเทศ เพื่อช่วยในการตัดสินใจของบริษัท โดยบริษัทสามารถใช้ข้อมูล ใน Data Warehouse เพื่อแสดงแนวโน้ม, รูปแบบการซื้อของลูกค้า และความสัมพันธ์ แต่ก่อนข้อมูลที่จะเอามาจัดเก็บต้องพักให้อยู่ในรูปแบบของdata warehouse และหน่วยงานต้องการใช้
2. Data Storage
เป็นกระบวนการจัดเก็บข้อมูลที่จัดเก็บไว้ในคลังข้อมูล
3. Data Analysis
จากนั้นข้อมูลที่ถูกเก็บไว้จะนำมาวิเคราะห์ในส่วนนี้ หรือใน Access ก็คือส่วนของการสร้าง Query ซึ่งการวิเคราะห์จะทำได้ 2 ทางหลัก
3.1 การทำเหมืองข้อมูลหรือ data mining คือ software ที่ใช้ในการค้นหา pattern
ของข้อมูลที่เก็บอยู่ใน database
3.2 OLAP เป็น software ที่ ดูความสัมพันธ์ในหลากหลายมิติ ทั้งสองเครื่องมือที่เปลี่ยนเอา data ให้
มาอยู่ในรูป information
4. Results
หลังจากข้อมูลที่ถูกวิเคราะห์ก็จะมาอยู่ในรูป information ในส่วนต่าง เช่น การแสดงผลลัพธ์ผ่านทาง Report ต่างๆ
5. Solution
เมื่อได้ผลการวิเคราะห์แล้ว องค์กรสามารถนำผลการวิเคราะห์นั้น เป็นแนวทางในการจัดการองค์กร หรือใช้ในแต่ละด้านขององค์กรโดยเฉพาะในด้านของ การลงทุนขององค์กร ไม่ว่าจะเป็นในด้านของ CRM ,SCM และกลยุทธ์ต่างๆ
Hierachy of Data
ฐานข้อมูล ประกอบไปด้วยแฟ้มข้อมูล (File) ระเบียน (Record) และ เขตข้อมูล (Field) และถูกจัดการด้วยระบบเดียวกัน โดย
- บิต (bit) ย่อมาจาก Binary Digit ข้อมูลในคอมพิวเตอร์ 1 บิต จะแสดงได้ 2 สถานะคือ 0 หรือ 1 การเก็บข้อมูลต่างๆได้จะต้องนำ บิต หลายๆ บิต มาเรียงต่อกัน
- เมื่อเรานำ ไบต์ (byte) หลายๆ ไบต์ มาเรียงต่อกัน เรียกว่า เขตข้อมูล (field) เช่น Name ใช้เก็บชื่อ LastName ใช้เก็บนามสกุล เป็นต้น
- เมื่อนำเขตข้อมูล หลายๆ เขตข้อมูล มาเรียงต่อกัน เรียกว่า ระเบียน (record) เช่น ระเบียน ที่ 1 เก็บ ชื่อ นามสกุล วันเดือนปีเกิด ของ นักเรียนคนที่ 1 เป็นต้น
- การเก็บระเบียนหลายๆระเบียน รวมกัน เรียกว่า แฟ้มข้อมูล (File) เช่น แฟ้มข้อมูล นักเรียน จะเก็บ ชื่อ นามสกุล วันเดือนปีเกิด ของนักเรียน จำนวน 500 คน เป็นต้น
- การจัดเก็บ แฟ้มข้อมูล หลายๆ แฟ้มข้อมูล ไว้ภายใต้ระบบเดียวกัน เรียกว่า ฐานข้อมูล หรือ Database เช่น เก็บ แฟ้มข้อมูล นักเรียน อาจารย์ วิชาที่เปิดสอน เป็นต้น
การเข้าถึงข้อมูลในฐานข้อมูลจึงจำเป็นต้องมีระบบการจัดการฐานข้อมูลมาช่วยเรียกว่า database management system (DBMS) จะมีหน้าที่ในการจัดการ และควบคุมความถูกต้อง ความซ้ำซ้อนและความสัมพันธ์ระหว่างข้อมูลต่างๆ ภายในฐานข้อมูลแทนโปรแกรมเมอร์ ทำให้ผู้ใช้สามารถเรียกใช้ข้อมูลจากฐานข้อมูลได้ DBMS ก็ได้แก่ MS Access, MySQL เป็นต้น
Problems with the Traditional File Environment: ปัญหาของการเก็บไฟล์ข้อมูลแบบเก่า
- เกิดความซ้ำซ้อน(Redundancy) และความไม่ถูกต้อง(Inconsistency) ของข้อมูล
- Data Redundancy: เกิดจากการซ้ำซ้อนของข้อมูลที่มีการเก็บกันไว้คนละที่
- Data Inconsistency: เมื่อเกิดการซ้าซ้อนของข้อมูล จึงนำมาซึ่งความถูกต้องของข้อมูล
- Program-data dependence
- การที่โปรแกรมบางโปรแกรมมีข้อมูลที่เกี่ยวข้องกัน เมื่อมีการอัพเดตข้อมูลใด โปรแกรมอีกโปรแกรมก็ควรจะมีการอัพเดตข้อมูลที่เกี่ยวข้องให้เหมือนกัน ไม่งั้นจะถ้าข้อมูลนั้นจะเกิดควาไม่ถูกต้องของข้อมูล
- Lack of flexibility
- ระบบแบบเก่า กว่าที่จะมีการวิเคราะห์ข้อมูลและรายงานไปยังผู้บริหารหรือหน่วยงานที่เกี่ยวข้อง ทำได้ล้าช้า ทำให้ข้อมูลนั้นๆ อาจเกิดความล่าสมัยไป ไม่สามารถตอบสนองกับความต้องการปัจจุบันได้
- Poor security
- ระบบเก่ามีการควบคุมหรือจัดการข้อมูลน้อย เมื่อไม่่มีความรู้ในการจัดการข้อมูลจึงไม่มีการระบุว่าใครมีสิทธิ์บ้างในการเข้าถึงข้อมูล
- Lack of data sharing and availability
- ข้อมูลหรือสารสนเทศต่างๆ ไม่มีอิสระในการส่งต่อข้ามแผนกหรือหน่วยงานในองค์กร ผู้ใช้จะได้รับข้อมูลต่างกันในข้อมูลเดียวกันเพราะอยู่กันต่างระบบ และจะนำมาซึ่งความไม่ถูกต้องของข้อมูล
ประเภท Database
1. Relational Database เป็นรูปแบตาราง สองมิติ
2. Object-oriented database คือสามารถเก็บข้อมูล object คือ unstructured File เช่น Audio, Photo, File เป็นต้น
3. Multidimentional database เป็น database ในหลายมิติ มีความลึกได้
อธิบาย
relational database เป็นการนำเสนอข้อมูลในรูปแบบตารางใน database ต้องมีระบุประเภทของข้อมูล คือมีนิยามกำหนดอยู่ วิธีการซ้ำซ้อนกัน คือในแต่ละ record จะต้องมีอย่างน้อย 1 field ที่จะต้องไม่ซ้ำซ้อนกัน เรียกว่า primary key การเลือก primary key ที่ดีจะต้องไม่ซ้ำซ้อนกัน และห้ามมีการเปลี่ยนแปลงหรือนำกลับมาใช้หม่ได้ เช่น เบอร์โทรศัพท์เป็น Primary key ที่ไม่ดีแต่รหัสนักศึกษาใช้เป็น primary key ที่ดี
Designing Databases
- Conceptual design: Model ฐานข้อมูลของธุรกิจ
- Physical design: มุมมองของข้อมูลในฐานข้อมูล เช่น field ในตาราง เป็นต้น
- Entity-relationship diagram (ER-Diagram): เป็นการเชื่อมโยงความสัมพันธ์ระหว่างแต่ละ Entity
- Normalization: ขั้นตอนการลดความซับซ้อนของข้อมูลในตาราง โดยถ้าข้อมูลใดสามารถรวมกลุ่มเป็นอีกตารางหนึ่งด้ ก็ควรแยกออกมาสร้างเป็นอีกตาราง ไม่ควรใส่รวมกันหมดในตารางเดียว
Effective Management of Databases
- Database Administrator (DBA): คนดูแลระบบฐานข้อมูลในองค์กร
โครงสร้างของ Database
มี 2 รูปแบบ คือ
- Centralized คือรูปแบบการรวมศูนย์ คือ มีที่เดียวในสถานที่เดียวและกระจายไปยังที่ต่างๆ
- Distributed คือการกระจายฐานข้อมูลใน ไปยังสาขา เป็นข้อมูลเดียวกับส่วนกลาง ประโยชน์คือ เมื่อ Database ใด Database หรือเสียก็ยังทำงานได้ สามารถ ปรับปรุงข้อมูลได้สองแบบ ถ้าเป็น Distribution แบบ Partition คือแบบ batch และแบบ real time
Data mining
: เหมืองข้อมูล คือกระบวนการที่วิเราะห์ข้อมูล ทำให้สามารถการค้นหา pattern และแนวโน้มของข้อมูลได้
Business Intelligence
คือกระบวนการที่องค์กรธุรกิจ เอา Database มาใช้เพื่อใช้ในการตัดสินใจขององค์กร โดยอาศัยเครื่องมือมาช่วยในการวิเคราะห์ Vendors ต่างๆ ได้แก่ IBM, ORACLE, SAP, SAS, Microsoft เป็นต้น
Database and Web
คือ ปัจจุบัน Website ที่ให้มีการกรอกข้อมูลการใช้งาน การ Log in เข้าระบบ การสมัครสมาชิกต่างๆ ล้วนแต่มีการนำ Database มาใช้กันทั้งสิ้น
Information Policy
คือ องค์กรที่มีการทำ Database ควรที่จะมีนโยบายในการใช้งาน เช่น ใครเป็นผู้ที่ดูแลระบบ ใครมีสิทธิและอำนาจในการเข้าไปดูข้อมูลบ้าง จะมีการจัดการข้อมูลอย่างไร มีบรรษัทภิบาลในการเก็บรักษาข้อมูล เป็นต้น
Managerial Issues
- ความปลอดภัยของข้อมูลและจรรยาบรรณ
- ความเป็นส่วนตัว
- การ Backup ข้อมูล
- ความล้าสมัยของข้อมูล ต้องมีการแปลงจากข้อมูลที่เป็น analog ให้มาอยู่ในรูป digital
Participant
- น.ส.อภิญญา ชลพอง 5220211008 - 1
- น.ส. จินตวีร์ ชลชาติภิญโญ 5220211011 - 1
- นายชัยพัฒน์ ผดุงศุภไลย 52202110055 - 1
- นายพศิน วณิชย์วรนันต์ 52202110056 - 1
- นายภาคภูมิ ชินวงศ์ 5220211069 - 2





