จากหลักสูตรเรียนออนไลน์ RSU-MOOC: rsu001 ฉลาดด้วยข้อมูล ใครๆ ก็ทำได้ (คลังข้อมูลและการทำเหมืองข้อมูล)
เนื้อหาก่อนหน้านี้ : Association Rule Discovery
Data Classification (การจำแนกประเภทข้อมูล)
- เป็นกระบวนการหากฎเพื่อจำแนกประเภทของวัตถุจากคุณสมบัติของวัตถุ
- เป็นกระบวนการสร้างรูปแบบ (Model) จัดการข้อมูลให้อยู่ในกลุ่มที่กำหนดมาให้
Classification and Prediction
คือ การแยกประเภทข้อมูลให้อยู่ในกลุ่มที่กำหนดมาให้ โดยการสร้างกฏเพื่อช่วยในการตัดสินใจจากข้อมูลที่มีอยู่
เพื่อใช้ทำนายแนวโน้มการเกิดขึ้นของข้อมูลที่ยังไม่เกิดขึ้น รวมทั้งทำนายค่าที่ไม่ทราบหรือค่าที่หายไป
มี 3 ขั้นตอนดังนี้
1. Model Construction (การสร้างต้นแบบ)
สร้างจาก Training Data(ข้อมูลเรียนรู้) กลุ่มข้อมูลที่จะสอนว่าโมเดลควรเป็นอย่างไร
โดย Training Data จะถูก Algorithm วิเคราะห์แบ่งประเภท
สร้างเป็นโมเดลในรูปแบบของกฎการแบ่งประเภท
2. Model Evaluation (การประเมิน)
เมื่อได้โมเดลแล้ว จะใส่ Testing Data(ข้อมูลทดสอบระบบ) เพื่อประเมินผลโมเดลว่ามีความถูกต้องแค่ไหน
และในขั้นตอนนี้จะปรับปรุงโมเดลจนกว่าจะได้ความถูกต้องในระดับที่น่าพอใจ เมื่อสมบูรณ์แบบก็จะเป็น Classifier Model
3. Classifier Model (จำแนกประเภท)
ต่อจากนั้นนำ Unseen Data ข้อมูลที่ไม่เคยเห็นมาก่อน ใส่เข้าไปในโมเดลนี้ เพื่อทำการ Classification จัดจำแนกประเภทข้อมูล
แล้วไปทำการ Perdict ทำนาย
เนื้อหาต่อไป : Decision Tree