วันอังคารที่ 3 ตุลาคม พ.ศ. 2560

[บันทึกความรู้] Classification

จากหลักสูตรเรียนออนไลน์ RSU-MOOC: rsu001 ฉลาดด้วยข้อมูล ใครๆ ก็ทำได้ (คลังข้อมูลและการทำเหมืองข้อมูล)
เนื้อหาก่อนหน้านี้ : Association Rule Discovery

Data Classification (การจำแนกประเภทข้อมูล)
- เป็นกระบวนการหากฎเพื่อจำแนกประเภทของวัตถุจากคุณสมบัติของวัตถุ
- เป็นกระบวนการสร้างรูปแบบ (Model) จัดการข้อมูลให้อยู่ในกลุ่มที่กำหนดมาให้

Classification and Prediction
คือ การแยกประเภทข้อมูลให้อยู่ในกลุ่มที่กำหนดมาให้ โดยการสร้างกฏเพื่อช่วยในการตัดสินใจจากข้อมูลที่มีอยู่
เพื่อใช้ทำนายแนวโน้มการเกิดขึ้นของข้อมูลที่ยังไม่เกิดขึ้น  รวมทั้งทำนายค่าที่ไม่ทราบหรือค่าที่หายไป
 มี 3 ขั้นตอนดังนี้


1. Model Construction (การสร้างต้นแบบ)
สร้างจาก Training Data(ข้อมูลเรียนรู้) กลุ่มข้อมูลที่จะสอนว่าโมเดลควรเป็นอย่างไร
โดย Training Data จะถูก Algorithm วิเคราะห์แบ่งประเภท
สร้างเป็นโมเดลในรูปแบบของกฎการแบ่งประเภท

2. Model Evaluation (การประเมิน)
เมื่อได้โมเดลแล้ว   จะใส่ Testing Data(ข้อมูลทดสอบระบบ) เพื่อประเมินผลโมเดลว่ามีความถูกต้องแค่ไหน
และในขั้นตอนนี้จะปรับปรุงโมเดลจนกว่าจะได้ความถูกต้องในระดับที่น่าพอใจ  เมื่อสมบูรณ์แบบก็จะเป็น Classifier Model

3. Classifier Model (จำแนกประเภท)
ต่อจากนั้นนำ  Unseen Data ข้อมูลที่ไม่เคยเห็นมาก่อน  ใส่เข้าไปในโมเดลนี้ เพื่อทำการ Classification จัดจำแนกประเภทข้อมูล
แล้วไปทำการ Perdict ทำนาย

เนื้อหาต่อไป :  Decision Tree