ความแตกต่างระหว่างการจัดกลุ่มและจำแนกประเภท | การจัดกลุ่มและการจำแนกประเภท

Anonim

ความแตกต่างที่สำคัญ - การจัดกลุ่มและการจัดประเภท

แม้ว่าการจำแนกกลุ่มและการจำแนกเป็นขั้นตอนคล้าย ๆ กัน แต่ก็มีความแตกต่างกันไปตามความหมาย ในโลกของการทำเหมืองข้อมูลการจัดกลุ่มและจำแนกเป็นวิธีการเรียนรู้สองประเภท ทั้งสองวิธีนี้เป็นลักษณะของวัตถุเป็นกลุ่มตามคุณลักษณะอย่างน้อยหนึ่งอย่าง ข้อแตกต่างที่สำคัญระหว่างการจำแนกกลุ่มและการจัดหมวดหมู่คือ การจัดกลุ่มเป็นเทคนิคการเรียนรู้ที่ไม่ได้รับการยกเว้นที่ใช้ในการจัดกลุ่มตัวอย่างที่คล้ายคลึงกันบนพื้นฐานของคุณสมบัติ ขณะที่ การจำแนกเป็นเทคนิคการเรียนรู้ที่ได้รับการดูแลที่ใช้เพื่อกำหนดแท็กที่กำหนดไว้ล่วงหน้าในกรณีต่างๆ พื้นฐานของคุณสมบัติ

Clustering คืออะไร?

การจัดกลุ่มเป็นวิธีการจัดกลุ่มออบเจ็กต์ในลักษณะที่วัตถุที่มีลักษณะคล้ายกันมารวมกันและวัตถุที่มีคุณสมบัติแตกต่างออกไป เป็นเทคนิคทั่วไปสำหรับการวิเคราะห์ข้อมูลทางสถิติที่ใช้ในการเรียนรู้ด้วยเครื่องจักรและการทำเหมืองข้อมูล การจัดกลุ่มสามารถใช้สำหรับการวิเคราะห์ข้อมูลเชิงสำรวจและการสรุปข้อมูลทั่วไป

การจัดกลุ่มเป็นของการทำเหมืองข้อมูลที่ไม่ได้รับการยกเว้นและการจัดกลุ่มไม่ได้เป็นขั้นตอนวิธีเฉพาะแบบเดียว แต่เป็นวิธีทั่วไปในการแก้ปัญหา การจัดกลุ่มสามารถทำได้ด้วยอัลกอริทึมต่างๆ อัลกอริทึมคลัสเตอร์และการตั้งค่าพารามิเตอร์ที่เหมาะสมจะขึ้นอยู่กับชุดข้อมูลแต่ละชุด ไม่ใช่งานอัตโนมัติ แต่เป็นการค้นพบซ้ำ ดังนั้นจึงจำเป็นต้องปรับเปลี่ยนการประมวลผลข้อมูลและการสร้างแบบจำลองพารามิเตอร์จนกว่าผลจะบรรลุคุณสมบัติที่ต้องการ การจัดกลุ่ม K-means และการจัดกลุ่มตามลำดับชั้นเป็นอัลกอริทึมการจัดกลุ่มข้อมูลทั่วไปที่ใช้ในการทำเหมืองข้อมูล

การจัดประเภทคืออะไร?

การจำแนกประเภทเป็นขั้นตอนการจำแนกประเภทที่วัตถุมีการรับรู้จำแนกและเข้าใจบนพื้นฐานของชุดข้อมูลการฝึกอบรม การจำแนกเป็นเทคนิคการเรียนรู้แบบมีการควบคุมโดยมีชุดการฝึกและข้อสังเกตที่กำหนดไว้อย่างถูกต้อง

อัลกอริธึมที่ใช้การจำแนกประเภทมักเป็นที่รู้จักกันในชื่อลักษณนามและข้อสังเกตมักเรียกว่าอินสแตนซ์ K-Neighbor algorithm และ algorithm tree algorithms เป็นขั้นตอนวิธีการจำแนกประเภทที่มีชื่อเสียงที่สุดในการทำเหมืองข้อมูล

อะไรคือความแตกต่างระหว่าง Clustering กับ Classification ?

คำจำกัดความของ Clustering และการจำแนกประเภท:

Clustering: การจัดกลุ่มเป็นเทคนิคการเรียนรู้ที่ไม่มีการควบคุมโดยอัตโนมัติซึ่งใช้ในการจัดกลุ่มตัวอย่างที่คล้ายกันบนพื้นฐานของคุณสมบัติ

การจำแนกประเภท: การจำแนกประเภทเป็นเทคนิคการเรียนรู้ที่ได้รับการดูแลซึ่งใช้ในการกำหนดแท็กที่กำหนดไว้ล่วงหน้าไปยังอินสแตนซ์บนพื้นฐานของคุณสมบัติ

ลักษณะของการจัดกลุ่มและการจัดหมวดหมู่:

การกำกับดูแล:

การจัดกลุ่ม: การจัดกลุ่มเป็นเทคนิคการเรียนรู้ที่ไม่ได้รับการยกเว้น

การจำแนกประเภท: การจำแนกประเภทเป็นเทคนิคการเรียนรู้ที่ได้รับการดูแล

ชุดฝึกอบรม:

การจัดกลุ่ม: ไม่ได้ใช้ชุดฝึกซ้อมในการจัดกลุ่ม

การจำแนกประเภท: ใช้ชุดฝึกอบรมเพื่อค้นหาความเหมือนในการจัดหมวดหมู่

กระบวนการ:

การจัดกลุ่ม: ใช้แนวคิดทางสถิติและชุดข้อมูลจะแบ่งออกเป็นส่วนย่อยที่มีคุณสมบัติคล้ายกัน

การจำแนกประเภท: การจัดหมวดหมู่ใช้อัลกอริทึมในการจัดหมวดหมู่ข้อมูลใหม่ตามข้อสังเกตของชุดฝึกอบรม

ป้าย:

การจัดกลุ่ม: ไม่มีการจัดกลุ่มในกลุ่ม

การจัดประเภท: มีป้ายกำกับสำหรับบางจุด

จุดมุ่งหมาย:

การจัดกลุ่ม: จุดมุ่งหมายของการจัดกลุ่มคือการจัดกลุ่มของวัตถุเพื่อหาว่ามีความสัมพันธ์ใด ๆ ระหว่างกันหรือไม่

การจำแนกประเภท: จุดมุ่งหมายของการจัดกลุ่มคือการหาว่าคลาสใดเป็นวัตถุใหม่จากชุดชั้นเรียนที่กำหนดไว้ล่วงหน้า

การจัดกลุ่มและการจำแนกประเภท - สรุป

การจัดกลุ่มและการจำแนกอาจดูเหมือนคล้ายกันเนื่องจากทั้งสองอัลกอริทึมการทำเหมืองข้อมูลแบ่งข้อมูลออกเป็นส่วนย่อย แต่เป็นเทคนิคการเรียนรู้สองแบบที่ใช้ในการทำเหมืองข้อมูลเพื่อวัตถุประสงค์ในการรับข้อมูลที่เชื่อถือได้ ชุดของข้อมูลดิบ

รูปภาพมารยาท: "Cluster-2" โดย Cluster-2 gif: hellisp derivative work: (Public Domain) โดยวิกิพีเดีย "Magnetism" by John Aplessed - งานของตัวเอง (โดเมนสาธารณะ) ผ่านทาง Commons