Fuzzy K-Means เป็นอัลกอริทึมเดียวกับ K-mean ซึ่งเป็นเทคนิคการจัดกลุ่มแบบง่ายที่ได้รับความนิยม ข้อแตกต่างเพียงอย่างเดียวคือแทนที่จะกำหนดจุดเฉพาะให้กับคลัสเตอร์เดียวเท่านั้นมันอาจมีความคลุมเครือบางประเภทหรือทับซ้อนกันระหว่างสองคลัสเตอร์ขึ้นไป ต่อไปนี้เป็นประเด็นสำคัญที่อธิบายถึง Fuzzy K-Means:
- ซึ่งแตกต่างจาก K-Means ซึ่งมองหาฮาร์ดคลัสเตอร์ซึ่งแต่ละจุดเป็นของคลัสเตอร์เดียว Fuzzy K-Means จะค้นหากลุ่มที่อ่อนกว่าสำหรับการซ้อนทับ
- จุดเดียวในคลัสเตอร์แบบอ่อนสามารถเป็นของมากกว่าหนึ่งคลัสเตอร์โดยมีค่าความสัมพันธ์ที่แน่นอนต่อแต่ละจุด
- ความสัมพันธ์เป็นสัดส่วนกับระยะห่างของจุดนั้นจากคลัสเตอร์เซนทรอยด์
- เช่นเดียวกับ K-Means Fuzzy K-Means ทำงานบนวัตถุที่มีการวัดระยะทางที่กำหนดไว้และสามารถแสดงใน n- พื้นที่เวกเตอร์มิติ
แผนที่ Fuzzy K-mean ลดการไหล
การไหลของ MapReduce ของ K-Means และ Fuzzy K-Means ไม่มีความแตกต่างกันมากนัก การใช้งานทั้งสองอย่างใน Mahout นั้นคล้ายคลึงกัน
ต่อไปนี้คือไฟล์ พารามิเตอร์ที่จำเป็น สำหรับการใช้งาน Fuzzy K-Means:
java เรียงลำดับอาร์เรย์ของจำนวนเต็ม
- คุณต้องมีชุดข้อมูล Vector สำหรับการป้อนข้อมูล
- จะต้องมี RandomSeedGenerator เพื่อเพาะเมล็ด k คลัสเตอร์เริ่มต้น
- สำหรับการวัดระยะทาง SquaredEuclideanDistanceMeasure จำเป็นต้องมี
- ค่าเกณฑ์คอนเวอร์เจนซ์จำนวนมากเช่น –cd 1.0 หากมีการใช้ค่ากำลังสองของการวัดระยะทาง
- ค่าสำหรับ maxIterations ค่าเริ่มต้นคือ -x 10
- ค่าสัมประสิทธิ์ของการทำให้เป็นมาตรฐานหรือปัจจัยความฟัซซี่ที่มีค่ามากกว่า -m 1.0
มีคำถามสำหรับเรา? พูดถึงพวกเขาในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป
กระทู้ที่เกี่ยวข้อง
การเรียนรู้ภายใต้การดูแลใน Apache Mahout