Fuzzy K-mean การจัดกลุ่มใน Mahout



บล็อกนี้ให้ข้อมูลเบื้องต้นเกี่ยวกับการทำคลัสเตอร์ Fuzzy K-Means ใน Apache Mahout

Fuzzy K-Means เป็นอัลกอริทึมเดียวกับ K-mean ซึ่งเป็นเทคนิคการจัดกลุ่มแบบง่ายที่ได้รับความนิยม ข้อแตกต่างเพียงอย่างเดียวคือแทนที่จะกำหนดจุดเฉพาะให้กับคลัสเตอร์เดียวเท่านั้นมันอาจมีความคลุมเครือบางประเภทหรือทับซ้อนกันระหว่างสองคลัสเตอร์ขึ้นไป ต่อไปนี้เป็นประเด็นสำคัญที่อธิบายถึง Fuzzy K-Means:





  • ซึ่งแตกต่างจาก K-Means ซึ่งมองหาฮาร์ดคลัสเตอร์ซึ่งแต่ละจุดเป็นของคลัสเตอร์เดียว Fuzzy K-Means จะค้นหากลุ่มที่อ่อนกว่าสำหรับการซ้อนทับ
  • จุดเดียวในคลัสเตอร์แบบอ่อนสามารถเป็นของมากกว่าหนึ่งคลัสเตอร์โดยมีค่าความสัมพันธ์ที่แน่นอนต่อแต่ละจุด
  • ความสัมพันธ์เป็นสัดส่วนกับระยะห่างของจุดนั้นจากคลัสเตอร์เซนทรอยด์
  • เช่นเดียวกับ K-Means Fuzzy K-Means ทำงานบนวัตถุที่มีการวัดระยะทางที่กำหนดไว้และสามารถแสดงใน n- พื้นที่เวกเตอร์มิติ

แผนที่ Fuzzy K-mean ลดการไหล

การไหลของ MapReduce ของ K-Means และ Fuzzy K-Means ไม่มีความแตกต่างกันมากนัก การใช้งานทั้งสองอย่างใน Mahout นั้นคล้ายคลึงกัน

ต่อไปนี้คือไฟล์ พารามิเตอร์ที่จำเป็น สำหรับการใช้งาน Fuzzy K-Means:



java เรียงลำดับอาร์เรย์ของจำนวนเต็ม
  • คุณต้องมีชุดข้อมูล Vector สำหรับการป้อนข้อมูล
  • จะต้องมี RandomSeedGenerator เพื่อเพาะเมล็ด k คลัสเตอร์เริ่มต้น
  • สำหรับการวัดระยะทาง SquaredEuclideanDistanceMeasure จำเป็นต้องมี
  • ค่าเกณฑ์คอนเวอร์เจนซ์จำนวนมากเช่น –cd 1.0 หากมีการใช้ค่ากำลังสองของการวัดระยะทาง
  • ค่าสำหรับ maxIterations ค่าเริ่มต้นคือ -x 10
  • ค่าสัมประสิทธิ์ของการทำให้เป็นมาตรฐานหรือปัจจัยความฟัซซี่ที่มีค่ามากกว่า -m 1.0

มีคำถามสำหรับเรา? พูดถึงพวกเขาในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป

กระทู้ที่เกี่ยวข้อง



การเรียนรู้ภายใต้การดูแลใน Apache Mahout