สถิติสำหรับการเรียนรู้ของเครื่อง: คู่มือสำหรับผู้เริ่มต้น



บทความนี้เกี่ยวกับสถิติสำหรับการเรียนรู้ของเครื่องเป็นคำแนะนำที่ครอบคลุมเกี่ยวกับแนวคิดต่างๆเกี่ยวกับสถิติของระบบปฏิบัติการพร้อมตัวอย่าง

การทำความเข้าใจข้อมูลและสามารถสร้างมูลค่าจากข้อมูลนั้นเป็นทักษะแห่งทศวรรษ การเรียนรู้ของเครื่องเป็นทักษะหลักอย่างหนึ่งที่ช่วยให้ บริษัท ต่างๆบรรลุเป้าหมายได้ อย่างไรก็ตามในการเริ่มต้นคุณต้องสร้างรากฐานให้ถูกต้อง ดังนั้นในบทความนี้ฉันจะพูดถึงแนวคิดพื้นฐานบางประการและให้แนวทางในการเริ่มต้นการเดินทางใน Machine Learning ดังนั้นในบทความเกี่ยวกับสถิติสำหรับการเรียนรู้ของเครื่องจะกล่าวถึงหัวข้อต่อไปนี้:

  1. ความน่าจะเป็น
  2. สถิติ
  3. พีชคณิตเชิงเส้น

ความน่าจะเป็นและสถิติสำหรับการเรียนรู้ของเครื่อง:





ความน่าจะเป็นคืออะไร?

ความน่าจะเป็นจะวัดความเป็นไปได้ที่เหตุการณ์จะเกิดขึ้น ตัวอย่างเช่นหากคุณหมุนตัวตายที่ยุติธรรมและไม่มีอคติความน่าจะเป็นของ หนึ่ง เปลี่ยนเป็น 1/6 . ทีนี้ถ้าคุณสงสัยวพี่? คำตอบนั้นค่อนข้างง่าย!

วิธีหยุดโปรแกรมใน java

เนื่องจากมีความเป็นไปได้หกประการและทั้งหมดมีความเป็นไปได้เท่าเทียมกัน (การตายที่ยุติธรรม) ดังนั้นเราสามารถเพิ่ม 1 + 1 + 1 + 1 + 1 + 1 = 6. แต่เนื่องจากเราสนใจในไฟล์ เหตุการณ์ที่ 1 ปรากฏขึ้น . มี วิธีเดียวที่จะทำให้เหตุการณ์เกิดขึ้นได้ ดังนั้น,



ความน่าจะเป็นของการพลิกขึ้น 1 ครั้ง = 1/6

เป็นกรณีเดียวกันกับตัวเลขอื่น ๆ ทั้งหมดเนื่องจากเหตุการณ์ทั้งหมดมีโอกาสเท่ากัน ง่ายใช่มั้ย?

คำจำกัดความของความน่าจะเป็นสำหรับตัวอย่างนี้มักจะเป็นเช่นนั้น - ความน่าจะเป็นของการพลิกขึ้น 1 ครั้งคืออัตราส่วนของจำนวนครั้งที่ 1 เปลี่ยนเป็นจำนวนครั้งทั้งหมดที่รีดตายหากการรีดตายเป็นจำนวนอนันต์ ครั้ง.สิ่งนี้สมเหตุสมผลอย่างไร



มาทำให้น่าสนใจยิ่งขึ้น พิจารณาสองกรณี - คุณรีดความตายอย่างยุติธรรม 5 ครั้ง ในกรณีหนึ่งลำดับของตัวเลขที่ปรากฏคือ - [1,4,2,6,4,3] ในอีกกรณีหนึ่งเราได้ - [2,2,2,2,2,2] คุณคิดว่าอันไหนน่าจะมากกว่ากัน

ทั้งสองมีโอกาสเท่ากัน ดูเหมือนจะแปลกใช่มั้ย?

ตอนนี้ให้พิจารณาอีกกรณีหนึ่งที่ทั้ง 5 ม้วนในแต่ละกรณีคือ อิสระ . ความหมายหนึ่งม้วนไม่มีผลต่ออีกม้วน ในกรณีแรกเมื่อ 6 พลิกขึ้นมันไม่รู้เลยว่า 2 พลิกขึ้นมาก่อนหน้านี้ ดังนั้นทั้ง 5 ม้วนจึงมีโอกาสเท่ากัน

ในทำนองเดียวกัน 2s ตรงในกรณีที่สองสามารถเข้าใจได้ว่าเป็นลำดับของเหตุการณ์ที่เป็นอิสระ และเหตุการณ์ทั้งหมดนี้มีโอกาสเท่าเทียมกัน โดยรวมแล้วเนื่องจากเรามีลูกเต๋าเดียวกัน ความน่าจะเป็นของจำนวนเฉพาะที่พลิกกลับในกรณีที่หนึ่งเหมือนกับกรณีที่สอง ต่อไปในบทความเกี่ยวกับสถิติสำหรับการเรียนรู้ของเครื่องให้เราเข้าใจคำศัพท์ ความเป็นอิสระ

ความเป็นอิสระ

สองเหตุการณ์ กล่าวว่า A และ B เป็นอิสระหากการเกิด A ไม่มีผลต่อเหตุการณ์ B . ตัวอย่างเช่นหากคุณทอยเหรียญและหมุนแม่พิมพ์ผลของการตายจะไม่มีผลต่อการที่เหรียญจะแสดงหัวหรือก้อย นอกจากนี้สำหรับ สองเหตุการณ์อิสระ A และ B , ความน่าจะเป็นที่ A และ B สามารถเกิดขึ้นพร้อมกัน . ตัวอย่างเช่นหากคุณต้องการให้ความน่าจะเป็นที่เหรียญแสดงหัวและการตายแสดง 3

P (A และ B) = P (A) * P (B)

ดังนั้น P = & frac12 (ความน่าจะเป็นของการพลิกขึ้น) * ⅙ (ความน่าจะเป็นของการพลิกขึ้น 3 ครั้ง) = 1/12

ในตัวอย่างก่อนหน้านี้สำหรับทั้งสองกรณี P = ⅙ * ⅙ * ⅙ * ⅙ * ⅙ * ⅙

ตอนนี้เรามาพูดถึงเหตุการณ์ที่ไม่เป็นอิสระ พิจารณาตารางต่อไปนี้:

อ้วน ไม่อ้วน
ปัญหาหัวใจสี่ห้าสิบห้า
ไม่มีปัญหาเรื่องหัวใจ1030

มีการสำรวจคน 100 คน 60 มีปัญหาเกี่ยวกับหัวใจและ 40 ไม่ได้ จาก 60 คนที่มีปัญหาเกี่ยวกับหัวใจ 45 คนเป็นโรคอ้วน ในจำนวน 40 คนที่ไม่มีปัญหาเกี่ยวกับหัวใจ 10 คนเป็นโรคอ้วน หากมีคนถามคุณ -

  1. ความน่าจะเป็นที่จะมีปัญหาเกี่ยวกับหัวใจคืออะไร?
  2. ความน่าจะเป็นที่จะมีปัญหาเกี่ยวกับหัวใจและไม่เป็นโรคอ้วนคืออะไร?

คำตอบสำหรับคำถามแรกนั้นง่าย - 60/100 สำหรับอันที่สองจะเป็น 15/100 ตอนนี้พิจารณาคำถามที่สาม - บุคคลหนึ่งถูกเลือกโดยการสุ่ม เขาถูกตรวจพบว่าเป็นโรคหัวใจ ความน่าจะเป็นที่เขาเป็นโรคอ้วนคืออะไร?

ตอนนี้คิดถึงข้อมูลที่ให้กับคุณ - เป็นที่รู้กันว่าเขาเป็นโรคหัวใจ ดังนั้นเขาจึงไม่สามารถเป็นจาก 40 ที่ไม่มีโรคหัวใจ มีเพียง 60 ตัวเลือกที่เป็นไปได้ (แถวบนสุดในตาราง) ตอนนี้ในบรรดาความเป็นไปได้ที่ลดลงความน่าจะเป็นที่เขาเป็นโรคอ้วนคือ 45/60 ตอนนี้คุณได้ทราบแล้วว่าเหตุการณ์ที่เป็นอิสระคืออะไรต่อไปในบทความนี้เกี่ยวกับสถิติสำหรับการเรียนรู้ของเครื่องให้เราเข้าใจความน่าจะเป็นแบบมีเงื่อนไข

ความน่าจะเป็นตามเงื่อนไข

เพื่อทำความเข้าใจความน่าจะเป็นแบบมีเงื่อนไขเรามาพูดคุยกันต่อด้วยตัวอย่างข้างต้น สถานะของการเป็นโรคอ้วนและสถานะของการประสบปัญหาหัวใจนั้นไม่ได้เป็นอิสระ หากการเป็นโรคอ้วนไม่ได้ส่งผลกระทบต่อปัญหาเกี่ยวกับหัวใจจำนวนผู้ป่วยโรคอ้วนและไม่อ้วนสำหรับผู้ที่มีปัญหาเกี่ยวกับหัวใจจะเท่ากัน

นอกจากนี้เราได้รับแจ้งว่าบุคคลนั้นมีปัญหาเกี่ยวกับหัวใจและเราต้องหาความน่าจะเป็นที่เขาเป็นโรคอ้วน ดังนั้นความน่าจะเป็นในกรณีนี้จึงมีเงื่อนไขว่าเขามีปัญหาเกี่ยวกับหัวใจ หากความน่าจะเป็นของเหตุการณ์ A ถูกกำหนดเงื่อนไขในเหตุการณ์ B เราจะแสดงเป็น

P (A | B)

ตอนนี้มีทฤษฎีบทที่ช่วยให้เราคำนวณความน่าจะเป็นตามเงื่อนไขนี้ได้ เรียกว่า กฎของ Bayes .

อนุกรม fibonacci ใน c ++

P (A | B) = P (A และ B) / P (B)

คุณสามารถตรวจสอบทฤษฎีบทนี้ได้โดยเสียบตัวอย่างที่เราเพิ่งพูดถึง หากคุณเข้าใจแล้วคุณสามารถเริ่มต้นด้วยสิ่งต่อไปนี้ - ไร้เดียงสา Bayes . ใช้ความน่าจะเป็นแบบมีเงื่อนไขเพื่อจำแนกว่าอีเมลเป็นสแปมหรือไม่ สามารถดำเนินการจำแนกประเภทอื่น ๆ ได้อีกมากมาย แต่โดยพื้นฐานแล้วความน่าจะเป็นแบบมีเงื่อนไขเป็นหัวใจสำคัญของ .

สถิติ:

สถิติคือ ใช้ในการสรุปและทำการอนุมานเกี่ยวกับจุดข้อมูลจำนวนมาก ใน Data Science และ Machine Learning คุณมักจะเจอคำศัพท์ต่อไปนี้

  • มาตรการศูนย์กลาง
  • การแจกแจง (โดยเฉพาะอย่างยิ่งปกติ)

มาตรการส่วนกลางและมาตรการสเปรด

หมายถึง:

ค่าเฉลี่ยเป็นเพียงไฟล์ ค่าเฉลี่ยของตัวเลข . ในการหาค่าเฉลี่ยคุณต้องรวมตัวเลขและหารด้วยจำนวนตัวเลข ตัวอย่างเช่นค่าเฉลี่ยของ [1,2,3,4,5] คือ 15/5 = 3

mean-statistics-for-machine-learning

ค่ามัธยฐาน:

มัธยฐานคือ องค์ประกอบตรงกลางของชุดตัวเลข เมื่อเรียงลำดับจากน้อยไปมาก ตัวอย่างเช่นตัวเลข [1,2,4,3,5] จะเรียงลำดับจากน้อยไปมาก [1,2,3,4,5] ค่ากลางคือ 3 ค่ามัธยฐานคือ 3 แต่ถ้าจำนวนของตัวเลขเป็นเลขคู่จึงไม่มีเลขกลางล่ะ? ในกรณีนี้ให้คุณหาค่าเฉลี่ยของจำนวนกลางสุดสองตัว สำหรับลำดับของตัวเลข 2n จากน้อยไปมากให้หาค่าเฉลี่ยที่ n และ (n + 1)จำนวนที่จะได้รับค่ามัธยฐาน ตัวอย่าง - [1,2,3,4,5,6] มีค่ามัธยฐาน (3 + 4) / 2 = 3.5

โหมด:

โหมดเป็นเพียงไฟล์ หมายเลขที่พบบ่อยที่สุดในชุดตัวเลข . ตัวอย่างเช่นโหมดของ [1,2,3,3,4,5,5,5] คือ 5

ความแปรปรวน:

ความแปรปรวนไม่ใช่ตัววัดศูนย์กลาง มันวัด ข้อมูลของคุณกระจายไปตามค่าเฉลี่ยอย่างไร . เป็นปริมาณ

xคือค่าเฉลี่ยของเลข N คุณหาจุดลบค่าเฉลี่ยหากำลังสองของผลต่างนี้ ทำสิ่งนี้สำหรับตัวเลข N ทั้งหมดแล้วหาค่าเฉลี่ย รากที่สองของความแปรปรวนเรียกว่าส่วนเบี่ยงเบนมาตรฐาน ต่อไปในบทความนี้เกี่ยวกับสถิติสำหรับการเรียนรู้ของเครื่องให้เราเข้าใจการแจกแจงปกติ

การกระจายปกติ

การกระจายช่วยเรา ทำความเข้าใจว่าข้อมูลของเราแพร่กระจายอย่างไร . ตัวอย่างเช่นในกลุ่มตัวอย่างอายุเราอาจมีคนหนุ่มสาวมากกว่าผู้สูงอายุและด้วยเหตุนี้ค่านิยมที่น้อยกว่าค่านิยมที่มากกว่า แต่เราจะกำหนดการกระจายได้อย่างไร? ลองพิจารณาตัวอย่างด้านล่าง

แกน y แสดงถึงความหนาแน่น โหมดของการกระจายนี้คือ 30 เนื่องจากเป็นจุดสูงสุดและบ่อยที่สุด เรายังสามารถหาค่ามัธยฐาน ค่ามัธยฐานอยู่ที่จุดบนแกน x ซึ่งครอบคลุมพื้นที่ครึ่งหนึ่งใต้เส้นโค้ง พื้นที่ภายใต้การแจกแจงปกติเท่ากับ 1 เนื่องจากผลรวมของความน่าจะเป็นของเหตุการณ์ทั้งหมดคือ 1 ตัวอย่างเช่น

ค่ามัธยฐานในกรณีข้างต้นคือประมาณ 4 ซึ่งหมายความว่าพื้นที่ใต้เส้นโค้งก่อน 4 จะเหมือนกับหลัง 4 ลองพิจารณาอีกตัวอย่างหนึ่ง

เราเห็นการแจกแจงปกติสามแบบ สีน้ำเงินและสีแดงมีค่าเฉลี่ยเท่ากัน สีแดงมีความแปรปรวนมากกว่า ดังนั้นมันจึงกระจายออกไปมากกว่าสีฟ้า แต่เนื่องจากพื้นที่ต้องเป็น 1 จุดสูงสุดของเส้นโค้งสีแดงจึงสั้นกว่าเส้นโค้งสีน้ำเงินเพื่อให้พื้นที่คงที่

หวังว่าคุณจะเข้าใจสถิติพื้นฐานและการแจกแจงปกติ ต่อไปในบทความเกี่ยวกับสถิติสำหรับการเรียนรู้ของเครื่องให้เราเรียนรู้เกี่ยวกับพีชคณิตเชิงเส้น

พีชคณิตเชิงเส้น

AI สมัยใหม่จะเป็นไปไม่ได้หากไม่มี Linear Algebra มันเป็นแกนกลางของ การเรียนรู้เชิงลึก และถูกนำมาใช้แม้ในอัลกอริทึมง่ายๆเช่น . มาเริ่มกันเลยโดยไม่ต้องรออีกต่อไป

คุณต้องคุ้นเคยกับเวกเตอร์ พวกมันเป็นตัวแทนรูปทรงเรขาคณิตในอวกาศ ตัวอย่างเช่นเวกเตอร์ [3,4] มี 3 หน่วยตามแกน x และ 4 หน่วยตามแกน y พิจารณาภาพต่อไปนี้ -

เวกเตอร์ d1 มี 0.707 หน่วยตามแกน x และ 0.707 หน่วยตามแกน y เวกเตอร์มี 1 มิติ จำเป็นต้องมีขนาดและทิศทาง ตัวอย่างเช่น,

ภาพด้านบนมีเวกเตอร์ (4,3) ขนาดของมันคือ 5 และทำ 36.9 องศาด้วยแกน x

ทีนี้เมทริกซ์คืออะไร? เมทริกซ์คืออาร์เรย์ของตัวเลขหลายมิติ ใช้ทำอะไร เราจะเห็นข้างหน้า แต่ก่อนอื่นมาดูวิธีการใช้งาน

เมทริกซ์

เมทริกซ์สามารถมีได้หลายมิติ ลองพิจารณาเมทริกซ์ 2 มิติ มีแถว (m) และคอลัมน์ (n) ดังนั้นจึงมีองค์ประกอบ m * n

ตัวอย่างเช่น,

เมทริกซ์นี้มี 5 แถวและ 5 คอลัมน์ เรียกมันว่า A. เพราะฉะนั้น A (2,3) คือรายการที่แถวที่สองและคอลัมน์ที่สามซึ่งก็คือ 8

ตอนนี้คุณรู้แล้วว่าเมทริกซ์คืออะไรให้เราดูการดำเนินการต่างๆของเมทริกซ์

การดำเนินการเมทริกซ์

การเพิ่มเมทริกซ์

เมทริกซ์สองตัวของ เหมือนกัน สามารถเพิ่มมิติข้อมูลได้ นอกจากนี้ยังเกิดขึ้นอย่างชาญฉลาด

การคูณสเกลาร์

เมทริกซ์สามารถคูณด้วยปริมาณสเกลาร์ การคูณดังกล่าวนำไปสู่ทุกรายการในเมทริกซ์ที่คูณด้วยสเกลาร์ สเกลาร์เป็นเพียงตัวเลข

การเปลี่ยนเมทริกซ์

เมทริกซ์ทรานสโพสนั้นง่ายมาก สำหรับเมทริกซ์ A (m, n) ให้ A เป็นทรานสโพส แล้ว

A '(i, j) = A (j, i)

ตัวอย่างเช่น,

การคูณเมทริกซ์

นี่อาจจะยุ่งยากกว่าการดำเนินการอื่น ๆ เล็กน้อย ก่อนที่เราจะเจาะลึกลงไปเรามากำหนดผลิตภัณฑ์จุดระหว่างเวกเตอร์สองตัวกัน

พิจารณาเวกเตอร์ X = [1,4,6,0] และเวกเตอร์ Y = [2,3,4,5] จากนั้นผลิตภัณฑ์ดอทระหว่าง X และ Y จะถูกกำหนดเป็น

การค้นหาไบนารีใน java คืออะไร

X.Y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38

ดังนั้นมันคือการคูณและการบวกอย่างชาญฉลาด ตอนนี้ลองพิจารณาเมทริกซ์สองตัว A (m, n) และ B (n, k) โดยที่ m, n, k คือมิติและด้วยเหตุนี้จึงเป็นจำนวนเต็ม เรากำหนดการคูณเมทริกซ์เป็น

ในตัวอย่างข้างต้นองค์ประกอบแรกของผลิตภัณฑ์ (44) ได้มาจากผลิตภัณฑ์ดอทของแถวแรกของเมทริกซ์ด้านซ้ายพร้อมกับคอลัมน์แรกของเมทริกซ์ด้านขวา ในทำนองเดียวกัน 72 ได้มาจากผลิตภัณฑ์ดอทของแถวแรกของเมทริกซ์ด้านซ้ายกับคอลัมน์ที่สองของเมทริกซ์ด้านขวา

โปรดทราบว่าสำหรับเมทริกซ์ด้านซ้ายจำนวนคอลัมน์ควรเท่ากับจำนวนแถวในคอลัมน์ด้านขวา ในกรณีของเราผลิตภัณฑ์ AB มีอยู่ แต่ไม่มี BA เนื่องจาก m ไม่เท่ากับ k สำหรับเมทริกซ์สองเมทริกซ์ A (m, n) และ B (n, k) ผลิตภัณฑ์ AB ถูกกำหนดและขนาดของผลิตภัณฑ์คือ (m, k) (ขนาดด้านนอกสุดของ (m, n), (n, k )). แต่ไม่ได้กำหนด BA ไว้เว้นแต่ m = k

ด้วยเหตุนี้เราจึงมาจบบทความเกี่ยวกับสถิติสำหรับการเรียนรู้ของเครื่อง ฉันหวังว่าคุณจะเข้าใจศัพท์เฉพาะของ Machine Learning อยู่บ้าง มันไม่ได้จบแค่นี้ เพื่อให้แน่ใจว่าคุณพร้อมในอุตสาหกรรมคุณสามารถดูหลักสูตรของ Edureka เกี่ยวกับ Data Science และ AI สามารถพบได้