เทคนิคการสร้างแบบจำลองในการวิเคราะห์ธุรกิจด้วย R



บล็อกนี้จะแนะนำสั้น ๆ เกี่ยวกับเทคนิคการสร้างแบบจำลองใน Business Analytics กับ R

เทคนิคการสร้างแบบจำลองต่างๆ:

เราสามารถแบ่งปัญหาออกเป็นกระบวนการย่อย ๆ :





การจัดหมวดหมู่ - คือที่ที่เราจัดประเภทข้อมูล เช่น. โรคทุกโรคมีพฤติกรรมบางอย่างและเราสามารถจำแนกได้เพิ่มเติม

ตัวอย่างเช่นโรคลดภูมิคุ้มกันโรคที่ทำให้ปวดศีรษะเป็นต้น



การถดถอย - เกี่ยวข้องกับการค้นหาความสัมพันธ์ระหว่างตัวแปรหลายตัว

ตัวอย่างเช่นน้ำหนักของมนุษย์สัมพันธ์กับส่วนสูงของเขาอย่างไร

ความผิดปกติการตรวจจับ - โดยพื้นฐานแล้วมีความผันผวน



ตัวอย่างเช่นในกรณีไฟฟ้าแรงสูงหรือแรงดันไฟฟ้าต่ำ

อีกตัวอย่างหนึ่งอาจรวมถึงพฤติกรรมที่มีการควบคุมซึ่งเกี่ยวข้องกับการขับรถในด้านขวาหรือด้านซ้ายตามประเทศ ความผิดปกติในที่นี้คือใครบางคนขับรถมาจากฝั่งตรงข้าม

อีกตัวอย่างหนึ่งอาจเป็นการบุกรุกเครือข่าย ที่นี่ผู้ใช้ที่ได้รับการรับรองความถูกต้องจะเข้าสู่เว็บไซต์ของ บริษัท ของคุณจากนั้นหากมีผู้เข้าสู่ระบบที่ไม่ผ่านการตรวจสอบสิทธิ์แสดงว่าAn0moly.

ความสำคัญของคุณสมบัติ - โดยทั่วไปจะให้คุณสมบัติหลายอย่างเช่นส่วนสูงน้ำหนักอุณหภูมิการเต้นของหัวใจ สิ่งที่ควรทราบก็คือคุณลักษณะทั้งหมดนี้มีความสำคัญต่องาน

ตัวอย่างเช่นมีคนพยายามคาดเดาว่าบุคคลจะไปถึงที่ทำงานในเวลาใด แต่ละแอตทริบิวต์มีบทบาทสำคัญ แต่แอตทริบิวต์ทั้งหมดไม่สำคัญ

กฎการสมาคม - ในแง่ที่ง่ายกว่านั้นคือการวิเคราะห์หรือทำนายพฤติกรรมถัดไปโดยที่มันจะหมุนรอบเครื่องมือแนะนำ

ฟังก์ชันใน sql คืออะไร

ตัวอย่างเช่นคนซื้อขนมปังอาจซื้อนมด้วย หากเราวิเคราะห์พฤติกรรมการจับจ่ายในอดีตสินค้าทั้งหมดในตะกร้ามีความสัมพันธ์กัน ในกรณีนี้อาจมีความเป็นไปได้ที่คนที่ซื้อขนมปังจะซื้อนมด้วย

การทำคลัสเตอร์ - เป็นหนึ่งในเทคนิคที่เก่าแก่ที่สุดในสถิติ ในความเป็นจริงเราสามารถสร้างแบบจำลองปัญหาใด ๆ ได้เสมอไม่ว่าจะเป็นการจัดประเภทหรือการจัดกลุ่มซึ่งหมายถึงการจัดกลุ่มเอนทิตีที่คล้ายคลึงกัน

ตัวอย่างเช่น:

1) ใช้ตะกร้าแอปเปิ้ลและส้มซึ่งเราสามารถแยกแอปเปิ้ลออกจากส้มได้

2) กรณีการใช้งานที่สำคัญสำหรับการทำคลัสเตอร์คือการดูแลสุขภาพ สถิติและการวิเคราะห์เกือบทั้งหมดเริ่มต้นด้วยกรณีการใช้งานด้านการดูแลสุขภาพ หากต้องการเจาะลึกลงไปมีคำที่เรียกว่ากลุ่มประชากรตามรุ่น (คนที่มีโรคคล้ายกัน) เพื่อให้สามารถศึกษาแยกจากลูกค้าที่มีอยู่ได้ ตัวอย่างเช่นถ้าคน 10 คนเป็นไข้และปวดหัวอีก 10 คนเราจะหาสิ่งที่พบบ่อยระหว่างพวกเขาและสร้างยา

คุณสมบัติการสกัด - ในความแม่นยำในการแยกคุณลักษณะความถูกต้องและความล้มเหลวค่อนข้างเกี่ยวข้อง กล่าวอีกนัยหนึ่งการแยกคุณลักษณะสามารถเรียกได้ว่าเป็นการจดจำรูปแบบ

ตัวอย่างเช่น:

ในการค้นหาของ Google เมื่อผู้ใช้ป้อนคำศัพท์จะมีผลลัพธ์ขึ้นมา ตอนนี้คำถามสำคัญที่จะถามคือมันรู้ได้อย่างไรว่าหน้าใดเกี่ยวข้องและไม่เกี่ยวข้องกับคำนี้ สิ่งนี้สามารถตอบได้ด้วยการแยกคุณลักษณะและการจดจำรูปแบบซึ่งจะเพิ่มคุณสมบัติที่โดดเด่น สมมติว่ามีการให้ภาพถ่ายกล้องบางตัวตรวจจับใบหน้าเน้นใบหน้าเพื่อให้ได้ภาพที่สวยงามซึ่งยังใช้การจดจำคุณลักษณะ

การลบล้างและการโอเวอร์โหลดใน java

การเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่มีผู้ดูแล

ถึง) หมวดการทำนาย - เทคนิคนี้รวมถึงการถดถอยโลจิสติกส์โครงข่ายประสาทเทียมและต้นไม้แห่งการตัดสินใจ ตัวอย่างบางส่วน ได้แก่ การตรวจจับการฉ้อโกง (ที่คอมพิวเตอร์เรียนรู้และคาดการณ์การฉ้อโกงครั้งต่อไปจากประวัติการฉ้อโกงครั้งก่อน) ในการเรียนรู้ที่ไม่มีผู้ดูแลเราไม่สามารถทำนายด้วยตัวอย่างได้เนื่องจากไม่มีข้อมูลในอดีต

ข) หมวดหมู่การจัดหมวดหมู่ - ยกตัวอย่างไม่ว่าธุรกรรมจะฉ้อโกงหรือไม่ก็ตามจะเข้าสู่หมวดหมู่การจัดประเภท ที่นี่เราใช้ข้อมูลในอดีตและจัดประเภทด้วยโครงสร้างการตัดสินใจหรือในกรณีที่เราไม่ได้ใช้ข้อมูลประวัติใด ๆ เลยจากนั้นเราจะเริ่มต้นข้อมูลโดยตรงและพยายามใช้ประโยชน์จากคุณลักษณะของเราเอง ตัวอย่างเช่นหากเราจำเป็นต้องรู้จักพนักงานที่มีแนวโน้มจะลาออกจากองค์กรหรือมีแนวโน้มที่จะอยู่ต่อ ในกรณีนี้เป็นองค์กรใหม่ที่เราไม่สามารถใช้ข้อมูลประวัติได้เราสามารถใช้การทำคลัสเตอร์เพื่อดึงข้อมูลได้ตลอดเวลา

ค) หมวดหมู่การสำรวจ - นี่เป็นวิธีการตรงไปตรงมาซึ่งมาพร้อมกับความหมายของข้อมูลขนาดใหญ่ ในการเรียนรู้ที่ไม่ได้รับการดูแลเรียกว่าองค์ประกอบหลักการและการจัดกลุ่ม

ง) หมวดหมู่ผู้สนใจ - ที่นี่มีองค์ประกอบหลายอย่างที่เกี่ยวข้องเช่นการขายข้าม / ขึ้นการวิเคราะห์ตะกร้าตลาด ในการวิเคราะห์ตะกร้าไม่มีการเรียนรู้ภายใต้การดูแลเนื่องจากไม่มีข้อมูลในอดีต ดังนั้นเราจึงใช้ข้อมูลโดยตรงและค้นหาการเชื่อมโยงการจัดลำดับและการวิเคราะห์ปัจจัย

มีคำถามสำหรับเรา? พูดถึงพวกเขาในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป

กระทู้ที่เกี่ยวข้อง: