กระบวนการวิเคราะห์เชิงทำนายในการวิเคราะห์ธุรกิจด้วย R



บล็อกนี้ให้แนวคิดสั้น ๆ เกี่ยวกับกระบวนการ Predictive Analytics ใน Business Analytics ด้วย R

กระบวนการสร้างแบบจำลองทั่วไป:

ในขั้นตอนการสร้างแบบจำลองทั่วไปสิ่งสำคัญคือต้องเริ่มวาดสมมติฐาน ได้รับ RFP (คำขอข้อเสนอ) จากนั้นจึงมีการวาดสมมติฐาน





  1. กำหนดแหล่งข้อมูลที่เหมาะสม - ที่นี่ลูกค้าอาจให้แหล่งข้อมูลถ้าไม่เราต้องหาแหล่งข้อมูล จากสถานการณ์สมมติที่เราพยายามประเมินว่าใครจะชนะการเลือกตั้งการวิเคราะห์ข้อมูลสาธารณะจะทำโดยใช้แหล่งที่มาซึ่งรวมถึงโซเชียลมีเดียช่องข่าวหรือความคิดเห็นสาธารณะ เรายังต้องเข้าใจจำนวนข้อมูลที่จำเป็นในการวิเคราะห์ปัญหา ในกรณีนี้เรามักมองหาตัวอย่างขนาดใหญ่เนื่องจากเป็นกรณีการเลือกตั้ง ในทางกลับกันหากทำการวิเคราะห์เกี่ยวกับการดูแลสุขภาพก็เป็นเรื่องยากที่จะไปหาประชากรจำนวนมากเนื่องจากมีความเป็นไปได้ที่จะมีคนไม่เพียงพอที่จะตรวจสอบสมมติฐาน นอกจากนี้คุณภาพของข้อมูลก็มีความสำคัญมาก
  2. แยกข้อมูล - ตัวอย่างเช่นหากเราใช้ตัวอย่างประชากรเราสามารถดูคุณลักษณะต่างๆเช่นรายได้สูงรายได้ต่ำอายุประชากรในวัยทำงาน (นอกสถานที่ / นอกสถานที่) ผู้อยู่อาศัย NRI ความครอบคลุมของโรงพยาบาล ฯลฯ เพื่อเริ่มการศึกษา . ที่นี่เราอาจไม่จำเป็นต้องมีคุณลักษณะมากมายสำหรับสมมติฐาน เราเข้าใจดีว่าคุณลักษณะต่างๆเช่นรายได้สูงและต่ำอาจไม่ใช่ปัจจัยที่เอื้อต่อการตัดสินว่าใครจะชนะการเลือกตั้ง แต่อายุสามารถสร้างความแตกต่างได้เนื่องจากจะนับได้โดยตรงว่าจะมีคนโหวตกี่คน หลายครั้งเราอาจยกเว้นแอตทริบิวต์ที่ใช้น้อยหรือรวมแอตทริบิวต์ที่เป็นประโยชน์ อาจผิดพลาดได้ในทั้งสองกรณี นั่นคือเหตุผลว่าทำไมการวิเคราะห์จึงเป็นเรื่องท้าทาย
  3. นวดข้อมูลให้พอดีกับเครื่องมือ - เนื่องจากเครื่องมือบางชนิดไม่สามารถรับข้อมูลทั้งหมดได้ เครื่องมือบางอย่างยอมรับเฉพาะข้อมูล CSV หรือข้อมูล excel การขาดเครื่องมือถือเป็นความท้าทาย
  4. เรียกใช้การวิเคราะห์ - การดำเนินการนี้สามารถทำได้โดยใช้เทคนิคการวิเคราะห์มากมาย
  5. วาดข้อสรุป - การวิเคราะห์ให้ตัวเลขที่แม่นยำ แต่ขึ้นอยู่กับผู้ใช้ที่จะได้ข้อสรุปจากตัวเลขเหล่านี้ เช่นถ้าบอกว่า 10% หรือ 20% เราต้องเข้าใจว่าหมายถึงอะไร? มันได้มาจากความสัมพันธ์ระหว่าง Attribute A และ Attribute B หรือไม่?
  6. นำผลลัพธ์ไปใช้ - สิ่งสำคัญคือต้องนำข้อสรุปไปใช้เพื่อให้เห็นผลลัพธ์ในธุรกิจ เช่นอาจสรุปได้ว่า 'คนซื้อร่มในฤดูฝน' ซึ่งอาจส่งผลให้เกิดธุรกิจมากขึ้น ที่นี่เราจำเป็นต้องดำเนินการตามข้อสรุปที่เราทำร่มวางจำหน่ายในร้านค้า แต่อาจมีปัญหาในการจัดการ ช่วงเวลาที่สถิติให้ผลลัพธ์การใช้งานอาจผิดพลาด
  7. ติดตามความคืบหน้า - ขั้นตอนสุดท้ายที่นี่การตรวจสอบมีบทบาทสำคัญ การตรวจสอบอาจผิดพลาดเนื่องจากมีองค์กรจำนวนไม่น้อยที่ต้องการติดตามความคืบหน้าและถือเป็นขั้นตอนเล็กน้อย แต่การเฝ้าติดตามมีความสำคัญเนื่องจากเราสามารถเข้าใจได้ว่าการวิจัยและข้อสรุปของเรามุ่งไปในทิศทางที่ถูกต้องหรือไม่

ตรวจสอบบทความนี้ด้วย' ความสัมพันธ์ไม่ได้หมายถึงสาเหตุ 'ซึ่งให้ข้อมูลเชิงลึกว่านักวิเคราะห์ผิดพลาดได้อย่างไร ประเด็นสำคัญที่ควรทราบในแผนภูมินี้คือการดำเนินการวิเคราะห์เป็นขั้นตอนเดียวที่เครื่องจักรมีความรับผิดชอบและนอกเหนือจากนั้นขึ้นอยู่กับมนุษย์ที่จะกำหนดวิธีการวิจัยในท้ายที่สุด

มีคำถามสำหรับเรา? พูดถึงพวกเขาในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป



กระทู้ที่เกี่ยวข้อง: