ทำไมคุณควรผสมผสานเมื่อคุณสามารถเข้าร่วม Tableau ได้แล้ว?



การผสมผสานข้อมูลใน Tableau - วิธีการที่ใช้เมื่อมีข้อมูลที่เกี่ยวข้องในแหล่งข้อมูลหลายแหล่งซึ่งคุณต้องการวิเคราะห์ร่วมกันในมุมมองเดียว

ในโลกที่สร้างและใช้ข้อมูล 2.5 quintillion ไบต์ต่อวันองค์กรต่างๆต้องมองหาวิธีการใหม่ ๆ ในการแปลงและรวมข้อมูลเพื่อให้ได้ประสิทธิภาพสูงสุด วิธีหนึ่งในการรวมข้อมูลคือ การผสมผสานข้อมูลใน Tableau .

ตอนนี้เนื่องจากสิ่งนี้ตอบสนองจุดประสงค์ที่สำคัญเช่นนี้ในวงจรข้อมูลขององค์กรใดองค์กรหนึ่งจึงเป็นโมดูลที่สำคัญมากในส่วนใหญ่ . ในบล็อกนี้เราจะพูดถึงแนวคิดต่อไปนี้:





ทำไมคุณถึงต้องการ Data Blending ใน Tableau

สมมติว่าคุณเป็น ตารางนักพัฒนา ใครมีข้อมูลธุรกรรมที่เก็บไว้ใน Salesforce และข้อมูลโควต้าที่เก็บไว้ใน Access ข้อมูลที่คุณต้องการรวมจะถูกเก็บไว้ในฐานข้อมูลที่แตกต่างกันและความละเอียดของข้อมูลที่จับในแต่ละตารางจะแตกต่างกันในแหล่งข้อมูลทั้งสองแหล่งดังนั้นการผสมผสานข้อมูลจึงเป็นวิธีที่ดีที่สุดในการรวมข้อมูลนี้

การผสมข้อมูลมีประโยชน์ภายใต้เงื่อนไขต่อไปนี้:



  1. คุณต้องการรวมข้อมูลจากฐานข้อมูลอื่นที่ไม่สนับสนุนโดยการรวมข้ามฐานข้อมูล

    การรวมข้ามฐานข้อมูลไม่รองรับการเชื่อมต่อกับคิวบ์ (เช่น Oracle Essbase) หรือการเชื่อมต่อแบบแยกเฉพาะบางส่วน (เช่น Google Analytics) ในกรณีนี้ให้ตั้งค่าแหล่งข้อมูลแต่ละแหล่งสำหรับข้อมูลที่คุณต้องการวิเคราะห์จากนั้นใช้การผสมผสานข้อมูลเพื่อรวมแหล่งข้อมูลในแผ่นงานเดียว

  2. ข้อมูลอยู่ในระดับที่แตกต่างกันของรายละเอียด

    บางครั้งชุดข้อมูลหนึ่งจะรวบรวมข้อมูลโดยใช้หลาย ๆ ระดับของรายละเอียด กล่าวคือมีความละเอียดมากกว่าหรือน้อยกว่าชุดข้อมูลอื่น ๆ

    ตัวอย่างเช่นสมมติว่าคุณกำลังวิเคราะห์ข้อมูลธุรกรรมและข้อมูลโควต้า ข้อมูลธุรกรรมอาจรวบรวมธุรกรรมทั้งหมด อย่างไรก็ตามข้อมูลโควต้าอาจรวมธุรกรรมในระดับไตรมาส เนื่องจากค่าธุรกรรมถูกบันทึกไว้ในระดับรายละเอียดที่แตกต่างกันในแต่ละชุดข้อมูลคุณจึงควรใช้การผสมผสานข้อมูลเพื่อรวมข้อมูล



Data Blending ใน Tableau คืออะไร?

การผสมผสานข้อมูลเป็นคุณสมบัติที่มีประสิทธิภาพมากใน คณะกรรมการ . ใช้เมื่อมีข้อมูลที่เกี่ยวข้องในแหล่งข้อมูลหลายแหล่งซึ่งคุณต้องการวิเคราะห์ร่วมกันในมุมมองเดียว เป็นวิธีการรวมข้อมูลที่เสริมตารางข้อมูลจากแหล่งข้อมูลหนึ่งกับคอลัมน์ของข้อมูลจากแหล่งข้อมูลอื่น

โดยปกติคุณจะใช้การรวมเพื่อทำการรวมข้อมูลประเภทนี้ แต่ก็มีหลายครั้งขึ้นอยู่กับปัจจัยต่างๆเช่นประเภทของข้อมูลและความละเอียดของข้อมูลเมื่อใช้การผสมผสานข้อมูลจะดีกว่า

แตกต่างจากการเข้าร่วมข้อมูลอย่างไร?

การผสมข้อมูลจำลองการรวมซ้ายแบบดั้งเดิม ความแตกต่างที่สำคัญระหว่างทั้งสองคือ เมื่อไหร่ การเข้าร่วมจะดำเนินการโดยคำนึงถึงการรวม

เข้าร่วมทางซ้าย

เมื่อคุณใช้การรวมด้านซ้ายเพื่อรวมข้อมูลแบบสอบถามจะถูกส่งไปยังฐานข้อมูลที่ดำเนินการรวม การใช้การรวมซ้ายจะส่งคืนแถวทั้งหมดจากตารางด้านซ้ายและแถวใด ๆ จากตารางด้านขวาที่มีการจับคู่แถวที่ตรงกันในตารางด้านซ้าย ผลลัพธ์ของการเข้าร่วมจะถูกส่งกลับไปและรวบรวมโดย Tableau

ตัวอย่างเช่นสมมติว่าคุณมีตารางต่อไปนี้ ถ้าคอลัมน์ทั่วไปคือ รหัสผู้ใช้ การรวมด้านซ้ายจะนำข้อมูลทั้งหมดจากตารางด้านซ้ายรวมถึงข้อมูลทั้งหมดจากตารางด้านขวาเนื่องจากแต่ละแถวมีการจับคู่แถวที่ตรงกันในตารางด้านซ้าย

model view controller java ตัวอย่าง

การเข้าร่วมข้อมูล - การผสมผสานข้อมูลใน Tableau - Edurekaการผสมผสานข้อมูล

เมื่อคุณใช้การผสมข้อมูลเพื่อรวมข้อมูลแบบสอบถามจะถูกส่งไปยังฐานข้อมูลสำหรับแหล่งข้อมูลแต่ละแหล่งที่ใช้บนแผ่นงาน ผลลัพธ์ของการสืบค้นรวมถึงข้อมูลที่รวบรวมจะถูกส่งกลับและรวมกันโดย Tableau มุมมองใช้แถวทั้งหมดจากแหล่งข้อมูลหลักตารางด้านซ้ายและแถวที่รวมจากแหล่งข้อมูลรองตารางด้านขวาโดยยึดตามมิติข้อมูลของเขตข้อมูลการเชื่อมโยง

คุณสามารถเปลี่ยนฟิลด์การเชื่อมโยงหรือเพิ่มฟิลด์การเชื่อมโยงเพิ่มเติมเพื่อรวมแถวข้อมูลอื่นหรือแถวเพิ่มเติมจากแหล่งข้อมูลทุติยภูมิในการผสมผสานโดยเปลี่ยนค่าที่รวม

ตัวอย่างเช่นสมมติว่าคุณมีตารางต่อไปนี้ หากฟิลด์การเชื่อมโยงเป็น รหัสผู้ใช้ ทั้งสองตารางที่ผสมข้อมูลของคุณจะใช้ข้อมูลทั้งหมดจากตารางด้านซ้ายและเสริมตารางด้านซ้ายด้วยข้อมูลจากตารางด้านขวา ในกรณีนี้ค่าทั้งหมดไม่สามารถเป็นส่วนหนึ่งของตารางผลลัพธ์ได้เนื่องจากสิ่งต่อไปนี้:

  • แถวในตารางด้านซ้ายไม่มีแถวที่ตรงกันในตารางด้านขวาตามที่ระบุโดยค่า null
  • มีค่าที่เกี่ยวข้องหลายค่าในแถวในตารางด้านขวาตามที่ระบุด้วยเครื่องหมายดอกจัน (*)

สมมติว่าคุณมีตารางเดียวกันกับด้านบน แต่แหล่งข้อมูลรองมีเขตข้อมูลใหม่ที่เรียกว่า วัตถุประสงค์ . อีกครั้งหากฟิลด์การเชื่อมโยงคือ รหัสผู้ใช้ การผสมผสานข้อมูลของคุณจะนำข้อมูลทั้งหมดจากตารางด้านซ้ายและเสริมด้วยข้อมูลจากตารางด้านขวา ในกรณีนี้คุณจะเห็นค่าว่างและเครื่องหมายดอกจันเหมือนกันในตัวอย่างก่อนหน้านี้นอกเหนือจากสิ่งต่อไปนี้:

  • เพราะว่า วัตถุประสงค์ ฟิลด์เป็นหน่วยวัดคุณจะเห็นค่าแถวสำหรับวัตถุประสงค์รวมฟิลด์ก่อนที่ข้อมูลในตารางด้านขวาจะรวมกับข้อมูลในตารางด้านซ้าย
  • เช่นเดียวกับตัวอย่างก่อนหน้านี้แถวในตารางด้านซ้ายไม่มีแถวที่สอดคล้องกันสำหรับ วัตถุประสงค์ ตามที่ระบุโดยค่า null ที่สอง

เมื่อใดที่จะทดแทนการเข้าร่วมสำหรับ การผสมผสาน

1. ข้อมูลต้องทำความสะอาด

หากตารางของคุณไม่จับคู่กันอย่างถูกต้องหลังจากการรวมให้ตั้งค่าแหล่งข้อมูลสำหรับแต่ละตารางทำการปรับแต่งที่จำเป็น (นั่นคือเปลี่ยนชื่อคอลัมน์เปลี่ยนชนิดข้อมูลคอลัมน์สร้างกลุ่มใช้การคำนวณ ฯลฯ ) และ จากนั้นใช้การผสมข้อมูลเพื่อรวมข้อมูล

2. การเข้าร่วมทำให้เกิดข้อมูลที่ซ้ำกัน

ข้อมูลที่ซ้ำกันหลังจากการรวมเป็นอาการของข้อมูลในระดับรายละเอียดที่แตกต่างกัน หากคุณสังเกตเห็นข้อมูลที่ซ้ำกันแทนที่จะสร้างการรวมให้ใช้การผสมผสานข้อมูลเพื่อผสมผสานกับมิติข้อมูลทั่วไปแทน

3. คุณมีข้อมูลมากมาย

โดยทั่วไปจะแนะนำให้รวมข้อมูลจากฐานข้อมูลเดียวกัน ฐานข้อมูลจะจัดการการเข้าร่วมซึ่งช่วยให้การเข้าร่วมสามารถใช้ประโยชน์จากความสามารถดั้งเดิมของฐานข้อมูลบางอย่างได้ อย่างไรก็ตามหากคุณกำลังทำงานกับข้อมูลจำนวนมากการรวมเข้าด้วยกันอาจทำให้ฐานข้อมูลเครียดและส่งผลต่อประสิทธิภาพอย่างมาก ในกรณีนี้การผสมข้อมูลอาจช่วยได้ เนื่องจาก Tableau จัดการการรวมข้อมูลหลังจากรวบรวมข้อมูลจึงมีข้อมูลที่จะรวมน้อยกว่า เมื่อมีข้อมูลที่จะรวมน้อยลงโดยทั่วไปประสิทธิภาพจะดีขึ้น

การผสมผสานข้อมูลของคุณใน Tableau

คุณสามารถใช้การผสมผสานข้อมูลเมื่อคุณมีข้อมูลในแหล่งข้อมูลแยกต่างหากที่คุณต้องการวิเคราะห์ร่วมกันในแผ่นงานเดียว Tableau มีแหล่งข้อมูลในตัวสองแหล่งที่ชื่อ ตัวอย่างซุปเปอร์สโตร์ และ ตัวอย่างกาแฟ chain.mdb ซึ่งจะใช้เพื่อแสดงการผสมข้อมูล

ขั้นตอนที่ 1: เชื่อมต่อกับข้อมูลของคุณและตั้งค่าแหล่งข้อมูล

  • เชื่อมต่อกับชุดข้อมูลและตั้งค่าแหล่งข้อมูลในหน้าแหล่งข้อมูล ฉันแหล่งข้อมูลที่สร้างขึ้น ตัวอย่างกาแฟ chain.mdb ,ซึ่งเป็นไฟล์ฐานข้อมูล MS Access จะใช้เพื่อแสดงการผสมข้อมูล
  • ไปที่ ข้อมูล > แหล่งข้อมูลใหม่เชื่อมต่อกับข้อมูลชุดที่สองตัวอย่างนี้ใช้ไฟล์ ตัวอย่าง - ซูเปอร์สโตร์ แหล่งข้อมูล. ทีแม่ไก่ตั้งค่าแหล่งข้อมูล
  • คลิกที่แท็บแผ่นงานเพื่อเริ่มสร้างมุมมองของคุณ

ขั้นตอนที่ 2: กำหนดแหล่งข้อมูลหลัก

  • ลากอย่างน้อยหนึ่งเขตข้อมูลจากแหล่งข้อมูลหลักของคุณไปยังมุมมองเพื่อกำหนดให้เป็นแหล่งข้อมูลหลัก ใน ข้อมูล บานหน้าต่างคลิกแหล่งข้อมูลที่คุณต้องการกำหนดให้เป็นแหล่งข้อมูลหลัก ในตัวอย่างนี้ ตัวอย่างร้านกาแฟ ถูกเลือก
  • ภาพหน้าจอต่อไปนี้แสดงตารางและการรวมต่างๆที่มีอยู่ในไฟล์

วิธีการต่อท้าย java

ขั้นตอนที่ 3: กำหนดแหล่งข้อมูลรอง

  • เขตข้อมูลที่ใช้ในมุมมองจากแหล่งข้อมูลที่ไม่ใช่แหล่งข้อมูลหลักหรือลิงก์ที่ใช้งานอยู่จะกำหนดแหล่งข้อมูลที่ตามมาเป็นแหล่งข้อมูลรองโดยอัตโนมัติ ในกรณีนี้ตัวอย่าง Superstore

ขั้นตอนที่ 4: ผสมผสานข้อมูล

  • ตอนนี้คุณสามารถรวมข้อมูลจากทั้งสองแหล่งตามมิติข้อมูลทั่วไป ( สถานะ , ในกรณีนี้). โปรดทราบว่ารูปภาพลิงก์ขนาดเล็กจะปรากฏถัดจากมิติข้อมูล - สถานะ สิ่งนี้บ่งชี้มิติร่วมระหว่างแหล่งข้อมูลทั้งสอง
  • สมมติว่าคุณสร้างแผนภูมิแท่งด้วย อัตราส่วนกำไร ในชั้นวางคอลัมน์และ สถานะ ใน Row Shelf แผนภูมิจะแสดงให้เห็นว่าอัตราส่วนกำไรแตกต่างกันอย่างไรสำหรับแต่ละรัฐทั้งในซูเปอร์สโตร์และร้านกาแฟในเครือ

ข้อ จำกัด ของการผสมผสานข้อมูลใน Tableau

  1. มีข้อ จำกัด ในการผสมผสานข้อมูลบางอย่างเกี่ยวกับมวลรวมที่ไม่ใช่สารเติมแต่งเช่น ปานกลาง และ RAWSQLAGG .
  2. การผสมผสานข้อมูลทำให้ความเร็วของการสืบค้นลดลงในรายละเอียดสูง
  3. เมื่อคุณพยายามจัดเรียงตามเขตข้อมูลจากการคำนวณที่ใช้ข้อมูลผสมเขตข้อมูลจากการคำนวณจะไม่อยู่ในรายการแบบหล่นลงเขตข้อมูลของกล่องโต้ตอบเรียงลำดับ
  4. แหล่งข้อมูลคิวบ์สามารถใช้เป็นแหล่งข้อมูลหลักสำหรับการผสมข้อมูลใน Tableau เท่านั้น ไม่สามารถใช้เป็นแหล่งข้อมูลทุติยภูมิได้

ฉันหวังว่าทุกคนจะมีความคิดที่ยุติธรรมเกี่ยวกับ การผสมผสานข้อมูลใน Tableau จากบล็อกนี้ หิวสำหรับความรู้เพิ่มเติม? ไม่ต้องกังวลวิดีโอนี้จะช่วยให้คุณเข้าใจแนวคิดได้ดีขึ้น