Hive Data Models



แบบจำลองข้อมูล Hive มีส่วนประกอบต่อไปนี้เช่นฐานข้อมูลตารางพาร์ติชันและที่เก็บข้อมูลหรือคลัสเตอร์ไฮฟ์รองรับประเภทพื้นฐานเช่นจำนวนเต็มลอยคู่และสตริง

Hive เป็นระบบคลังข้อมูลสำหรับ Hadoop ที่อำนวยความสะดวกในการสรุปข้อมูลการสืบค้นแบบเฉพาะกิจและการวิเคราะห์ชุดข้อมูลขนาดใหญ่ที่จัดเก็บในระบบไฟล์ที่เข้ากันได้กับ Hadoop กลุ่มจัดโครงสร้างข้อมูลให้เป็นแนวคิดฐานข้อมูลที่เข้าใจดีเช่นตารางแถวคอลัมน์และพาร์ติชัน รองรับประเภทดั้งเดิมเช่นจำนวนเต็มลอยคู่และสตริง Hive ยังรองรับ Associative Arrays, Lists, Structs และ Serialize และ Deserialized API ใช้เพื่อย้ายข้อมูลเข้าและออกจากตาราง





มาดูรายละเอียดของโมเดลข้อมูล Hive

ประเภทของชุดใน java

แบบจำลองข้อมูลไฮฟ์:

แบบจำลองข้อมูล Hive ประกอบด้วยส่วนประกอบต่อไปนี้:



  • ฐานข้อมูล
  • ตาราง
  • พาร์ทิชัน
  • ที่เก็บข้อมูลหรือคลัสเตอร์

พาร์ทิชัน:

พาร์ติชันหมายถึงการแบ่งตารางออกเป็นส่วนที่เป็นเม็ดเล็ก ๆ ตามค่าของคอลัมน์พาร์ติชันเช่น 'data' ซึ่งทำให้การสืบค้นข้อมูลส่วนต่างๆทำได้เร็วขึ้น

Hive Data Models

php เปลี่ยนสตริงเป็นอาร์เรย์

Partition คืออะไร? คีย์พาร์ติชันกำหนดวิธีจัดเก็บข้อมูล ที่นี่ค่าที่ไม่ซ้ำกันของคีย์พาร์ติชันแต่ละค่าจะกำหนดพาร์ติชันของตาราง พาร์ติชันตั้งชื่อตามวันที่เพื่อความสะดวก คล้ายกับ 'Block Splitting' ใน HDFS



ถัง:

ที่เก็บข้อมูลให้โครงสร้างพิเศษแก่ข้อมูลที่อาจใช้สำหรับการสืบค้นที่มีประสิทธิภาพ การรวมตารางสองตารางที่อยู่ในคอลัมน์เดียวกันรวมถึงคอลัมน์การเข้าร่วมสามารถนำไปใช้เป็นการเข้าร่วมด้านแผนที่ได้ การเก็บข้อมูลด้วย ID ที่ใช้หมายความว่าเราสามารถประเมินการสืบค้นที่อิงตามผู้ใช้ได้อย่างรวดเร็วโดยเรียกใช้บนกลุ่มตัวอย่างแบบสุ่มของผู้ใช้ทั้งหมด

มีคำถามสำหรับเรา? โปรดระบุไว้ในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป

tostring () วิธี java

กระทู้ที่เกี่ยวข้อง:

คำสั่ง Hive ที่เป็นประโยชน์