Hive เป็นระบบคลังข้อมูลสำหรับ Hadoop ที่อำนวยความสะดวกในการสรุปข้อมูลการสืบค้นแบบเฉพาะกิจและการวิเคราะห์ชุดข้อมูลขนาดใหญ่ที่จัดเก็บในระบบไฟล์ที่เข้ากันได้กับ Hadoop กลุ่มจัดโครงสร้างข้อมูลให้เป็นแนวคิดฐานข้อมูลที่เข้าใจดีเช่นตารางแถวคอลัมน์และพาร์ติชัน รองรับประเภทดั้งเดิมเช่นจำนวนเต็มลอยคู่และสตริง Hive ยังรองรับ Associative Arrays, Lists, Structs และ Serialize และ Deserialized API ใช้เพื่อย้ายข้อมูลเข้าและออกจากตาราง
มาดูรายละเอียดของโมเดลข้อมูล Hive
ประเภทของชุดใน java
แบบจำลองข้อมูลไฮฟ์:
แบบจำลองข้อมูล Hive ประกอบด้วยส่วนประกอบต่อไปนี้:
- ฐานข้อมูล
- ตาราง
- พาร์ทิชัน
- ที่เก็บข้อมูลหรือคลัสเตอร์
พาร์ทิชัน:
พาร์ติชันหมายถึงการแบ่งตารางออกเป็นส่วนที่เป็นเม็ดเล็ก ๆ ตามค่าของคอลัมน์พาร์ติชันเช่น 'data' ซึ่งทำให้การสืบค้นข้อมูลส่วนต่างๆทำได้เร็วขึ้น
php เปลี่ยนสตริงเป็นอาร์เรย์
Partition คืออะไร? คีย์พาร์ติชันกำหนดวิธีจัดเก็บข้อมูล ที่นี่ค่าที่ไม่ซ้ำกันของคีย์พาร์ติชันแต่ละค่าจะกำหนดพาร์ติชันของตาราง พาร์ติชันตั้งชื่อตามวันที่เพื่อความสะดวก คล้ายกับ 'Block Splitting' ใน HDFS
ถัง:
ที่เก็บข้อมูลให้โครงสร้างพิเศษแก่ข้อมูลที่อาจใช้สำหรับการสืบค้นที่มีประสิทธิภาพ การรวมตารางสองตารางที่อยู่ในคอลัมน์เดียวกันรวมถึงคอลัมน์การเข้าร่วมสามารถนำไปใช้เป็นการเข้าร่วมด้านแผนที่ได้ การเก็บข้อมูลด้วย ID ที่ใช้หมายความว่าเราสามารถประเมินการสืบค้นที่อิงตามผู้ใช้ได้อย่างรวดเร็วโดยเรียกใช้บนกลุ่มตัวอย่างแบบสุ่มของผู้ใช้ทั้งหมด
มีคำถามสำหรับเรา? โปรดระบุไว้ในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป
tostring () วิธี java
กระทู้ที่เกี่ยวข้อง: