วิธีเรียกใช้ Hive Scripts



นี่คือบทช่วยสอนเกี่ยวกับวิธีเรียกใช้ Hive Scripts การเรียกใช้สคริปต์นี้จะช่วยลดเวลาและความพยายามในการเขียนและดำเนินการแต่ละคำสั่งด้วยตนเอง

Apache Hive เป็นแพ็คเกจ Data Warehousing ที่สร้างขึ้นบน Hadoop จึงถูกนำมาใช้มากขึ้นสำหรับการวิเคราะห์ข้อมูลการขุดข้อมูลและการสร้างแบบจำลองเชิงคาดการณ์ องค์กรต่างๆกำลังมองหามืออาชีพที่มีความมั่นคง . ในโพสต์นี้เรามาดูวิธีเรียกใช้ Hive Scripts โดยทั่วไปเราใช้สคริปต์เพื่อดำเนินการชุดคำสั่งพร้อมกัน Hive Scripts มีการใช้งานในลักษณะเดียวกัน จะช่วยลดเวลาและความพยายามในการเขียนและดำเนินการแต่ละคำสั่งด้วยตนเอง

Hive Scripts ได้รับการสนับสนุนใน Hive 0.10.0 และเวอร์ชันที่สูงกว่า เนื่องจากเวอร์ชัน Hive 0.90 ถูกติดตั้งใน CDH3 เราจึงไม่สามารถเรียกใช้ Hive Scripts ใน CDH3 ได้ คุณสามารถลองทำตามขั้นตอนด้านล่างใน CDH4 เนื่องจากมีเวอร์ชัน Hive 0.10.0 ติดตั้งอยู่ คุณทราบวิธีสร้าง Hive script หรือไม่? หากไม่มีให้คลิก เพื่อให้ได้รับความกระจ่างมากขึ้น





Master-Hive-Now

ตอนนี้ให้เราดูวิธีการเขียนสคริปต์ใน Hive และเรียกใช้ใน CDH4:



ขั้นตอนที่ 1: การเขียนสคริปต์ Hive

ในการเขียน Hive Script ไฟล์ควรถูกบันทึกด้วยนามสกุล. sql เปิดเทอร์มินัลในการแจกจ่าย Cloudera CDH4 ของคุณและให้คำสั่งต่อไปนี้เพื่อสร้าง Hive Script
คำสั่ง: sudo gedit sample.sql

ในการดำเนินการคำสั่งดังกล่าวจะเปิดไฟล์พร้อมรายการคำสั่ง Hive ทั้งหมดที่ต้องดำเนินการ



ในสคริปต์นี้จะมีการสร้างตารางอธิบายและข้อมูลจะถูกโหลดและดึงข้อมูลจากตาราง

1. การสร้างตารางในไฮฟ์:

คำสั่ง: สร้างผลิตภัณฑ์ตาราง (productid: int, productname: string, price: float, category: string) แถวรูปแบบฟิลด์ที่คั่นด้วย ','

ในที่นี้ผลิตภัณฑ์คือชื่อตารางและ {productid, productname, price, category} คือคอลัมน์ของตารางนี้

ฟิลด์ที่ปิดท้ายด้วย ',' แสดงว่าคอลัมน์ในไฟล์อินพุตถูกคั่นด้วยสัญลักษณ์ ','

โดยค่าเริ่มต้นระเบียนในไฟล์อินพุตจะถูกคั่นด้วยบรรทัดใหม่

2. การอธิบายตาราง:

คำสั่ง: อธิบายผลิตภัณฑ์

3. การโหลดข้อมูลลงในตาราง

ในการโหลดข้อมูลลงในตารางก่อนอื่นเราต้องสร้างไฟล์อินพุตซึ่งมีระเบียนที่ต้องแทรกในตาราง

ให้เราสร้างไฟล์อินพุต

คำสั่ง: sudo gedit input.txt

แก้ไขเนื้อหาในไฟล์ดังแสดงในรูป

4. การดึงข้อมูล:

ในการดึงข้อมูลจะใช้คำสั่ง select

คำสั่ง: เลือก * จากผลิตภัณฑ์

คำสั่งดังกล่าวใช้เพื่อดึงค่าของคอลัมน์ทั้งหมดที่มีอยู่ในตาราง สคริปต์ควรเป็นเหมือนที่แสดงในภาพด้านล่าง

ตอนนี้เราเขียนสคริปต์ Hive เสร็จแล้ว สามารถบันทึกไฟล์ sample.sql ได้แล้ว

วิธีใช้อนาคอนดาสำหรับงูหลาม

ขั้นตอนที่ 2: เรียกใช้ Hive Script

ต่อไปนี้เป็นคำสั่งในการรันสคริปต์ Hive:

คำสั่ง: hive –f /home/cloudera/sample.sql

ขณะเรียกใช้สคริปต์ตรวจสอบให้แน่ใจว่าเส้นทางทั้งหมดของตำแหน่งของไฟล์สคริปต์มีอยู่

เราจะเห็นได้ว่าคำสั่งทั้งหมดถูกดำเนินการเรียบร้อยแล้ว

นี่คือวิธีเรียกใช้และเรียกใช้สคริปต์ Hive ใน CDH4

Hive เป็นองค์ประกอบที่สำคัญของ Hadoop และความเชี่ยวชาญของคุณใน Hive สามารถทำให้คุณได้งาน Hadoop ที่ทำเงินสูงสุด Edureka มีหลักสูตร Hadoop ที่ได้รับการดูแลเป็นพิเศษซึ่งจะช่วยให้คุณเชี่ยวชาญแนวคิดต่างๆเช่น MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume และ Sqoop คลิกที่ปุ่มด้านล่างเพื่อเริ่มต้น

มีคำถามสำหรับเรา? โปรดระบุไว้ในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป

กระทู้ที่เกี่ยวข้อง:

คำสั่ง Hive

Hive Data Models