ด้วยความต้องการข้อมูลขนาดใหญ่ที่เพิ่มขึ้นและ Apache Hadoop ก็คือที่หัวใจสำคัญของการปฏิวัติได้เปลี่ยนวิธีที่เราจัดระเบียบและคำนวณข้อมูล ความจำเป็นที่องค์กรจะต้องปรับ Hadoop ให้สอดคล้องกับความต้องการทางธุรกิจของพวกเขาทำให้เกิดการกระจายตัวในเชิงพาณิชย์ การกระจาย Hadoop เชิงพาณิชย์มักจะมาพร้อมกับคุณสมบัติที่ออกแบบมาเพื่อเพิ่มความคล่องตัวในการปรับใช้ Hadoop Cloudera Hadoop Distribution มอบแพลตฟอร์มแบบบูรณาการที่ยืดหยุ่นและปรับขนาดได้ซึ่งทำให้ง่ายต่อการจัดการปริมาณข้อมูลที่เพิ่มขึ้นอย่างรวดเร็วและความหลากหลายของข้อมูลในองค์กรของคุณ
ในบล็อกเกี่ยวกับ Cloudera Hadoop Distribution เราจะกล่าวถึงหัวข้อต่อไปนี้:
Cloudera Hadoop: บทนำสู่ Hadoop
Hadoop เป็นเฟรมเวิร์กโอเพนซอร์สของ Apache ที่จัดเก็บและประมวลผลข้อมูลขนาดใหญ่ในสภาพแวดล้อมแบบกระจายฝั่งตรงข้ามคลัสเตอร์โดยใช้โมเดลการเขียนโปรแกรมอย่างง่าย Hadoop ให้การคำนวณแบบขนานที่ด้านบนของพื้นที่จัดเก็บแบบกระจายหากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Hadoop โดยละเอียดจาก คุณสามารถอ้างถึงสิ่งนี้
หลังจากแนะนำ Hadoop สั้น ๆ แล้วตอนนี้ให้ฉันอธิบายประเภทต่างๆของ Hadoop Distribution
Cloudera Hadoop: การกระจาย Hadoop
เนื่องจาก Apache Hadoop เป็นโอเพ่นซอร์ส บริษัท หลายแห่งจึงพัฒนาการแจกแจงที่นอกเหนือไปจากรหัสโอเพนซอร์สดั้งเดิม สิ่งนี้คล้ายกับการกระจาย Linux เช่น RedHat, Fedora และ Ubuntu ลินุกซ์แต่ละรุ่นรองรับฟังก์ชันและคุณสมบัติของตัวเองเช่น GUI ที่ใช้งานง่ายใน Ubuntu ในทำนองเดียวกัน หมวกสีแดง เป็นที่นิยมในองค์กรเนื่องจากให้การสนับสนุนและยังให้อุดมการณ์ในการเปลี่ยนแปลงส่วนใดส่วนหนึ่งของระบบตามต้องการ Red Hat ช่วยให้คุณไม่ต้องกังวลกับปัญหาความเข้ากันได้ของซอฟต์แวร์ ซึ่งมักจะเป็นปัญหาใหญ่สำหรับผู้ใช้ที่กำลังเปลี่ยนจาก Windows
ในทำนองเดียวกันการแจกแจง Hadoop มี 3 ประเภทหลักซึ่งมีชุดฟังก์ชันและคุณสมบัติของตัวเองและสร้างขึ้นภายใต้ HDFS พื้นฐาน
Cloudera vs MapR เทียบกับ Hortonworks
รูป: MapR vs Hortonworks vs Cloudera
การกระจาย Cloudera Hadoop
Cloudera เป็นเทรนด์ของตลาดใน Hadoop Space และเป็นรายแรกที่ปล่อยการจัดจำหน่าย Hadoop เชิงพาณิชย์ มีบริการให้คำปรึกษาเพื่อลดช่องว่างระหว่าง -“ Apache Hadoop ให้อะไร” และ“ สิ่งที่องค์กรต้องการ”
Cloudera Distribution คือ:
- รวดเร็วสำหรับธุรกิจ : ตั้งแต่การวิเคราะห์ไปจนถึงวิทยาศาสตร์ข้อมูลและทุกสิ่งในระหว่างนั้น Cloudera มอบประสิทธิภาพที่คุณต้องการเพื่อปลดล็อกศักยภาพของข้อมูลที่ไม่ จำกัด
- ทำให้ Hadoop ง่ายต่อการจัดการ : ด้วย Cloudera Manager ตัวช่วยสร้างอัตโนมัติช่วยให้คุณปรับใช้คลัสเตอร์ของคุณได้อย่างรวดเร็วโดยไม่คำนึงถึงสเกลหรือสภาพแวดล้อมการปรับใช้
- ปลอดภัยโดยไม่ต้องประนีประนอม: ตอบสนองความต้องการด้านความปลอดภัยของข้อมูลและการปฏิบัติตามข้อกำหนดที่เข้มงวดโดยไม่ต้องสูญเสียความคล่องตัวทางธุรกิจ Cloudera นำเสนอแนวทางบูรณาการในการรักษาความปลอดภัยและการกำกับดูแลข้อมูล
Horton-Works การกระจาย
Horton-Works Data Platform (HDP) เป็นแพลตฟอร์มโอเพนซอร์สทั้งหมดที่ออกแบบมาเพื่อจัดเตรียมข้อมูลจากแหล่งข้อมูลและรูปแบบต่างๆ แพลตฟอร์มนี้รวมถึงเครื่องมือ Hadoop ต่างๆเช่น Hadoop Distributed File System (HDFS), MapReduce, Zookeeper, HBase, Pig, Hive และส่วนประกอบเพิ่มเติม
นอกจากนี้ยังรองรับคุณสมบัติเช่น:
- HDP ทำให้ Hive เร็วขึ้น ผ่านโครงการ Stinger ใหม่
- HDP หลีกเลี่ยงการล็อกผู้ขาย โดยให้คำมั่นสัญญากับ Hadoop เวอร์ชันที่แยกออกมา
- HDP มุ่งเน้นไปที่การปรับปรุง การใช้งาน ของแพลตฟอร์ม Hadoop
การกระจาย MapR
MapR เป็นผู้ให้บริการโซลูชัน Hadoop ที่เน้นแพลตฟอร์มเช่นเดียวกับ HortonWorks และ Cloudera MapR รวมระบบฐานข้อมูลของตัวเองที่เรียกว่า MapR-DB ในขณะที่นำเสนอบริการแจกจ่าย Hadoop MapR-DB ถูกอ้างว่าเร็วกว่าฐานข้อมูล Hadoop ของหุ้นสี่ถึงเจ็ดเท่านั่นคือ HBase ซึ่งดำเนินการกับการแจกแจงอื่น ๆ
มีคุณสมบัติที่น่าสนใจเช่น:
- เป็นการกระจาย Hadoop เดียวที่มี Pig, Hive และ Sqoop โดยไม่ต้องพึ่งพา Java ใด ๆ - เนื่องจากอาศัย MapR-File System
- MapR คือการแจกจ่าย Hadoop ที่พร้อมสำหรับการผลิตมากที่สุดพร้อมการปรับปรุงมากมายที่ทำให้ใช้งานง่ายขึ้นเร็วขึ้นและเชื่อถือได้
ตอนนี้เรามาพูดคุยเกี่ยวกับ Cloudera Hadoop Distribution ในเชิงลึก
สมัครสมาชิกช่อง YouTube ของเราเพื่อรับอัปเดตใหม่ ...
Cloudera Hadoop: การกระจายของ Cloudera
Cloudera เป็นผู้เล่นที่รู้จักกันดีที่สุดในพื้นที่ Hadoop เพื่อเปิดตัวการจัดจำหน่าย Hadoop เชิงพาณิชย์ครั้งแรก
รูป: การกระจายของ Cloudera Hadoop
Cloudera Hadoop Distribution รองรับชุดคุณสมบัติต่อไปนี้:
- CDH ของ Cloudera ประกอบด้วยส่วนประกอบโอเพนซอร์สทั้งหมดกำหนดเป้าหมายการใช้งานระดับองค์กรและเป็นหนึ่งในการกระจาย Hadoop เชิงพาณิชย์ที่ได้รับความนิยมมากที่สุด
- Cloudera เป็นที่รู้จักในด้านนวัตกรรมเป็นรายแรกที่นำเสนอ SQL สำหรับ Hadoop ด้วย อิมพาลา เครื่องมือค้นหา
- คอนโซลการจัดการ - ผู้จัดการ Cloudera ใช้งานง่ายและใช้งานได้ด้วยอินเทอร์เฟซผู้ใช้ที่หลากหลายซึ่งแสดงข้อมูลคลัสเตอร์ทั้งหมดอย่างเป็นระเบียบและสะอาด
- ใน CDH คุณสามารถเพิ่มบริการไปยังคลัสเตอร์ที่กำลังเริ่มทำงานได้โดยไม่มีการหยุดชะงัก
- ส่วนเพิ่มเติมอื่น ๆ ของ Cloudera ได้แก่ การรักษาความปลอดภัยส่วนต่อประสานผู้ใช้และอินเทอร์เฟซสำหรับการทำงานร่วมกับแอปพลิเคชันของ บริษัท อื่น
- CDH ให้ เทมเพลตโหนด นั่นคืออนุญาตให้สร้างกลุ่มของโหนดในคลัสเตอร์ Hadoop ที่มีการกำหนดค่าที่แตกต่างกัน จะกำจัดการใช้การกำหนดค่าเดียวกันทั่วคลัสเตอร์ Hadoop
- นอกจากนี้ยังรองรับ:
- ความน่าเชื่อถือ
ผู้จำหน่าย Hadoop จะดำเนินการตอบสนองทันทีเมื่อตรวจพบข้อบกพร่อง ด้วยความตั้งใจที่จะทำให้โซลูชันเชิงพาณิชย์มีเสถียรภาพมากขึ้นแพตช์และการแก้ไขจะถูกปรับใช้ทันที สนับสนุน
ผู้จำหน่าย Cloudera Hadoop ให้คำแนะนำทางเทคนิคและความช่วยเหลือที่ทำให้ลูกค้าสามารถนำ Hadoop มาใช้กับงานระดับองค์กรและแอปพลิเคชันที่มีความสำคัญต่อภารกิจได้ง่ายความสมบูรณ์
ผู้ขาย Hadoop จับคู่การแจกจ่ายของพวกเขากับเครื่องมือเสริมอื่น ๆ ที่ช่วยให้ลูกค้าปรับแต่งแอปพลิเคชัน Hadoop เพื่อจัดการกับงานเฉพาะของพวกเขา
- ความน่าเชื่อถือ
การแจกแจงของ Cloudera มี 2 ประเภทที่แตกต่างกัน
- Cloudera Express Edition
- Cloudera Enterprise Edition
ตอนนี้เรามาดูความแตกต่างระหว่างกัน
คุณสมบัติ | Cloudera-Express | Cloudera-Enterprise |
การจัดการคลัสเตอร์ | ||
1. การจัดการหลายคลัสเตอร์ | ใช่ | ใช่ |
2. การจัดการทรัพยากร | ใช่ | ใช่ |
การปรับใช้ | ||
1. รองรับ CDH 4 และ 5 | ใช่ | ใช่ |
2. การอัพเกรด CDH แบบโรลลิ่ง | ไม่ | ใช่ |
การจัดการบริการและการกำหนดค่า | ||
1. จัดการบริการ HDFS, MapReduce, YARN, Impala, HBase, Hive, Hue, Oozie, Zookeeper, Solr, Spark และ Accumulo | ใช่ | ใช่ |
2. การเริ่มต้นบริการใหม่ | ไม่ | ใช่ |
ความปลอดภัย | ||
1. การพิสูจน์ตัวตน LDAP | ไม่ | ใช่ |
2. การตรวจสอบสิทธิ์ SAML | ไม่ | ใช่ |
การตรวจสอบและการวินิจฉัย | ||
1. ประวัติสุขภาพ | ใช่ | ใช่ |
การจัดการการแจ้งเตือน | ||
1. แจ้งเตือนทางอีเมล | ใช่ | ใช่ |
2. แจ้งเตือนผ่าน SNMP | ไม่ | ใช่ |
คุณสมบัติการจัดการขั้นสูง | ||
1. สำรองและกู้คืนอัตโนมัติ | ไม่ | ใช่ |
2. การเรียกดูและค้นหาไฟล์ | ไม่ | ใช่ |
3. MapReduce, Impala, HBase, รายงานการใช้งานเส้นด้าย | ไม่ | ใช่ |
Cloudera Hadoop: ผู้จัดการ Cloudera
จากข้อมูลของ Cloudera Cloudera Manager เป็นวิธีที่ดีที่สุด ติดตั้ง , กำหนดค่า , จัดการ และ มอนิเตอร์ กองซ้อน Hadoop
ให้:
- การปรับใช้และการกำหนดค่าอัตโนมัติ
- การตรวจสอบและการรายงานที่ปรับแต่งได้
- การแก้ไขปัญหาที่มีประสิทธิภาพอย่างง่ายดาย
- ศูนย์ - การบำรุงรักษาช่วงหยุดทำงาน
รับความรู้เชิงลึกเกี่ยวกับ Cloudera Hadoop และเครื่องมือต่างๆ
การสาธิตของ Cloudera Manager
มาสำรวจ Cloudera Manager กัน
1. รูปด้านล่างแสดงจำนวนบริการที่กำลังทำงานอยู่ใน Cloudera Manager คุณยังสามารถดูแผนภูมิเกี่ยวกับการใช้ CPU คลัสเตอร์การใช้งาน Disk IO ฯลฯ
รูป: หน้าแรกของ Cloudera Manager
java มีความสัมพันธ์
2. ภาพด้านล่างแสดงให้เห็นถึงคลัสเตอร์ HBase มันให้แผนภูมิและกราฟเกี่ยวกับสภาวะสุขภาพของเซิร์ฟเวอร์ HBase REST ที่กำลังทำงานอยู่
รูป: สภาวะสุขภาพของเซิร์ฟเวอร์ HBase
3. ตอนนี้เรามาดูแท็บอินสแตนซ์ของคลัสเตอร์ HBase ซึ่งคุณสามารถตรวจสอบสถานะและการกำหนดค่า IP ได้
รูป: สถานะและที่อยู่ IP ของโฮสต์เซิร์ฟเวอร์ของคลัสเตอร์ HBase
4. ถัดไปคุณมีแท็บ Configuration ที่นี่คุณสามารถดูพารามิเตอร์การกำหนดค่าทั้งหมดและเปลี่ยนค่าได้
รูป: การกำหนดค่าคลัสเตอร์ HBase
ตอนนี้เรามาทำความเข้าใจว่าพัสดุใน Cloudera คืออะไร
Cloudera Hadoop: พัสดุ
พัสดุคือรูปแบบการแจกจ่ายไบนารีที่มีไฟล์โปรแกรมพร้อมด้วยข้อมูลเมตาเพิ่มเติมที่ใช้โดย Cloudera Manager
พัสดุมีอยู่ในตัวและติดตั้งในไดเร็กทอรีที่กำหนดเวอร์ชันซึ่งหมายความว่าสามารถติดตั้งบริการที่กำหนดได้หลายเวอร์ชันเคียงข้างกัน
ด้านล่างนี้คือประโยชน์ของการใช้ Parcel:
จัดเตรียมการแจกจ่าย CDH เป็นวัตถุชิ้นเดียวเช่นแทนที่จะมีแพ็คเกจแยกต่างหากสำหรับแต่ละส่วนของ CDH พัสดุจะมีเพียงวัตถุเดียวที่จะติดตั้ง
มีความสอดคล้องภายใน (เนื่องจาก CDH ทั้งหมดถูกแจกจ่ายเป็นพัสดุชิ้นเดียวส่วนประกอบ CDH ทั้งหมดจะถูกจับคู่และจะไม่มีความเสี่ยงที่ชิ้นส่วนต่างๆที่มาจาก CDH เวอร์ชันต่างๆ)
คุณสามารถติดตั้งอัปเกรดดาวน์เกรดแจกจ่ายและเปิดใช้งานพัสดุใน CDH ได้โดยคลิกเพียงไม่กี่ครั้ง
ตอนนี้เรามาดูวิธีการติดตั้งและเปิดใช้งานบริการ Kafka ใน CDH โดยใช้ Parcels
- ไปที่หน้าแรกของ Cloudera manager >> Hosts >> Parcels ตามที่แสดงด้านล่าง
รูป: การเลือกพัสดุจากโฮสต์
2. หากคุณไม่เห็นคาฟคาในรายการพัสดุคุณสามารถเพิ่มพัสดุลงในรายการได้
- ค้นหาพัสดุของ Kafka เวอร์ชันที่คุณต้องการใช้ หากคุณไม่เห็นคุณสามารถเพิ่มที่เก็บพัสดุลงในรายการได้
- ค้นหาพัสดุสำหรับ Kafka เวอร์ชันที่คุณต้องการติดตั้ง - Cloudera แจกจ่ายเวอร์ชัน Apache Kafka .
รูปด้านล่างแสดงให้เห็นถึงสิ่งเดียวกัน
รูป: เส้นทางที่เก็บสำหรับพัสดุ
3. คัดลอกลิงค์ตามที่แสดงในรูปด้านบนและเพิ่มลงใน Remote Parcel Repository ดังที่แสดงด้านล่าง
รูป: การเพิ่มเส้นทาง Kafka จากที่เก็บ
สี่.หลังจากเพิ่มเส้นทางแล้ว Kafka จะพร้อมสำหรับการดาวน์โหลด คุณสามารถคลิกที่ปุ่มดาวน์โหลดและดาวน์โหลด Kafka
รูป: การดาวน์โหลด Kafka
5. เมื่อดาวน์โหลด Kafka แล้วสิ่งที่คุณต้องทำคือแจกจ่ายและเปิดใช้งาน
รูป: การเปิดใช้งาน Kafka
เมื่อเปิดใช้งานคุณสามารถไปข้างหน้าและดู Kafka ได้ในแท็บบริการใน Cloudera manager
รูป: บริการ Kafka
Cloudera Hadoop: การสร้างเวิร์กโฟลว์ Oozie
การสร้างเวิร์กโฟลว์โดยการเขียนโค้ด XML ด้วยตนเองแล้วเรียกใช้งานนั้นมีความซับซ้อน คุณสามารถอ้างอิงสิ่งนี้ กำหนดเวลางาน Oozie บล็อกเพื่อทราบเกี่ยวกับแนวทางดั้งเดิม
คุณสามารถดูภาพด้านล่างซึ่งเราได้เขียนไฟล์ XML เพื่อสร้างเวิร์กโฟลว์ Oozie อย่างง่าย รูป: การสร้างเวิร์กโฟลว์ Oozie โดยใช้แนวทางดั้งเดิม
อย่างที่คุณเห็นแม้กระทั่งการสร้างตัวกำหนดตารางเวลา Oozie แบบง่ายๆเราต้องเขียนโค้ด XML ขนาดใหญ่ซึ่งใช้เวลานานและการดีบักทุกบรรทัดจะยุ่งยาก เพื่อเอาชนะสิ่งนี้ Cloudera Manager ได้แนะนำคุณสมบัติใหม่ที่เรียกว่า เว้ ซึ่งมี GUI และคุณสมบัติการลากและวางที่เรียบง่ายเพื่อสร้างและดำเนินการเวิร์กโฟลว์ Oozie
ตอนนี้เรามาดูกันว่า Hue ทำงานเดียวกันด้วยวิธีที่ง่ายขึ้นอย่างไร
ก่อนสร้างเวิร์กโฟลว์ก่อนอื่นเรามาสร้างไฟล์อินพุตกันก่อนเช่น clickstream.txt และ user.txt
ในไฟล์ user.txt เรามี User Id, Name, Age, Country, Gender ดังที่แสดงด้านล่าง เราต้องการไฟล์ผู้ใช้นี้เพื่อให้ทราบจำนวนผู้ใช้และการคลิก URL (ที่กล่าวถึงในไฟล์คลิกสตรีม) ตามรหัสผู้ใช้
รูป: การสร้างไฟล์ข้อความ
เพื่อให้ทราบจำนวนคลิกของผู้ใช้ในแต่ละ URL เรามีสตรีมคลิกที่มีรหัสผู้ใช้และ URL
รูป: ไฟล์ Clickstream
มาเขียนคำค้นหาในไฟล์สคริปต์กัน
รูป: ไฟล์สคริปต์
หลังจากสร้างไฟล์ผู้ใช้ไฟล์ clickstream และไฟล์สคริปต์ต่อไปเราสามารถดำเนินการต่อและสร้างเวิร์กโฟลว์ Oozie ได้
1. คุณสามารถลากและวางเวิร์กโฟลว์ Oozie ดังที่แสดงในภาพ
รูป: ลากและวางคุณสมบัติในการสร้างเวิร์กโฟลว์ Oozie
2. ไม่นานหลังจากวางการกระทำของคุณคุณต้องระบุพา ธ ไปยังไฟล์สคริปต์และเพิ่มพารามิเตอร์ที่กล่าวถึงในไฟล์สคริปต์ ที่นี่คุณต้องเพิ่มพารามิเตอร์ OUTPUT, CLICKSTREAM และ USER และระบุเส้นทางไปยังพารามิเตอร์แต่ละตัว
รูป: การเพิ่มไฟล์สคริปต์และพารามิเตอร์ที่จำเป็นเพื่อดำเนินการ
3. เมื่อคุณระบุเส้นทางและเพิ่มพารามิเตอร์แล้วให้บันทึกและส่งเวิร์กโฟลว์ดังที่แสดงในภาพด้านล่าง
รูป: การบันทึกและส่งการดำเนินการ Oozie
4. เมื่อคุณส่งงานแล้วงานของคุณจะเสร็จสมบูรณ์ การดำเนินการและขั้นตอนอื่น ๆ ได้รับการดูแลโดย Hue
รูป: สถานะการดำเนินการของงาน Oozie
5.ตอนนี้เราได้ดำเนินการงาน Oozie แล้วเรามาดูแท็บการทำงานกัน ประกอบด้วย ID ผู้ใช้และสถานะของเวิร์กโฟลว์ นอกจากนี้ยังแสดงรหัสข้อผิดพลาดหากมีเวลาเริ่มต้นและเวลาสิ้นสุดของรายการการทำงาน
รูป: องค์ประกอบที่มีอยู่ในแท็บการทำงานของเวิร์กโฟลว์ Oozie
6. ถัดจากแท็บการกระทำคือแท็บรายละเอียด ในนี้เราสามารถดูเวลาเริ่มต้นและเวลาที่แก้ไขล่าสุดของงานได้
รูป: รายละเอียดของขั้นตอนการทำงาน Oozie
7. ถัดจากแท็บรายละเอียดเรามีแท็บการกำหนดค่าของเวิร์กโฟลว์
รูป: การตั้งค่าคอนฟิกของเวิร์กโฟลว์ Oozie
7. ในขณะที่เรียกใช้รายการการดำเนินการหากมีข้อผิดพลาดใด ๆ รายการนั้นจะแสดงอยู่ในแท็บบันทึก คุณสามารถอ้างถึงข้อความแสดงข้อผิดพลาดและแก้ไขข้อผิดพลาดตามนั้น
รูป: ไฟล์บันทึกที่มีรหัสข้อผิดพลาดและข้อความแสดงข้อผิดพลาด
8. นี่คือโค้ด XML ของเวิร์กโฟลว์ที่ฮิวสร้างขึ้นโดยอัตโนมัติ
รูป: โค้ด XML ของเวิร์กโฟลว์ Oozie
9.1. ตามที่คุณได้ระบุพา ธ สำหรับไดเร็กทอรีเอาต์พุตในขั้นตอนที่ 2 ที่นี่คุณมีไดเร็กทอรีเอาต์พุตใน HDFS Browser ดังที่แสดงด้านล่าง
รูป: ไดเร็กทอรีเอาต์พุตของเบราว์เซอร์ HDFS
9.2 เมื่อคุณคลิกที่ไดเร็กทอรีเอาต์พุตคุณจะพบไฟล์ข้อความชื่อ output.txt และไฟล์ข้อความนั้นมีเอาต์พุตจริงดังแสดงในรูปด้านล่าง
รูป: ข้อความผลลัพธ์สุดท้าย
นี่คือวิธีที่ Hue ทำให้งานของเราง่ายขึ้นโดยการให้ตัวเลือกการลากและวางเพื่อสร้างเวิร์กโฟลว์ Oozie
ฉันหวังว่าบล็อกนี้จะเป็นประโยชน์สำหรับการทำความเข้าใจเกี่ยวกับ Cloudera Distribution และส่วนประกอบต่างๆของ Cloudera
ต้องการมีส่วนร่วมในการปฏิวัติข้อมูลขนาดใหญ่หรือไม่?ตอนนี้คุณเข้าใจ Cloudera Hadoop Distribution แล้วลองดูไฟล์ โดย Edureka บริษัท การเรียนรู้ออนไลน์ที่เชื่อถือได้ซึ่งมีเครือข่ายผู้เรียนที่พึงพอใจมากกว่า 250,000 คนกระจายอยู่ทั่วโลก หลักสูตรการฝึกอบรม Edureka Big Data Hadoop Certification ช่วยให้ผู้เรียนมีความเชี่ยวชาญใน HDFS, Yarn, MapReduce, Pig, Hive, HBase, Oozie, Flume และ Sqoop โดยใช้กรณีการใช้งานแบบเรียลไทม์ในโดเมนการค้าปลีกโซเชียลมีเดียการบินการท่องเที่ยวการเงิน
มีคำถามสำหรับเรา? โปรดระบุไว้ในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป