Cloudera Hadoop: เริ่มต้นกับการแจกจ่าย CDH



บล็อก Edureka เกี่ยวกับ Cloudera Hadoop Tutorial จะให้ข้อมูลเชิงลึกที่สมบูรณ์เกี่ยวกับส่วนประกอบต่างๆของ Cloudera เช่น Cloudera Manager, Parcels, Hue และอื่น ๆ

ด้วยความต้องการข้อมูลขนาดใหญ่ที่เพิ่มขึ้นและ Apache Hadoop ก็คือที่หัวใจสำคัญของการปฏิวัติได้เปลี่ยนวิธีที่เราจัดระเบียบและคำนวณข้อมูล ความจำเป็นที่องค์กรจะต้องปรับ Hadoop ให้สอดคล้องกับความต้องการทางธุรกิจของพวกเขาทำให้เกิดการกระจายตัวในเชิงพาณิชย์ การกระจาย Hadoop เชิงพาณิชย์มักจะมาพร้อมกับคุณสมบัติที่ออกแบบมาเพื่อเพิ่มความคล่องตัวในการปรับใช้ Hadoop Cloudera Hadoop Distribution มอบแพลตฟอร์มแบบบูรณาการที่ยืดหยุ่นและปรับขนาดได้ซึ่งทำให้ง่ายต่อการจัดการปริมาณข้อมูลที่เพิ่มขึ้นอย่างรวดเร็วและความหลากหลายของข้อมูลในองค์กรของคุณ

ในบล็อกเกี่ยวกับ Cloudera Hadoop Distribution เราจะกล่าวถึงหัวข้อต่อไปนี้:





Cloudera Hadoop: บทนำสู่ Hadoop

Hadoop เป็นเฟรมเวิร์กโอเพนซอร์สของ Apache ที่จัดเก็บและประมวลผลข้อมูลขนาดใหญ่ในสภาพแวดล้อมแบบกระจายฝั่งตรงข้ามคลัสเตอร์โดยใช้โมเดลการเขียนโปรแกรมอย่างง่าย Hadoop ให้การคำนวณแบบขนานที่ด้านบนของพื้นที่จัดเก็บแบบกระจายหากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Hadoop โดยละเอียดจาก คุณสามารถอ้างถึงสิ่งนี้

หลังจากแนะนำ Hadoop สั้น ๆ แล้วตอนนี้ให้ฉันอธิบายประเภทต่างๆของ Hadoop Distribution



Cloudera Hadoop: การกระจาย Hadoop

เนื่องจาก Apache Hadoop เป็นโอเพ่นซอร์ส บริษัท หลายแห่งจึงพัฒนาการแจกแจงที่นอกเหนือไปจากรหัสโอเพนซอร์สดั้งเดิม สิ่งนี้คล้ายกับการกระจาย Linux เช่น RedHat, Fedora และ Ubuntu ลินุกซ์แต่ละรุ่นรองรับฟังก์ชันและคุณสมบัติของตัวเองเช่น GUI ที่ใช้งานง่ายใน Ubuntu ในทำนองเดียวกัน หมวกสีแดง เป็นที่นิยมในองค์กรเนื่องจากให้การสนับสนุนและยังให้อุดมการณ์ในการเปลี่ยนแปลงส่วนใดส่วนหนึ่งของระบบตามต้องการ Red Hat ช่วยให้คุณไม่ต้องกังวลกับปัญหาความเข้ากันได้ของซอฟต์แวร์ ซึ่งมักจะเป็นปัญหาใหญ่สำหรับผู้ใช้ที่กำลังเปลี่ยนจาก Windows

ในทำนองเดียวกันการแจกแจง Hadoop มี 3 ประเภทหลักซึ่งมีชุดฟังก์ชันและคุณสมบัติของตัวเองและสร้างขึ้นภายใต้ HDFS พื้นฐาน

Cloudera vs MapR เทียบกับ Hortonworks

รูป: MapR vs Hortonworks vs Cloudera

รูป: MapR vs Hortonworks vs Cloudera



การกระจาย Cloudera Hadoop

Cloudera เป็นเทรนด์ของตลาดใน Hadoop Space และเป็นรายแรกที่ปล่อยการจัดจำหน่าย Hadoop เชิงพาณิชย์ มีบริการให้คำปรึกษาเพื่อลดช่องว่างระหว่าง -“ Apache Hadoop ให้อะไร” และ“ สิ่งที่องค์กรต้องการ”

Cloudera Distribution คือ:

  • รวดเร็วสำหรับธุรกิจ : ตั้งแต่การวิเคราะห์ไปจนถึงวิทยาศาสตร์ข้อมูลและทุกสิ่งในระหว่างนั้น Cloudera มอบประสิทธิภาพที่คุณต้องการเพื่อปลดล็อกศักยภาพของข้อมูลที่ไม่ จำกัด
  • ทำให้ Hadoop ง่ายต่อการจัดการ : ด้วย Cloudera Manager ตัวช่วยสร้างอัตโนมัติช่วยให้คุณปรับใช้คลัสเตอร์ของคุณได้อย่างรวดเร็วโดยไม่คำนึงถึงสเกลหรือสภาพแวดล้อมการปรับใช้
  • ปลอดภัยโดยไม่ต้องประนีประนอม: ตอบสนองความต้องการด้านความปลอดภัยของข้อมูลและการปฏิบัติตามข้อกำหนดที่เข้มงวดโดยไม่ต้องสูญเสียความคล่องตัวทางธุรกิจ Cloudera นำเสนอแนวทางบูรณาการในการรักษาความปลอดภัยและการกำกับดูแลข้อมูล

Horton-Works การกระจาย

Horton-Works Data Platform (HDP) เป็นแพลตฟอร์มโอเพนซอร์สทั้งหมดที่ออกแบบมาเพื่อจัดเตรียมข้อมูลจากแหล่งข้อมูลและรูปแบบต่างๆ แพลตฟอร์มนี้รวมถึงเครื่องมือ Hadoop ต่างๆเช่น Hadoop Distributed File System (HDFS), MapReduce, Zookeeper, HBase, Pig, Hive และส่วนประกอบเพิ่มเติม

นอกจากนี้ยังรองรับคุณสมบัติเช่น:

  • HDP ทำให้ Hive เร็วขึ้น ผ่านโครงการ Stinger ใหม่
  • HDP หลีกเลี่ยงการล็อกผู้ขาย โดยให้คำมั่นสัญญากับ Hadoop เวอร์ชันที่แยกออกมา
  • HDP มุ่งเน้นไปที่การปรับปรุง การใช้งาน ของแพลตฟอร์ม Hadoop

การกระจาย MapR

MapR เป็นผู้ให้บริการโซลูชัน Hadoop ที่เน้นแพลตฟอร์มเช่นเดียวกับ HortonWorks และ Cloudera MapR รวมระบบฐานข้อมูลของตัวเองที่เรียกว่า MapR-DB ในขณะที่นำเสนอบริการแจกจ่าย Hadoop MapR-DB ถูกอ้างว่าเร็วกว่าฐานข้อมูล Hadoop ของหุ้นสี่ถึงเจ็ดเท่านั่นคือ HBase ซึ่งดำเนินการกับการแจกแจงอื่น ๆ

มีคุณสมบัติที่น่าสนใจเช่น:

  • เป็นการกระจาย Hadoop เดียวที่มี Pig, Hive และ Sqoop โดยไม่ต้องพึ่งพา Java ใด ๆ - เนื่องจากอาศัย MapR-File System
  • MapR คือการแจกจ่าย Hadoop ที่พร้อมสำหรับการผลิตมากที่สุดพร้อมการปรับปรุงมากมายที่ทำให้ใช้งานง่ายขึ้นเร็วขึ้นและเชื่อถือได้

ตอนนี้เรามาพูดคุยเกี่ยวกับ Cloudera Hadoop Distribution ในเชิงลึก

สมัครสมาชิกช่อง YouTube ของเราเพื่อรับอัปเดตใหม่ ...

Cloudera Hadoop: การกระจายของ Cloudera

Cloudera เป็นผู้เล่นที่รู้จักกันดีที่สุดในพื้นที่ Hadoop เพื่อเปิดตัวการจัดจำหน่าย Hadoop เชิงพาณิชย์ครั้งแรก

รูป: การกระจายของ Cloudera Hadoop

Cloudera Hadoop Distribution รองรับชุดคุณสมบัติต่อไปนี้:

  1. CDH ของ Cloudera ประกอบด้วยส่วนประกอบโอเพนซอร์สทั้งหมดกำหนดเป้าหมายการใช้งานระดับองค์กรและเป็นหนึ่งในการกระจาย Hadoop เชิงพาณิชย์ที่ได้รับความนิยมมากที่สุด
  2. Cloudera เป็นที่รู้จักในด้านนวัตกรรมเป็นรายแรกที่นำเสนอ SQL สำหรับ Hadoop ด้วย อิมพาลา เครื่องมือค้นหา
  3. คอนโซลการจัดการ - ผู้จัดการ Cloudera ใช้งานง่ายและใช้งานได้ด้วยอินเทอร์เฟซผู้ใช้ที่หลากหลายซึ่งแสดงข้อมูลคลัสเตอร์ทั้งหมดอย่างเป็นระเบียบและสะอาด
  4. ใน CDH คุณสามารถเพิ่มบริการไปยังคลัสเตอร์ที่กำลังเริ่มทำงานได้โดยไม่มีการหยุดชะงัก
  5. ส่วนเพิ่มเติมอื่น ๆ ของ Cloudera ได้แก่ การรักษาความปลอดภัยส่วนต่อประสานผู้ใช้และอินเทอร์เฟซสำหรับการทำงานร่วมกับแอปพลิเคชันของ บริษัท อื่น
  6. CDH ให้ เทมเพลตโหนด นั่นคืออนุญาตให้สร้างกลุ่มของโหนดในคลัสเตอร์ Hadoop ที่มีการกำหนดค่าที่แตกต่างกัน จะกำจัดการใช้การกำหนดค่าเดียวกันทั่วคลัสเตอร์ Hadoop
  7. นอกจากนี้ยังรองรับ:
    • ความน่าเชื่อถือ
      ผู้จำหน่าย Hadoop จะดำเนินการตอบสนองทันทีเมื่อตรวจพบข้อบกพร่อง ด้วยความตั้งใจที่จะทำให้โซลูชันเชิงพาณิชย์มีเสถียรภาพมากขึ้นแพตช์และการแก้ไขจะถูกปรับใช้ทันที
    • สนับสนุน
      ผู้จำหน่าย Cloudera Hadoop ให้คำแนะนำทางเทคนิคและความช่วยเหลือที่ทำให้ลูกค้าสามารถนำ Hadoop มาใช้กับงานระดับองค์กรและแอปพลิเคชันที่มีความสำคัญต่อภารกิจได้ง่าย

    • ความสมบูรณ์
      ผู้ขาย Hadoop จับคู่การแจกจ่ายของพวกเขากับเครื่องมือเสริมอื่น ๆ ที่ช่วยให้ลูกค้าปรับแต่งแอปพลิเคชัน Hadoop เพื่อจัดการกับงานเฉพาะของพวกเขา

การแจกแจงของ Cloudera มี 2 ประเภทที่แตกต่างกัน

  1. Cloudera Express Edition
  2. Cloudera Enterprise Edition

ตอนนี้เรามาดูความแตกต่างระหว่างกัน

คุณสมบัติ Cloudera-Express Cloudera-Enterprise
การจัดการคลัสเตอร์
1. การจัดการหลายคลัสเตอร์ใช่ใช่
2. การจัดการทรัพยากรใช่ใช่
การปรับใช้
1. รองรับ CDH 4 และ 5ใช่ใช่
2. การอัพเกรด CDH แบบโรลลิ่งไม่ใช่
การจัดการบริการและการกำหนดค่า
1. จัดการบริการ HDFS, MapReduce, YARN, Impala, HBase, Hive, Hue, Oozie, Zookeeper, Solr, Spark และ Accumuloใช่ใช่
2. การเริ่มต้นบริการใหม่ไม่ใช่
ความปลอดภัย
1. การพิสูจน์ตัวตน LDAPไม่ใช่
2. การตรวจสอบสิทธิ์ SAMLไม่ใช่
การตรวจสอบและการวินิจฉัย
1. ประวัติสุขภาพใช่ใช่
การจัดการการแจ้งเตือน
1. แจ้งเตือนทางอีเมลใช่ใช่
2. แจ้งเตือนผ่าน SNMPไม่ใช่
คุณสมบัติการจัดการขั้นสูง
1. สำรองและกู้คืนอัตโนมัติไม่ใช่
2. การเรียกดูและค้นหาไฟล์ไม่ใช่
3. MapReduce, Impala, HBase, รายงานการใช้งานเส้นด้ายไม่ใช่

Cloudera Hadoop: ผู้จัดการ Cloudera

จากข้อมูลของ Cloudera Cloudera Manager เป็นวิธีที่ดีที่สุด ติดตั้ง , กำหนดค่า , จัดการ และ มอนิเตอร์ กองซ้อน Hadoop

ให้:

  1. การปรับใช้และการกำหนดค่าอัตโนมัติ
  2. การตรวจสอบและการรายงานที่ปรับแต่งได้
  3. การแก้ไขปัญหาที่มีประสิทธิภาพอย่างง่ายดาย
  4. ศูนย์ - การบำรุงรักษาช่วงหยุดทำงาน

รับความรู้เชิงลึกเกี่ยวกับ Cloudera Hadoop และเครื่องมือต่างๆ

การสาธิตของ Cloudera Manager

มาสำรวจ Cloudera Manager กัน

1. รูปด้านล่างแสดงจำนวนบริการที่กำลังทำงานอยู่ใน Cloudera Manager คุณยังสามารถดูแผนภูมิเกี่ยวกับการใช้ CPU คลัสเตอร์การใช้งาน Disk IO ฯลฯ

รูป: หน้าแรกของ Cloudera Manager

java มีความสัมพันธ์

2. ภาพด้านล่างแสดงให้เห็นถึงคลัสเตอร์ HBase มันให้แผนภูมิและกราฟเกี่ยวกับสภาวะสุขภาพของเซิร์ฟเวอร์ HBase REST ที่กำลังทำงานอยู่

รูป: สภาวะสุขภาพของเซิร์ฟเวอร์ HBase

3. ตอนนี้เรามาดูแท็บอินสแตนซ์ของคลัสเตอร์ HBase ซึ่งคุณสามารถตรวจสอบสถานะและการกำหนดค่า IP ได้

รูป: สถานะและที่อยู่ IP ของโฮสต์เซิร์ฟเวอร์ของคลัสเตอร์ HBase

4. ถัดไปคุณมีแท็บ Configuration ที่นี่คุณสามารถดูพารามิเตอร์การกำหนดค่าทั้งหมดและเปลี่ยนค่าได้

รูป: การกำหนดค่าคลัสเตอร์ HBase

ตอนนี้เรามาทำความเข้าใจว่าพัสดุใน Cloudera คืออะไร

Cloudera Hadoop: พัสดุ

พัสดุคือรูปแบบการแจกจ่ายไบนารีที่มีไฟล์โปรแกรมพร้อมด้วยข้อมูลเมตาเพิ่มเติมที่ใช้โดย Cloudera Manager

พัสดุมีอยู่ในตัวและติดตั้งในไดเร็กทอรีที่กำหนดเวอร์ชันซึ่งหมายความว่าสามารถติดตั้งบริการที่กำหนดได้หลายเวอร์ชันเคียงข้างกัน

ด้านล่างนี้คือประโยชน์ของการใช้ Parcel:

  • จัดเตรียมการแจกจ่าย CDH เป็นวัตถุชิ้นเดียวเช่นแทนที่จะมีแพ็คเกจแยกต่างหากสำหรับแต่ละส่วนของ CDH พัสดุจะมีเพียงวัตถุเดียวที่จะติดตั้ง

  • มีความสอดคล้องภายใน (เนื่องจาก CDH ทั้งหมดถูกแจกจ่ายเป็นพัสดุชิ้นเดียวส่วนประกอบ CDH ทั้งหมดจะถูกจับคู่และจะไม่มีความเสี่ยงที่ชิ้นส่วนต่างๆที่มาจาก CDH เวอร์ชันต่างๆ)

  • คุณสามารถติดตั้งอัปเกรดดาวน์เกรดแจกจ่ายและเปิดใช้งานพัสดุใน CDH ได้โดยคลิกเพียงไม่กี่ครั้ง

ตอนนี้เรามาดูวิธีการติดตั้งและเปิดใช้งานบริการ Kafka ใน CDH โดยใช้ Parcels

  1. ไปที่หน้าแรกของ Cloudera manager >> Hosts >> Parcels ตามที่แสดงด้านล่าง

    รูป: การเลือกพัสดุจากโฮสต์

2. หากคุณไม่เห็นคาฟคาในรายการพัสดุคุณสามารถเพิ่มพัสดุลงในรายการได้

  1. ค้นหาพัสดุของ Kafka เวอร์ชันที่คุณต้องการใช้ หากคุณไม่เห็นคุณสามารถเพิ่มที่เก็บพัสดุลงในรายการได้
  2. ค้นหาพัสดุสำหรับ Kafka เวอร์ชันที่คุณต้องการติดตั้ง - Cloudera แจกจ่ายเวอร์ชัน Apache Kafka .
    รูปด้านล่างแสดงให้เห็นถึงสิ่งเดียวกัน

รูป: เส้นทางที่เก็บสำหรับพัสดุ

3. คัดลอกลิงค์ตามที่แสดงในรูปด้านบนและเพิ่มลงใน Remote Parcel Repository ดังที่แสดงด้านล่าง

รูป: การเพิ่มเส้นทาง Kafka จากที่เก็บ

สี่.หลังจากเพิ่มเส้นทางแล้ว Kafka จะพร้อมสำหรับการดาวน์โหลด คุณสามารถคลิกที่ปุ่มดาวน์โหลดและดาวน์โหลด Kafka

รูป: การดาวน์โหลด Kafka

5. เมื่อดาวน์โหลด Kafka แล้วสิ่งที่คุณต้องทำคือแจกจ่ายและเปิดใช้งาน

รูป: การเปิดใช้งาน Kafka

เมื่อเปิดใช้งานคุณสามารถไปข้างหน้าและดู Kafka ได้ในแท็บบริการใน Cloudera manager

รูป: บริการ Kafka

Cloudera Hadoop: การสร้างเวิร์กโฟลว์ Oozie

การสร้างเวิร์กโฟลว์โดยการเขียนโค้ด XML ด้วยตนเองแล้วเรียกใช้งานนั้นมีความซับซ้อน คุณสามารถอ้างอิงสิ่งนี้ กำหนดเวลางาน Oozie บล็อกเพื่อทราบเกี่ยวกับแนวทางดั้งเดิม

คุณสามารถดูภาพด้านล่างซึ่งเราได้เขียนไฟล์ XML เพื่อสร้างเวิร์กโฟลว์ Oozie อย่างง่าย รูป: การสร้างเวิร์กโฟลว์ Oozie โดยใช้แนวทางดั้งเดิม

อย่างที่คุณเห็นแม้กระทั่งการสร้างตัวกำหนดตารางเวลา Oozie แบบง่ายๆเราต้องเขียนโค้ด XML ขนาดใหญ่ซึ่งใช้เวลานานและการดีบักทุกบรรทัดจะยุ่งยาก เพื่อเอาชนะสิ่งนี้ Cloudera Manager ได้แนะนำคุณสมบัติใหม่ที่เรียกว่า เว้ ซึ่งมี GUI และคุณสมบัติการลากและวางที่เรียบง่ายเพื่อสร้างและดำเนินการเวิร์กโฟลว์ Oozie

ตอนนี้เรามาดูกันว่า Hue ทำงานเดียวกันด้วยวิธีที่ง่ายขึ้นอย่างไร

ก่อนสร้างเวิร์กโฟลว์ก่อนอื่นเรามาสร้างไฟล์อินพุตกันก่อนเช่น clickstream.txt และ user.txt
ในไฟล์ user.txt เรามี User Id, Name, Age, Country, Gender ดังที่แสดงด้านล่าง เราต้องการไฟล์ผู้ใช้นี้เพื่อให้ทราบจำนวนผู้ใช้และการคลิก URL (ที่กล่าวถึงในไฟล์คลิกสตรีม) ตามรหัสผู้ใช้

รูป: การสร้างไฟล์ข้อความ

เพื่อให้ทราบจำนวนคลิกของผู้ใช้ในแต่ละ URL เรามีสตรีมคลิกที่มีรหัสผู้ใช้และ URL

รูป: ไฟล์ Clickstream

มาเขียนคำค้นหาในไฟล์สคริปต์กัน

รูป: ไฟล์สคริปต์

หลังจากสร้างไฟล์ผู้ใช้ไฟล์ clickstream และไฟล์สคริปต์ต่อไปเราสามารถดำเนินการต่อและสร้างเวิร์กโฟลว์ Oozie ได้

1. คุณสามารถลากและวางเวิร์กโฟลว์ Oozie ดังที่แสดงในภาพ

รูป: ลากและวางคุณสมบัติในการสร้างเวิร์กโฟลว์ Oozie

2. ไม่นานหลังจากวางการกระทำของคุณคุณต้องระบุพา ธ ไปยังไฟล์สคริปต์และเพิ่มพารามิเตอร์ที่กล่าวถึงในไฟล์สคริปต์ ที่นี่คุณต้องเพิ่มพารามิเตอร์ OUTPUT, CLICKSTREAM และ USER และระบุเส้นทางไปยังพารามิเตอร์แต่ละตัว

รูป: การเพิ่มไฟล์สคริปต์และพารามิเตอร์ที่จำเป็นเพื่อดำเนินการ

3. เมื่อคุณระบุเส้นทางและเพิ่มพารามิเตอร์แล้วให้บันทึกและส่งเวิร์กโฟลว์ดังที่แสดงในภาพด้านล่าง

รูป: การบันทึกและส่งการดำเนินการ Oozie

4. เมื่อคุณส่งงานแล้วงานของคุณจะเสร็จสมบูรณ์ การดำเนินการและขั้นตอนอื่น ๆ ได้รับการดูแลโดย Hue

รูป: สถานะการดำเนินการของงาน Oozie

5.ตอนนี้เราได้ดำเนินการงาน Oozie แล้วเรามาดูแท็บการทำงานกัน ประกอบด้วย ID ผู้ใช้และสถานะของเวิร์กโฟลว์ นอกจากนี้ยังแสดงรหัสข้อผิดพลาดหากมีเวลาเริ่มต้นและเวลาสิ้นสุดของรายการการทำงาน

รูป: องค์ประกอบที่มีอยู่ในแท็บการทำงานของเวิร์กโฟลว์ Oozie

6. ถัดจากแท็บการกระทำคือแท็บรายละเอียด ในนี้เราสามารถดูเวลาเริ่มต้นและเวลาที่แก้ไขล่าสุดของงานได้

รูป: รายละเอียดของขั้นตอนการทำงาน Oozie

7. ถัดจากแท็บรายละเอียดเรามีแท็บการกำหนดค่าของเวิร์กโฟลว์

รูป: การตั้งค่าคอนฟิกของเวิร์กโฟลว์ Oozie

7. ในขณะที่เรียกใช้รายการการดำเนินการหากมีข้อผิดพลาดใด ๆ รายการนั้นจะแสดงอยู่ในแท็บบันทึก คุณสามารถอ้างถึงข้อความแสดงข้อผิดพลาดและแก้ไขข้อผิดพลาดตามนั้น

รูป: ไฟล์บันทึกที่มีรหัสข้อผิดพลาดและข้อความแสดงข้อผิดพลาด

8. นี่คือโค้ด XML ของเวิร์กโฟลว์ที่ฮิวสร้างขึ้นโดยอัตโนมัติ

รูป: โค้ด XML ของเวิร์กโฟลว์ Oozie

9.1. ตามที่คุณได้ระบุพา ธ สำหรับไดเร็กทอรีเอาต์พุตในขั้นตอนที่ 2 ที่นี่คุณมีไดเร็กทอรีเอาต์พุตใน HDFS Browser ดังที่แสดงด้านล่าง

รูป: ไดเร็กทอรีเอาต์พุตของเบราว์เซอร์ HDFS

9.2 เมื่อคุณคลิกที่ไดเร็กทอรีเอาต์พุตคุณจะพบไฟล์ข้อความชื่อ output.txt และไฟล์ข้อความนั้นมีเอาต์พุตจริงดังแสดงในรูปด้านล่าง

รูป: ข้อความผลลัพธ์สุดท้าย

นี่คือวิธีที่ Hue ทำให้งานของเราง่ายขึ้นโดยการให้ตัวเลือกการลากและวางเพื่อสร้างเวิร์กโฟลว์ Oozie

ฉันหวังว่าบล็อกนี้จะเป็นประโยชน์สำหรับการทำความเข้าใจเกี่ยวกับ Cloudera Distribution และส่วนประกอบต่างๆของ Cloudera

ต้องการมีส่วนร่วมในการปฏิวัติข้อมูลขนาดใหญ่หรือไม่?

ตอนนี้คุณเข้าใจ Cloudera Hadoop Distribution แล้วลองดูไฟล์ โดย Edureka บริษัท การเรียนรู้ออนไลน์ที่เชื่อถือได้ซึ่งมีเครือข่ายผู้เรียนที่พึงพอใจมากกว่า 250,000 คนกระจายอยู่ทั่วโลก หลักสูตรการฝึกอบรม Edureka Big Data Hadoop Certification ช่วยให้ผู้เรียนมีความเชี่ยวชาญใน HDFS, Yarn, MapReduce, Pig, Hive, HBase, Oozie, Flume และ Sqoop โดยใช้กรณีการใช้งานแบบเรียลไทม์ในโดเมนการค้าปลีกโซเชียลมีเดียการบินการท่องเที่ยวการเงิน

มีคำถามสำหรับเรา? โปรดระบุไว้ในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป