บทแนะนำเกี่ยวกับ Big Data: สิ่งที่คุณต้องรู้เกี่ยวกับ Big Data!



บล็อกเกี่ยวกับบทช่วยสอนเกี่ยวกับข้อมูลขนาดใหญ่นี้จะช่วยให้คุณเห็นภาพรวมที่สมบูรณ์ของข้อมูลขนาดใหญ่ลักษณะการใช้งานและความท้าทายเกี่ยวกับข้อมูลขนาดใหญ่

การสอนข้อมูลขนาดใหญ่

Big Data คุณไม่เคยได้ยินคำนี้มาก่อนหรือ ฉันแน่ใจว่าคุณมี ในช่วง 4 ถึง 5 ปีที่ผ่านมาใคร ๆ ก็พูดถึง Big Data แต่คุณรู้หรือไม่ว่าข้อมูลขนาดใหญ่นี้คืออะไรสร้างผลกระทบต่อชีวิตของเราอย่างไรและทำไมองค์กรต่างๆจึงต้องการหาผู้เชี่ยวชาญด้วย เหรอ? ในบทช่วยสอนเกี่ยวกับข้อมูลขนาดใหญ่นี้ฉันจะให้ข้อมูลเชิงลึกที่สมบูรณ์เกี่ยวกับข้อมูลขนาดใหญ่

ด้านล่างนี้เป็นหัวข้อที่ฉันจะกล่าวถึงในบทช่วยสอนเกี่ยวกับข้อมูลขนาดใหญ่นี้:





  • เรื่องราวของข้อมูลขนาดใหญ่
  • ปัจจัยขับเคลื่อนข้อมูลขนาดใหญ่
  • Big Data คืออะไร?
  • ลักษณะข้อมูลขนาดใหญ่
  • ประเภทของข้อมูลขนาดใหญ่
  • ตัวอย่างข้อมูลขนาดใหญ่
  • การประยุกต์ใช้ข้อมูลขนาดใหญ่
  • ความท้าทายกับข้อมูลขนาดใหญ่

การสอนข้อมูลขนาดใหญ่ - Edureka

ผมขอเริ่มบทแนะนำข้อมูลขนาดใหญ่นี้ด้วยเรื่องราวสั้น ๆ



เรื่องราวของข้อมูลขนาดใหญ่

ในสมัยโบราณผู้คนเคยเดินทางจากหมู่บ้านหนึ่งไปยังอีกหมู่บ้านหนึ่งโดยใช้เกวียนเทียม แต่เมื่อเวลาผ่านไปหมู่บ้านต่างๆก็กลายเป็นเมืองและผู้คนก็กระจายกันไป ระยะทางในการเดินทางจากเมืองหนึ่งไปอีกเมืองก็เพิ่มขึ้นเช่นกัน ดังนั้นจึงกลายเป็นปัญหาในการเดินทางระหว่างเมืองพร้อมกับกระเป๋าเดินทาง เพื่อนที่ชาญฉลาดคนหนึ่งแนะนำว่าเราควรดูแลและให้อาหารม้ามากกว่านี้เพื่อแก้ปัญหานี้ เมื่อฉันดูวิธีแก้ปัญหานี้มันก็ไม่ได้แย่ขนาดนั้น แต่คุณคิดว่าม้าจะกลายเป็นช้างได้หรือไม่? ฉันไม่คิดอย่างนั้น ผู้ชายฉลาดอีกคนพูดว่าแทนที่จะลากม้า 1 ตัวให้เรามีม้า 4 ตัวเพื่อดึงรถเข็นคันเดียวกัน พวกคุณคิดอย่างไรกับวิธีแก้ปัญหานี้? ฉันคิดว่ามันเป็นทางออกที่ยอดเยี่ยมมาก ปัจจุบันผู้คนสามารถเดินทางในระยะทางไกลได้โดยใช้เวลาน้อยลงและยังมีสัมภาระมาก

แนวคิดเดียวกันนี้ใช้กับข้อมูลขนาดใหญ่ Big Data กล่าวว่าจนถึงวันนี้เราโอเคในการจัดเก็บข้อมูลลงในเซิร์ฟเวอร์ของเราเนื่องจากปริมาณข้อมูลค่อนข้าง จำกัด และระยะเวลาในการประมวลผลข้อมูลนี้ก็โอเคเช่นกัน แต่ตอนนี้ในโลกแห่งเทคโนโลยีปัจจุบันข้อมูลเติบโตเร็วเกินไปและผู้คนอาศัยข้อมูลเป็นจำนวนมากหลายครั้ง นอกจากนี้ความเร็วในการเพิ่มขึ้นของข้อมูลจึงเป็นไปไม่ได้ที่จะจัดเก็บข้อมูลลงในเซิร์ฟเวอร์ใด ๆ

ในบล็อกเรื่อง Big Data Tutorial นี้ให้เราสำรวจแหล่งที่มาของข้อมูลขนาดใหญ่ซึ่งระบบดั้งเดิมไม่สามารถจัดเก็บและประมวลผลได้



ปัจจัยขับเคลื่อนข้อมูลขนาดใหญ่

ปริมาณข้อมูลบนดาวเคราะห์โลกเพิ่มขึ้นอย่างทวีคูณด้วยเหตุผลหลายประการ แหล่งข้อมูลต่างๆและกิจกรรมในแต่ละวันของเราสร้างข้อมูลมากมาย ด้วยการคิดค้นเว็บโลกทั้งใบออนไลน์ไปแล้วทุกสิ่งที่เราทำทิ้งร่องรอยดิจิทัลไว้ เมื่อวัตถุอัจฉริยะกำลังออนไลน์อัตราการเติบโตของข้อมูลจึงเพิ่มขึ้นอย่างรวดเร็ว แหล่งที่มาที่สำคัญของ Big Data ได้แก่ ไซต์โซเชียลมีเดียเครือข่ายเซ็นเซอร์รูปภาพ / วิดีโอดิจิทัลโทรศัพท์มือถือบันทึกธุรกรรมซื้อบันทึกเว็บเวชระเบียนคลังข้อมูลการเฝ้าระวังทางทหารอีคอมเมิร์ซการวิจัยทางวิทยาศาสตร์ที่ซับซ้อนและอื่น ๆ ข้อมูลทั้งหมดเหล่านี้มีปริมาณข้อมูลประมาณสี่พันล้านไบต์ ภายในปี 2020 ปริมาณข้อมูลจะอยู่ที่ประมาณ 40 Zettabytes ซึ่งเทียบเท่ากับการเพิ่มเม็ดทรายทุกเม็ดบนโลกนี้คูณด้วยเจ็ดสิบห้า

กองและกองใน java

Big Data คืออะไร?

Big Data เป็นคำที่ใช้สำหรับการรวบรวมชุดข้อมูลที่มีขนาดใหญ่และซับซ้อนซึ่งยากต่อการจัดเก็บและประมวลผลโดยใช้เครื่องมือจัดการฐานข้อมูลที่มีอยู่หรือแอปพลิเคชันการประมวลผลข้อมูลแบบเดิม ความท้าทายรวมถึงการจับการดูแลการจัดเก็บการค้นหาการแบ่งปันการถ่ายโอนการวิเคราะห์และการแสดงภาพข้อมูลนี้

ลักษณะข้อมูลขนาดใหญ่

คุณลักษณะ 5 ประการที่กำหนด Big Data ได้แก่ Volume, Velocity, Variety, Veracity และ Value

  1. ปริมาณ

    ปริมาณหมายถึง 'ปริมาณข้อมูล' ซึ่งเพิ่มขึ้นในแต่ละวันอย่างรวดเร็ว ขนาดของข้อมูลที่มนุษย์สร้างขึ้นเครื่องจักรและปฏิสัมพันธ์บนโซเชียลมีเดียนั้นมีขนาดใหญ่มาก นักวิจัยคาดการณ์ว่าจะมีการสร้าง 40 Zettabytes (40,000 Exabytes) ภายในปี 2020 ซึ่งเพิ่มขึ้น 300 เท่าจากปี 2548

  2. ความเร็ว

    Velocity หมายถึงอัตราการก้าวที่แหล่งที่มาต่างๆสร้างข้อมูลทุกวัน การไหลของข้อมูลจำนวนมากและต่อเนื่อง ปัจจุบันมีผู้ใช้งานรายวัน (Facebook DAU) บนมือถือ 1.03 พันล้านคนซึ่งเพิ่มขึ้น 22% เมื่อเทียบเป็นรายปี สิ่งนี้แสดงให้เห็นว่าจำนวนผู้ใช้เพิ่มขึ้นอย่างรวดเร็วบนโซเชียลมีเดียและความเร็วในการสร้างข้อมูลทุกวัน หากคุณสามารถรับมือกับความเร็วได้คุณจะสามารถสร้างข้อมูลเชิงลึกและตัดสินใจโดยใช้ข้อมูลแบบเรียลไทม์

  3. ความหลากหลาย

    เนื่องจากมีแหล่งที่มามากมายที่เอื้อต่อ Big Data ประเภทของข้อมูลที่สร้างขึ้นจึงแตกต่างกัน สามารถมีโครงสร้างกึ่งโครงสร้างหรือไม่มีโครงสร้าง ดังนั้นจึงมีข้อมูลมากมายที่สร้างขึ้นทุกวัน ก่อนหน้านี้เราเคยรับข้อมูลจาก excel และฐานข้อมูลตอนนี้ข้อมูลมาในรูปแบบของรูปภาพไฟล์เสียงวิดีโอข้อมูลเซ็นเซอร์ ฯลฯ ดังที่แสดงในภาพด้านล่าง ดังนั้นข้อมูลที่ไม่มีโครงสร้างที่หลากหลายนี้จึงสร้างปัญหาในการจับการจัดเก็บการขุดและการวิเคราะห์ข้อมูล

  4. VERACITY

    ความถูกต้องหมายถึงข้อมูลที่มีข้อสงสัยหรือความไม่แน่นอนของข้อมูลที่มีเนื่องจากข้อมูลไม่สอดคล้องกันและไม่ครบถ้วน ในภาพด้านล่างคุณจะเห็นว่าไม่มีค่าบางอย่างในตาราง นอกจากนี้ค่าบางอย่างก็ยากที่จะยอมรับเช่น - ค่าต่ำสุด 15,000 ในแถวที่ 3 ก็เป็นไปไม่ได้ ความไม่สอดคล้องและความไม่สมบูรณ์นี้คือความจริง
    ข้อมูลที่มีอยู่ในบางครั้งอาจยุ่งเหยิงและอาจยากที่จะเชื่อถือ ด้วยข้อมูลขนาดใหญ่หลายรูปแบบคุณภาพและความถูกต้องเป็นเรื่องยากที่จะควบคุมเช่นโพสต์ Twitter ที่มีแฮชแท็กคำย่อการพิมพ์ผิดและคำพูดที่เป็นภาษาพูด ปริมาณมักเป็นสาเหตุที่ทำให้ข้อมูลขาดคุณภาพและความถูกต้อง

    • เนื่องจากความไม่แน่นอนของข้อมูลผู้นำทางธุรกิจ 1 ใน 3 จึงไม่เชื่อถือข้อมูลที่ใช้ในการตัดสินใจ
    • พบในการสำรวจว่า 27% ของผู้ตอบแบบสอบถามไม่แน่ใจว่าข้อมูลของตนไม่ถูกต้องมากเพียงใด
    • คุณภาพของข้อมูลที่ไม่ดีทำให้เศรษฐกิจสหรัฐฯมีมูลค่าราว 3.1 ล้านล้านเหรียญต่อปี
  5. VALUE

    หลังจากพูดคุยเรื่อง Volume, Velocity, Variety และ Veracity แล้วยังมี V อีกตัวที่ควรนำมาพิจารณาเมื่อดู Big Data นั่นคือ Value มันเป็นเรื่องดีและดีที่จะได้เข้าถึงบิ๊กข้อมูลแต่เว้นแต่เราจะเปลี่ยนเป็นมูลค่าได้ก็เปล่าประโยชน์ ฉันหมายถึงการเปลี่ยนเป็นมูลค่าเป็นการเพิ่มประโยชน์ให้กับองค์กรที่กำลังวิเคราะห์ข้อมูลขนาดใหญ่หรือไม่? องค์กรที่ทำงานเกี่ยวกับ Big Data ได้รับ ROI (ผลตอบแทนจากการลงทุน) สูงหรือไม่? เว้นแต่จะเพิ่มผลกำไรของพวกเขาด้วยการทำงานกับ Big Data ก็ไม่มีประโยชน์.

ดูวิดีโอ Big Data ด้านล่างเพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ Big Data:

บทแนะนำข้อมูลขนาดใหญ่สำหรับผู้เริ่มต้น | Big Data คืออะไร | Edureka

ตามที่กล่าวไว้ใน Variety มีข้อมูลประเภทต่างๆที่สร้างขึ้นทุกวัน ตอนนี้ให้เราเข้าใจประเภทของข้อมูล:

ประเภทของข้อมูลขนาดใหญ่

ข้อมูลขนาดใหญ่มีสามประเภท:

  • มีโครงสร้าง
  • กึ่งโครงสร้าง
  • ไม่มีโครงสร้าง

  1. มีโครงสร้าง

    ข้อมูลที่สามารถจัดเก็บและประมวลผลในรูปแบบคงที่เรียกว่าข้อมูลที่มีโครงสร้าง ข้อมูลที่จัดเก็บในระบบการจัดการฐานข้อมูลเชิงสัมพันธ์ (RDBMS) เป็นตัวอย่างหนึ่งของข้อมูลที่มีโครงสร้าง ง่ายต่อการประมวลผลข้อมูลที่มีโครงสร้างเนื่องจากมีสคีมาที่ตายตัว Structured Query Language (SQL) มักใช้เพื่อจัดการข้อมูลประเภทดังกล่าว

  2. กึ่งโครงสร้าง

    ข้อมูลกึ่งโครงสร้างเป็นข้อมูลประเภทหนึ่งที่ไม่มีโครงสร้างที่เป็นทางการของแบบจำลองข้อมูลกล่าวคือนิยามตารางใน DBMS เชิงสัมพันธ์ แต่อย่างไรก็ตามก็มีคุณสมบัติขององค์กรบางอย่างเช่นแท็กและเครื่องหมายอื่น ๆ เพื่อแยกองค์ประกอบทางความหมายที่ทำให้ง่ายขึ้น วิเคราะห์. ไฟล์ XML หรือเอกสาร JSON เป็นตัวอย่างของข้อมูลกึ่งโครงสร้าง

  3. ไม่มีโครงสร้าง

    ข้อมูลที่มีรูปแบบที่ไม่รู้จักและไม่สามารถเก็บไว้ใน RDBMS และไม่สามารถวิเคราะห์ได้เว้นแต่จะถูกแปลงเป็นรูปแบบที่มีโครงสร้างเรียกว่าเป็นข้อมูลที่ไม่มีโครงสร้าง ไฟล์ข้อความและเนื้อหามัลติมีเดียเช่นรูปภาพไฟล์เสียงวิดีโอเป็นตัวอย่างของข้อมูลที่ไม่มีโครงสร้าง ข้อมูลที่ไม่มีโครงสร้างเติบโตเร็วกว่าข้อมูลอื่น ๆ ผู้เชี่ยวชาญกล่าวว่า 80 เปอร์เซ็นต์ของข้อมูลในองค์กรไม่มีโครงสร้าง

จนถึงตอนนี้ฉันเพิ่งพูดถึงการแนะนำ Big Data นอกจากนี้บทแนะนำเกี่ยวกับ Big Data นี้ยังพูดถึงตัวอย่างการใช้งานและความท้าทายใน Big Data

ตัวอย่างข้อมูลขนาดใหญ่

ทุกวันเราอัปโหลดข้อมูลหลายล้านไบต์ 90% ของข้อมูลทั่วโลกถูกสร้างขึ้นในช่วงสองปีที่ผ่านมา

วิธีใช้ goto ใน c ++
  • Walmart จัดการได้มากกว่า 1 ล้าน การทำธุรกรรมของลูกค้าทุกชั่วโมง
  • ร้านค้า Facebook การเข้าถึงและการวิเคราะห์ 30+ เพตาไบต์ ของข้อมูลที่ผู้ใช้สร้างขึ้น
  • 230+ ล้าน ทวีตถูกสร้างขึ้นทุกวัน
  • มากกว่า 5 พันล้าน ผู้คนกำลังโทรส่งข้อความทวีตและเรียกดูบนโทรศัพท์มือถือทั่วโลก
  • ผู้ใช้ YouTube อัปโหลด 48 ชั่วโมง ของวิดีโอใหม่ทุกนาทีของวัน
  • Amazon จัดการ 15 ล้าน ลูกค้าคลิกสตรีมข้อมูลผู้ใช้ต่อวันเพื่อแนะนำผลิตภัณฑ์
  • 294 พันล้าน มีการส่งอีเมลทุกวัน บริการจะวิเคราะห์ข้อมูลนี้เพื่อค้นหาสแปม
  • มีรถยนต์สมัยใหม่ใกล้ตัว เซ็นเซอร์ 100 ตัว ซึ่งจะตรวจสอบระดับน้ำมันเชื้อเพลิงแรงดันลมยาง ฯลฯ รถแต่ละคันจะสร้างข้อมูลเซ็นเซอร์จำนวนมาก

การประยุกต์ใช้ข้อมูลขนาดใหญ่

เราไม่สามารถพูดถึงข้อมูลได้โดยไม่ต้องพูดถึงผู้คนผู้ที่ได้รับประโยชน์จากแอปพลิเคชัน Big Data เกือบทุกอุตสาหกรรมในปัจจุบันใช้ประโยชน์จากแอปพลิเคชัน Big Data ไม่ทางใดก็ทางหนึ่ง

  • การดูแลสุขภาพที่ชาญฉลาดขึ้น : การใช้ข้อมูลของผู้ป่วยในระดับเพตะไบต์องค์กรสามารถดึงข้อมูลที่มีความหมายจากนั้นสร้างแอปพลิเคชันที่สามารถทำนายสภาพที่ทรุดโทรมของผู้ป่วยล่วงหน้า
  • โทรคมนาคม : ภาคโทรคมนาคมรวบรวมข้อมูลวิเคราะห์และเสนอแนวทางแก้ไขปัญหาต่างๆ ด้วยการใช้แอปพลิเคชัน Big Data บริษัท โทรคมนาคมสามารถลดการสูญเสียแพ็กเก็ตข้อมูลได้อย่างมากซึ่งเกิดขึ้นเมื่อเครือข่ายมีโอเวอร์โหลดและทำให้การเชื่อมต่อกับลูกค้าของพวกเขาราบรื่น
  • ขายปลีก : การค้าปลีกมีอัตรากำไรขั้นต้นที่แคบที่สุดและเป็นหนึ่งในผู้ได้รับประโยชน์สูงสุดจากข้อมูลขนาดใหญ่ ความสวยงามของการใช้ข้อมูลขนาดใหญ่ในการค้าปลีกคือการเข้าใจพฤติกรรมของผู้บริโภค เครื่องมือแนะนำของ Amazon ให้คำแนะนำโดยอิงจากประวัติการเข้าชมของผู้บริโภค
  • การควบคุมการจราจร : ความแออัดของการจราจรเป็นความท้าทายที่สำคัญสำหรับหลาย ๆ เมืองทั่วโลก การใช้ข้อมูลและเซ็นเซอร์อย่างมีประสิทธิภาพจะเป็นกุญแจสำคัญในการจัดการการจราจรที่ดีขึ้นเนื่องจากเมืองต่างๆมีประชากรหนาแน่นมากขึ้น
  • การผลิต : การวิเคราะห์ข้อมูลขนาดใหญ่ในอุตสาหกรรมการผลิตสามารถลดข้อบกพร่องของส่วนประกอบปรับปรุงคุณภาพของผลิตภัณฑ์เพิ่มประสิทธิภาพและประหยัดเวลาและค่าใช้จ่าย
  • คุณภาพการค้นหา : ทุกครั้งที่เราดึงข้อมูลจาก google เราจะสร้างข้อมูลให้พร้อมกัน Google จัดเก็บข้อมูลนี้และใช้เพื่อปรับปรุงคุณภาพการค้นหา

มีคนพูดอย่างถูกต้อง: “ ไม่ใช่ทุกอย่างในสวนโรซี่!” . จนถึงตอนนี้ในบทช่วยสอนเกี่ยวกับ Big Data ฉันเพิ่งแสดงภาพ Big Data ให้คุณเห็น แต่ถ้ามันง่ายมากที่จะใช้ประโยชน์จากข้อมูลขนาดใหญ่คุณไม่คิดว่าองค์กรทั้งหมดจะลงทุนกับมันหรือ ให้ฉันบอกคุณล่วงหน้าว่าไม่ใช่อย่างนั้น มีความท้าทายหลายประการที่เกิดขึ้นเมื่อคุณทำงานกับ Big Data

ตอนนี้คุณคุ้นเคยกับ Big Data และคุณสมบัติต่างๆแล้วส่วนถัดไปของบล็อกเกี่ยวกับ Big Data Tutorial นี้จะให้ความกระจ่างเกี่ยวกับความท้าทายที่สำคัญบางประการที่ Big Data ต้องเผชิญ

ความท้าทายกับข้อมูลขนาดใหญ่

ขอบอกความท้าทายเล็กน้อยที่มาพร้อมกับ Big Data:

  1. คุณภาพข้อมูล - ปัญหาที่นี่คือ 4V เช่นความจริง ข้อมูลที่นี่ยุ่งมากไม่สอดคล้องกันและไม่สมบูรณ์ ข้อมูลสกปรกมีมูลค่า 600 พันล้านเหรียญสหรัฐให้กับ บริษัท ทุกปีในสหรัฐอเมริกา
  1. การค้นพบ - การค้นหาข้อมูลเชิงลึกเกี่ยวกับ Big Data ก็เหมือนกับการหาเข็มในกองหญ้า การวิเคราะห์ข้อมูลเพตะไบต์โดยใช้อัลกอริทึมที่มีประสิทธิภาพสูงเพื่อค้นหารูปแบบและข้อมูลเชิงลึกเป็นเรื่องยากมาก
  1. การจัดเก็บ - ยิ่งองค์กรมีข้อมูลมากเท่าไหร่ปัญหาในการจัดการก็จะยิ่งซับซ้อนมากขึ้นเท่านั้น คำถามที่เกิดขึ้นคือ“ เก็บไว้ที่ไหน” เราต้องการระบบจัดเก็บข้อมูลที่สามารถปรับขนาดขึ้นหรือลงตามความต้องการได้อย่างง่ายดาย
  1. การวิเคราะห์ - ในกรณีของข้อมูลขนาดใหญ่โดยส่วนใหญ่เราไม่ทราบประเภทของข้อมูลที่เรากำลังจัดการอยู่ดังนั้นการวิเคราะห์ข้อมูลจึงยากยิ่งขึ้น
  1. ความปลอดภัย - เนื่องจากข้อมูลมีขนาดใหญ่การรักษาความปลอดภัยจึงเป็นอีกหนึ่งความท้าทาย ซึ่งรวมถึงการพิสูจน์ตัวตนของผู้ใช้การ จำกัด การเข้าถึงตามผู้ใช้การบันทึกประวัติการเข้าถึงข้อมูลการใช้การเข้ารหัสข้อมูลอย่างเหมาะสมเป็นต้น
  1. ขาดความสามารถ - มีโครงการ Big Data จำนวนมากในองค์กรใหญ่ ๆ แต่ทีมนักพัฒนานักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์ที่มีความซับซ้อนซึ่งมีความรู้เกี่ยวกับโดเมนเพียงพอยังคงเป็นความท้าทาย

Hadoop เพื่อช่วยเหลือ

เรามีตัวช่วยในการรับมือกับความท้าทายของ Big Data นั่นคือ Hadoop . Hadoop เป็นโอเพนซอร์สเฟรมเวิร์กการเขียนโปรแกรมบน Java ที่สนับสนุนการจัดเก็บและการประมวลผลชุดข้อมูลขนาดใหญ่มากในสภาพแวดล้อมการประมวลผลแบบกระจาย เป็นส่วนหนึ่งของโครงการ Apache ที่สนับสนุนโดย Apache Software Foundation

Hadoop ด้วยการประมวลผลแบบกระจายจัดการข้อมูลที่มีโครงสร้างและไม่มีโครงสร้างจำนวนมากได้อย่างมีประสิทธิภาพมากกว่าคลังข้อมูลขององค์กรแบบเดิม Hadoop ทำให้สามารถเรียกใช้แอปพลิเคชันบนระบบที่มีโหนดฮาร์ดแวร์สินค้าหลายพันรายการและจัดการข้อมูลได้หลายพันเทราไบต์ องค์กรต่างๆใช้ Hadoop เนื่องจากเป็นซอฟต์แวร์โอเพนซอร์สและสามารถทำงานบนฮาร์ดแวร์สินค้า (คอมพิวเตอร์ส่วนบุคคลของคุณ)การประหยัดค่าใช้จ่ายในช่วงแรกเป็นเรื่องที่น่าทึ่งเนื่องจากฮาร์ดแวร์สินค้ามีราคาถูกมาก เมื่อข้อมูลองค์กรเพิ่มขึ้นคุณต้องเพิ่มฮาร์ดแวร์สินค้าโภคภัณฑ์มากขึ้นและมากขึ้นทันทีเพื่อจัดเก็บและด้วยเหตุนี้ Hadoop จึงพิสูจน์ได้ว่าประหยัดนอกจากนี้ Hadoop ยังมีชุมชน Apache ที่แข็งแกร่งอยู่เบื้องหลังซึ่งยังคงมีส่วนร่วมในการพัฒนาอย่างต่อเนื่อง

ตามที่สัญญาไว้ก่อนหน้านี้ในบล็อกเรื่อง Big Data Tutorial ฉันได้ให้ข้อมูลเชิงลึกสูงสุดใน Big Data แก่คุณ นี่คือจุดสิ้นสุดของการสอน Big Data ตอนนี้ขั้นตอนต่อไปคือการเรียนรู้และเรียนรู้ Hadoop เรามี ชุดการสอน Hadoop บล็อกที่จะให้ความรู้โดยละเอียดเกี่ยวกับระบบนิเวศ Hadoop ที่สมบูรณ์

สิ่งที่ดีที่สุด Happy Hadooping!

ตอนนี้คุณเข้าใจแล้วว่า Big Data คืออะไรลองดูไฟล์ โดย Edureka บริษัท การเรียนรู้ออนไลน์ที่เชื่อถือได้ซึ่งมีเครือข่ายผู้เรียนที่พึงพอใจมากกว่า 250,000 คนกระจายอยู่ทั่วโลก หลักสูตรการฝึกอบรม Edureka Big Data Hadoop Certification ช่วยให้ผู้เรียนมีความเชี่ยวชาญใน HDFS, Yarn, MapReduce, Pig, Hive, HBase, Oozie, Flume และ Sqoop โดยใช้กรณีการใช้งานแบบเรียลไทม์ในโดเมนการค้าปลีกโซเชียลมีเดียการบินการท่องเที่ยวการเงิน

มีคำถามสำหรับเรา? โปรดระบุไว้ในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป

กระทู้ที่เกี่ยวข้อง:

ฟังก์ชัน fibonacci c ++