Informatica Tutorial: การทำความเข้าใจ Informatica 'Inside Out'



บล็อก Informatica Tutorial นี้จะอธิบายรายละเอียด Informatica PowerCenter สถาปัตยกรรม Informatica และวิธีสร้างโดเมนใน Informatica

เราได้เรียนรู้ในบล็อกที่แล้วเกี่ยวกับ และการประยุกต์ใช้ในชีวิตจริงให้เราดำน้ำลึกตอนนี้และทำความเข้าใจในบล็อก Informatica Tutorial เกี่ยวกับ Informatica สถาปัตยกรรมและกรณีการใช้งาน เป็นหนึ่งในทักษะที่ได้รับความสนใจมากที่สุดในตลาดปัจจุบันเนื่องจากเป็นแพลตฟอร์มการรวมข้อมูลที่ไม่เหมือนใครและเป็นกลางซึ่งทำงานร่วมกันระหว่างมาตรฐานระบบและแอปพลิเคชันที่แตกต่างกันตามที่กล่าวไว้ในบล็อกที่แล้ว Informatica PowerCenter เป็นผลิตภัณฑ์หลักของ Informatica และมักใช้แทนกันได้ เพื่อสรุปว่า Informatica Powercenter เป็นแพลตฟอร์มการรวมข้อมูลองค์กรแบบครบวงจรเดียวที่ช่วยให้ บริษัท และองค์กรภาครัฐทุกขนาดสามารถเข้าถึงค้นพบและรวมข้อมูลจากแทบทุกระบบธุรกิจในรูปแบบใดก็ได้และส่งมอบข้อมูลนั้นทั่วทั้งองค์กรด้วยความเร็วใด ๆ . เป็นเครื่องมือ ETL (Extract, Transform and Load) โดยมีข้อได้เปรียบหลักเหนือเครื่องมือ ETL อื่น ๆ ดังนี้:

  • มีความแข็งแรงและสามารถใช้ได้ทั้งในระบบที่ใช้ windows และ UNIX
  • มีประสิทธิภาพสูง แต่ง่ายมากสำหรับการพัฒนาบำรุงรักษาและการจัดการ

Informatica Tutorial: การทำความเข้าใจ Informatica PowerCenter

เพื่อให้เข้าใจถึงเวลาจริงของ Informatica เราควรทำความเข้าใจในเชิงลึกเกี่ยวกับ Informatica Architecture และส่วนประกอบอื่น ๆ ของ Informatica ดังนั้นในตอนท้ายของบล็อก Informatica Tutorial นี้คุณจะสามารถเข้าใจสิ่งต่อไปนี้:





  1. Informatica Architecture คืออะไร?
    1. ส่วนประกอบไคลเอ็นต์ของ Informatica
      1. Informatica PowerCenter Repository Manager
      2. Informatica PowerCenter Designer
      3. PowerCenter Workflow Manager
      4. PowerCenter Workflow Monitor
      5. ผู้ดูแลคอนโซล
    2. ส่วนประกอบเซิร์ฟเวอร์ของ Informatica
      1. บริการพื้นที่เก็บข้อมูล
      2. บริการบูรณาการ
      3. บริการ SAP BW
      4. ฮับบริการเว็บไซต์
  2. การไหลของข้อมูลใน Informatica
  3. โดเมน Informatica และโหนด
  4. Informatica Services & ผู้จัดการฝ่ายบริการ
  5. Use Case: วิธีโหลดตารางขนาดผลิตภัณฑ์โดยใช้ SCD

Informatica Architecture คืออะไร?

สถาปัตยกรรมของ Informatica PowerCenter เป็นไปตามแนวคิด Service Oriented Architecture (SOA) สถาปัตยกรรมที่มุ่งเน้นบริการ (SOA) สามารถกำหนดเป็นกลุ่มของบริการซึ่งสื่อสารระหว่างกัน กระบวนการสื่อสารเกี่ยวข้องกับการถ่ายโอนข้อมูลอย่างง่ายหรืออาจเกี่ยวข้องกับบริการตั้งแต่สองบริการขึ้นไปที่ประสานกิจกรรมเดียวกัน

การพัฒนา Informatica ขึ้นอยู่กับเทคนิคการพัฒนาตามส่วนประกอบ การพัฒนาตามส่วนประกอบเป็นเทคนิคที่ใช้ส่วนประกอบหรือหน่วยการทำงานที่กำหนดไว้ล่วงหน้าหรือทั้งสองอย่างพร้อมฟังก์ชันเฉพาะเพื่อประกอบผลิตภัณฑ์ขั้นสุดท้าย PowerCenter ทำตามวิธีการพัฒนาตามองค์ประกอบโดยอนุญาตให้สร้างกระแสข้อมูลจากต้นทางไปยังเป้าหมายโดยใช้ส่วนประกอบต่าง ๆ (เรียกว่าการแปลง) และเชื่อมโยงเข้าด้วยกันตามต้องการ วิธีที่ดีในการทำความเข้าใจก่อนอื่นคือต้องทำความเข้าใจว่าอะไรคือส่วนประกอบของ Informatica จากนั้นเราจะเรียนรู้วิธีใช้ Informatica เพื่อแก้ปัญหาทางธุรกิจทั่วไปผ่านกรณีการใช้งาน



ดังนั้นเครื่องมือ Informatica PowerCenter จึงประกอบด้วย 2 องค์ประกอบ พวกเขาคือ:

  • ส่วนประกอบไคลเอ็นต์
  • ส่วนประกอบเซิร์ฟเวอร์
Informatica-tutorial-Informatica-Architecture

รูป: ภาพรวมสถาปัตยกรรม Informatica

ส่วนประกอบไคลเอนต์ของ Informatica PowerCenter:

  • PowerCenter Repository Manager:

Repository Manager ใช้เพื่อจัดการที่เก็บ สามารถจัดการผู้ใช้และกลุ่ม เราสามารถสร้างลบและแก้ไขผู้ใช้ที่เก็บและกลุ่มผู้ใช้ นอกจากนี้เรายังสามารถกำหนดและเพิกถอนสิทธิ์พื้นที่เก็บข้อมูลและสิทธิ์ของโฟลเดอร์



Repository Manager มีหน้าต่างดังต่อไปนี้:

  • เนวิเกเตอร์: โดยจะแสดงอ็อบเจ็กต์ทั้งหมดที่คุณสร้างใน Repository Manager, Designer และ Workflow Manager จะจัดระเบียบก่อนโดยที่เก็บแล้วตามโฟลเดอร์
  • หลัก: มีคุณสมบัติของอ็อบเจ็กต์ที่เลือกในเนวิเกเตอร์ คอลัมน์ในหน้าต่างนี้จะเปลี่ยนไปตามวัตถุที่เลือกในเนวิเกเตอร์
  • เอาท์พุต: จัดเตรียมเอาต์พุตของงานที่ดำเนินการภายใน Repository Manager

รูป: Repository Manager

  • Informatica PowerCenter Designer

PowerCenter Designer เป็นไคลเอนต์ที่เราระบุวิธีการย้ายข้อมูลระหว่างแหล่งที่มาและเป้าหมายต่างๆ นี่คือที่ที่เราตีความข้อกำหนดทางธุรกิจต่างๆโดยใช้ส่วนประกอบของ PowerCenter ที่แตกต่างกันที่เรียกว่าการแปลงและส่งผ่านข้อมูล (การแปลง) ตัวออกแบบใช้เพื่อสร้างนิยามของแหล่งที่มานิยามเป้าหมายและการแปลงที่สามารถนำไปใช้เพิ่มเติมสำหรับการพัฒนาการแมป

รูป: Informatica PowerCenter Designer

  • Informatica PowerCenter Workflow Manager

    เป็นชุดตามลำดับของเซสชันและงานอื่น ๆ ที่ได้รับการออกแบบมาเพื่อบรรลุวัตถุประสงค์ในการปฏิบัติงานโดยรวม มัน executes ชุดของการแมป (เป็นเซสชัน) และงานอื่น ๆ

รูป: ตัวจัดการเวิร์กโฟลว์

Workflow Manager เป็นแอปพลิเคชัน PowerCenter ที่ช่วยให้นักออกแบบสามารถสร้างและเรียกใช้เวิร์กโฟลว์ได้ สามารถเปิดได้ดังนี้:

  • สามารถเปิดใช้งานได้จาก Designer โดยคลิกที่ไอคอน“ W”
  • สามารถเปิดได้อย่างอิสระจากพา ธ Start> All Programs> Informatica PowerCenter 9.6.1> Client> PowerCenter Client> PowerCenter Workflow Manager
  • สามารถเปิดได้จากเครื่องมือออกแบบเวิร์กโฟลว์ - เครื่องมือที่คุณใช้สร้างวัตถุเวิร์กโฟลว์

รูป: Workflow Manager Interface

ตัวจัดการเวิร์กโฟลว์จะแสดงหน้าต่างต่อไปนี้เพื่อช่วยคุณสร้างและจัดระเบียบเวิร์กโฟลว์:

  • คุณสามารถเชื่อมต่อและทำงานในหลายที่เก็บและโฟลเดอร์ ในเนวิเกเตอร์ตัวจัดการเวิร์กโฟลว์จะแสดงไอคอนสีแดงบนวัตถุที่ไม่ถูกต้อง
  • คุณสามารถสร้างแก้ไขและดูงานเวิร์กโฟลว์และเวิร์กโฟลว์
  • ประกอบด้วยแท็บเพื่อแสดงข้อความเอาต์พุตประเภทต่างๆ หน้าต่างผลลัพธ์ประกอบด้วยแท็บต่อไปนี้:
    • แสดงข้อความเมื่อคุณบันทึกเวิร์กโฟลว์เวิร์กโฟลว์หรืองาน แท็บบันทึกแสดงสรุปการตรวจสอบความถูกต้องเมื่อคุณบันทึกเวิร์กโฟลว์หรือเวิร์กเล็ต
    • ดึงข้อมูลบันทึก แสดงข้อความเมื่อ Workflow Manager ดึงอ็อบเจ็กต์จากที่เก็บ
    • แสดงข้อความเมื่อคุณตรวจสอบความถูกต้องของเวิร์กโฟลว์เวิร์กโฟลว์หรืองาน
    • แสดงข้อความเมื่อคุณคัดลอกอ็อบเจ็กต์ที่เก็บ
    • แสดงข้อความจาก Integration Service
    • แสดงข้อความจาก Repository Service

Informatica Workflow Designer

แมปลำดับการดำเนินการและการอ้างอิงของเซสชันงานและเวิร์กเล็ตสำหรับเซิร์ฟเวอร์ Informatica

รูป: ตัวออกแบบเวิร์กโฟลว์

  • นักพัฒนางาน

สร้างงานเซสชันคำสั่งเชลล์และอีเมล งานที่สร้างใน Task Developer สามารถใช้ซ้ำได้

  • Worklet Designer

สร้างวัตถุที่แสดงถึงชุดของงาน อ็อบเจ็กต์ Worklet สามารถใช้ซ้ำได้

นอกจากนี้ตัวจัดการเวิร์กโฟลว์ยังแสดงแถบสถานะที่แสดงสถานะของการดำเนินการที่คุณดำเนินการ

รูปต่อไปนี้แสดงให้เห็นว่าเวิร์กโฟลว์ทั่วไปมีลักษณะอย่างไรรวมถึงคอมโพเนนต์งาน Start, Link และ Session

รูป: ตัวอย่างของ Workflow Manager

  • การตรวจสอบเวิร์กโฟลว์ Informatica PowerCenter

Workflow Monitor ซึ่งเป็นเครื่องมือ PowerCenter ใช้เพื่อตรวจสอบการดำเนินการของเวิร์กโฟลว์และงาน

Workflow Monitor สามารถใช้เพื่อ:

  • ดูรายละเอียดเกี่ยวกับเวิร์กโฟลว์หรืองานที่รันในมุมมองแผนภูมิแกนต์หรือมุมมองงาน
  • เรียกใช้หยุดยกเลิกและเริ่มเวิร์กโฟลว์หรืองานต่อ
  • Workflow Monitor แสดงเวิร์กโฟลว์ที่รันอย่างน้อยหนึ่งครั้ง
  • Workflow Monitor จะรับข้อมูลจาก Integration Service และ Repository Service อย่างต่อเนื่อง นอกจากนี้ยังดึงข้อมูลจากที่เก็บเพื่อแสดงข้อมูลในอดีต

รูป: Workflow Monitor

วิธีเปิด Informatica Workflow Monitor:

ในการเปิด Workflow Monitor ให้ไปที่:

Start> All Programs> lnformatica PowerCenter 9.6.1> Client> PowerCenter Client> PowerCenter Workflow Monitor

นอกจากนี้ยังสามารถเปิดจอภาพได้:

  • จากเนวิเกเตอร์ตัวจัดการเวิร์กโฟลว์
    • สามารถกำหนดค่าตัวจัดการเวิร์กโฟลว์เพื่อเปิดการตรวจสอบเวิร์กโฟลว์เมื่อเรียกใช้เวิร์กโฟลว์จากตัวจัดการเวิร์กโฟลว์
    • จาก Tools> Workflow Monitor ใน Designer, Workflow Manager หรือ Repository Manager
  • หรือจากไอคอน Workflow Monitor บนแถบเครื่องมือ Tools

รูป: ส่วนของจอภาพเวิร์กโฟลว์

  • คอมพิวเตอร์ผู้ดูแลคอนโซล

Informatica Administrator console (เครื่องมือผู้ดูแลระบบ) เป็นเครื่องมือการดูแลระบบเพื่อดูแลโดเมน Informatica และการรักษาความปลอดภัย InformaticaInformatica Administrator console (เครื่องมือผู้ดูแลระบบ) พร้อมใช้งานหลังจากการติดตั้ง Informatica

รูป: Informatica Administrator Console

Administration Console ทำงานต่อไปนี้ในโดเมน:

  • การจัดการบริการแอปพลิเคชัน: จัดการบริการแอปพลิเคชันทั้งหมดในโดเมนรวมถึงบริการรวมและบริการพื้นที่เก็บข้อมูล
  • การกำหนดค่าโหนด: กำหนดค่าคุณสมบัติโหนดรวมถึงไดเร็กทอรีสำรองและทรัพยากร อนุญาตให้ปิดโหนดและเริ่มต้นใหม่ได้เช่นกันเมื่อจำเป็น
  • การจัดการวัตถุโดเมน: สร้างและจัดการวัตถุเช่นบริการโหนดใบอนุญาตและโฟลเดอร์
  • การดูและแก้ไขคุณสมบัติออบเจ็กต์โดเมน: ช่วยให้สามารถดูคุณสมบัติของวัตถุทั้งหมดในโดเมนและแก้ไขภายในได้
  • งานบริหารความปลอดภัย: จัดการผู้ใช้กลุ่มบทบาทและสิทธิพิเศษ
  • การดูเหตุการณ์บันทึก: ใช้โปรแกรมดูบันทึกเพื่อดูเหตุการณ์บันทึกของโดเมน, บริการรวม, บริการ SAP BW, ฮับบริการเว็บและบริการที่เก็บ

รูป: Administrator console-Interface

ดังนั้นโดยสรุปส่วนประกอบไคลเอนต์ของ Informatica ประกอบด้วย 5 องค์ประกอบ ได้แก่ Informatica Repository Manager, Informatica PowerCenter Designer, Informatica Workflow Manager, Informatica Workflow Monitor และ Informatica Administrator Console เป็นการสร้างแบบฟอร์มของเครื่องมือทั้งหมด ตอนนี้ให้พยายามทำความเข้าใจส่วนประกอบเซิร์ฟเวอร์ของ Informatica PowerCenter

ส่วนประกอบเซิร์ฟเวอร์ของ Informatica PowerCenter

ส่วนประกอบเซิร์ฟเวอร์ PowerCenter ประกอบด้วยบริการต่อไปนี้:

  • บริการพื้นที่เก็บข้อมูล: บริการ Repository จะจัดการที่เก็บ จะดึงข้อมูลแทรกและอัพเดตข้อมูลเมตาลงในตารางฐานข้อมูลที่เก็บ
  • บริการบูรณาการ: บริการ Integration รันเซสชันและเวิร์กโฟลว์
  • บริการ SAP BW: บริการ SAP BW มองหาคำขอ RFC จาก SAP BW และเริ่มเวิร์กโฟลว์เพื่อแยกข้อมูลหรือโหลดข้อมูลลงใน SAP BW
  • ศูนย์กลางบริการเว็บ: ฮับบริการบนเว็บรับคำขอจากไคลเอนต์บริการเว็บและแสดงเวิร์กโฟลว์ PowerCenter เป็นบริการ

เมื่อเราเข้าใจทั้งไคลเอนต์และส่วนประกอบเซิร์ฟเวอร์ของ Informatica แล้วกราฟิกข้อมูลต่อไปนี้จะอธิบายการไหลของข้อมูลใน Informatica นั่นคือวิธีการประมวลผลข้อมูล:

รูป: การไหลของข้อมูลใน Informatica

ในจุดนี้เป็นเรื่องที่สมเหตุสมผลมากในการทำความเข้าใจว่าหน่วยพื้นฐานอื่น ๆ ใน Informatica มีอะไรบ้างเช่น Domain & Node, Service & Service Manager ดังนั้นโปรดใช้เวลาสักครู่เพื่อทำความเข้าใจก่อนที่เราจะลงมือทำกับ Informatica

โดเมน Informatica และโหนด:

คุณสมบัติเด่นของโดเมนมีดังนี้:

  • โดเมนคือคอลเลกชันตรรกะหรือชุดของโหนดและบริการ
  • PowerCenter Domain เป็นหน่วยการดูแลระบบพื้นฐานของ PowerCenter
  • โดเมนสามารถเป็นการติดตั้ง PowerCenter เดียวหรืออาจประกอบด้วยการติดตั้ง PowerCenter หลายรายการ

คุณสมบัติเด่นของโหนดมีดังนี้:

  • โหนดคือการแสดงทางตรรกะของเครื่องทางกายภาพ มีคุณสมบัติทางกายภาพเช่นชื่อโฮสต์และหมายเลขพอร์ต
  • แต่ละโหนดเรียกใช้ตัวจัดการบริการซึ่งรับผิดชอบแอปพลิเคชันและบริการหลัก
  • โหนดสามารถเป็นโหนดเกตเวย์หรือโหนดของผู้ปฏิบัติงานได้ แต่สามารถเป็นของโดเมนเดียวได้

รูป: โหนด Informatica Domain n

Informatica Services & ผู้จัดการฝ่ายบริการ:

บริการเป็นทรัพยากรที่จัดเตรียมฟังก์ชันพิเศษ กระบวนการ PowerCenter ทั้งหมดทำงานเป็นบริการบนโหนด

Informatica PowerCenter มีบริการสองประเภท:

  • Application Services แสดงฟังก์ชันที่ใช้เซิร์ฟเวอร์รวมทั้ง Repository และ Integration Services
  • บริการหลักเป็นตัวแทนของฟังก์ชันที่จัดการและดูแลสภาพแวดล้อมที่ PowerCenter ดำเนินการและรวมถึงบริการต่างๆเช่น Log Service, Licensing Service และ Domain Service และอื่น ๆ อีกมากมาย

ผู้จัดการฝ่ายบริการ

  • ตัวจัดการบริการคือบริการที่จัดการการดำเนินการของโดเมนทั้งหมดและทำงานบนแต่ละโหนดภายในโดเมน
  • บนโหนดเกตเวย์ตัวจัดการบริการรับผิดชอบสิ่งต่อไปนี้:
    • การควบคุมโดเมน
    • การจัดการบริการที่ทำงานบนโดเมน
    • ให้บริการค้นหา
  • ในทุกโหนดตัวจัดการบริการมีไว้เพื่อควบคุมบริการหลักและบริการแอปพลิเคชัน

ส่วนประกอบต่างๆของ PowerCenter โต้ตอบกันอย่างไร:

รูป: Informatica Component Interaction

Use Case: วิธีโหลดตารางขนาดผลิตภัณฑ์โดยใช้ SCD

คำชี้แจงปัญหา: เป้าหมายของเราคือโหลดตารางมิติข้อมูลผลิตภัณฑ์โดยใช้ Slowly Changing Dimensions (SCDs) Type 2 โดยใช้วันที่มีผลบังคับใช้

ด้วยระบบแหล่งที่มาของลูกค้าซึ่งมีรายละเอียดรหัสลูกค้าชื่อเมืองรัฐและประเทศของลูกค้าเราจำเป็นต้องสร้างรายการใหม่ในตารางมิติเป้าหมายทุกครั้งที่ลูกค้ามาพร้อมกับค่าที่แตกต่างกัน

เพื่อให้เข้าใจสิ่งนี้ได้ดีขึ้นหากลูกค้าส่งคืนค่ารัฐหรือเมืองที่แตกต่างกันเมื่อเทียบกับค่าที่มีอยู่แล้วในตารางมิติข้อมูลเป้าหมายจะต้องสร้างรายการใหม่ด้วยค่าที่อัปเดต สิ่งนี้ทำได้โดยการใช้ตารางเป้าหมายตามโซลูชัน SCD

ด้านล่างนี้เป็นกระบวนการทีละขั้นตอนในการโหลดตารางขนาดผลิตภัณฑ์โดยใช้ SCD

ขั้นตอนที่ 1 : เปิด PowerCenter Designer

ขั้นตอนที่ 2 : เชื่อมต่อกับที่เก็บ

รูป: การสร้างการเชื่อมต่อกับ Repository

ขั้นตอนที่ 3 : เปิดตัวออกแบบ

รูป: การเปิดตัว PowerCenter Designer

ขั้นตอนที่ 4: โหลดซอร์สจากฐานข้อมูล

รูป: ตัวเลือกต่างๆในการโหลดชุดข้อมูล Source

ขั้นตอนที่ 5: เชื่อมต่อกับฐานข้อมูล

ขั้นตอนที่ 6: เลือกตาราง SCD_INPUT_DATA

ขั้นตอนที่ 7: โหลดเป้าหมายที่กำหนดจากฐานข้อมูลในทำนองเดียวกัน

รูป: ตัวเลือกต่างๆสำหรับชุดเป้าหมาย

ขั้นตอนที่ 8 : ออกแบบเวิร์กโฟลว์เพื่อดำเนินการตามที่ต้องการดังที่แสดงด้านล่าง

รูป: การออกแบบเวิร์กโฟลว์สำหรับฐานข้อมูล

ขั้นตอนที่ 9 : เรียกใช้ Oracle SQL Developer และโหลด SCD_CUSTOMER โต๊ะ

รูป: ตาราง SCD_CUSTOMER

ขั้นตอนที่ 10 : แก้ไขค่าของรัฐสำหรับลูกค้า Mary และ Hannah

รูป: การแก้ไขค่าของ Mary

รูป: การแก้ไขค่าของ Hannah

ขั้นตอนที่ 11 : เรียกใช้จอภาพเวิร์กโฟลว์และดำเนินการเวิร์กโฟลว์

รูป: กำลังดำเนินการเวิร์กโฟลว์

รูป: เอาต์พุตเวิร์กโฟลว์

อะไรคือความแตกต่างระหว่างการโอเวอร์โหลดและการลบล้าง

ขั้นตอนที่ 12: ดำเนินการคำสั่งด้านล่างเพื่อรับฐานข้อมูลเป้าหมาย

  • เลือก * จาก scd_customer_target

รูป: การดำเนินการสืบค้น SQL สำหรับเอาต์พุตเป้าหมาย

ขั้นตอนที่ 13: เอาต์พุตตารางมิติข้อมูลผลิตภัณฑ์

รูป: เอาต์พุตตารางขนาดผลิตภัณฑ์

สรุปได้ว่าตารางผลิตภัณฑ์ที่โหลดมีค่าในอดีตของข้อมูลรวมถึงการเปลี่ยนแปลงของค่าปัจจุบันและได้มาจากการใช้ Informatica PowerCenter

ฉันหวังว่าบล็อก Informatica Tutorial นี้จะมีประโยชน์ในการสร้างรากฐานของ Informatica ของคุณและสร้างความสนใจมากพอที่จะเรียนรู้เพิ่มเติมเกี่ยวกับ Informatica

หากคุณได้ตัดสินใจที่จะประกอบอาชีพ Informatica แล้วฉันขอแนะนำให้คุณทราบว่าทำไมคุณไม่ลองดู หน้าหลักสูตร การฝึกอบรม Informatica Certification ที่ Edureka จะทำให้คุณเป็นผู้เชี่ยวชาญด้าน Informatica ผ่านการฝึกอบรมผู้สอนแบบสดและการฝึกปฏิบัติจริงโดยใช้กรณีการใช้งานจริง

มีคำถามสำหรับเรา? โปรดระบุไว้ในส่วนความคิดเห็นแล้วเราจะติดต่อกลับไป