SQL สำหรับวิทยาศาสตร์ข้อมูล: โซลูชั่นครบวงจรสำหรับผู้เริ่มต้น



โพสต์บล็อกนี้เกี่ยวกับ SQL for Data Science จะช่วยให้คุณเข้าใจว่า SQL สามารถใช้ในการจัดเก็บเข้าถึงและดึงข้อมูลเพื่อทำการวิเคราะห์ข้อมูลได้อย่างไร

นับตั้งแต่ที่ Data Science ได้รับการจัดอันดับให้เป็นงานที่มีแนวโน้มมากที่สุดแห่งยุคเราทุกคนพยายามเข้าร่วมการแข่งขัน . โพสต์บล็อกนี้เกี่ยวกับ SQL for Data Science จะช่วยให้คุณเข้าใจว่า SQL สามารถใช้ในการจัดเก็บเข้าถึงและดึงข้อมูลเพื่อทำการวิเคราะห์ข้อมูลได้อย่างไร

นี่คือรายการหัวข้อที่จะเป็น กล่าวถึงในบล็อกนี้:





    1. เหตุใด SQL จึงจำเป็นสำหรับวิทยาศาสตร์ข้อมูล
    2. SQL คืออะไร?
    3. พื้นฐานของ SQL
    4. การติดตั้ง MySQL
    5. Hands-On

เหตุใด SQL จึงจำเป็นสำหรับวิทยาศาสตร์ข้อมูล

คุณทราบหรือไม่ว่าเรากำลังสร้างข้อมูลมากกว่า 2.5 quintillion ไบต์ในแต่ละวัน การสร้างข้อมูลที่ก้าวกระโดดนี้เป็นสาเหตุที่อยู่เบื้องหลังความนิยมของเทคโนโลยีระดับไฮเอนด์เช่น วิทยาศาสตร์ข้อมูล , , และอื่น ๆ

การได้รับข้อมูลเชิงลึกที่เป็นประโยชน์จากข้อมูลคือสิ่งที่เรียกว่า Data Science Data Science เกี่ยวข้องกับการแยกประมวลผลและวิเคราะห์ข้อมูลจำนวนมาก ในปัจจุบันสิ่งที่เราต้องการคือ ที่สามารถใช้ในการจัดเก็บและจัดการข้อมูลจำนวนมหาศาลนี้



วิทยาศาสตร์ข้อมูลคืออะไร - Edureka

นี่คือที่ SQL เข้ามา

SQL สามารถใช้เพื่อจัดเก็บเข้าถึงและดึงข้อมูลจำนวนมหาศาลเพื่อดำเนินกระบวนการ Data Science ทั้งหมดได้อย่างราบรื่นยิ่งขึ้น



SQL คืออะไร?

SQL ซึ่งย่อมาจาก Structured Query Language เป็นภาษาแบบสอบถามที่มีวัตถุประสงค์เพื่อจัดการฐานข้อมูลเชิงสัมพันธ์

แต่ฐานข้อมูลเชิงสัมพันธ์คืออะไร?

ฐานข้อมูลเชิงสัมพันธ์คือกลุ่มของตารางที่กำหนดไว้อย่างชัดเจนซึ่งข้อมูลสามารถเข้าถึงแก้ไขปรับปรุงและอื่น ๆ ได้โดยไม่ต้องแก้ไขตารางฐานข้อมูล SQL เป็นมาตรฐาน (API) สำหรับฐานข้อมูลเชิงสัมพันธ์

กลับมาที่ SQL การเขียนโปรแกรม SQL สามารถใช้เพื่อดำเนินการหลายอย่างกับข้อมูลเช่นการสอบถามการแทรกการอัปเดตการลบบันทึกฐานข้อมูล ตัวอย่างของฐานข้อมูลเชิงสัมพันธ์ที่ใช้ SQL ได้แก่ MySQL Database, Oracle เป็นต้น

หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ SQL คุณสามารถไปที่ไฟล์ ติดตามบล็อก:

  1. การทำความเข้าใจประเภทข้อมูล SQL - สิ่งที่คุณต้องรู้เกี่ยวกับประเภทข้อมูล SQL
  2. สร้างตารางใน SQL - ทุกสิ่งที่คุณต้องการทราบเกี่ยวกับการสร้างตารางใน SQL

ก่อนที่เราจะเริ่มการสาธิตเกี่ยวกับ SQL เรามาทำความคุ้นเคยกับคำสั่งพื้นฐานของ SQL กันก่อน

พื้นฐานของ SQL

SQL มีชุดคำสั่งง่ายๆในการแก้ไขตารางข้อมูลมาดูคำสั่งพื้นฐานของ SQL กันบ้าง:

  • สร้างฐานข้อมูล - สร้างฐานข้อมูลใหม่
  • สร้างตาราง - สร้างตารางใหม่
  • ใส่ลงใน - แทรกข้อมูลใหม่ลงในฐานข้อมูล
  • เลือก - แยกข้อมูลจากฐานข้อมูล
  • อัปเดต - อัปเดตข้อมูลในฐานข้อมูล
  • ลบ - ลบข้อมูลจากฐานข้อมูล
  • แก้ไขฐานข้อมูล - แก้ไขฐานข้อมูล
  • แก้ไขตาราง - ปรับเปลี่ยนตาราง
  • วางตาราง - ลบตาราง
  • สร้างดัชนี - สร้างดัชนีเพื่อค้นหาองค์ประกอบ
  • DROP INDEX - ลบ ดัชนี

เพื่อให้เข้าใจ SQL ได้ดีขึ้นมาติดตั้ง MySQL และดูว่าคุณจะเล่นกับข้อมูลได้อย่างไร

การติดตั้ง MySQL

การติดตั้ง MySQL เป็นงานง่ายๆ นี่คือไฟล์ คำแนะนำทีละขั้นตอน ที่จะช่วยคุณติดตั้ง MySQL บนระบบของคุณ

เมื่อคุณติดตั้งเสร็จแล้ว MySQL ทำตามส่วนด้านล่างเพื่อดูการสาธิตง่ายๆที่จะแสดงให้คุณเห็นว่าคุณสามารถแทรกจัดการและแก้ไขข้อมูลได้อย่างไร

ผสานซอร์สโค้ด c ++ เรียงลำดับ

SQL สำหรับวิทยาศาสตร์ข้อมูล - การสาธิต MySQL

ในการสาธิตนี้เราจะดูวิธีสร้างฐานข้อมูลและประมวลผล นี่เป็นการสาธิตระดับเริ่มต้นเพื่อให้คุณเริ่มต้นด้วยการวิเคราะห์ข้อมูลบน SQL

เริ่มกันเลย!

ขั้นตอนที่ 1: สร้างฐานข้อมูล SQL

ฐานข้อมูล SQL คือคลังเก็บข้อมูลที่สามารถจัดเก็บข้อมูลในรูปแบบที่มีโครงสร้าง ตอนนี้เรามาสร้างฐานข้อมูลโดยใช้ MySQL :

สร้างฐานข้อมูล edureka ใช้ edureka

ในโค้ดด้านบนมีคำสั่ง SQL สองคำสั่ง:

บันทึก : คำสั่ง SQL ถูกกำหนดเป็นตัวพิมพ์ใหญ่และใช้เซมิโคลอนเพื่อยุติคำสั่ง SQL

  1. สร้างฐานข้อมูล: คำสั่งนี้สร้างฐานข้อมูลชื่อ 'edureka'

  2. ใช้: คำสั่งนี้ใช้เพื่อเปิดใช้งานฐานข้อมูล ที่นี่เรากำลังเปิดใช้งานฐานข้อมูล 'edureka'

ขั้นตอนที่ 2: สร้างตารางที่มีคุณสมบัติข้อมูลที่จำเป็น

การสร้างตารางทำได้ง่ายเพียงแค่สร้างฐานข้อมูล คุณเพียงแค่กำหนดตัวแปรหรือคุณสมบัติของตารางด้วยประเภทข้อมูลที่เกี่ยวข้อง มาดูกันว่าสามารถทำได้อย่างไร:

สร้างของเล่นตาราง (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, Quantity INTEGER)

ในข้อมูลโค้ดด้านบนเกิดสิ่งต่อไปนี้:

  1. ใช้คำสั่ง 'สร้างตาราง' เพื่อสร้างตารางที่เรียกว่าของเล่น
  2. ตารางของเล่นประกอบด้วยคุณสมบัติ 4 ประการ ได้แก่ TID (รหัสธุรกรรม) ชื่อรายการราคาและปริมาณ
  3. ตัวแปรแต่ละตัวถูกกำหนดด้วยชนิดข้อมูลตามลำดับ
  4. ตัวแปร TID ถูกประกาศเป็นคีย์หลัก คีย์หลักโดยทั่วไปหมายถึงตัวแปรที่สามารถจัดเก็บค่าเฉพาะได้

คุณสามารถตรวจสอบรายละเอียดของตารางที่กำหนดเพิ่มเติมได้โดยใช้คำสั่งต่อไปนี้:

อธิบายของเล่น

ขั้นตอนที่ 3: การแทรกข้อมูลลงในตาราง

ตอนนี้เราได้สร้างตารางแล้วมาเติมเต็มด้วยค่าบางอย่าง ก่อนหน้านี้ในบล็อกนี้ฉันได้กล่าวถึงวิธีที่คุณสามารถเพิ่มข้อมูลลงในตารางโดยใช้คำสั่งเดียวนั่นคือ INSERT INTO

มาดูกันว่าจะทำอย่างไร:

สุดท้ายสุดท้ายและจบใน java
INSERT INTO toys VALUES (NULL, 'Train', 550, 88) INSERT INTO toys VALUES (NULL, 'Hotwheels_car', 350, 80) INSERT INTO toys VALUES (NULL, 'Magic_Pencil', 70, 100) INSERT INTO toys VALUES ( NULL, 'Dog_house', 120, 54) INSERT INTO toys VALUES (NULL, 'Skateboard', 700, 42) INSERT INTO toys VALUES (NULL, 'GI Joe', 300, 120)

ในข้อมูลโค้ดด้านบนเราเพียงแค่ใส่ข้อสังเกต 6 ข้อลงในตาราง 'ของเล่น' ของเราโดยใช้คำสั่ง INSERT INTO สำหรับการสังเกตแต่ละครั้งภายในวงเล็บฉันได้ระบุค่าของตัวแปรหรือคุณลักษณะแต่ละรายการที่กำหนดไว้ขณะสร้างตาราง

ตัวแปร TID ถูกตั้งค่าเป็น NULL เนื่องจากจะเพิ่มขึ้นอัตโนมัติจาก 1

ตอนนี้เรามาแสดงข้อมูลทั้งหมดที่มีอยู่ในตารางของเรา สามารถทำได้โดยใช้คำสั่งด้านล่าง:

เลือก * จากของเล่น


ขั้นตอนที่ 4: แก้ไขรายการข้อมูล

สมมติว่าคุณตัดสินใจเพิ่มราคา G.I. โจเพราะมันทำให้คุณมีลูกค้ามากมาย คุณจะอัปเดตราคาของตัวแปรในฐานข้อมูลอย่างไร

ทำได้ง่ายเพียงใช้คำสั่งด้านล่าง:

UPDATE ของเล่น SET ราคา = 350 WHERE TID = 6

คำสั่ง UPDATE ช่วยให้คุณสามารถแก้ไขค่า / ตัวแปรที่เก็บไว้ในตารางได้ พารามิเตอร์ SET ช่วยให้คุณเลือกคุณลักษณะเฉพาะและใช้พารามิเตอร์ WHERE เพื่อระบุตัวแปร / ค่าที่คุณต้องการเปลี่ยนแปลง ในคำสั่งด้านบนฉันได้อัปเดตราคาของการป้อนข้อมูลที่มี TID คือ 6 (G.I. Joe)

ตอนนี้เรามาดูตารางที่อัปเดต:

เลือก * จากของเล่น

คุณยังสามารถแก้ไขสิ่งที่คุณต้องการให้แสดงได้โดยอ้างถึงคอลัมน์ที่คุณต้องการดู ตัวอย่างเช่นคำสั่งด้านล่างจะแสดงเฉพาะชื่อของของเล่นและราคาตามลำดับ:

เลือก Item_name ราคาจากของเล่น

ขั้นตอนที่ 5: การดึงข้อมูล

ดังนั้นหลังจากใส่ข้อมูลและแก้ไขแล้วก็ถึงเวลาดึงและดึงข้อมูลตามความต้องการของธุรกิจ นี่คือที่ที่สามารถดึงข้อมูลเพื่อการวิเคราะห์ข้อมูลและการสร้างแบบจำลองข้อมูลเพิ่มเติม

โปรดทราบว่านี่เป็นตัวอย่างง่ายๆในการเริ่มต้นใช้งาน SQL อย่างไรก็ตามในสถานการณ์จริงข้อมูลมีความซับซ้อนและมีขนาดใหญ่กว่ามาก อย่างไรก็ตามคำสั่ง SQL ยังคงเหมือนเดิมและนั่นคือสิ่งที่ทำให้ SQL ง่ายและเข้าใจได้ สามารถประมวลผลชุดข้อมูลที่ซับซ้อนด้วยชุดคำสั่ง SQL ง่ายๆ

ตอนนี้มาดึงข้อมูลด้วยการปรับเปลี่ยนสองสามอย่าง อ้างอิงโค้ดด้านล่างและพยายามทำความเข้าใจว่ามันทำอะไรโดยไม่ต้องดูผลลัพธ์:

เลือก * จากของเล่น LIMIT 2

คุณเดาได้! จะแสดงข้อสังเกตสองประการแรกที่มีอยู่ในตารางของฉัน

มาลองสิ่งที่น่าสนใจกว่านี้

เลือก * จากของเล่นสั่งซื้อตามราคา ASC

ดังแสดงในรูปค่าต่างๆจะถูกจัดเรียงตามลำดับจากน้อยไปหามากของตัวแปรราคา หากคุณต้องการมองหาสินค้าที่ซื้อบ่อยที่สุดสามรายการคุณจะทำอย่างไร?

มันค่อนข้างง่ายจริงๆ!

เลือก * จากของเล่นสั่งซื้อตามปริมาณ DESC LIMIT 3

ลองอีกครั้ง

เลือก * จากของเล่น WHERE Price> 400 ORDER BY Price ASC


ข้อความค้นหานี้แยกรายละเอียดของของเล่นที่มีราคามากกว่า 400 และจัดเรียงผลลัพธ์จากน้อยไปมากของราคา

นั่นคือวิธีที่คุณสามารถประมวลผลข้อมูลโดยใช้ SQL ตอนนี้คุณรู้พื้นฐานของ SQL สำหรับ Data Science แล้วฉันแน่ใจว่าคุณอยากเรียนรู้เพิ่มเติม นี่คือบล็อกสองสามบล็อกที่จะช่วยคุณเริ่มต้น:

  1. วิทยาศาสตร์ข้อมูลคืออะไร? คู่มือสำหรับผู้เริ่มต้นใช้งาน Data Science
  2. MySQL Tutorial - คู่มือสำหรับผู้เริ่มต้นเรียนรู้ MySQL

หากคุณต้องการลงทะเบียนสำหรับหลักสูตรที่สมบูรณ์เกี่ยวกับปัญญาประดิษฐ์และการเรียนรู้ของเครื่อง Edureka มีการดูแลเป็นพิเศษ ที่จะทำให้คุณมีความเชี่ยวชาญในเทคนิคต่างๆเช่นการเรียนรู้ภายใต้การดูแลการเรียนรู้โดยไม่ได้รับการดูแลและการประมวลผลภาษาธรรมชาติ รวมถึงการฝึกอบรมเกี่ยวกับความก้าวหน้าล่าสุดและแนวทางทางเทคนิคในปัญญาประดิษฐ์และการเรียนรู้ของเครื่องเช่นการเรียนรู้เชิงลึกแบบจำลองกราฟิกและการเรียนรู้แบบเสริมกำลัง