นับตั้งแต่ที่ Data Science ได้รับการจัดอันดับให้เป็นงานที่มีแนวโน้มมากที่สุดแห่งยุคเราทุกคนพยายามเข้าร่วมการแข่งขัน . โพสต์บล็อกนี้เกี่ยวกับ SQL for Data Science จะช่วยให้คุณเข้าใจว่า SQL สามารถใช้ในการจัดเก็บเข้าถึงและดึงข้อมูลเพื่อทำการวิเคราะห์ข้อมูลได้อย่างไร
นี่คือรายการหัวข้อที่จะเป็น กล่าวถึงในบล็อกนี้:
เหตุใด SQL จึงจำเป็นสำหรับวิทยาศาสตร์ข้อมูล
คุณทราบหรือไม่ว่าเรากำลังสร้างข้อมูลมากกว่า 2.5 quintillion ไบต์ในแต่ละวัน การสร้างข้อมูลที่ก้าวกระโดดนี้เป็นสาเหตุที่อยู่เบื้องหลังความนิยมของเทคโนโลยีระดับไฮเอนด์เช่น วิทยาศาสตร์ข้อมูล , , และอื่น ๆ
การได้รับข้อมูลเชิงลึกที่เป็นประโยชน์จากข้อมูลคือสิ่งที่เรียกว่า Data Science Data Science เกี่ยวข้องกับการแยกประมวลผลและวิเคราะห์ข้อมูลจำนวนมาก ในปัจจุบันสิ่งที่เราต้องการคือ ที่สามารถใช้ในการจัดเก็บและจัดการข้อมูลจำนวนมหาศาลนี้
SQL สามารถใช้เพื่อจัดเก็บเข้าถึงและดึงข้อมูลจำนวนมหาศาลเพื่อดำเนินกระบวนการ Data Science ทั้งหมดได้อย่างราบรื่นยิ่งขึ้น
SQL คืออะไร?
SQL ซึ่งย่อมาจาก Structured Query Language เป็นภาษาแบบสอบถามที่มีวัตถุประสงค์เพื่อจัดการฐานข้อมูลเชิงสัมพันธ์
แต่ฐานข้อมูลเชิงสัมพันธ์คืออะไร?
ฐานข้อมูลเชิงสัมพันธ์คือกลุ่มของตารางที่กำหนดไว้อย่างชัดเจนซึ่งข้อมูลสามารถเข้าถึงแก้ไขปรับปรุงและอื่น ๆ ได้โดยไม่ต้องแก้ไขตารางฐานข้อมูล SQL เป็นมาตรฐาน (API) สำหรับฐานข้อมูลเชิงสัมพันธ์
กลับมาที่ SQL การเขียนโปรแกรม SQL สามารถใช้เพื่อดำเนินการหลายอย่างกับข้อมูลเช่นการสอบถามการแทรกการอัปเดตการลบบันทึกฐานข้อมูล ตัวอย่างของฐานข้อมูลเชิงสัมพันธ์ที่ใช้ SQL ได้แก่ MySQL Database, Oracle เป็นต้น
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ SQL คุณสามารถไปที่ไฟล์ ติดตามบล็อก:
- การทำความเข้าใจประเภทข้อมูล SQL - สิ่งที่คุณต้องรู้เกี่ยวกับประเภทข้อมูล SQL
- สร้างตารางใน SQL - ทุกสิ่งที่คุณต้องการทราบเกี่ยวกับการสร้างตารางใน SQL
ก่อนที่เราจะเริ่มการสาธิตเกี่ยวกับ SQL เรามาทำความคุ้นเคยกับคำสั่งพื้นฐานของ SQL กันก่อน
พื้นฐานของ SQL
SQL มีชุดคำสั่งง่ายๆในการแก้ไขตารางข้อมูลมาดูคำสั่งพื้นฐานของ SQL กันบ้าง:
- สร้างฐานข้อมูล - สร้างฐานข้อมูลใหม่
- สร้างตาราง - สร้างตารางใหม่
- ใส่ลงใน - แทรกข้อมูลใหม่ลงในฐานข้อมูล
- เลือก - แยกข้อมูลจากฐานข้อมูล
- อัปเดต - อัปเดตข้อมูลในฐานข้อมูล
- ลบ - ลบข้อมูลจากฐานข้อมูล
- แก้ไขฐานข้อมูล - แก้ไขฐานข้อมูล
- แก้ไขตาราง - ปรับเปลี่ยนตาราง
- วางตาราง - ลบตาราง
- สร้างดัชนี - สร้างดัชนีเพื่อค้นหาองค์ประกอบ
- DROP INDEX - ลบ ดัชนี
เพื่อให้เข้าใจ SQL ได้ดีขึ้นมาติดตั้ง MySQL และดูว่าคุณจะเล่นกับข้อมูลได้อย่างไร
การติดตั้ง MySQL
การติดตั้ง MySQL เป็นงานง่ายๆ นี่คือไฟล์ คำแนะนำทีละขั้นตอน ที่จะช่วยคุณติดตั้ง MySQL บนระบบของคุณ
เมื่อคุณติดตั้งเสร็จแล้ว MySQL ทำตามส่วนด้านล่างเพื่อดูการสาธิตง่ายๆที่จะแสดงให้คุณเห็นว่าคุณสามารถแทรกจัดการและแก้ไขข้อมูลได้อย่างไร
ผสานซอร์สโค้ด c ++ เรียงลำดับ
SQL สำหรับวิทยาศาสตร์ข้อมูล - การสาธิต MySQL
ในการสาธิตนี้เราจะดูวิธีสร้างฐานข้อมูลและประมวลผล นี่เป็นการสาธิตระดับเริ่มต้นเพื่อให้คุณเริ่มต้นด้วยการวิเคราะห์ข้อมูลบน SQL
เริ่มกันเลย!
ขั้นตอนที่ 1: สร้างฐานข้อมูล SQL
ฐานข้อมูล SQL คือคลังเก็บข้อมูลที่สามารถจัดเก็บข้อมูลในรูปแบบที่มีโครงสร้าง ตอนนี้เรามาสร้างฐานข้อมูลโดยใช้ MySQL :
สร้างฐานข้อมูล edureka ใช้ edureka
ในโค้ดด้านบนมีคำสั่ง SQL สองคำสั่ง:
บันทึก : คำสั่ง SQL ถูกกำหนดเป็นตัวพิมพ์ใหญ่และใช้เซมิโคลอนเพื่อยุติคำสั่ง SQL
สร้างฐานข้อมูล: คำสั่งนี้สร้างฐานข้อมูลชื่อ 'edureka'
ใช้: คำสั่งนี้ใช้เพื่อเปิดใช้งานฐานข้อมูล ที่นี่เรากำลังเปิดใช้งานฐานข้อมูล 'edureka'
ขั้นตอนที่ 2: สร้างตารางที่มีคุณสมบัติข้อมูลที่จำเป็น
การสร้างตารางทำได้ง่ายเพียงแค่สร้างฐานข้อมูล คุณเพียงแค่กำหนดตัวแปรหรือคุณสมบัติของตารางด้วยประเภทข้อมูลที่เกี่ยวข้อง มาดูกันว่าสามารถทำได้อย่างไร:
สร้างของเล่นตาราง (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, Quantity INTEGER)
ในข้อมูลโค้ดด้านบนเกิดสิ่งต่อไปนี้:
- ใช้คำสั่ง 'สร้างตาราง' เพื่อสร้างตารางที่เรียกว่าของเล่น
- ตารางของเล่นประกอบด้วยคุณสมบัติ 4 ประการ ได้แก่ TID (รหัสธุรกรรม) ชื่อรายการราคาและปริมาณ
- ตัวแปรแต่ละตัวถูกกำหนดด้วยชนิดข้อมูลตามลำดับ
- ตัวแปร TID ถูกประกาศเป็นคีย์หลัก คีย์หลักโดยทั่วไปหมายถึงตัวแปรที่สามารถจัดเก็บค่าเฉพาะได้
คุณสามารถตรวจสอบรายละเอียดของตารางที่กำหนดเพิ่มเติมได้โดยใช้คำสั่งต่อไปนี้:
อธิบายของเล่น
ขั้นตอนที่ 3: การแทรกข้อมูลลงในตาราง
ตอนนี้เราได้สร้างตารางแล้วมาเติมเต็มด้วยค่าบางอย่าง ก่อนหน้านี้ในบล็อกนี้ฉันได้กล่าวถึงวิธีที่คุณสามารถเพิ่มข้อมูลลงในตารางโดยใช้คำสั่งเดียวนั่นคือ INSERT INTO
มาดูกันว่าจะทำอย่างไร:
สุดท้ายสุดท้ายและจบใน java
INSERT INTO toys VALUES (NULL, 'Train', 550, 88) INSERT INTO toys VALUES (NULL, 'Hotwheels_car', 350, 80) INSERT INTO toys VALUES (NULL, 'Magic_Pencil', 70, 100) INSERT INTO toys VALUES ( NULL, 'Dog_house', 120, 54) INSERT INTO toys VALUES (NULL, 'Skateboard', 700, 42) INSERT INTO toys VALUES (NULL, 'GI Joe', 300, 120)
ในข้อมูลโค้ดด้านบนเราเพียงแค่ใส่ข้อสังเกต 6 ข้อลงในตาราง 'ของเล่น' ของเราโดยใช้คำสั่ง INSERT INTO สำหรับการสังเกตแต่ละครั้งภายในวงเล็บฉันได้ระบุค่าของตัวแปรหรือคุณลักษณะแต่ละรายการที่กำหนดไว้ขณะสร้างตาราง
ตัวแปร TID ถูกตั้งค่าเป็น NULL เนื่องจากจะเพิ่มขึ้นอัตโนมัติจาก 1
ตอนนี้เรามาแสดงข้อมูลทั้งหมดที่มีอยู่ในตารางของเรา สามารถทำได้โดยใช้คำสั่งด้านล่าง:
เลือก * จากของเล่น
ขั้นตอนที่ 4: แก้ไขรายการข้อมูล
สมมติว่าคุณตัดสินใจเพิ่มราคา G.I. โจเพราะมันทำให้คุณมีลูกค้ามากมาย คุณจะอัปเดตราคาของตัวแปรในฐานข้อมูลอย่างไร
ทำได้ง่ายเพียงใช้คำสั่งด้านล่าง:
UPDATE ของเล่น SET ราคา = 350 WHERE TID = 6
คำสั่ง UPDATE ช่วยให้คุณสามารถแก้ไขค่า / ตัวแปรที่เก็บไว้ในตารางได้ พารามิเตอร์ SET ช่วยให้คุณเลือกคุณลักษณะเฉพาะและใช้พารามิเตอร์ WHERE เพื่อระบุตัวแปร / ค่าที่คุณต้องการเปลี่ยนแปลง ในคำสั่งด้านบนฉันได้อัปเดตราคาของการป้อนข้อมูลที่มี TID คือ 6 (G.I. Joe)
ตอนนี้เรามาดูตารางที่อัปเดต:
เลือก * จากของเล่น
คุณยังสามารถแก้ไขสิ่งที่คุณต้องการให้แสดงได้โดยอ้างถึงคอลัมน์ที่คุณต้องการดู ตัวอย่างเช่นคำสั่งด้านล่างจะแสดงเฉพาะชื่อของของเล่นและราคาตามลำดับ:
เลือก Item_name ราคาจากของเล่น
ขั้นตอนที่ 5: การดึงข้อมูล
ดังนั้นหลังจากใส่ข้อมูลและแก้ไขแล้วก็ถึงเวลาดึงและดึงข้อมูลตามความต้องการของธุรกิจ นี่คือที่ที่สามารถดึงข้อมูลเพื่อการวิเคราะห์ข้อมูลและการสร้างแบบจำลองข้อมูลเพิ่มเติม
โปรดทราบว่านี่เป็นตัวอย่างง่ายๆในการเริ่มต้นใช้งาน SQL อย่างไรก็ตามในสถานการณ์จริงข้อมูลมีความซับซ้อนและมีขนาดใหญ่กว่ามาก อย่างไรก็ตามคำสั่ง SQL ยังคงเหมือนเดิมและนั่นคือสิ่งที่ทำให้ SQL ง่ายและเข้าใจได้ สามารถประมวลผลชุดข้อมูลที่ซับซ้อนด้วยชุดคำสั่ง SQL ง่ายๆ
ตอนนี้มาดึงข้อมูลด้วยการปรับเปลี่ยนสองสามอย่าง อ้างอิงโค้ดด้านล่างและพยายามทำความเข้าใจว่ามันทำอะไรโดยไม่ต้องดูผลลัพธ์:
เลือก * จากของเล่น LIMIT 2
คุณเดาได้! จะแสดงข้อสังเกตสองประการแรกที่มีอยู่ในตารางของฉัน
มาลองสิ่งที่น่าสนใจกว่านี้
เลือก * จากของเล่นสั่งซื้อตามราคา ASC
ดังแสดงในรูปค่าต่างๆจะถูกจัดเรียงตามลำดับจากน้อยไปหามากของตัวแปรราคา หากคุณต้องการมองหาสินค้าที่ซื้อบ่อยที่สุดสามรายการคุณจะทำอย่างไร?
มันค่อนข้างง่ายจริงๆ!
เลือก * จากของเล่นสั่งซื้อตามปริมาณ DESC LIMIT 3
ลองอีกครั้ง
เลือก * จากของเล่น WHERE Price> 400 ORDER BY Price ASC
ข้อความค้นหานี้แยกรายละเอียดของของเล่นที่มีราคามากกว่า 400 และจัดเรียงผลลัพธ์จากน้อยไปมากของราคา
นั่นคือวิธีที่คุณสามารถประมวลผลข้อมูลโดยใช้ SQL ตอนนี้คุณรู้พื้นฐานของ SQL สำหรับ Data Science แล้วฉันแน่ใจว่าคุณอยากเรียนรู้เพิ่มเติม นี่คือบล็อกสองสามบล็อกที่จะช่วยคุณเริ่มต้น:
- วิทยาศาสตร์ข้อมูลคืออะไร? คู่มือสำหรับผู้เริ่มต้นใช้งาน Data Science
- MySQL Tutorial - คู่มือสำหรับผู้เริ่มต้นเรียนรู้ MySQL
หากคุณต้องการลงทะเบียนสำหรับหลักสูตรที่สมบูรณ์เกี่ยวกับปัญญาประดิษฐ์และการเรียนรู้ของเครื่อง Edureka มีการดูแลเป็นพิเศษ ที่จะทำให้คุณมีความเชี่ยวชาญในเทคนิคต่างๆเช่นการเรียนรู้ภายใต้การดูแลการเรียนรู้โดยไม่ได้รับการดูแลและการประมวลผลภาษาธรรมชาติ รวมถึงการฝึกอบรมเกี่ยวกับความก้าวหน้าล่าสุดและแนวทางทางเทคนิคในปัญญาประดิษฐ์และการเรียนรู้ของเครื่องเช่นการเรียนรู้เชิงลึกแบบจำลองกราฟิกและการเรียนรู้แบบเสริมกำลัง