โครงการแมชชีนเลิร์นนิงล่าสุดที่จะลองในปี 2019



บทความนี้จะให้ความรู้ที่ครอบคลุมเกี่ยวกับโครงการ Machine Learning ในอุตสาหกรรมและความก้าวหน้าที่เกิดขึ้นในพื้นที่นี้

เห็นได้ชัดว่าเป็นสนามที่ได้เห็นความก้าวหน้าอย่างบ้าคลั่งในช่วงสองสามปีที่ผ่านมา แนวโน้มและความก้าวหน้านี้ได้สร้างโอกาสในการทำงานมากมายในอุตสาหกรรม ความจำเป็นในการ วิศวกรการเรียนรู้ของเครื่อง เป็นที่ต้องการสูงและกระแสนี้เกิดจากการพัฒนาเทคโนโลยีและการสร้างข้อมูลจำนวนมหาศาลหรือที่เรียกว่า Big Data ดังนั้นในบทความนี้ฉันจะพูดถึงโครงการแมชชีนเลิร์นนิงที่น่าทึ่งที่สุดที่ควรรู้และดำเนินการตามลำดับต่อไปนี้:

Machine Learning คืออะไร?

การเรียนรู้ของเครื่องเป็นแนวคิดที่ช่วยให้เครื่องสามารถเรียนรู้จากตัวอย่างและประสบการณ์ได้โดยไม่ต้องตั้งโปรแกรมไว้อย่างชัดเจน ดังนั้นแทนที่จะเขียนโค้ดสิ่งที่คุณทำคือคุณป้อนข้อมูลไปยังอัลกอริทึมทั่วไปและอัลกอริทึม / เครื่องจะสร้างตรรกะตามข้อมูลที่กำหนด





ใครคือ ML Engineer

ขั้นตอนการเรียนรู้ของเครื่อง

อัลกอริทึมการเรียนรู้ของเครื่องจะเป็นไปตามรูปแบบหรือขั้นตอนทั่วไป



การรวบรวมข้อมูล: ขั้นตอนนี้เกี่ยวข้องกับการรวบรวมข้อมูลที่เกี่ยวข้องทั้งหมดจากแหล่งต่างๆ

การโต้เถียงข้อมูล: เป็นกระบวนการทำความสะอาดและแปลง“ ข้อมูลดิบ” ให้อยู่ในรูปแบบที่สะดวกในการบริโภค

วิเคราะห์ข้อมูล: วิเคราะห์ข้อมูลเพื่อเลือกและกรองข้อมูลที่จำเป็นในการเตรียมแบบจำลอง



อัลกอริทึมรถไฟ: อัลกอริทึมได้รับการฝึกฝนเกี่ยวกับชุดข้อมูลการฝึกอบรมซึ่งอัลกอริทึมเข้าใจรูปแบบและกฎที่ควบคุมข้อมูล

แบบทดสอบ: ชุดข้อมูลการทดสอบจะกำหนดความถูกต้องของแบบจำลองของเรา

การปรับใช้: หากยอมรับความเร็วและความแม่นยำของโมเดลได้ก็ควรนำโมเดลนั้นไปใช้ในระบบจริง หลังจากนำโมเดลไปใช้ตามประสิทธิภาพโมเดลจะได้รับการอัปเดตและปรับปรุงหากประสิทธิภาพลดลงโมเดลจะได้รับการฝึกอบรมใหม่

ประเภทของการเรียนรู้ของเครื่อง

Machine Learning แบ่งออกเป็นสามประเภทย่อย:

การเรียนรู้ภายใต้การดูแล: เป็นตัวแปรที่คุณมีตัวแปรอินพุต (x) และตัวแปรเอาต์พุต (Y) และคุณใช้อัลกอริทึมเพื่อเรียนรู้ฟังก์ชันการแม็ปจากอินพุตไปยังเอาต์พุต

การเรียนรู้ที่ไม่มีผู้ดูแล: บางครั้งข้อมูลที่ระบุไม่มีโครงสร้างและไม่มีป้ายกำกับ ดังนั้นจึงเป็นเรื่องยากที่จะจัดประเภทข้อมูลในประเภทต่างๆ การเรียนรู้ที่ไม่มีผู้ดูแลช่วยแก้ปัญหานี้ การเรียนรู้นี้ใช้เพื่อจัดกลุ่มข้อมูลอินพุตในชั้นเรียนโดยอาศัยคุณสมบัติทางสถิติ

การเรียนรู้การเสริมแรง: ทั้งหมดนี้เกี่ยวกับการดำเนินการที่เหมาะสมเพื่อให้ได้รับรางวัลสูงสุดในสถานการณ์หนึ่ง ๆ
เมื่อพูดถึงการเรียนรู้แบบเสริมแรงจะไม่มีผลลัพธ์ที่คาดหวัง ตัวแทนเสริมกำลังตัดสินใจว่าจะดำเนินการใดเพื่อดำเนินงานที่กำหนด ในกรณีที่ไม่มีชุดข้อมูลการฝึกอบรมจะต้องเรียนรู้จากประสบการณ์

ตอนนี้เรามาดูโครงการ Real-Life Machine Learning สองสามโครงการที่สามารถช่วยให้ บริษัท ต่างๆสร้างผลกำไรได้

การใช้งานในอุตสาหกรรม

1. MOTION STUDIO

โดเมน: ครึ่ง

โฟกัส: เพิ่มประสิทธิภาพกระบวนการคัดเลือก

เมนูแบบเลื่อนลงในเชิงมุม js

ความท้าทายทางธุรกิจ: Motion Studio เป็นโรงงานผลิตรายการวิทยุที่ใหญ่ที่สุดในยุโรป มีรายได้มากกว่าพันล้านดอลลาร์ บริษัท จึงตัดสินใจเปิดตัวรายการเรียลลิตี้โชว์ใหม่: อาร์เจสตาร์. การตอบสนองต่อการแสดงเป็นประวัติการณ์และ บริษัท ก็เต็มไปด้วยคลิปเสียง คุณในฐานะผู้เชี่ยวชาญด้าน ML จะต้องจัดประเภทเสียงเป็นชาย / หญิงเพื่อให้การกรองระดับแรกเร็วขึ้น

ประเด็นสำคัญ: ตัวอย่างเสียงอยู่ในสำเนียงต่างๆ

ผลประโยชน์ทางธุรกิจ: ตั้งแต่ อาร์เจสตาร์ เป็นรายการเรียลลิตี้เวลาในการคัดเลือกผู้สมัครสั้นมาก ความสำเร็จทั้งหมดของการแสดงและด้วยเหตุนี้ผลกำไรจึงขึ้นอยู่กับการดำเนินการที่รวดเร็วและราบรื่น

นำเข้าแพนด้าในรูปแบบ pd import numpy เป็น np import matplotlib.pyplot เป็น plt import seaborn เป็น sns% matplotlib inline import Warningings Warningings.filterwarnings ('Ignpy') df = pd.read_csv ('voice-Classification.csv') df.head ()

# ตรวจสอบเลขที่ ของระเบียน df.info () df.describe () df.isnull (). sum ()

พิมพ์ ('Shape of Data:', df.shape) print ('จำนวนป้ายกำกับทั้งหมด: {}'. format (df.shape [0])) print ('Number of male: {}'. format (df [ df.label == 'male']. shape [0])) print ('Number of female: {}'. format (df [df.label == 'female']. shape [0]))

X = df.iloc [:,: -1] พิมพ์ (df.shape) พิมพ์ (X.shape)

จาก sklearn.preprocessing import LabelEncoder y = df.iloc [:, - 1] gender_encoder = LabelEncoder () y = gender_encoder.fit_transform (y) y จาก sklearn.preprocessing import StandardScaler scaler = StandardScaler () scaler.fit (X) X = scaler.transform (X) จาก sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.3, random_state = 100) จาก sklearn.svm import SVC จาก sklearn import metrics จาก sklearn.metrics , ความสับสน _matrix svc_model = SVC () svc_model.fit (X_train, y_train) y_pred = svc_model.predict (X_test) พิมพ์ ('คะแนนความแม่นยำ:') พิมพ์ (metrics.accuracy_score (y_test, y_pred))

พิมพ์ (ความสับสน _ เมทริกซ์ (y_test, y_pred))

2. LITHIONPOWER

โดเมน: ยานยนต์

โฟกัส: กระตุ้นไดรเวอร์

ความท้าทายทางธุรกิจ: Lithionpower เป็นผู้ให้บริการแบตเตอรี่รถยนต์ไฟฟ้า (e-vehicle) รายใหญ่ที่สุด โดยทั่วไปแล้วผู้ขับขี่จะเช่าแบตเตอรี่เป็นเวลา 1 วันจากนั้นจึงเปลี่ยนเป็นแบตเตอรี่ที่ชาร์จแล้วจาก บริษัท Lithionpower มีรูปแบบการกำหนดราคาที่ผันแปรตามประวัติการขับขี่ของผู้ขับขี่ เนื่องจากอายุการใช้งานของแบตเตอรี่ขึ้นอยู่กับปัจจัยต่างๆเช่นการใช้งานเกินความเร็วระยะทางที่ขับเคลื่อนต่อวันเป็นต้นคุณในฐานะผู้เชี่ยวชาญ ML จะต้องสร้างรูปแบบคลัสเตอร์ที่สามารถจัดกลุ่มผู้ขับขี่เข้าด้วยกันตามข้อมูลการขับขี่

ประเด็นสำคัญ: ผู้ขับขี่จะได้รับแรงจูงใจตามคลัสเตอร์ดังนั้นการจัดกลุ่มจะต้องถูกต้อง

ผลประโยชน์ทางธุรกิจ: เพิ่มผลกำไรสูงสุด 15-20% เนื่องจากผู้ขับขี่ที่มีประวัติไม่ดีจะถูกเรียกเก็บเงินมากขึ้น

นำเข้าแพนด้าเป็น pd import numpy เป็น np import matplotlib.pyplot เป็น plt import seaborn เป็น sns sns.set () # สำหรับการจัดรูปแบบพล็อตคำเตือนการนำเข้าแบบอินไลน์ matplotlib ('ละเว้น') นำเข้า matplotlib.pyplot เป็น plt plt.rcParams [ 'figure.figsize'] = (12, 6) df = pd.read_csv ('driver-data.csv') df.head ()

df.info () df.describe ()

จาก sklearn.cluster นำเข้า KMeans # การ 2 คลัสเตอร์ kmeans = KMeans (n_clusters = 2) df_analyze = df.drop ('id', axis = 1) kmeans.fit (df_analyze)

kmeans.cluster_centers_

พิมพ์ (kmeans.labels_) พิมพ์ (len (kmeans.labels_))

พิมพ์ (ชนิด (kmeans.labels_)) ไม่ซ้ำกัน counts = np.unique (kmeans.labels_, return_counts = True) พิมพ์ (dict (zip (ไม่ซ้ำ, counts)))

df_analyze ['คลัสเตอร์'] = kmeans.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6, ด้าน = 1, fit_reg = เท็จ)

# ตอนนี้มาตรวจสอบคลัสเตอร์เมื่อ n = 4 kmeans_4 = KMeans (n_clusters = 4) kmeans_4.fit (df.drop ('id', axis = 1)) kmeans_4.fit (df.drop ('id', axis = 1)) พิมพ์ (kmeans_4.cluster_centers_) ไม่ซ้ำกัน counts = np.unique (kmeans_4.labels_, return_counts = True) kmeans_4.cluster_centers_ print (dict (zip (unique, counts)))

df_analyze ['คลัสเตอร์'] = kmeans_4.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6, ด้าน = 1, fit_reg = เท็จ)

3. BluEx

โดเมน: โลจิสติกส์

โฟกัส: เส้นทางที่เหมาะสมที่สุด

ความท้าทายทางธุรกิจ: BluEx เป็น บริษัท โลจิสติกส์ชั้นนำในอินเดีย เป็นที่ทราบกันดีว่าการจัดส่งแพ็กเก็ตให้กับลูกค้าอย่างมีประสิทธิภาพ อย่างไรก็ตาม BluEx กำลังเผชิญกับความท้าทายที่คนขับรถตู้ต้องใช้เส้นทางที่ไม่เหมาะสมในการจัดส่ง ทำให้เกิดความล่าช้าและค่าน้ำมันที่สูงขึ้น คุณในฐานะผู้เชี่ยวชาญ ML ต้องสร้างแบบจำลอง ML โดยใช้ Reinforcement Learning เพื่อให้พบเส้นทางที่มีประสิทธิภาพผ่านโปรแกรม

ประเด็นสำคัญ: ข้อมูลมีคุณสมบัติมากมายและการจัดประเภทอาจเป็นเรื่องยุ่งยาก

ผลประโยชน์ทางธุรกิจ: ประหยัดค่าน้ำมันได้ถึง 15% โดยใช้เส้นทางที่เหมาะสมที่สุด

นำเข้า numpy เป็น pylab นำเข้า np เป็น plt import networkx เป็น nx #Initializing points points_list = [(0,1), (1,5), (5,6), (5,4), (1,2), (2 , 3), (2,7)] เป้าหมาย = 7 แมป = {0: 'เริ่ม', 1: '1', 2: '2', 3: '3', 4: '4', 5: '5 ', 6:' 6 ', 7:' 7-Destination '} G = nx.Graph () G.add_edges_from (points_list) pos = nx.spring_layout (G, k = .5, center = points_list [2]) nx .draw_networkx_nodes (G, pos, node_color = 'g') nx.draw_networkx_edges (G, pos, edge_color = 'b') nx.draw_networkx_labels (G, pos) plt.show ()

NO_OF_POINTS = 8 #Inititlaizing R Matrix R = np.matrix (np.ones (shape = (NO_OF_POINTS, NO_OF_POINTS))) R * = -1 สำหรับจุดใน point_list: print (point) if point [1] == goal: R [point] = 150 else: R [point] = 0 if point [0] == goal: R [point [:: - 1]] = 150 else: # reverse of point R [point [:: - 1]] = 0

R [เป้าหมายเป้าหมาย] = 150 R

Q = np.matrix (np.zeros ([NO_OF_POINTS, NO_OF_POINTS])) # พารามิเตอร์การเรียนรู้ gamma = 0.8 initial_state = 1 def available_actions (state): current_state_row = R [state,] av_act = np.where (current_state_row & ampampampgt = 0 ) [1] ส่งคืน av_act available_act = available_actions (initial_state) def sample_next_action (available_actions_range): next_action = int (np.random.choice (available_act, 1)) ส่งคืน next_action action = sample_next_action (available_act) def update (current_state, action, gamma) : max_index = np.where (Q [action,] == np.max (Q [action,])) [1] if max_index.shape [0] & ampampampgt 1: max_index = int (np.random.choice (max_index, size = 1)) else: max_index = int (max_index) max_value = Q [action, max_index] Q [current_state, action] = R [current_state, action] + gamma * max_value print ('max_value', R [current_state, action] + gamma * max_value) if (np.max (Q) & ampampampgt 0): return (np.sum (Q / np.max (Q) * 100)) else: return (0) update (initial_state, action, gamma)

คะแนน = [] สำหรับ i ในช่วง (700): current_state = np.random.randint (0, int (Q.shape [0])) available_act = available_actions (current_state) action = sample_next_action (available_act) score = update (current_state, action, gamma) scores.append (score) print ('Score:', str (score)) print ('Trained Q matrix:') print (Q / np.max (Q) * 100) # Testing current_state = 0 steps = [current_state] ในขณะที่ current_state! = 7: next_step_index = np.where (Q [current_state,] == np.max (Q [current_state,])) [1] ถ้า next_step_index.shape [0] & ampampampgt 1: next_step_index = int (np.random.choice (next_step_index, size = 1)) else: next_step_index = int (next_step_index) steps.append (next_step_index) current_state = next_step_index

พิมพ์ ('เส้นทางที่มีประสิทธิภาพสูงสุด:') พิมพ์ (ขั้นตอน) plt.plot (คะแนน) plt.show ()

โครงการ Open Source Machine Learning ในปี 2019

Detectron : Detectron เป็นระบบซอฟต์แวร์ของ Facebook AI Research ที่ใช้อัลกอริธึมการตรวจจับวัตถุที่ล้ำสมัย เขียนด้วยภาษา Python และขับเคลื่อนโดยกรอบการเรียนรู้เชิงลึกของ Caffe2

เป้าหมายของ Detectron คือการจัดหาโค้ดเบสคุณภาพสูงและประสิทธิภาพสูงสำหรับการวิจัยการตรวจจับวัตถุ ได้รับการออกแบบให้มีความยืดหยุ่นเพื่อรองรับการใช้งานและการประเมินผลงานวิจัยใหม่อย่างรวดเร็ว ประกอบด้วยโมเดลที่ผ่านการฝึกอบรมมากกว่า 50 แบบ

หนาแน่น : การประมาณท่าทางของมนุษย์หนาแน่นมีจุดมุ่งหมายที่การทำแผนที่พิกเซลของมนุษย์ทั้งหมดของภาพ RGB กับพื้นผิว 3 มิติของร่างกายมนุษย์ DensePose-RCNN ถูกนำไปใช้ในเฟรมเวิร์กของ Detectron

TensorFlow.js : เป็นไลบรารีสำหรับพัฒนาและฝึกอบรมโมเดล ML และปรับใช้ในเบราว์เซอร์ มันกลายเป็นรุ่นที่ได้รับความนิยมอย่างมากนับตั้งแต่เปิดตัวเมื่อต้นปีและยังคงสร้างความประหลาดใจให้กับความยืดหยุ่น ด้วยสิ่งนี้คุณสามารถ

  • พัฒนา ML ในเบราว์เซอร์: ใช้ API ที่ยืดหยุ่นและใช้งานง่ายเพื่อสร้างแบบจำลองตั้งแต่เริ่มต้นโดยใช้ไลบรารีพีชคณิตเชิงเส้น JavaScript ระดับต่ำหรือ API ชั้นระดับสูง
  • เรียกใช้โมเดลที่มีอยู่ : ใช้ตัวแปลงโมเดล TensorFlow.js เพื่อเรียกใช้โมเดล TensorFlow ที่มีอยู่แล้วในเบราว์เซอร์
  • ฝึกโมเดลที่มีอยู่ใหม่: ฝึกโมเดล ML ที่มีอยู่ก่อนแล้วอีกครั้งโดยใช้ข้อมูลเซ็นเซอร์ที่เชื่อมต่อกับเบราว์เซอร์หรือข้อมูลฝั่งไคลเอ็นต์อื่น ๆ

เวฟโกลว์: แมชชีนเลิร์นนิงกำลังพัฒนาความก้าวหน้าครั้งใหญ่ในการประมวลผลเสียงและไม่ใช่แค่การสร้างเพลงหรือการจัดหมวดหมู่ WaveGlow เป็นเครือข่าย Generative ตามโฟลว์สำหรับการสังเคราะห์เสียงโดย NVIDIA นักวิจัยยังได้ระบุขั้นตอนที่คุณสามารถปฏิบัติตามหากคุณต้องการฝึกโมเดลของคุณเองตั้งแต่เริ่มต้น

ภาพวาด : ลองนึกภาพว่าคุณมีภาพครึ่งหนึ่งของฉากและคุณต้องการทิวทัศน์เต็มรูปแบบนั่นคือสิ่งที่ภาพที่วาดออกมาสามารถทำเพื่อคุณได้ โปรเจ็กต์นี้เป็นการใช้งาน Keras ของกระดาษ Image Outpainting ของ Stanford แบบจำลองได้รับการฝึกอบรมด้วย 3500 ข้อมูลชายหาดที่ถูกทิ้งโดยมีการโต้แย้งรวมถึง 10,500 ภาพสำหรับ 25 ยุค .

นี่คือกระดาษที่น่าทึ่งพร้อมคำอธิบายโดยละเอียดทีละขั้นตอน ตัวอย่างที่ต้องลองสำหรับผู้ที่ชื่นชอบการเรียนรู้ของเครื่องทุกคน โดยส่วนตัวแล้วนี่เป็นโครงการ Machine Learning ที่ฉันชอบมาก

การเปลี่ยนแปลงที่ใช้งานและแฝงใน Informatica

การประสานกันอย่างลึกซึ้งของจิตรกร : พูดถึงภาพนี่เป็นผลงานชิ้นเอก สิ่งที่อัลกอริทึมนี้ทำคือรับภาพเป็นอินพุตจากนั้นหากคุณเพิ่มองค์ประกอบภายนอกลงในรูปภาพมันจะผสมผสานองค์ประกอบนั้นเข้ากับสภาพแวดล้อมราวกับว่าเป็นส่วนหนึ่งของมัน

คุณสามารถบอกความแตกต่างได้หรือไม่? ไม่มีสิทธิ์? นี่แสดงให้เห็นว่าเรามาไกลแค่ไหนในแง่ของ Machine Learning

DeepMimic: ตอนนี้ให้ดูภาพอย่างใกล้ชิดที่นี่คุณจะเห็นรูปไม้ที่ทำสปินเตะตีกลับและกงล้อ เพื่อนของฉันกำลังเสริมสร้างการเรียนรู้ในเชิงปฏิบัติ DeepMimic คือตัวอย่างการเรียนรู้การเสริมแรงเชิงลึกของทักษะตัวละครที่อิงทางฟิสิกส์

ม่วงแดง : Magenta เป็นโครงการวิจัยที่สำรวจบทบาทของการเรียนรู้ของเครื่องในกระบวนการสร้างงานศิลปะและดนตรี โดยพื้นฐานแล้วสิ่งนี้เกี่ยวข้องกับการพัฒนาอัลกอริธึมการเรียนรู้เชิงลึกและการเสริมสร้างการเรียนรู้ใหม่สำหรับการสร้างเพลงรูปภาพภาพวาดและวัสดุอื่น

นอกจากนี้ยังเป็นการสำรวจในการสร้างเครื่องมือและอินเทอร์เฟซอัจฉริยะที่ช่วยให้ศิลปินและนักดนตรีสามารถขยาย ( ไม่เปลี่ยน! ) กระบวนการของพวกเขาโดยใช้แบบจำลองเหล่านี้ ไปสยายปีกสร้างเนื้อหาที่เป็นเอกลักษณ์ของคุณสำหรับ Instagram หรือ Soundcloud และกลายเป็นผู้มีอิทธิพล

ดังนั้นเราจึงมาถึงตอนจบของบทความ Machine Learning Projects ที่น่าทึ่งนี้ ลองดูตัวอย่างเหล่านี้และแจ้งให้เราทราบในส่วนความคิดเห็นด้านล่าง ฉันหวังว่าคุณจะได้ทราบถึงการนำ Machine Learning ไปใช้จริงในอุตสาหกรรมนี้ Edureka’s ทำให้คุณมีความเชี่ยวชาญในเทคนิคต่างๆเช่นการเรียนรู้ภายใต้การดูแลการเรียนรู้โดยไม่มีผู้ดูแลและการประมวลผลภาษาธรรมชาติ รวมถึงการฝึกอบรมเกี่ยวกับความก้าวหน้าล่าสุดและแนวทางทางเทคนิคในปัญญาประดิษฐ์และการเรียนรู้ของเครื่องเช่นการเรียนรู้เชิงลึกแบบจำลองกราฟิกและการเรียนรู้แบบเสริมกำลัง