คำถามสัมภาษณ์ Google Data Science: สิ่งที่คุณต้องรู้เพื่อถอดรหัส



บทความนี้มี Questiosn สัมภาษณ์วิทยาศาสตร์ข้อมูลของ Google กระบวนการสัมภาษณ์และข้อกำหนดเบื้องต้นในการสมัครงานที่ Google

การได้รับการว่าจ้างใน บริษัท ที่มีชื่อเสียงระดับโลกอย่าง Google เป็นงานในฝันของผู้คนจำนวนมาก พวกเขามีนักวิทยาศาสตร์การวิจัย AI ที่มีความสามารถมากที่สุด และ ในโลก. แหล่งข้อมูลสำหรับ Google มีไม่มาก คำถามสัมภาษณ์ออนไลน์และการหางานทำที่นั่นไม่ใช่เรื่องง่าย ดังนั้นฉันจะพูดถึงหัวข้อต่อไปนี้ในบทความนี้:

ลักษณะงานและข้อกำหนด

โดยมีเงินเดือนเฉลี่ยอยู่ที่ 169,067 ดอลลาร์ รวมถึงโบนัส เงินเดือนของ Google Data Scientist มีตั้งแต่ 120,000 เหรียญ - 280,000 เหรียญ . ด้วยเงินเดือนที่สูงนี้คุณต้องทราบข้อกำหนดที่เหมาะสมสำหรับงานที่คุณสมัคร แม้ว่าข้อกำหนดจะแตกต่างกันไปในแต่ละตำแหน่ง แต่ด้านล่างนี้คือข้อกำหนดทั่วไปบางประการ:

ความต้องการขั้นต่ำ:





google

  • ปริญญาโทสาขาวินัยเชิงปริมาณ (สถิติ, การวิจัยปฏิบัติการ, วิทยาการคอมพิวเตอร์)
  • มีประสบการณ์ทำงาน 2 ปีในสายงานที่เกี่ยวข้องกับการวิเคราะห์ข้อมูล
  • มีประสบการณ์กับซอฟต์แวร์ทางสถิติ (เช่น , , MATLAB, Pandas) และ
  • สัมผัสกับภาษาฐานข้อมูล (เช่น SQL )

หน้าที่ความรับผิดชอบ:



  • ทำงานกับชุดข้อมูลขนาดใหญ่ที่ซับซ้อน แก้ไขปัญหาการวิเคราะห์ที่ยากและไม่เป็นกิจวัตรโดยใช้วิธีการวิเคราะห์ขั้นสูงตามความจำเป็น
  • ดำเนินการวิเคราะห์ซึ่งรวมถึงการรวบรวมข้อมูลและข้อกำหนดข้อกำหนดการประมวลผลการวิเคราะห์การส่งมอบอย่างต่อเนื่องและการนำเสนอ
  • สร้างและสร้างต้นแบบไปป์ไลน์การวิเคราะห์ซ้ำ ๆ เพื่อให้ข้อมูลเชิงลึกในระดับ
  • พัฒนาความรู้ที่ครอบคลุมเกี่ยวกับโครงสร้างและเมตริกข้อมูลของ Google สนับสนุนการเปลี่ยนแปลงที่จำเป็นสำหรับการพัฒนาผลิตภัณฑ์
  • โต้ตอบข้ามสายงานการให้คำแนะนำทางธุรกิจ (เช่นผลประโยชน์ด้านต้นทุนการคาดการณ์การวิเคราะห์การทดลอง)
  • วิจัยและพัฒนาวิธีการวิเคราะห์การคาดการณ์และการเพิ่มประสิทธิภาพเพื่อปรับปรุงคุณภาพของผลิตภัณฑ์ที่รองรับผู้ใช้ของ Google

กระบวนการสัมภาษณ์ Google Data Science

การล้างรายการโปรดเป็นงานที่ยากซึ่งขึ้นอยู่กับคุณ CV, จดหมายสมัครงาน และ ประสบการณ์ . Google วิทยาศาสตร์ข้อมูล คำถามสัมภาษณ์เป็นส่วนผสมของของเล่นพัฒนาสมองและคำถามทางเทคนิค โดยปกติกระบวนการแรกคือการสัมภาษณ์ทางโทรศัพท์

สัมภาษณ์ทางโทรศัพท์:

ประกอบด้วยคำถามส่วนใหญ่ขึ้นอยู่กับ (คอนกรีตและทฤษฎี) และอิงตามอย่างมาก . คำถามยังแตกต่างกันไปตามโครงการที่คุณทำ
  • กรณีที่ 1: บทสัมภาษณ์ได้ถามเกี่ยวกับเทคนิคการแยกคุณลักษณะ PCA (ใช้ในโครงการ) การวิเคราะห์สหสัมพันธ์เทคนิคการจำแนกบางประเภทที่ใช้ (SVM, GBM, neural net) ทำไมไม่ถดถอยโลจิสติกส์ทำไมต้อง GBM - โดยทั่วไปคำถามเกี่ยวกับการแยกชั้น
  • กรณีที่ 2: เหตุใดจึงต้องใช้การเลือกคุณสมบัติ ถ้าตัวทำนายสองตัวมีความสัมพันธ์กันอย่างมากผลต่อสัมประสิทธิ์ในการถดถอยโลจิสติกส์คืออะไร? ช่วงความเชื่อมั่นของสัมประสิทธิ์คืออะไร?
  • กรณีที่ 3: ดิสก์กำลังหมุนอยู่บนแกนหมุนและคุณไม่ทราบทิศทางที่ดิสก์กำลังหมุน คุณได้รับชุดหมุด คุณจะใช้หมุดเพื่ออธิบายวิธีที่ดิสก์หมุนอย่างไร?
หลังจากการสัมภาษณ์ทางโทรศัพท์จะเป็นการเผชิญหน้าและรอบการเข้ารหัส ดังนั้นเรามาพูดคุยเกี่ยวกับคำถามสัมภาษณ์ Google Data Science ที่พบบ่อยที่สุด แม้ว่าคำถามเหล่านี้อาจไม่ได้ถูกถามอย่างตรงตามที่ระบุไว้ด้านล่าง แต่ฉันพยายามพูดถึงคำถามเหล่านี้เป็นจำนวนมาก

คำถามสัมภาษณ์ Google Data Science

คำถามเหล่านี้ไม่ใช่เรื่องน่าสงสัยเนื่องจาก Google ได้หยุดถามคำถามเหล่านั้นแทนจึงมีคำถามคล้าย ๆ กันที่พวกเขาโทรหา คำถามในการแก้ปัญหา . มีคำถามเกี่ยวกับการเรียนรู้ของเครื่องจำนวนมากตั้งแต่คำถามทั่วไปไปจนถึงคำถามที่ใช้งานได้จริง Google โดยทั่วไปจะครอบคลุมหัวข้อต่างๆมากกว่าความลึก คำถามที่ 1 คุณอยู่ที่คาสิโนและมีสองลูกเต๋าให้เล่น คุณชนะ $ 10 ทุกครั้งที่คุณหมุน 5 หากคุณเล่นจนชนะแล้วหยุดการจ่ายเงินที่คาดว่าจะได้รับคืออะไร? คำถามที่ 2 คุณกำลังจะขึ้นเครื่องบินไปลอนดอนคุณต้องการทราบว่าคุณต้องนำร่มมาด้วยหรือไม่ คุณโทรหาเพื่อนสามคนแบบสุ่มและแต่ละคนถ้าฝนตก ความน่าจะเป็นที่เพื่อนของคุณกำลังพูดความจริงคือ 2/3 และความน่าจะเป็นที่พวกเขากำลังเล่นตลกกับคุณด้วยการโกหกคือ 1/3 ถ้าทั้ง 3 คนบอกว่าฝนตกความน่าจะเป็นที่ลอนดอนฝนจะตกจริงๆ ไตรมาสที่ 3 จะเพิ่มใหม่ได้อย่างไร เฟสบุ๊ค สมาชิกไปยังฐานข้อมูลของสมาชิกและรหัสความสัมพันธ์กับผู้อื่นในฐานข้อมูล? Q4. คุณจะทดสอบได้อย่างไรว่ามีความเป็นไปได้ที่ผู้ใช้จะใช้งานได้เพิ่มขึ้นหลังจาก 6 เดือนเนื่องจากผู้ใช้มีเพื่อนเพิ่มขึ้นในขณะนี้ คำถามที่ 5 คุณจะได้รับไพ่ 40 ใบที่มีสี่สีที่แตกต่างกัน - ไพ่สีเขียว 10 ใบ, ไพ่สีแดง 10 ใบ, ไพ่สีน้ำเงิน 10 ใบและใบเหลือง 10 ใบ ไพ่ของแต่ละสีจะมีหมายเลขตั้งแต่หนึ่งถึงสิบ สุ่มไพ่สองใบ ค้นหาความน่าจะเป็นที่ไพ่ที่หยิบมาไม่ใช่หมายเลขเดียวกันและสีเดียวกัน คำถาม 6. สร้างโปรแกรมในภาษาที่คุณเลือกเพื่ออ่านไฟล์ข้อความพร้อมทวีตต่างๆ ผลลัพธ์ควรเป็นไฟล์ข้อความ 2 ไฟล์ - ไฟล์หนึ่งมีรายการคำที่ไม่ซ้ำกันทั้งหมดในทวีตทั้งหมดพร้อมกับจำนวนคำที่ซ้ำกันและไฟล์ที่สองควรมีจำนวนคำที่ไม่ซ้ำกันสำหรับทวีตทั้งหมด คำถามที่ 7 คุณจะทำอย่างไรหากการลบค่าที่ขาดหายไปจากชุดข้อมูลทำให้เกิดอคติ คำถามที่ 8 ดิสก์กำลังหมุนอยู่บนแกนหมุนและคุณไม่ทราบทิศทางที่ดิสก์กำลังหมุน คุณได้รับชุดหมุด คุณจะใช้หมุดเพื่ออธิบายวิธีที่ดิสก์หมุนอย่างไร? คำถาม 9 คุณจะออกแบบเครื่องมือแนะนำสำหรับงานอย่างไร? คำถามที่ 10 คุณต้องการสร้างผลิตภัณฑ์ประเภทใดที่ Google คำถาม 11 รถยนต์ได้รับการปลูกฝังระบบติดตามความเร็วเพื่อให้ บริษัท ประกันภัยสามารถติดตามสถานะการขับขี่ของเราได้ จากรูปแบบใหม่นี้คำถามทางธุรกิจประเภทใดที่สามารถตอบได้? คำถามที่ 12 คุณจะตัดสินใจได้อย่างไรว่าอัลกอริทึมหนึ่งดีกว่าอีกอันหนึ่ง? คำถามที่ 13 กล่องมีใบแดง 12 ใบและใบดำ 12 ใบ อีกกล่องมีใบแดง 24 ใบและใบดำ 24 ใบ คุณต้องการจั่วไพ่สองใบโดยสุ่มจากหนึ่งในสองกล่องกล่องใดมีโอกาสได้ไพ่ที่มีสีเดียวกันมากกว่าและเพราะเหตุใด คำถาม 14 อะไรคือความแตกต่างระหว่างรุ่นที่มีถุงและรุ่นที่เพิ่มขึ้น? คำถามที่ 15 คุณกำลังสร้างรายงานสำหรับการอัปโหลดเนื้อหาของผู้ใช้ทุกเดือนและสังเกตเห็นจำนวนการอัปโหลดที่เพิ่มขึ้นอย่างกะทันหันในเดือนมกราคม การอัปโหลดที่เพิ่มขึ้นคือโดยเฉพาะอย่างยิ่งในการอัปโหลดรูปภาพ คุณคิดว่าอะไรเป็นสาเหตุของสิ่งนี้และคุณจะทดสอบการพุ่งขึ้นอย่างกะทันหันนี้อย่างไร? คำถามที่ 16 คุณเป็นเจ้าของธุรกิจเสื้อผ้าและต้องการปรับปรุงตำแหน่งของคุณในตลาด คุณจะทำอย่างไรจากระดับพื้นดิน? คำถามที่ 17 คุณจะตัดสินใจได้อย่างไรว่าอัลกอริทึมการกำหนดราคาไฟกระชากทั้งสองเวอร์ชันใดทำงานได้ดีกว่าสำหรับ บริษัท การบินใด ๆ คำถามที่ 18 ระดับความอิสระของบ่วงบาศคืออะไร? คำถามที่ 19 อะไรคือความแตกต่างระหว่างตัววนซ้ำตัวสร้างและความเข้าใจรายการใน Python คำถาม 20. ด้วยชุดของหน้าเว็บและการเปลี่ยนแปลงบนเว็บไซต์คุณจะทดสอบคุณลักษณะเว็บไซต์ใหม่เพื่อตรวจสอบว่าการเปลี่ยนแปลงทำงานในเชิงบวกได้อย่างไร คำถามที่ 21 ให้เมทริกซ์มิติ MxN กับแต่ละเซลล์ที่มีตัวอักษรให้ค้นหาว่ามีสตริงอยู่ในนั้นหรือไม่ คำถามที่ 22 คุณจะสร้างระบบแคชโดยใช้โครงสร้างข้อมูลขั้นสูงเช่น hashmap ได้อย่างไร? คำถามที่ 23 หากคุณสามารถรับชุดข้อมูลในหัวข้อที่สนใจได้โดยไม่คำนึงถึงวิธีการรวบรวมหรือทรัพยากรชุดข้อมูลจะเป็นอย่างไรและคุณจะทำอย่างไรกับมัน คำถามที่ 24 วิธีการตรวจจับความผิดปกติคืออะไร? คำถามที่ 25 การแคชทำงานอย่างไรและคุณใช้ใน Data Science อย่างไร เอาล่ะเรามาจบบทความนี้กัน คำถามสัมภาษณ์ Google Data Science เป็นส่วนใหญ่ ตามสถานการณ์ และต้องการให้คุณมี ความสามารถในการแก้ปัญหา และยิ่งไปกว่านั้นคุณต้องรู้วิธีใช้ Data Science กับสถานการณ์เหล่านี้ ฉันหวังว่านี่จะทำให้คุณมีมุมมองในการเตรียมพร้อมสำหรับการสัมภาษณ์ Data Science ในอนาคต ไม่ว่าจะเป็น Google, Microsoft, Apple หรือ Uber ยักษ์ใหญ่ด้านเทคโนโลยีทั้งหมดถามคำถามประเภทเดียวกันเมื่อพูดถึง Data Science เนื่องจากเป็นสาขาใหม่ที่กว้างใหญ่และในเวลาเดียวกัน ทำให้คุณมีความเชี่ยวชาญในเครื่องมือและระบบที่ผู้เชี่ยวชาญด้านวิทยาศาสตร์ข้อมูลใช้ รวมถึงการฝึกอบรมเกี่ยวกับสถิติวิทยาศาสตร์ข้อมูล Python Apache Spark & ​​Scala Tensorflow และ Tableau หลักสูตรนี้ได้รับการกำหนดโดยการวิจัยอย่างละเอียดเกี่ยวกับคำอธิบายงานมากกว่า 5,000 รายการทั่วโลก หากคุณมีข้อสงสัยใด ๆ อย่าลังเลที่จะพูดถึงในส่วนความคิดเห็นด้านล่าง