سوف تقصف عشوائيا المقابلات الفنية. الجميع يفعل. ها هي البيانات.

عندما تستمع إلى مئات المقابلات الفنية يومًا بعد يوم ، تبدأ في ملاحظة الأنماط. أو في هذه الحالة نقص في الأنماط.

لقد وجدت شيئًا واحدًا متسقًا إلى حد كبير ، واستخدمته كأساس للعبة الشرب:

  • في كل مرة يعتقد شخص ما أن الإجابة على سؤال المقابلة عبارة عن طاولة تجزئة ، تناول مشروبًا.
  • وفي كل مرة يكون الجواب في الواقع هو جدول التجزئة ، تناول مشروبين.

لكن لا تحاول هذه اللعبة. كدت أموت وأنا ألعبها.

السبب الذي يجعلني أقضي أيامي في الاستماع إلى المقابلات الفنية هو أنني شاركت منذ بضع سنوات في تأسيس Interviewing.io ، وهو عبارة عن منصة للمقابلات حيث يمكن للأشخاص التدرب على إجراء المقابلات الفنية دون الكشف عن هويتهم ، وفي أثناء ذلك ، العثور على وظائف.

نتيجة لذلك ، لدي وصول إلى الكثير من البيانات حول كيفية أداء نفس الأشخاص من مقابلة إلى أخرى. واكتشفت الكثير من التقلبات التي تجعلني أتساءل عن موثوقية نتائج المقابلة الفردية تمامًا.

كيف حصلنا على كل هذه البيانات

عندما يتطابق المحاور مع الشخص الذي تتم مقابلته على منصتنا ، فإنهما يلتقيان في بيئة تشفير تعاونية مع صوت ودردشة نصية ولوحة بيضاء ويقفزان مباشرة إلى سؤال تقني.

تميل أسئلة المقابلة على المنصة إلى أن تندرج ضمن فئة ما ستواجهه على شاشة الهاتف لدور هندسة البرمجيات الخلفية. عادةً ما يأتي المحاورون من مزيج من الشركات الكبيرة مثل Google و Facebook و Yelp ، بالإضافة إلى الشركات الناشئة التي تركز على الهندسة مثل Asana و Mattermark و KeepSafe والمزيد.

بعد كل مقابلة ، يقوم المحاورون بتقييم من أجريت معهم المقابلات على عدة أبعاد مختلفة ، بما في ذلك القدرة التقنية. يتم تصنيف القدرة التقنية على مقياس من 1 إلى 4 ، حيث 1 يعني "meh" و 4 "مذهل!" على منصتنا ، تعني النتيجة 3 أو أعلى عمومًا أن الشخص كان جيدًا بما يكفي للمضي قدمًا.

في هذه المرحلة ، قد تقول ، هذا جيد وكل شيء ، لكن ما المشكلة؟ تجمع الكثير من الشركات هذا النوع من البيانات في سياق خطوط الأنابيب الخاصة بها.

وهنا الشيء الذي يجعل لدينا خاص البيانات: في نفس الضيف يمكن القيام به عدة مقابلات، كل منها مع مختلف المحاور و / أو شركة مختلفة. هذا يفتح الباب أمام بعض التحليلات المقارنة المثيرة للاهتمام والتي يتم التحكم فيها إلى حد ما.

النتيجة رقم 1: أداؤك من مقابلة إلى أخرى متقلب

لنبدأ ببعض المرئيات. في الرسم البياني أدناه ، يمثل كل رمز شخص متوسط ​​الدرجة الفنية للشخص الذي تمت مقابلته الفردي الذي أجرى مقابلتين أو أكثر على المنصة.

الشيء الوحيد الذي لا نعرضه في هذا الرسم البياني هو مرور الوقت ، حتى تتمكن من رؤية أداء الأشخاص بمرور الوقت. إنها نوع من الفوضى الساخنة.

المحور ص هو الانحراف المعياري للأداء ، لذلك كلما تقدمت في مستوى أعلى ، أصبح أداء المقابلة أكثر تقلباً.

كما ترى ، فإن ما يقرب من 25٪ من الأشخاص الذين تمت مقابلتهم ثابتون في أدائهم ، والباقي موجودون في كل مكان.

إذا نظرت إلى الرسم البياني أعلاه ، على الرغم من الضوضاء ، يمكنك على الأرجح إجراء بعض التخمينات حول الأشخاص الذين ترغب في إجراء مقابلات معهم.

لكن ضع في اعتبارك أن كل منها يمثل وسيلة . دعنا نتظاهر ، بدلاً من ذلك ، أنه كان عليك اتخاذ قرار بناءً على نقطة بيانات واحدة فقط. هذا هو المكان الذي تصبح فيه الأمور مشبوهًا.

لتوجيه هذه النقطة إلى المنزل حقًا ، يجب عليك زيارة الإصدار التفاعلي الرائع حقًا من هذا الرسم البياني. هناك يمكنك توسيع أداء الجميع ومعرفة كيف كان أداء كل شخص في كل مقابلة. النتائج قد مفاجأة لك! على سبيل المثال:

  • العديد من الأشخاص الذين سجلوا 4 نقاط على الأقل سجلوا أيضًا نقطة واحدة على الأقل 2.
  • إذا نظرنا إلى الأداء العالي (متوسط ​​3.3 أو أعلى) ، فإننا لا نزال نرى قدرًا معقولاً من التباين.
  • تصبح الأمور غامضة حقًا عندما نفكر في الأداء "المتوسط" (المتوسط ​​بين 2.6 و 3.3).

؟ قم بزيارة التصور التفاعلي الرائع حقًا؟

كان لدينا فضول لمعرفة ما إذا كان التقلب يختلف على الإطلاق مع متوسط ​​درجات الأشخاص. بمعنى آخر ، هل كان اللاعبون الأضعف أكثر تقلباً من اللاعبين الأقوياء؟ الجواب لا. عندما أجرينا انحدارًا على الانحراف المعياري مقابل المتوسط ​​، لم نتمكن من التوصل إلى أي علاقة ذات معنى (R-squared ~ = 0.03) ، مما يعني أن الناس في كل مكان - بغض النظر عن مدى قوتهم في المتوسط.

بالنسبة لي ، عند النظر إلى هذه البيانات - ثم التظاهر بأنه كان علي اتخاذ قرار التوظيف بناءً على نتيجة مقابلة واحدة - شعرت وكأنني أنظر إلى صالون جميل ومجهز ببذخ من خلال ثقب المفتاح. أحيانًا ترى قطعة فنية على الحائط ، وأحيانًا ترى مجموعة المشروبات الكحولية ، وأحيانًا ترى ظهر الأريكة فقط.

لذلك ، في مواقف الحياة الواقعية ، عندما تحاول أن تقرر ما إذا كنت ستقدم شخصًا ما إلى الموقع ، فمن المحتمل أنك تحاول تجنب شيئين - الإيجابيات الكاذبة (جلب الأشخاص أسفل شريطك عن طريق الخطأ) والسلبيات الخاطئة (رفض الأشخاص الذي كان يجب أن يكون في).

يتمثل نموذج المقابلات في معظم الشركات الكبرى في أن السلبيات الزائفة أقل سوءًا من الإيجابيات الزائفة. هذا منطقي أليس كذلك؟ مع وجود خط أنابيب كبير بما يكفي وموارد كافية ، حتى مع وجود معدل سلبي خاطئ مرتفع ، ستظل تحصل على الأشخاص الذين تريدهم.

مع ارتفاع المعدل الإيجابي الخاطئ ، قد تحصل على توظيف أرخص ، لكن من المحتمل أن تلحق ضررًا لا رجعة فيه بمنتجك وثقافتك ومعايير التوظيف المستقبلية في هذه العملية. وبالطبع ، فإن الشركات التي تضع معايير وممارسات التوظيف لصناعة بأكملها هي الشركات التي لديها خطوط أنابيب كبيرة وموارد لا تنضب على ما يبدو.

على الرغم من ذلك ، فإن الجانب المظلم من التحسين لمعدلات سلبية كاذبة عالية يطل برأسه في شكل أزمة التوظيف الهندسية الحالية لدينا. هل حالات المقابلة الفردية ، في تجسدها الحالي ، تعطي إشارة كافية؟ أو وسط هذا الطلب الكبير على المواهب ، هل نستبعد الأشخاص المؤهلين لأننا جميعًا ننظر إلى رسم بياني كبير ومتقلب من خلال ثقب مفتاح صغير؟

لذا ، وبغض النظر عن الوعظ الزائدي ، بالنظر إلى مدى تقلب أداء المقابلة ، ما هي احتمالات فشل المرشح الجيد في شاشة الهاتف الفردية؟

النتيجة رقم 2: احتمالات فشلك في مقابلة واحدة بناءً على الأداء السابق

أدناه ، يمكنك رؤية توزيع متوسط ​​الأداء على جميع الأشخاص الذين تمت مقابلتهم.

من أجل معرفة احتمال فشل المرشح الذي حصل على متوسط ​​درجة معينة في مقابلة ، كان علينا القيام ببعض الإحصائيات.

أولاً ، قمنا بتقسيم الأشخاص الذين تمت مقابلتهم إلى مجموعات بناءً على متوسط ​​درجاتهم (مقربًا إلى أقرب 0.25). بعد ذلك ، لكل مجموعة ، حسبنا احتمال الفشل ، أي الحصول على درجة 2 أو أقل. أخيرًا ، للتغلب على مجموعة بيانات البداية الخاصة بنا ليست ضخمة ، قمنا بإعادة تشكيل بياناتنا.

في إجراء إعادة التشكيل لدينا ، تعاملنا مع نتيجة المقابلة كتوزيع متعدد الحدود. بعبارة أخرى ، تظاهرنا بأن كل مقابلة كانت عبارة عن لفة من نرد مرجح من 4 جوانب يتوافق مع مجموعة ذلك المرشح.

ثم أعدنا دحرجة النرد عدة مرات لإنشاء مجموعة بيانات "محاكاة" جديدة لكل مجموعة وحساب احتمالات فشل جديدة لكل مجموعة باستخدام مجموعات البيانات هذه. أدناه ، يمكنك رؤية نتائج تكرار هذه العملية 10000 مرة:

كما ترى ، يتداخل الكثير من التوزيعات أعلاه مع بعضها البعض. هذا مهم لأن هذه التداخلات تخبرنا أنه قد لا توجد فروق ذات دلالة إحصائية بين تلك المجموعات (على سبيل المثال بين 2.75 و 3).

بالتأكيد ، مع ظهور الكثير من البيانات ، قد تصبح الحدود بين المجموعات أكثر وضوحًا. من ناحية أخرى، إذا كنا لا تحتاج إلى كمية هائلة من البيانات للكشف عن الاختلافات في نسبة الفشل، قد تشير إلى أن الناس هم جوهريا متغير بدرجة كبيرة في أدائها.

في نهاية اليوم ، بينما يمكننا أن نقول بثقة أن هناك فرقًا كبيرًا بين الطرف السفلي من الطيف (2.25) مقابل الطرف العلوي (3.75) ، بالنسبة للأشخاص في المنتصف ، فإن الأشياء غامضة.

ومع ذلك ، باستخدام هذه التوزيعات ، حاولنا حساب احتمالية فشل المرشح الذي حصل على درجة متوسطة معينة في مقابلة واحدة:

حقيقة أن الأشخاص الأقوياء بشكل عام (على سبيل المثال يعني ~ = 3) يمكن أن يفسدوا المقابلات الفنية بنسبة تصل إلى 22٪ من الوقت تظهر أن هناك بالتأكيد مجال للتحسين في هذه العملية. ويتفاقم هذا بسبب الغموض العام في منتصف الطيف.

فهل المقابلات محكوم عليها بالفشل؟

بشكل عام ، عندما نفكر في إجراء المقابلات ، نفكر في شيء يجب أن يكون له نتائج متكررة وأن يحمل إشارة قوية. ومع ذلك ، فإن البيانات التي جمعناها تحكي قصة مختلفة.

وتتردد هذه القصة مع كل من تجربتي القصصية كموظف ومع المشاعر التي رأيناها يتردد صداها في المجتمع.

إن مقابلة Zach Holman مع بدء التشغيل هي نتائج رائعة على الانفصال بين عملية المقابلة والوظيفة التي من المفترض أن تملأها.

توصل السادة المحترمون في TripleByte إلى استنتاجات مماثلة من خلال النظر في بياناتهم الخاصة.

واحدة من أكثر التعبيرات المؤثرة لنتائج المقابلات غير المتسقة جاءت مؤخرًا من "مرفوض".

يمكنك أن تراهن على أن العديد من الأشخاص الذين تم رفضهم بعد شاشة الهاتف من قبل الشركة "أ" - ولكنهم يقومون بعمل أفضل أثناء شاشة هاتف مختلفة ، وينتهي بهم الأمر في نهاية المطاف في مكان يتمتع بسمعة طيبة تقليديًا - يتعرضون للضرب من قبل مسؤولي التوظيف في الشركة "أ" بعد 6 أشهر.

وعلى الرغم من جهود الجميع ، فإن دائرة التدليك الغامضة والمتقلبة والعشوائية في نهاية المطاف لعملية التوظيف تسير على قدم وساق.

لذا ، نعم ، إنها بالتأكيد إحدى الاستنتاجات المحتملة وهي أن المقابلة الفنية نفسها محكوم عليها بالفشل بالفعل ولا تقدم إشارة موثوقة وحتمية لمثيل مقابلة واحدة. تعد المقابلات الخوارزمية موضوعًا مثيرًا للجدل ونهتم بشدة بمضايقته.

هناك شيء واحد على وجه الخصوص نحن متحمسون للغاية بشأنه وهو تتبع أداء المقابلة كدالة لنوع المقابلة ، حيث نحصل على المزيد والمزيد من أنواع / مناهج المقابلات المختلفة التي تحدث على المنصة. في الواقع ، يتمثل أحد أهدافنا طويلة المدى في البحث حقًا في بياناتنا ، والنظر إلى مشهد أنماط المقابلات المختلفة ، وإصدار بعض البيانات الجادة القائمة على البيانات حول أنواع المقابلات الفنية التي تؤدي إلى أعلى إشارة.

ومع ذلك ، في غضون ذلك ، أميل إلى فكرة أن الاعتماد على الأداء الكلي له معنى أكبر بكثير من اتخاذ مثل هذا القرار المهم بناءً على مقابلة واحدة عشوائية.

لا يمكن للأداء التجميعي أن يساعد في تصحيح الأداء السيئ بشكل غير معهود فحسب ، بل يمكنه أيضًا التخلص من الأشخاص الذين يقومون بعمل جيد في نهاية المطاف في مقابلة عن طريق الصدفة أو أولئك الذين ، بمرور الوقت ، يقدمون إلى الوحش ويحفظون Cracking the Coding Interview .

أعلم أنه ليس من العملي (أو الممكن) دائمًا جمع بيانات الأداء المجمعة في البرية. ولكن لنفترض أن أداء المرشح هو الحد الفاصل - أو حيث يختلف أدائه بشكل كبير عما تتوقعه. قد يكون من المنطقي إجراء مقابلة معهم مرة أخرى ، مع التركيز على مواد مختلفة ، قبل اتخاذ القرار النهائي.

لقد جمعنا الكثير من بيانات أداء المقابلة التي لم يتم تضمينها بعد في هذا التحليل ، لذلك إذا كنت مهتمًا بمعرفة ما إذا كان أداء المقابلة لا يزال تعسفيًا ، فابق على اتصال!

هل تريد أن تصبح رائعًا في المقابلات الفنية وأن تحصل على وظيفتك التالية في هذه العملية؟ انضم إلى المقابلة.