1. تسرب البيانات أثناء المعالجة المسبقة
تطبيق التحويلات (مثل القياس أو تعويض القيم المفقودة) على كامل البيانات قبل التقسيم يؤدي إلى تسريب معلومات الاختبار إلى مرحلة التدريب.
2. استخدام الدقة (Accuracy) مع البيانات غير المتوازنة
إذا كانت 99% من البيانات سلبية، فإن نموذجًا بسيطًا يتنبأ دائمًا بالسلب سيحصل على دقة 99% ولكنه عديم الفائدة. استخدم الدقة المحددة أو الاستدعاء أو درجة F1 بدلاً من ذلك.
3. تجاهل النماذج الأساسية المبسطة
قبل الانتقال إلى الشبكات العصبية العميقة والمعقدة، قم دائمًا ببناء نموذج أساسي بسيط (مثل الانحدار اللوجستي).