Share

تصنيف انواع الاصوات بالاعتماد على DCT والتعلم العميق == Classification of Sound Types Based on DCT and Deep Learning

Author name: هيثم محمد عباس شاكر
Supervisor name: توفيق عبد الخالق عباس الاسدي
General topic: Computer Science
Specific topic: Artificial Intelligence
Degree: Master
University: University of Babylon - Information Technology Collage - Department Of Software
Language: English
University location: Babylon
Key words:
  • Gray Images
  • DCT
  • Deep Learning
  • Motor Faults
  • Poultry stress
  • Animals Sound
  • Sound Analysis
  • CNN
Abstract: يلعب تحليل الصوت دورا رئيسيا في العديد من التخصصات، على سبيل المثال، في المجال الصناعي، يمكن لمشغلي الالات ذوي الخبرة سماع واكتشاف العديد من اعطال الماطورات الدوارة. ومع ذلك، نظرا لبيئات الضوضاء المعقدة في المصانع، قد يكون من الصعب اكتشاف هذه الاعطال. يعد تحديد اعطال الماطورات الدوارة امرا بالغ الاهمية لتقليل تكاليف الاصلاح، ومنع التوقف غير المتوقع للالات، وضمان الانتاج دون انقطاع. وبالمثل، في المجال البيطري، يعتمد مربي الماشية على تحليل الصوت لمراقبة صحة الحيوانات واكتشاف العلامات المبكرة للامراض. ومع ذلك، فان الضوضاء المحيطة في المزارع تعقد المراقبة الصحية الدقيقة القائمة على الصوت. ظهرت تقنيات التعلم العميق (DL)، وخاصة نماذج تصنيف الصوت، كحل اساسي لتشخيص الاعطال وتحليل اصوات الحيوانات. تقترح هذه الاطروحة طريقة للكشف عن الصوت وتصنيفه باستخدام الشبكة العصبية التلافيفية (CNN) وYOLO v8m، والاستفادة من تحويل الصوت الى صورة لتحسين المعالجة. اولا، في مرحلة المعالجة المسبقة، يحول الصوت الملتقط من المصدر (الة او حيوان) الى قيم رقمية احادية البعد (1D) في نطاق الوقت. بعد ذلك، يطبق تحويل جيب التمام المنفصل (DCT) لاستخراج انماط الميزات وتقليل الضوضاء بفعالية. تطبع مصفوفة المعاملات احادية البعد الناتجة ضمن النطاق (0-255)، ثم تقسم الى اجزاء متساوية وتخزن في مصفوفة ثنائية الابعاد (2D) لتوليد صور رمادية. ثانيا، في مرحلة تصنيف الصوت، تعد هذه الصور الرمادية مدخلات لشبكة CNN وYOLO v8m لاجراء تصنيف متعدد في اطار تعلم مشرف. اظهرت النتائج سرعة تدريب عالية، محققة دقة تصنيف عالية بنسبة 100% لشبكة CNN في تحديد اعطال الماطور، و97.1% لشبكة YOLO v8m في التعرف على اصوات الحيوانات، و97.6% لشبكة CNN في تصنيف اصوات الدواجن. علاوة على ذلك، يشخص النموذج الاصوات بفعالية في ظل ظروف ضوضاء مختلفة متعلقة بتسجيل الصوت. وفي نهاية المطاف، فان النتائج التي توصلت اليها هذه الاطروحة قد تؤثر على ابحاث تحليل الصوت من خلال تمهيد الطريق امام التقنيات والاساليب المبتكرة، وتعزيز تحليل وتفسير الصوت عبر مختلف التخصصات.
Full text: 7e2fc10ed0.pdf
Logo