خلاصة :-
يعد التعلم العميق أحد أكثر تقنيات التعلم الآلي الواعدة التي أحدثت ثورة في مجال الذكاء الاصطناعي. تم استخدام الشبكات العصبية التقليدية والمعروفة (CNNs) المعروفة في تطبيقات التعرف على الأنماط الطبية التي تعتمد على مفاهيم التعلم العميق. ويرجع ذلك إلى أهمية الكشف عن المختلفة (AD) في أنظمة التشخيص الآلي. في هذا البحث ، يتم إجراء AD على مخططات طيفية إشارات تخطيط كهربية الدماغ (EEG) وصور القرنية الطبية لأنظمة إنترنت الأشياء الطبية (IoMT). يتم استخدام التعلم العميق المستند إلى نماذج CNN لهذه المهمة مع مراحل التدريب والاختبار. تمر كل صورة إدخال عبر سلسلة من طبقات الالتفاف مع مرشحات نواة مختلفة. لمهمة التصنيف ، يتم استخدام التجميع والطبقات المتصلة بالكامل. تكشف تجارب المحاكاة الحاسوبية عن نجاح وتفوق النماذج المقترحة للتشخيص الطبي الآلي في أنظمة إنترنت الأشياء.
تقنية التشخيص الآلي المقترحة: -
تقدم هذه الورقة تقنية التعلم العميق لمرض الزهايمر من صور القرنية وإشارات مخطط كهربية الدماغ. المساهمة الرئيسية هي السماح بالتشخيص الآلي من كل من صور القرنية وإشارات مخطط كهربية الدماغ. يتم نشر النموذج المقترح على صور القرنية وإشارات مخطط كهربية الدماغ بشكل منفصل. يتكون نموذج التعلم العميق من عدة طبقات رئيسية. الطبقة الأولى هي CNV. الطبقة الثانية هي PL. يتم نشر كل من طبقات CNV و PL لاستخراج المعالم. تستخرج طبقة CNV الميزات من الصور المدخلة عن طريق تطبيق مجموعة من المرشحات المسؤولة عن استخراج الميزات. بالإضافة إلى ذلك ، تكون طبقة PL مسؤولة عن تقليل عدد الميزات بناءً على تحديد البكسل. تعتمد عملية اختيار البكسل على تقنية التجميع القصوى. يتم نشر الحد الأقصى للتجميع لتحديد القيمة القصوى من كل نافذة في خريطة المعالم. علاوة على ذلك ، تقوم شبكة التصنيف بعملية التصنيف. تتكون هذه الشبكة من طبقة FC ، وهي مسؤولة عن تحويل خريطة المعالم المُنشأة إلى متجه ليتم تسجيلها في المصنف. تم اعتماد طبقة كثيفة بوظيفة تنشيط Soft-max في المصنف
الطبقة التلافيفية :-
تستخدم طبقة CNV تقنية تسمى التصفية المكانية الخطية على الصورة المدخلة. يشار إلى المرشح عادة باسم النواة. يتم تطبيق جميع المرشحات على الصورة بأكملها. 33 تنشئ هذه الطبقة خرائط المعالم. تؤكد كل خريطة على بعض السمات المميزة للصورة الأصلية. تتم تصفية المنطقة الفعلية في الشكل 1 ، التي يمثلها المربع ، لتشكيل المكون الأول للخريطة وفقًا للصيغة التالية.
طبقة التجميع :-
تقوم هذه الطبقة باستخراج المعالم في الشبكات العصبية. يقلل من حجم الصور أو خرائط المعالم. يتم تحقيق ذلك عن طريق دمج وحدات البكسل المجاورة في المجال المكاني في قيمة واحدة. هذه القيمة التمثيلية هي الحد الأقصى أو القيمة المتوسطة لوحدات البكسل المدمجة. تستخدم التقنية المقترحة أقصى قدر من التجميع. إنها تنتج القيمة القصوى من مجموعة المعالم في خريطة المعالم. يتم توضيح الحد الأقصى للتجميع في الشكل 2. ينتج عن التجميع أبعاد أصغر للميزات. إنه يقلل من عدد معلمات الشبكة وبالتالي يقلل من الحسابات والتحكم في فرط التجهيز. علاوة على ذلك ، فإن التجميع يجعل الشبكة مقاومة للتحولات والتناوب والتشوهات الطفيفة في صور المصدر ، حيث يتم أخذ القيمة القصوى / المتوسطة في الحي المحلي.
طبقة FC :-
في طبقة الإخراج لهذا الإدراك متعدد الطبقات ، يتم استخدام وظيفة تنشيط SoftMax. يشير مفهوم "FC" إلى أن كل خلية عصبية في الطبقة السابقة متصلة بخلايا عصبية مقابلة في الخلية اللاحقة. قد يكون الجمع بين الميزات عالية المستوى الناتجة عن طبقات الالتفاف والتجميع أفضل للتصنيف. يجب تصنيف هذه الميزات المدمجة. هذا ما تصنعه طبقة FC بناءً على مجموعة بيانات التدريب. بالإضافة إلى ذلك ، إنها طريقة غير مكلفة لتعلم مثل هذا المزيج من الميزات غير الخطية. يتم استخدام Soft-max كدالة تنشيط في إخراج طبقة FC ، حيث يكون مجموع احتمالات الخرج 1.
من خلال الجمع بين الطبقات المذكورة أعلاه ، تعمل طبقات الالتفاف والتجميع كمستخلصات ميزة ، في حين أن FC
طبقة تلعب دور المصنف. عملية Soft-max.
النموذج المقترح لتشخيص القرنية :-
يتكون النموذج المقترح لمرض الزهايمر من صور القرنية من خمسة لفات وخمس طبقات تجميع كحد أقصى لاستخراج الخلل. بالإضافة إلى ذلك ، تقوم طبقة FC ، كما هو موضح في الشكل 3 ، بإجراء عملية التصنيف. يوضح الجدول 2 النموذج المقترح مع شكل الإخراج لكل طبقة. يتكون النموذج القائم على التعلم العميق المقترح من طبقة CNV ، وطبقات التجميع القصوى ، وطبقة تجمع متوسط عالمي في النهاية. أبعاد الصور المدخلة هي 224 224. تحتوي طبقة CNV على 32 مرشحًا ، متبوعًا بالحجم 2 كحد أقصى للتجميع. أخيرًا ، يتم استخدام طبقة كثيفة لقرار التصنيف ثنائي الحالة في إطار عمل الكشف والتنبؤ>
نموذج مقترح لتشخيص إشارة EEG :-
في دراسة الحالة هذه ، الهدف هو تقديم نموذج التعلم العميق لحل مشكلة تشخيص الصرع. ال التنسيق الشائع لبيانات الإدخال لنموذج التعلم العميق هو الصور. لذلك ، هناك حاجة لتحويل إشارات EEG في الصور. يتم تنفيذ هذه العملية عن طريق توليد مخططات طيفية لإشارات EEG المدخلات. الجرام الطيفي هو تصوير مرئي ملون يعتمد على السعة لطيف الترددات أثناء تغيرها بمرور الوقت. يصور كيف يتغير تردد الإشارة بمرور الوقت. يوضح هذا الرسم البياني محتوى الطاقة المعبر عنه كدالة للخطأ الحر على المحور الرأسي والوقت على المحور الأفقي. بالنسبة لإشارة EEG ، يعتبر المخطط الطيفي تقديرًا للتطور الزمني لمحتوى تردد هذه الإشارة.
لحساب المخطط الطيفي ، أولاً ، يتم تقسيم إشارة EEG إلى نوافذ متساوية الطول ، والتي قد تتداخل أو لا تتداخل. يجب مراعاة الطبيعة غير الثابتة لإشارة مخطط كهربية الدماغ ، عند ضبط حجم النافذة. المفهوم الأساسي هو إظهار الميزات الطيفية لإشارة EEG غير الثابتة كسلسلة من الصور الطيفية. ينبغي أن يكون طول المقطع للإشارة النموذجية غير الثابتة صغيراً بما يكفي ، بحيث لا يمكن ملاحظة تغير التردد. بعد ذلك ، نحسب تحويل فورييه قصير المدى. أخيرًا ، نعرض كل طيف طاقة. يتم حساب هذه الأطياف قطعة تلو الأخرى ، ومكدسة جنبًا إلى جنب لتكوين خريطة ملونة تعتمد على الحجم.
مواصفات مجموعة البيانات المستخدمة :-
هذا القسم مخصص لوصف مواصفات مجموعة البيانات المستخدمة. تم أخذ مجموعة البيانات الخاصة بإشارات EEG من معهد ماساتشوستس للتكنولوجيا في الولايات المتحدة (CHB-MIT). مجموعة البيانات هذه متاحة من خلال موقع الويب ، http://physionet.org/physiobank/database/chbmit/. تم جمع البيانات المسجلة لـ 23 طفلاً باستخدام أقطاب كهربائية لفروة الرأس ، مع تكرار أخذ العينات من 256 هرتز. تُعرَّف حالة النوبة على أنها الفترة التي يستغرقها المرضى لتجربة بداية النوبة ، في حين أن الفترة بين النوبات هي الحالة الطبيعية بين النوبة. تُعرَّف فترة ما قبل النوبة بأنها الانتقال بين الفترتين السابقتين. يعطي الجدول 4 معلومات المرضى الثلاثة الذين تم فحصهم: chb01 و chb08 و chb20. كل من هؤلاء المرضى لديه عدد مختلف من النوبات. من ناحية أخرى ، تتوفر مجموعة البيانات الأساسية من خلال موقع الويب http://bioimlab.dei.unipd.it/Endo٪20Aliza٪20Data٪20Set.htm. تظهر العينات الطبيعية وغير الطبيعية من صور القرنية في الشكل.
نتائج تجارب محاكاة الكمبيوتر :-
يقدم هذا القسم تجارب المحاكاة المختلفة التي تم إجراؤها لتقييم الأداء ودقة تقنية التشخيص الآلي. دقة التقنية المقدمة تقيس التقليدية قوة نموذج سي إن إن. يمكن حسابه بالمعادلة:
نتائج تجربة تصنيف صور القرنية :-
يتم عرض نتائج تجربة تصنيف صور القرنية في هذا القسم. كما هو موضح سابقًا ، فإن ملف تحتوي التقنية المقدمة على طبقات مختلفة كما هو موضح في الشكل 3. دقة وفقدان مرحلة التدريب ويرد نموذج التعلم العميق في الشكلين 6 و 7. من هذه الأرقام ، يتضح أن دقة التقنية المقترحة تصل إلى 100٪ وأن الخسارة قريبة من الصفر. تتم مقارنة نتائج التقنية المقترحة مع نتائج ذات الصلة أعمال البحث والتقنيات الأخرى المستخدمة.
يتم النظر في حالات ما قبل النوبة والعادية مقابل الحالات النزلية. تم النظر في سيناريو آخر لمشكلة تصنيف الدول الثلاث ، وهو الوضع الطبيعي مقابل النوبة مقابل ما قبل النوبة. تم اختبار النموذج المقترح على جميع القنوات الـ 23 للمرضى الثلاثة. بعد حساب المخطط الطيفي ، تم تحليل نتائج دقة التصنيف لجميع القنوات المختلفة البالغ عددها 23 قناة للمرضى الثلاثة وتم جدولة قيم الدقة في الجداول 5-7 والأشكال 8-10. المريض رقم 1 لديه سبع نوبات صرع. يوضح الجدول 5 دقة تصنيف إشارة EEG على 23 قناة. في سيناريو الحالات الثلاث وعملية الكشف ، يُلاحظ أن أفضل نتائج التصنيف يتم تقديمها بواسطة القناة 11. دقة حالة التصنيف هذه تتراوح بين 74.07٪ و 94.44٪. في حالة التنبؤ ، يتم إعطاء أفضل نتيجة تصنيف بواسطة القناة 06 ، والدقة هي 94.44٪. المريض رقم 8 لديه خمس نوبات صرع. تم جدولة نتائج هذه التجربة باستخدام نفس سيناريوهات المحاكاة المستخدمة للمريض رقم 1 في الجدول 6. دقة التصنيف ثلاثي الحالات 70.37٪ من القناة 23. في عملية الكشف ، يتم إعطاء أفضل تصنيف من القناة 15 حيث تبلغ الدقة 72.22٪. في عملية التنبؤ ، أعلى دقة هي 88.89٪ من القناة 03. تم إجراء آخر تجربة تصنيف على المريض رقم 20 ، الذي لديه 8 نوبات صرع. تم جدولة النتائج في الجدول 7. من هذه النتائج ، في حالة التصنيف ثلاثي الحالات ، أعلى دقة من القناة 09 تساوي 70.37٪. في عملية الكشف ، دقة التصنيف تساوي 77.68٪ من القناة 03. في عملية التنبؤ ، أعلى دقة تساوي 94.44٪ من سبع قنوات ، كما هو موضح في الجدول 7 والشكل 10. وأخيرًا ، للتأكيد على تفوق التقنية المقترحة ، يتم عرض مقارنة بين التقنية المقترحة و Zhou CNN41 في الجدول 8. يتم إجراء المقارنة من منظور الدقة. تؤكد هذه المقارنة على تفوق النموذج المقترح في عمليات الكشف والتنبؤ.
خاتمة
يعتبر التشخيص التلقائي القائم على فحص الصور والإشارات الطبية مجالًا بحثيًا جذابًا. في هذه الورقة البحثية ، تم استخدام معالجة الإشارات الطبية لتصميم تشخيص آلي بسيط وفعال
أداة من الإشارات والصور. تم اقتراح تقنية AD فعالة باستخدام خوارزمية CNN لإشارة EEG وتحجيم صورة القرنية. تم اختبار التقنية المقترحة والتحقق من صحتها على قاعدة بيانات مختلفة. تظهر نتائج المحاكاة أن التقنية المقترحة تحقق دقة عالية في كل من كشف النوبات والتنبؤ بها. في بالإضافة إلى ذلك ، تم الكشف عن التشوهات من صور القرنية بدقة عالية. هذا العمل يمكن أن تكون خطوة فعالة لبناء أنظمة تشخيص مؤتمتة كاملة وفعالة.