شناسایی ترماتودها با استفاده از روش نزدیکترین همسایه

نویسنده

چکیده

 ترماتودها کرمهای پهن بیضی هستند که طول گونه های مختلف
آنها بین 1 میلی متر تا چند سانتی متر متغیر است. ترماتودها بطور تخمینی شامل
18000 تا 24000 گونه مختلف هستند که تقزیبا تمام آنها بصورت انگل در بدن نرمتنان و
بی مهرگان هستند. انگل شناسان برای شناسایی گونه های انگلها خصوصیات متعددی را که
عمدتا خصوصیات ساختار بدن هستند مشاهده و بررسی می کنند. از اینرو شناسایی
تاکسونومی ترماتودها معمولا کاری دشوار است. خصوصیاتی که انگل شناسان معمولا در
نظر می گیرند مشتمل بر دو دسته است. دسته اول، ویژگیهای دارای مقادیر عددی مانند
طول بدن، طول بادکش دهانی، طول بادکش شکمی و ... است که این خصوصیات می توانند
توسط لامهای میکرومتری اندازه گیری شوند. دسنه دوم هم ویژگیهای توصیفی مانند شکل
ظاهری، تگومنت، موقعیت غدد ویتلوژن و ... می باشند. در این تحقیق، هدف ما یافتن مجموعه
ای کمینه از ویژگیهاست که با داشتن آنها بتوان خانواده، گروه و گونه ترماتود را
مشخص کرد. برای این منظور، از مجموعه داده ای بنام trematode morphological
diversification که شامل تعدادی ویژگی ساختاری شامل مقادیر
عددی در مورد 390 گونه ترماتود است. جهت دسته بندی از الگوریتم k نزدیکترین
همسایه (KNN) استفاده کرده و برای تقسیم مجموعه داده ها
به دو بخش داده های آموزشی و داده های تست روش Ten-cv را مورد
استفاده قرار دادیم. طی یک فرایند تکرار شونده انواع زیرمجموعه های ممکن از
ویژگیهای موجود را جهت یافتن مجموعه های کمینه آزمایش کردیم. نهایتا از بین تمام
ویژگیها برای دسته بندی خانواده ها با دقت بالا به یک مجموعه شامل 5 ویژگی و برای
دسته بندی گروه و گونه به ترتیب به دو مجموعه 3 و 5 عضوی از ویژگیها رسیدیم. نتایچ
نهایی از بعد دقت دسته بندی بسیار رضایت بخش بوده و سیستم پیشنهادی می تواند
بعنوان یک جایگزین موفق و دقیق برای شناسایی هویت ترماتودها مورد استفاده قرار
گیرد.    

کلیدواژه‌ها