مقایسه روش‌های آماری و یادگیری ماشین جهت انتخاب متغیرو تجزیه و تحلیل داده‌های ابعادی بالا: مطالعه شبیه‌سازی با کاربرد در پیش‌بینی سرطان تخمدان

Comparison of the machine learning and penalized statistical approaches for the variable selection in the high dimensional data analysis: simulation study with application to the ovarian cancer prediction


چاپ صفحه
پژوهان
صفحه نخست سامانه
نویسندگان
نویسندگان
اطلاعات تفضیلی
اطلاعات تفضیلی
دانلود مقاله
دانلود مقاله
دانشگاه علوم پزشکی تبریز
دانشگاه علوم پزشکی تبریز

نویسندگان: فرزانه حمیدی , ندا گیلانی , رضا عربی بلاغی

عنوان کنگره / همایش: Comparison of the machine learning and penalized statistical approaches for the variable selection in the high dimensional data analysis: simulation study with application to the ovarian cancer prediction , , بابلسر , 2022

اطلاعات کلی مقاله
hide/show

نویسنده ثبت کننده مقاله ندا گیلانی
مرحله جاری مقاله تایید نهایی
دانشکده/مرکز مربوطه دانشکده بهداشت
کد مقاله 79503
عنوان فارسی مقاله مقایسه روش‌های آماری و یادگیری ماشین جهت انتخاب متغیرو تجزیه و تحلیل داده‌های ابعادی بالا: مطالعه شبیه‌سازی با کاربرد در پیش‌بینی سرطان تخمدان
عنوان لاتین مقاله Comparison of the machine learning and penalized statistical approaches for the variable selection in the high dimensional data analysis: simulation study with application to the ovarian cancer prediction
نوع ارائه سخنرانی
عنوان کنگره / همایش Comparison of the machine learning and penalized statistical approaches for the variable selection in the high dimensional data analysis: simulation study with application to the ovarian cancer prediction
نوع کنگره / همایش ملی
کشور محل برگزاری کنگره/ همایش
شهر محل برگزاری کنگره/ همایش بابلسر
سال انتشار/ ارائه شمسی 1401
سال انتشار/ارائه میلادی 2022
تاریخ شمسی شروع و خاتمه کنگره/همایش 1401/06/02 الی 1401/06/04
آدرس لینک مقاله/ همایش در شبکه اینترنت
آدرس علمی (Affiliation) نویسنده متقاضی Department of Statistics and Epidemiology,Faculty of Health, Tabriz University of Medical Sciences, Tabriz, Iran

نویسندگان
hide/show

نویسنده نفر چندم مقاله
فرزانه حمیدیاول
ندا گیلانیدوم
رضا عربی بلاغیسوم

اطلاعات تفضیلی
hide/show

عنوان متن
خلاصه مقالهThere has been a question to see whether machine learning variable selection is superior to the penalized methods such as the LASSO or Elastic Net. In this paper, we address the problem of variable selection in the high dimensional logistic regression. We have proposed several conditions of the sample size, a number of significant variables and different correlation structures to analyse to question. We conducted extensive simulation studies and the results showed that Boruta machine learning variable selection is superior to the LASSO and Elastic Net in the highly correlated structures. On the other hand, in the case of lower correlation, the statistical approaches perform better than Boruta. This paper ended up with two real ovarian cancer datasets.
کلمات کلیدیVariable Selection, Machin learning, Boruta, LASSO, Elastic Net, Simulation.

لینک دانلود مقاله
hide/show

نام فایل تاریخ درج فایل اندازه فایل دانلود
Comparison of the Machine Learning and Classic Penalized Statistical Methods for the Variable Selection.pdf1401/07/12205532دانلود
KETABCHE.pdf1401/06/089527511دانلود
ghavahi.pdf1401/06/081035286دانلود