Skip to main content
فهرست مقالات

مقایسه الگوریتم های یادگیری ماشین نظارتی در تشخیص الگوریتم های تولید دامنه شبکه های بات مقاله

نویسنده:

نویسنده مسئول:

علمی-پژوهشی (وزارت علوم)/ISC (‎13 صفحه - از 17 تا 29 )

چکیده:

الگوریتم‌های تولید دامنه در شبکه‌های بات به‌عنوان نقاط ملاقات مدیر بات با خدمت‌دهنده فرمان‌ و ‌کنترل آن‌ها مورداستفاده قرار می‌گیرند و می‌توانند به‌طور مداوم تعداد زیادی از دامنه‌ها را برای گریز از تشخیص توسط روش‌های سنتی از جمله لیست سیاه،تولید کنند. شرکت‌های تأمین‌کننده امنیت اینترنتی، معمولاً لیست سیاه را برای شناسایی شبکه‌های بات و بدافزارها استفاده می‌کنند، اما الگوریتم تولید دامنه می‌تواند به‌طور مداوم دامنه را به‌روز کند تا از شناسایی لیست سیاه جلوگیری کند. شناسایی شبکه‌های بات مبتنی بر الگوریتم تولید دامنه یک مسئله چالش‌برانگیز در امنیت سامانه‌های کامپیوتری است. در این مقاله، ابتدا با استفاده از مهندسی ویژگی‌ها، سه نوع ویژگی‌ (ساختاری، آماری و زبانی) برای تشخیص الگوریتم‌های تولید دامنه استخراج‌شده و سپس مجموعه داده جدیدی از ترکیب یک مجموعه داده با دامنه‌های سالم و دو مجموعه داده با الگوریتم‌های تولید دامنه بدخواه و ناسالم تولید می‌شود. با استفاده از الگوریتم‌‌های یادگیری ماشین، رده‌بندی دامنه‌ها انجام‌شده و نتایج به‌صورت مقایسه‌ای جهت تعیین نمونه‌ با نرخ صحت بالاتر و نرخ مثبت نادرست کمتر جهت تشخیص الگوریتم‌های تولید دامنه مورد بررسی قرار می‌گیرد. نتایج به‌دست آمده در این مقاله، نشان می‌دهد الگوریتم جنگل تصادفی، نرخ صحت، نرخ تشخیص و مشخصه عملکرد پذیرنده بالاتری را به ترتیب برابر با 32/89%، 67/91% و 0/889 ارائه می‌دهد. همچنین در مقایسه با نتایج سایر الگوریتم‌های بررسی شده، الگوریتم جنگل تصادفی نرخ مثبت نادرست پایین‌تری برابر با 0/373نشان می‌دهد.

Domain generation algorithms (DGAs) are used in Botnets as rendezvous points to their command and control (C&C) servers, and can continuously provide a large number of domains which can evade detection by traditional methods such as Blacklist. Internet security vendors often use blacklists to detect Botnets and malwares, but the DGA can continuously update the domain to evade blacklist detection. In this paper, first, using features engineering; the three types of structural, statistical and linguistic features are extracted for the detection of DGAs, and then a new dataset is produced by using a dataset with normal DGAs and two datasets with malicious DGAs. Using supervised machine learning algorithms, the classification of DGAs has been performed and the results have been compared to determine a DGA detection model with a higher accuracy and a lower error rate. The results obtained in this paper show that the random forest algorithm offers accuracy rate, detection rate and receiver operating characteristic (ROC) equal to 89.32%, 91.67% and 0.889, respectively. Also, compared to the results of the other investigated algorithms, the random forest algorithm presents a lower false positive rate (FPR) equal to 0.373.

کلیدواژه ها:

شبکه‌بات ، الگوریتم های تولید دامنه ، الگوریتم های یادگیری ماشین ، فهرست سیاه ، خدمت دهنده فرمان و کنترل

Domain Generation Algorithms (DGAs) ، Machine Learning Algorithms ، Blacklist ، C&C Server ، botnet


برای مشاهده محتوای مقاله لازم است ورود پایگاه شوید. در صورتی که عضو نیستید از قسمت عضویت اقدام فرمایید.

لمشاهدة محتوی المقال یلزم الدخول إلی دخول الموقع.
إن كنت لا تقدر علی شراء الاشتراك عبرPayPal أو بطاقة VISA، الرجاء ارسال رقم هاتفك المحمول إلی مدير الموقع عبر credit@noormags.ir.

You should become a Sign in to be able to see articles.
If you fail to purchase subscription via PayPal or VISA Card, please send your mobile number to the Website Administrator via credit@noormags.ir.