Deteksi Malware pada File Executable Menggunakan Machine Learning Random Forest
Isi Artikel Utama
Abstrak
Ekspansi infrastruktur digital yang meluas telah memicu peningkatan eksponensial dalam ancaman siber, dengan perangkat lunak berbahaya (malware) menimbulkan risiko utama bagi sistem keamanan informasi. Metode deteksi berbasis tanda tangan dan heuristik tradisional menunjukkan keterbatasan serius dalam mengurangi eksploitasi zero-day dan malware multi-varian yang dikaburkan karena ketergantungannya yang kaku pada repositori tanda tangan yang ada dan kerentanannya terhadap tingkat false-positive yang tinggi. Untuk mengatasi keterbatasan ini, studi ini memperkenalkan kerangka kerja deteksi statis adaptif dan tangguh untuk file Portable Executable (PE) dengan memanfaatkan teknik pembelajaran mesin ensemble Random Forest. Dengan menggunakan dataset terstruktur yang terdiri dari file PE yang diambil dari repositori malware publik termasuk Malware Bazaar bersama dengan aplikasi benign yang terverifikasi, analisis statis dilakukan tanpa eksekusi kode untuk menjaga keamanan lingkungan. Sebanyak 75 fitur struktural yang berbeda yang mencakup header COFF, karakteristik bagian, direktori data, dan penanda konfigurasi diekstrak secara sistematis menggunakan pustaka Python pefile. Model dilatih menggunakan rasio pembagian data 80:20. Evaluasi eksperimental mencapai kemampuan generalisasi internal yang luar biasa dengan skor Out-of-Bag (OOB) sebesar 97,43%. Validasi independen pada rangkaian uji yang terdiri dari 332 file yang belum pernah dilihat sebelumnya menghasilkan matriks kebingungan yang seimbang yang terdiri dari 160 True Positive, 164 True Negative, 5 False Positive, dan 3 False Negative, yang menetapkan presisi, recall, dan skor F1 yang tinggi sekitar 98%. Analisis kepentingan fitur menyoroti bahwa parameter seperti MajorOperatingSystem Version, MajorSubsystemVersion, dan DllCharacteristics berfungsi sebagai diskriminator penting. Terakhir, model prediktif yang dioptimalkan diintegrasikan ke dalam arsitektur aplikasi yang dapat diakses melalui web yang didukung oleh Flask dan MySQL untuk memfasilitasi pengunggahan file yang digerakkan pengguna dan pelaporan inferensi waktu nyata, menawarkan lapisan pertahanan pelengkap yang skalabel untuk ekosistem keamanan siber modern
Rincian Artikel
Referensi
[2] M. Asam, S. Hussain Khan, T. Jamal, U. Zahoora, and A. Khan, “Malware Classification Using Deep Boosted Learning.”
[3] M. Altaiy, İ. Yildiz, and B. Uçan, “MALWARE DETECTION USING DEEP LEARNING ALGORITHMS,” 2023. [Online]. Available: https://orcid.org/0000-0003-2943-3857
[4] E. S. Alomari et al., “Malware Detection Using Deep Learning and Correlation-Based Feature Selection,” Symmetry (Basel), vol. 15, no. 1, Jan. 2023, doi: 10.3390/sym15010123.
[5] M. Masum, M. Jobair Hossain Faruk, H. Shahriar, K. Qian, D. Lo, and M. Islam Adnan, “Ransomware Classification and Detection With Machine Learning Algorithms.”
[6] F. A. Rafrastara, C. Supriyanto, C. Paramita, Y. P. Astuti, and F. Ahmed, “Performance Improvement of Random Forest Algorithm for Malware Detection on Imbalanced Dataset using Random Under-Sampling Method,” vol. 8, no. 2, 2023, [Online]. Available: https://orangedatamining.com/
[7] S. Yoo, S. Kim, S. Kim, and B. B. Kang, “AI-HydRa: Advanced hybrid approach using random forest and deep learning for malware classification,” Inf Sci (N Y), vol. 546, pp. 420–435, Feb. 2021, doi:10.1016/j.ins.2020.08.082.
[8] E. Valdis Tjahjadi and B. Santoso, “Klasifikasi Malware Menggunakan Teknik Machine Learning,” Copyright @BALOK, vol. 2, no. 1, 2023, [Online]. Available: https://www.kaggle.com/datasets/amauricio/pe-files-malwares.
[9] R. B. Hadiprakoso, W. Rendra Aditya, F. N. Pramitha, P. Siber, and S. Negara, “ANALISIS STATIS DETEKSI MALWARE ANDROID MENGGUNAKAN ALGORITMA SUPERVISED MACHINE LEARNING,” 2022.
[10] Y. Wanli Sitorus, P. Sukarno, S. Mandala, F. Informatika, and U. Telkom, “Analisis Deteksi Malware Android menggunakan metode Support Vector Machine & Random Forest,” vol. 8, no. 6, p. 12500, 2021.
[11] F. A. Rafrastara, C. Supriyanto, C. Paramita, and Y. P. Astuti, “Deteksi Malware menggunakan Metode Stacking berbasis Ensemble,” vol. 8, no. 1, 2023, [Online]. Available: https://orangedatamining.com/
[12] R. Marriam, R. Mohamad, S. Hiew Moi, and H. Amnur, “A Comparative Study of Rumor Detection Domains: Machine Learning, Deep Learning, and Statistical Approaches,” 2025. doi: http://dx.doi.org/10.62527/joiv.9.6.4793.
[13] F. Abdussalam and A. Rahmatulloh, “Analisis Efektivitas Algoritma Machine Learning Dalam Deteksi Malware Android ……… ANALISIS EFEKTIVITAS ALGORITMA MACHINE LEARNING DALAM DETEKSI MALWARE ANDROID DENGAN STATISTICAL TESTS,” 2024, doi:10.35316/jimi.v9i2.124-133.
[14] M. Asam et al., “Detection of exceptional malware variants using deep boosted feature spaces and machine learning,” Applied Sciences (Switzerland), vol. 11, no. 21, Nov. 2021, doi: 10.3390/app112110464.
[15] E. Horvitz and D. Mulligan, “Data, privacy, and the greater good,” Science (1979), vol. 349, no. 6245, pp. 253–255, Jul. 2015, doi:10.1126/science.aac4520.