Deteksi Malware pada File Executable Menggunakan Machine Learning Random Forest

M. Cakra Adhana; Alde Alanda; Hidra Amnur; Febrian  Kasmar

doi:10.62527/jitsi.7.2.602

PDF

Diterbitkan: Jun 30, 2026

DOI: https://doi.org/10.62527/jitsi.7.2.602

Kata Kunci:

Cybersecurity, Malware Detection, Portable Executable, Machine Learning, Random Forest, Static Analysis

M. Cakra Adhana

Politeknik Negeri Padang

Alde Alanda

Politeknik Negeri Padang

Hidra Amnur

Politeknik Negeri Padang

Febrian Kasmar

Politeknik Negeri Padang

Abstrak

Ekspansi infrastruktur digital yang meluas telah memicu peningkatan eksponensial dalam ancaman siber, dengan perangkat lunak berbahaya (malware) menimbulkan risiko utama bagi sistem keamanan informasi. Metode deteksi berbasis tanda tangan dan heuristik tradisional menunjukkan keterbatasan serius dalam mengurangi eksploitasi zero-day dan malware multi-varian yang dikaburkan karena ketergantungannya yang kaku pada repositori tanda tangan yang ada dan kerentanannya terhadap tingkat false-positive yang tinggi. Untuk mengatasi keterbatasan ini, studi ini memperkenalkan kerangka kerja deteksi statis adaptif dan tangguh untuk file Portable Executable (PE) dengan memanfaatkan teknik pembelajaran mesin ensemble Random Forest. Dengan menggunakan dataset terstruktur yang terdiri dari file PE yang diambil dari repositori malware publik termasuk Malware Bazaar bersama dengan aplikasi benign yang terverifikasi, analisis statis dilakukan tanpa eksekusi kode untuk menjaga keamanan lingkungan. Sebanyak 75 fitur struktural yang berbeda yang mencakup header COFF, karakteristik bagian, direktori data, dan penanda konfigurasi diekstrak secara sistematis menggunakan pustaka Python pefile. Model dilatih menggunakan rasio pembagian data 80:20. Evaluasi eksperimental mencapai kemampuan generalisasi internal yang luar biasa dengan skor Out-of-Bag (OOB) sebesar 97,43%. Validasi independen pada rangkaian uji yang terdiri dari 332 file yang belum pernah dilihat sebelumnya menghasilkan matriks kebingungan yang seimbang yang terdiri dari 160 True Positive, 164 True Negative, 5 False Positive, dan 3 False Negative, yang menetapkan presisi, recall, dan skor F1 yang tinggi sekitar 98%. Analisis kepentingan fitur menyoroti bahwa parameter seperti MajorOperatingSystem Version, MajorSubsystemVersion, dan DllCharacteristics berfungsi sebagai diskriminator penting. Terakhir, model prediktif yang dioptimalkan diintegrasikan ke dalam arsitektur aplikasi yang dapat diakses melalui web yang didukung oleh Flask dan MySQL untuk memfasilitasi pengunggahan file yang digerakkan pengguna dan pelaporan inferensi waktu nyata, menawarkan lapisan pertahanan pelengkap yang skalabel untuk ekosistem keamanan siber modern

##submission.howToCite##

M. Cakra Adhana, Alanda, A., Amnur, H., & Kasmar, F. (2026). Deteksi Malware pada File Executable Menggunakan Machine Learning Random Forest. JITSI : Jurnal Ilmiah Teknologi Sistem Informasi, 7(2), 176 - 182. https://doi.org/10.62527/jitsi.7.2.602

Terbitan

Vol 7 No 2 (2026)

Bagian

Articles

##submission.license.cc.by-sa4.footer##

Referensi

[1] M. Selinger, “AV-TEST Awards 2023: shining the spotlight on the best IT security.”
[2] M. Asam, S. Hussain Khan, T. Jamal, U. Zahoora, and A. Khan, “Malware Classification Using Deep Boosted Learning.”
[3] M. Altaiy, İ. Yildiz, and B. Uçan, “MALWARE DETECTION USING DEEP LEARNING ALGORITHMS,” 2023. [Online]. Available: https://orcid.org/0000-0003-2943-3857
[4] E. S. Alomari et al., “Malware Detection Using Deep Learning and Correlation-Based Feature Selection,” Symmetry (Basel), vol. 15, no. 1, Jan. 2023, doi: 10.3390/sym15010123.
[5] M. Masum, M. Jobair Hossain Faruk, H. Shahriar, K. Qian, D. Lo, and M. Islam Adnan, “Ransomware Classification and Detection With Machine Learning Algorithms.”
[6] F. A. Rafrastara, C. Supriyanto, C. Paramita, Y. P. Astuti, and F. Ahmed, “Performance Improvement of Random Forest Algorithm for Malware Detection on Imbalanced Dataset using Random Under-Sampling Method,” vol. 8, no. 2, 2023, [Online]. Available: https://orangedatamining.com/
[7] S. Yoo, S. Kim, S. Kim, and B. B. Kang, “AI-HydRa: Advanced hybrid approach using random forest and deep learning for malware classification,” Inf Sci (N Y), vol. 546, pp. 420–435, Feb. 2021, doi:10.1016/j.ins.2020.08.082.
[8] E. Valdis Tjahjadi and B. Santoso, “Klasifikasi Malware Menggunakan Teknik Machine Learning,” Copyright @BALOK, vol. 2, no. 1, 2023, [Online]. Available: https://www.kaggle.com/datasets/amauricio/pe-files-malwares.
[9] R. B. Hadiprakoso, W. Rendra Aditya, F. N. Pramitha, P. Siber, and S. Negara, “ANALISIS STATIS DETEKSI MALWARE ANDROID MENGGUNAKAN ALGORITMA SUPERVISED MACHINE LEARNING,” 2022.
[10] Y. Wanli Sitorus, P. Sukarno, S. Mandala, F. Informatika, and U. Telkom, “Analisis Deteksi Malware Android menggunakan metode Support Vector Machine & Random Forest,” vol. 8, no. 6, p. 12500, 2021.
[11] F. A. Rafrastara, C. Supriyanto, C. Paramita, and Y. P. Astuti, “Deteksi Malware menggunakan Metode Stacking berbasis Ensemble,” vol. 8, no. 1, 2023, [Online]. Available: https://orangedatamining.com/
[12] R. Marriam, R. Mohamad, S. Hiew Moi, and H. Amnur, “A Comparative Study of Rumor Detection Domains: Machine Learning, Deep Learning, and Statistical Approaches,” 2025. doi: http://dx.doi.org/10.62527/joiv.9.6.4793.
[13] F. Abdussalam and A. Rahmatulloh, “Analisis Efektivitas Algoritma Machine Learning Dalam Deteksi Malware Android ……… ANALISIS EFEKTIVITAS ALGORITMA MACHINE LEARNING DALAM DETEKSI MALWARE ANDROID DENGAN STATISTICAL TESTS,” 2024, doi:10.35316/jimi.v9i2.124-133.
[14] M. Asam et al., “Detection of exceptional malware variants using deep boosted feature spaces and machine learning,” Applied Sciences (Switzerland), vol. 11, no. 21, Nov. 2021, doi: 10.3390/app112110464.
[15] E. Horvitz and D. Mulligan, “Data, privacy, and the greater good,” Science (1979), vol. 349, no. 6245, pp. 253–255, Jul. 2015, doi:10.1126/science.aac4520.

Bilah Samping Artikel

Isi Artikel Utama

Abstrak

Rincian Artikel

Referensi