Volume 1, Nomor 5, Mei 2021
p-ISSN 2774-5147 ; e-ISSN 2774-5155
396
http://sostech.greenvest.co.id
PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA C4.5
DALAM MENENTUKAN KELAYAKAN PENERIMAAN BANTUAN
BEDAH RUMAH PADA DESA TIGA DOLOK
Paul V. M., Indra Gunawan, Bahrudi Efendi Damanik, Iin Parlina dan
Widodo Saputra
STIKOM Tunas Bangsa Pematangsiantar
E-mail: paulsitanggang653@gmail.com, _indra@amiktunasbangsa.ac.id,
_bahrudi@amiktunasbangsa.ac.id, _iin@amiktunasbangsa.ac.id dan
_widodo@amiktunasbangsa.ac.id
Diterima:
26 April 2021
Direvisi:
4 Mei 2021
Disetujui:
14 Mei 2021
Abstrak
Rumah yang layak huni merupakan kebutuhan dasar manusia,
rumah yang layak huni dikatakan jika pemilik rumah memiliki
rasa tentram dan nyaman tinggal di rumah tersebut. Rumah yang
layak huni dimaknai sebagai rumah yang memiliki fasilitas untuk
memenuhi kebutuhan manusia dalam melaksanakan aktivitas
sehari-hari. Belum tersalurkannya bantuan pemerintah secara
merata terhadap rumah penduduk Desa Tiga Dolok, disebabkan
oleh program yang telah berjalan selama ini sangat rumit, sistem
yang berjalan masih secara manual dalam pengolahan data
masyarakatnya. Oleh sebab itu penulis memberikan solusi untuk
mengklasifikasi tingkat kelayakan rumah dengan menggunakan
algoritma C4.5. Algoritma ini dipilih karena merupakan salah
satu metode pada Decision tree/Pohon Keputusan yang banyak
dimanfaatkan untuk melakukan prediksi terhadap suatu kasus.
Dengan demikian subsidi pemerintah untuk merenovasi rumah
yang tidak layak huni dapat disalurkan secara tepat sasaran.
Tujuan penelitian yaitu menggunakan pohon keputusan berbasis
algoritma C4.5 diharapkan dapat meningkatkan keakuratan
penerimaan bantuan renovasi kelayakan rumah. Metode
penelitian yang digunakan yaitu Data Mining. Analisa dan
perhitungan menggunakan algoritma ini sangat membantu proses
penentuan keputusan untuk menentukan masyarakat yang layak
menerima bantuan bedah rumah dan masyarakat yang tidak
layak menerima bantuan bedah rumah.
Kata kunci: Rumah Layak Huni; Algoritma C4.5; Decision tree
Abstract
A livable house is a basic human need, a livable house is said if
the homeowner has a sense of peace and comfort living in the
house. A livable house is defined as a house that has facilities to
meet human needs in carrying out daily activities. The
distribution of government assistance evenly to the homes of the
residents of Tiga Dolok Village, caused by the program that has
been running so far is very complicated, the system that runs is
still manually in the processing of community data. Therefore the
author provides a solution to classify the feasibility level of the
house using the C4.5 algorithm. This algorithm was chosen
because it is one of the methods in Decision tree that is widely
used to make predictions on a case. Thus government subsidies
Penerapan Data Mining Menggunakan Algoritma C4.5 SOSTECH, 2021
Dalam Menentukan Kelayakan Penerimaan Bantuan
Bedah Rumah pada Desa Tiga Dolok
Paul V. M., Indra Gunawan, Bahrudi Efendi Damanik, Iin Parlina dan
Widodo Saputra
397
to renovate uninhabitable homes can be channeled on target.
The purpose of the study is to use a decision tree based on the
C4.5 algorithm is expected to improve the accuracy of the
receipt of home feasibility renovation assistance. The research
method used is Data Mining. Analysis and calculation using this
algorithm greatly helps the decision-making process to
determine which communities are eligible for home surgical
assistance and people who do not deserve home surgical
assistance. Keywords: Livable House; C4.5 algorithm; Decision
tree
Keywords: Livable House; C4.5 algorithm; Decision tree
PENDAHULUAN
Kemiskinan merupakan salah satu masalah sosial dan ukuran terpenting untuk
mengatasi kemiskinan (Yacoub, 2013). Pahami tingkat kesejahteraan keluarga. Secara
keseluruhan kondisi kemiskinan di suatu daerah biasanya digunakan untuk mengukur
tingkat kesejahteraan suatu Negara (Purwanto & Taftazani, 2018). Permasalahan
kemiskinan yaitu memiliki rumah tidak layak huni dalam beberapa keluarga (Pramitha &
Warsono, 2016). Banyak dukungan dari pemerintah maupun masyarakat yang ingin
membantu, namun hal ini sering terjadi kesalahan maupun ketidak akuratan karena
kesalahan dalam pengolahan data calon penerima bantuan yang cukup besar secara
manual oleh panita pelaksana, sehingga terjadi kesalahan dalam pengambilan keputusan.
Informasi dapat digali dari beberapa data yang dikumpulkan yang berskala besar dapat
dilakukan dengan menggunakan teknologi data mining.
Daerah. rumah yang layak huni merupakan kebutuhan dasar manusia, rumah yang
layak huni harus dimaknai dari beberapa segi sosiologis, filosofis, kesehatan, legalitas,
fisik dan hemat energi. Secara teoritis sangat mudah dalam menemukan rumah yang
layak huni, secara sederhana rumah yang layak adalah tempat tinggal keluarga dan warga
dengan dukungan fasilitas lingkungan yang cukup untuk memenuhi kebutuhan dasar,
mulai dari air bersih, penerangan, sanitasi saluran pembuangan limbah, serta aman bagi
aktivitas penghuninya.
Desa atau Nagori Tiga Dolok masih banyak keluarga yang kurang mampu, salah
satunya rumah yang tidak layak huni, oleh karena itu untuk menanggulangi masalah ini
salah satunya program pemerintah adalah memberikan bantuan perbaikan rumah yang
tidak layak huni kepada masyarakat yang kurang mampu (Syaputra et al., 2021). Bantuan
bedah rumah adalah usaha untuk memberikan kesejahteraan masyarakat dan pemerataan
pembangunan.
Belum tersalurkannya bantuan pemerintah secara merata terhadap rumah penduduk
Desa Tiga Dolok, disebabkan oleh program yang telah berjalan selama ini sangat rumit,
sistem yang berjalan masih secara manual dalam pengolahan data masyarakatnya.
Oleh sebab itu, penulis memberikan solusi untuk mengklasifikasi tingkat kelayakan
rumah dengan menggunakan algoritma C4.5. Algoritma ini dipilih karena merupakan
salah satu metode pada Decision tree/Pohon Keputusan yang banyak dimanfaatkan untuk
melakukan prediksi terhadap suatu kasus (Elmande & Widodo, 2016). Dengan demikian
subsidi pemerintah dapat disalurkan secara tepat sasaran. Tujuan penelitian yaitu
menggunakan pohon keputusan berbasis algoritma C4.5 diharapkan dapat meningkatkan
keakuratan penerimaan bantuan renovasi kelayakan rumah.
Penelitian yang dilakukan oleh (Riadi & Rivai, 2020) mengatakan bedah rumah
merupakan salah satu program untuk warga miskin yang bertujuan tentunya untuk
Volume 1, Nomor 5, Mei 2021
p-ISSN 2774-5147 ; e-ISSN 2774-5155
398
http://sostech.greenvest.co.id
meringankan warga miskin agar memiliki rumah yang layak huni, selain itu diharapkan
kedepannya secara perlahan perekonomian yang dimiliki oleh warga tersebut dapat
berkembang serta meningkat lebih baik. Diperkuat oleh pendapat (Sidiq & Resnawaty,
2017) mengatakan partisipasi masyarakat merupakan prasyarat penting dalam
pelaksanaan pembangunan. Pembangunan yang tidak melibatkan masyarakat akan
cenderung memarginalkan masyarakat itu sendiri. Namun pada kenyataannya sering
terjadi pengabaian partisipasi masyarakat, sehingga masyarakat masih menjadi objek dari
pelaksanaan pembangunan
Penelitian terdahulu dilakukan oleh (Zaman, 2017) data mining dengan metode
klasifikasi menggunakan algoritma C4.5 sangat membantu dalam menentukan kelayakan
penerima bantuan RSRTLH, algoritma C4.5 dapat menemukan pola kelayakan penerima
bantuan rehabilitas sosial rumah tidak layak huni, pohon keputusan yang dihasilkan oleh
algoritma C4.5 mempercepat pengambilan keputusan oleh pihak yang berwenang.
Sehingga tingkat kesalahan dalam pengambilan keputusan bisa diperkecil,
pengimplementasian algoritma C4.5 dengan aplikasi WEKA dan RapidMiner
menghasilkan pohon keputusan yang sama dengan perhitungan manual, Pada riset
berikutnya mengembangkan algorima C4.5 untuk menentukan kelayakan penerima
bantuan rehabilatas sosial rumah tidak layak huni pada penelitian ini dalam bentuk
aplikasi data mining berbasiskan web.
METODE PENELITIAN
Data mining adalah proses yang menggunakan teknik statistic, matematika,
kecerdasan buatan dan machine learning untuk mengekstraksi dan mengidentifikasi
informasi yang bermanfaat (Handoko & Lesmana, 2018) dan pengetahuan yang terkait
dari berbagai database yang besar (Maulida, 2018). Hal penting yang terkait dengan data
mining adalah data mining merupakan suatu proses otomatis terhadap data yang sudah
ada (Nofriansyah et al., 2015), data yang akan diproses berupa data yang sangat besar dan
tujuan data mining adalah mendapatkan hubungan atau pola yang mungkin memberikan
indikasi yang bermanfaat (Nofriansyah et al., 2015).
Gambar 1. Proses-Proses Tahapan Data Mining
Algoritma C4.5 adalah salah satu metode klasifikasi dari data mining yang
digunakan untuk mengkonstruksikan pohon keputusan (decision tree)(Achmad, Slamat,
& ITATS, 2012). Menurut (Ratniasih, 2015) menjelaskan bahwa Decision tree atau
Penerapan Data Mining Menggunakan Algoritma C4.5 SOSTECH, 2021
Dalam Menentukan Kelayakan Penerimaan Bantuan
Bedah Rumah pada Desa Tiga Dolok
Paul V. M., Indra Gunawan, Bahrudi Efendi Damanik, Iin Parlina dan
Widodo Saputra
399
Pohon Keputusan adalah suatu metode klasifikasi yang paling popular karena mudah
untuk diinterpretasi oleh manusia.
Gambar 2. Decision tree
RapidMiner merupakan platform perangkat lunak ilmu data yang dikembangkan oleh
perusahaan yang bernama sama dengan pihak yang menyediakan lingkungan terintegrasi
untuk persiapan data (Elfaladonna & Rahmadani, 2019), penambangan teks dan analisis
prediktif (Pranoto & Harianto, 2020). RapidMiner dilengkapi dengan satu prosesor logika
dan 10.000 baris data (Aris & Benyamin, 2019). Berikut adalah gambar 3 tampilan
RapidMiner Studio Versi 9.3 yang akan digunakan peneliti seperti dibawah ini:
Gambar 3. Tampilan RapidMiner Studio versi 9.3
Volume 1, Nomor 5, Mei 2021
p-ISSN 2774-5147 ; e-ISSN 2774-5155
400
http://sostech.greenvest.co.id
Berikut merupakan penjelasan dari fitur-fitur yang terdapat dalam Rapid Miner:
a. View operators : Semua tahapan kerja ditampilkan secara berkelompok dan bisa
diikutsertakan di dalam proses analisa
b. View repository : Komponen pusat yang menyediakan service untuk manajemen dan
structural proses analisa baik data, data-data proses maupun hasil
c. View process : Menampilkan tahap-tahap individual operator di dalam proses analisa
dan juga interkoneksi
d. View parameter : Operator-operator yang mungkin memerlukan untuk bisa
berfungsi. Setelah sebuah operator dipilih di view process maka parameternya akan
ditampilkan
e. View help dan comment : Menampilkan deskripsi dari operator sedangkan view
comment menampilkan komentar yang dapat diedit terhadap operator.
HASIL DAN PEMBAHASAN
Menyiapkan Data
Tabel 1. Daftar Isian Data Dasar Keluarga
Kondis
i Atap
Rumah
Kondis
i
Dindin
g
Rumah
Kondis
i
Lantai
Rumah
Pencahay
aan
Rumah
Sirkulasi
Udara
Sarana
MCK
TP
S
Status
Kepemilik
an Rumah
Penghasil
an
Bagus
Layak
Pakai
Semen
Terang
Sejuk
Ada
Ada
Milik
Sendiri
Rp.
20.000.000
.
Bagus
Layak
Pakai
Semen
Terang
Sejuk
Ada
Ada
Milik
Sendiri
Rp.
12.000.000
.
Bagus
Layak
Pakai
Semen
Terang
Sejuk
Ada
Ada
Milik
Sendiri
Rp.
7.000.000.
Bagus
Layak
Pakai
Semen
Terang
Tidak
Sejuk
Ada
Ada
Milik
Sendiri
Rp.
7.000.000.
Bagus
Layak
Pakai
Semen
Terang
Sejuk
Ada
Ada
Milik
Sendiri
Rp.
7.000.000.
Bagus
Layak
Pakai
Semen
Terang
Sejuk
Ada
Ada
Milik
Sendiri
Rp.
5.000.000.
Bagus
Layak
Pakai
Semen
Terang
Sejuk
Ada
Ada
Milik
Sendiri
Rp.
4.500.000.
Rusak
Layak
Pakai
Tanah
Redup
Sejuk
Ada
Tdk
Ada
Milik
Sendiri
Rp.
2.000.000.
Bagus
Layak
Pakai
Semen
Redup
Sejuk
Ada
Ada
Milik
Sendiri
Rp.
6.350.000.
Rusak
Tidak
Layak
Pakai
Tanah
Terang
Sejuk
Ada
Tdk
Ada
Sewa
Rp.
1.500.000.
Penerapan Data Mining Menggunakan Algoritma C4.5 SOSTECH, 2021
Dalam Menentukan Kelayakan Penerimaan Bantuan
Bedah Rumah pada Desa Tiga Dolok
Paul V. M., Indra Gunawan, Bahrudi Efendi Damanik, Iin Parlina dan
Widodo Saputra
401
i=1$
ARLINA
MNRG
Bagus
Tidak
Layak
Pakai
Semen
Redup
Tdk
Ada
Tdk
Ada
Sewa
Rp.
1.000.000.
RABEN
NA
MANIK
Bagus
Tidak
Layak
Pakai
Tanah
Redup
Tdk
Ada
Ada
Milik
Sendiri
Rp.
1.300.000.
ELPERI
DA
SINAGA
Rusak
Tidak
Layak
Pakai
Tanah
Terang
Tdk
Ada
Ada
Milik
Sendiri
Rp.
1.400.000.
DENNI
SINAGA
Bagus
Layak
Pakai
Tanah
Terang
Tdk
Ada
Ada
Milik
Sendiri
Rp.
1.000.000.
RESTI
MANIK
Rusak
Tidak
Layak
Pakai
Tanah
Terang
Tdk
Ada
Ada
Milik
Sendiri
Rp.
1.500.000.
NAOMI
PPN
Rusak
Layak
Pakai
Semen
Terang
Ada
Ada
Milik
Sendiri
Rp.
2.000.000.
HENDRI
K P
Bagus
Tidak
Layak
Pakai
Tanah
Terang
Tdk
Ada
Tdk
Ada
Sewa
Rp.
1.000.000.
MANAT
AR
Rusak
Tidak
Layak
Pakai
Semen
Terang
Ada
Tdk
Ada
Sewa
Rp.
1.000.000.
NURLI
OPS
Bagus
Tidak
Layak
Pakai
Tanah
Terang
Ada
Tdk
Ada
Sewa
Rp.
1.000.000.
HOBBI
OPS
Rusak
Tidak
Layak
Pakai
Tanah
Redup
Tdk
Ada
Tdk
Ada
Sewa
Rp.
3.000.000.
Sumber data : Kantor Kepala Desa Tiga Dolok
Perhitungan Algoritma C4.5
Proses perhitungan menggunakan algoritma C4.5 untuk memperoleh hasil klasifikasi
pohon keputusan sebagai berikut :
Langkah 1 : Menentukan Nilai Entropy dan menghitung Entropy semua kasus yang
dibagi bedasarkan kelas atribut.
Rumus : Entropy(S) =
𝑛
$
−$
𝑝
i$* $log2$pi$
$
Keterangan :
S = Himpunan Kasus
n = Jumlah Partisi S
pi = Proporsi Si terhadap S
Langkah 2 : Perhitungan Gain untuk untuk masing-masing atribut.
Rumus : Gain(S,A)Entropy(S)-
𝑛
$
|
𝑆
i|
$*$
𝐸𝑛𝑡𝑟𝑜𝑝𝑦
$(
𝑆
i)
$
$
Keterangan :
S = Himpunan Kasus
A = Fitur
n = Jumlah Partisi Atribut A
|Si| = Proporsi Si terhadap S
|S| = Jumlah Kasus dalam S
i=1$
|
𝑆
|
$
Volume 1, Nomor 5, Mei 2021
p-ISSN 2774-5147 ; e-ISSN 2774-5155
402
http://sostech.greenvest.co.id
$
$
$
$
Entropy [Total] = (−$
12$
*$
𝑙𝑜𝑔
2$(
12$
)$+$(−$
8$
*$
𝑙𝑜𝑔
2$($
8$
))$
)$
20$ 20$ 20$ 20$
= 0,442179 + 0,528771
= 0,97095059. Untuk menghitung nilai entropy total, kita
menjumlahkan partisi layak dan partisi tidak layak.
Entropy [Kondisi Atap Rumah-Bagus]
= (−$
5$
*$
𝑙𝑜𝑔
2$($
5$
))$+$(−$
8$
*$
𝑙𝑜𝑔
2$($
8$
))$
13$ 13$ 13$ 13$
= 0,530197 + 0,43104
= 0,9612366. Untuk menghitung entropy tersebut, kita menjumlahkan partisi [Kondisi
Atap Rumah-Bagus yang layak] dengan [Kondisi Atap Rumah-Bagus yang tidak layak].
Entropy [Kondisi Atap Rumah-Rusak]
= (−$
7
$
7$
7$ 0$
*$
𝑙𝑜𝑔
2$($ ))$+$(−
$
7$ 7$
0$
*$
𝑙𝑜𝑔
2$($ ))
$
7$
= 0 + 0
= 0. Untuk menghitung entropy tersebut, kita menjumlahkan partisi [Kondisi Atap
Rumah-Rusak yang layak] dengan [Kondisi Atap Rumah-Rusak yang tidak layak].
Menghitung Gain untuk nilai Kondisi Atap Rumah
= 0,97095059 -
(
13
)*0,961236 +($
7
$
)
*0
20$ 20$
= 0,346146801. Nilai Gain merupakan hasil dari entropy total dikurang dengan setiap
partisi dibagi dengan jumlah total lalu dikali dengan jumlah entropy partisi.
Penerapan Data Mining Menggunakan Algoritma C4.5 SOSTECH, 2021
Dalam Menentukan Kelayakan Penerimaan Bantuan
Bedah Rumah pada Desa Tiga Dolok
Paul V. M., Indra Gunawan, Bahrudi Efendi Damanik, Iin Parlina dan
Widodo Saputra
403
Tabel 2. Pengolahan Data Menggunakan Microsoft Office Excel 2010
Jumlah
Layak
Tidak Layak
Entropy
Gain
Total
20
12
8
0,97095059
Kondisi Atap
Rumah
0,346146801
Bagus
13
5
8
0,9612366
Rusak
7
7
0
0
Kondisi
Dinding Rumah
0,506007579
Layak
Pakai
11
3
8
0,84535094
Tidak
Layak
Pakai
9
9
0
0
Kondisi Lantai
Rumah
0,506007579
Semen
11
3
8
0,84535094
Tanah
9
9
0
0
Pencahayaan
Rumah
0,403838894
Terang
15
8
7
0,99679163
Redup
5
4
1
0,72192809
Sirkulasi Udara
0,342246693
Sejuk
16
9
7
0,98869941
Tidak
Sejuk
4
3
1
0,81127812
Sarana MCK
0,346146801
Ada
13
5
8
0,9612366
Tidak Ada
7
7
0
0
Tempat
Pembuangan
Sampah
0,346146801
Ada
13
5
8
0,9612366
Tidak Ada
7
7
0
0
Penghasilan/
Bulan
0
>/= Rp.
5.000.000.
7
0
7
0
0
>/=
Rp.2.000.0
00. -
3.000.000.
3
3
0
0
0
</= Rp.
1.000.000.
-
1.500.000.
9
9
0
0
0
Volume 1, Nomor 5, Mei 2021
p-ISSN 2774-5147 ; e-ISSN 2774-5155
404
http://sostech.greenvest.co.id
1.
Kondisi
Dinding
Rumah
Layak Pakai
Tidak Layak Pakai
1.1
Kondisi
Lantai Rumah
Berhak
Menerima
Bantuan
Bedah Rumah
Tanah
1.1.2
?
Berhak
Menerima
Bantuan Bedah
Rumah
Semen
Sumber: Penulis dengan data penelitian
Perhitungan Pohon Keputusan
Setelah mendapatkan hasil pohon keputusan, maka akan didapatkan root node dan
dihubungkan oleh cabang, bergerak ke bawah dari root node sampai berakhir di leaf
node. Dapat kita lihat pada gambar 4 di bawah ini.
Gambar 4. Perhitungan Pohon Keputus an
Hasil Percobaan Menggunakan RapidMiner Studio
Proses Pengujian Dengan RapidMiner Studio
Proses pengujian dengan menggunakan metode decision tree C4.5 pada aplikasi
RapidMiner Studio dapat dilihat seperti tahapan dibawah ini :
Langkah 1 : Buka aplikasi RapidMiner Studio, berikut ini merupakan tampilan awal
aplikasi RapidMiner Studio Versi 9.7.