SISTEM IRIGASI CERDAS BERBASIS IoT DAN MODEL PEMBELAJARAN MESIN LANJUT
BAB I – PENDAHULUAN
1.1 Latar Belakang
Meningkatnya kebutuhan global terhadap pengelolaan air yang efisien dalam bidang pertanian mendorong pengembangan sistem irigasi cerdas (smart irrigation). Integrasi antara Internet of Things (IoT) dengan model Machine Learning (ML) telah merevolusi praktik irigasi tradisional melalui pemantauan waktu nyata (real-time monitoring) dan pengendalian presisi terhadap penggunaan air.
Namun demikian, sebagian besar sistem irigasi konvensional masih memiliki keterbatasan dalam hal akurasi dan kemampuan adaptasi terhadap perubahan kondisi lingkungan. Hal ini menimbulkan kebutuhan akan solusi yang lebih tangguh, skalabel, dan efisien untuk mengoptimalkan penggunaan air dan menjamin keberlanjutan sistem pertanian.
Dalam penelitian ini dikembangkan Sistem Irigasi Cerdas berbasis IoT dengan model pembelajaran mesin gabungan (ensemble) menggunakan algoritma Decision Tree Classifier (DTC) dan Random Forest Classifier (RFC). Sistem ini menganalisis parameter lingkungan penting seperti kelembapan tanah, suhu, pH tanah, serta jenis tanah untuk menentukan jadwal irigasi yang optimal. Dengan akurasi mencapai 98,7%, sistem ini mampu mengungguli metode irigasi tradisional sekaligus menjaga efisiensi komputasi.
1.2 Rumusan Masalah
- Bagaimana cara mengintegrasikan teknologi IoT dengan algoritma ML untuk menentukan jadwal irigasi yang efisien?
- Bagaimana kinerja model ensemble DTC–RFC dalam meningkatkan akurasi prediksi kebutuhan air tanaman dibandingkan metode tradisional?
- Bagaimana sistem ini dapat beradaptasi terhadap variasi lingkungan yang dinamis?
1.3 Tujuan Penelitian
- Membangun sistem irigasi cerdas berbasis IoT dan model pembelajaran mesin untuk mengoptimalkan penggunaan air.
- Menguji kinerja model DTC–RFC dalam klasifikasi kebutuhan irigasi.
- Menyediakan solusi berkelanjutan untuk meningkatkan produktivitas pertanian melalui manajemen air yang presisi.
1.4 Manfaat Penelitian
- Bagi Petani: Mengurangi pemborosan air dan meningkatkan hasil panen.
- Bagi Peneliti: Menjadi referensi pengembangan sistem pertanian berbasis kecerdasan buatan.
- Bagi Pemerintah dan Industri: Mendukung kebijakan pertanian berkelanjutan dan efisiensi sumber daya air.
BAB III – METODOLOGI PENELITIAN
3.1 Bahan dan Perangkat
Sistem ini memanfaatkan sensor IoT seperti:
Sensor kelembapan tanah (soil moisture sensor)
Sensor pH tanah
Sensor suhu dan intensitas cahaya
Data real-time yang dikumpulkan meliputi kelembapan, pH, jenis tanah, suhu, dan intensitas cahaya.
3.1 Data Sensor Lapangan Pertanian
Sistem menggunakan beberapa sensor untuk memantau kondisi lingkungan yang memengaruhi kesehatan tanaman dan kebutuhan air, seperti sensor kelembapan tanah, pH tanah, suhu, dan intensitas cahaya.
Kelembapan tanah menunjukkan kadar air dan menjadi dasar penentuan kebutuhan irigasi.
pH tanah menunjukkan tingkat keasaman atau kebasaan yang memengaruhi pertumbuhan dan penyerapan air.
Jenis tanah (pasir, lempung, liat) berpengaruh pada daya simpan air.
Suhu lingkungan memengaruhi laju penguapan dan transpirasi tanaman.
Intensitas cahaya berperan dalam proses fotosintesis dan siklus pertumbuhan tanaman.
3.2 Pra-pemrosesan Data
3.2.1 Penanganan Nilai Hilang
Data sensor sering kali memiliki nilai kosong atau tidak terbaca. Untuk mengatasi hal ini, digunakan metode imputasi, yaitu mengganti nilai yang hilang dengan rata-rata (mean) atau median dari kolom yang bersangkutan. Pemilihan metode tergantung pada distribusi data — jika data berdistribusi normal, digunakan rata-rata, sedangkan jika tidak, digunakan median.
3.2.2 Normalisasi Fitur
Karena setiap fitur memiliki satuan dan skala berbeda (misalnya suhu dalam °C, kelembapan dalam %, dan intensitas cahaya dalam lux), maka dilakukan normalisasi dengan metode Min-Max Scaling, yang mengubah nilai ke rentang 0–1. Langkah ini penting agar tidak ada fitur yang memiliki pengaruh lebih besar hanya karena perbedaan skala, dan agar model pembelajaran mesin dapat memproses data secara seimbang.
3.2.3 Pembagian Data
Setelah data bersih dan ternormalisasi, dataset dibagi menjadi dua bagian:
-
80% data latih (training set) untuk melatih model machine learning.
-
20% data uji (testing set) untuk mengevaluasi performa model.
Pembagian ini bertujuan untuk mengukur kemampuan model dalam melakukan prediksi terhadap data baru yang belum pernah dilihat sebelumnya.
3.3 Algoritma yang Diusulkan
Penelitian ini mengusulkan penggunaan model ensemble yang menggabungkan dua algoritma klasifikasi, yaitu Random Forest Classifier (RFC) dan Decision Tree Classifier (DTC). Model ini dirancang untuk memprediksi jadwal irigasi optimal berdasarkan data sensor yang dikumpulkan secara real-time.
Kombinasi kedua algoritma ini dipilih karena:
-
DTC mudah diinterpretasikan dan efektif untuk data non-linear.
-
RFC mampu meningkatkan akurasi dan ketahanan terhadap overfitting dengan menggabungkan banyak pohon keputusan.
3.3.1 Random Forest Classifier (RFC)
RFC adalah metode pembelajaran ensemble yang membangun banyak pohon keputusan (decision trees) secara acak dan menggabungkan hasil prediksinya melalui voting mayoritas. Setiap pohon dilatih menggunakan bootstrapping, yaitu pengambilan sampel acak dengan pengembalian, sehingga setiap pohon memiliki data latih yang berbeda.
3.3.1.1 Cara Kerja RFC
-
Dataset dibagi menjadi beberapa subset acak.
-
Setiap subset digunakan untuk membangun satu pohon keputusan.
-
Pada setiap node pohon, RFC memilih fitur terbaik untuk memisahkan data menggunakan Gini Impurity atau Information Gain.
-
Setelah semua pohon terbentuk, prediksi akhir ditentukan berdasarkan mayoritas hasil voting dari seluruh pohon.
3.3.1.2 Kriteria Pemisahan
RFC menggunakan ukuran seperti Gini Impurity atau Entropy untuk menentukan titik pemisahan terbaik pada setiap node. Pemisahan terus dilakukan hingga mencapai kondisi berhenti, seperti kedalaman maksimum pohon atau jumlah minimum sampel di node akhir.
3.3.1.3 Kelebihan RFC
-
Tahan terhadap overfitting, karena hasil akhir merupakan rata-rata dari banyak pohon.
-
Dapat mengukur tingkat kepentingan fitur, membantu mengetahui faktor lingkungan mana yang paling berpengaruh terhadap kebutuhan irigasi.
-
Efisien dan dapat diskalakan, cocok untuk data sensor yang besar dan bersifat real-time.
3.3.1.4 Hyperparameter Utama
Beberapa parameter penting yang memengaruhi kinerja RFC antara lain:
-
Jumlah pohon (n_estimators): banyaknya decision tree yang dibangun.
-
Kedalaman maksimum (max_depth): batas kedalaman pohon.
-
Minimum sampel per split (min_samples_split): jumlah minimum data yang dibutuhkan untuk membagi node.
-
Jumlah fitur maksimum (max_features): banyaknya atribut yang dipertimbangkan pada setiap pemisahan node.
3.3.2 Decision Tree Classifier (DTC)
DTC adalah algoritma machine learning yang sederhana namun efektif dan dapat digunakan untuk tugas klasifikasi maupun regresi. Dalam penelitian ini, DTC berfungsi sebagai model dasar dalam kerangka ensemble untuk mengklasifikasikan kebutuhan irigasi berdasarkan data sensor.
3.3.2.1 Struktur Pohon Keputusan (Decision Tree)
Pohon keputusan bekerja dengan cara membagi data secara rekursif berdasarkan nilai atribut input.
Pada setiap node, algoritma memilih fitur yang paling efektif memisahkan data ke dalam kelas yang berbeda (misalnya: “butuh irigasi” dan “tidak butuh irigasi”).
Proses ini terus berlanjut hingga memenuhi kondisi penghentian (stopping condition), seperti:
-
kedalaman maksimum pohon telah tercapai, atau
-
jumlah data pada satu node sudah lebih kecil dari batas minimum yang ditentukan.
3.3.2.2 Kriteria Pemisahan (Splitting Criterion)
Untuk menentukan titik pemisahan terbaik pada setiap node, DTC menggunakan ukuran seperti Gini Impurity atau Information Gain.
-
Gini Impurity mengukur seberapa “murni” pembagian data dalam satu node.
-
Information Gain mengukur seberapa besar peningkatan ketepatan klasifikasi setelah data dibagi berdasarkan fitur tertentu.
Fitur dengan nilai gain tertinggi akan dipilih untuk membagi data pada node tersebut.
3.3.2.3 Kelebihan DTC
-
Mudah dipahami (Interpretability): Struktur pohon yang berbentuk keputusan logis (“jika–maka”) membuat proses prediksi mudah dijelaskan, bahkan bagi pengguna non-teknis.
-
Dapat menangani data non-linear: DTC mampu memodelkan hubungan kompleks antar fitur tanpa perlu transformasi data terlebih dahulu.
-
Efisien untuk data berdimensi tinggi: Pohon keputusan dapat bekerja baik dengan dataset yang memiliki banyak fitur, baik numerik maupun kategorikal.
3.3.2.4 Hyperparameter Utama
Beberapa parameter penting dalam pengaturan DTC antara lain:
-
Maximum Depth: Menentukan kedalaman maksimum pohon; semakin dalam pohon, semakin kompleks modelnya.
-
Minimum Samples Split: Jumlah minimum sampel yang dibutuhkan untuk membagi sebuah node internal.
-
Minimum Samples Leaf: Jumlah minimum sampel yang harus ada pada node terminal (daun).
3.3.3 Ensemble dari DTC dan RFC
Model ensemble yang diusulkan dalam penelitian ini merupakan gabungan antara Decision Tree Classifier (DTC) dan Random Forest Classifier (RFC). Tujuannya adalah untuk memanfaatkan keunggulan masing-masing algoritma serta meningkatkan akurasi klasifikasi dalam memprediksi kebutuhan irigasi tanaman berdasarkan data sensor.
Pendekatan ensemble ini mampu mengurangi risiko overfitting dan meningkatkan ketahanan (robustness) model terhadap variasi data yang kompleks.
3.3.3.1 Konsep Hybrid RFC–DTC
Gabungan antara RFC dan DTC dapat dilakukan menggunakan dua pendekatan utama, yaitu stacking atau voting:
-
Stacking (Lapisan Bertingkat):
Dalam metode ini, hasil prediksi dari RFC dan DTC digunakan sebagai masukan bagi model tingkat kedua (meta-classifier). Model tingkat kedua ini bertugas menggabungkan kedua hasil prediksi untuk menghasilkan keputusan akhir yang lebih akurat. -
Voting (Pemungutan Suara):
Pada pendekatan ini, masing-masing model (RFC dan DTC) memberikan “suara” terhadap kelas hasil prediksi. Kelas dengan jumlah suara terbanyak akan dipilih sebagai hasil akhir prediksi kebutuhan irigasi.
3.3.3.2 Keunggulan Model Ensemble RFC–DTC
-
Peningkatan Akurasi:
Dengan menggabungkan prediksi dari dua model berbeda, ensemble mampu memperbaiki kesalahan yang mungkin dilakukan oleh salah satu model, sehingga menghasilkan prediksi yang lebih tepat. -
Ketahanan terhadap Overfitting:
DTC cenderung mengalami overfitting pada data pelatihan, tetapi RFC — yang menggabungkan banyak pohon — mampu menekan efek overfitting dengan melakukan rata-rata hasil dari banyak model. Kombinasi keduanya menciptakan keseimbangan antara akurasi tinggi dan generalisasi yang baik. -
Keseimbangan Kompleksitas dan Interpretabilitas:
-
RFC unggul dalam menangani data kompleks dan berdimensi tinggi dengan banyak fitur sensor.
-
DTC memiliki keunggulan dalam kemudahan interpretasi dan penanganan pola data yang lebih sederhana.
Dengan menggabungkan keduanya, sistem menjadi lebih adaptif terhadap berbagai kondisi lingkungan pertanian.
-
3.3.3.3 Penyetelan Hyperparameter (Hyperparameter Tuning)
Kinerja model ensemble dapat ditingkatkan melalui proses penyetelan hyperparameter, yaitu pengaturan nilai-nilai parameter penting pada model RFC dan DTC agar diperoleh kombinasi paling optimal.
Beberapa parameter yang disesuaikan meliputi:
-
RFC: jumlah pohon (n_estimators), kedalaman maksimum pohon (max_depth), dan jumlah fitur yang digunakan pada setiap pemisahan (max_features).
-
DTC: kedalaman maksimum pohon, kriteria pemisahan (Gini atau Entropy), serta jumlah minimum sampel pada setiap node.
Metode Grid Search atau Random Search digunakan untuk mencari kombinasi parameter terbaik berdasarkan hasil evaluasi performa model.
3.3.3.4 Integrasi ke dalam Sistem Irigasi Cerdas
Setelah model ensemble selesai dilatih dan dioptimalkan, model ini diintegrasikan ke dalam sistem irigasi cerdas (Smart Irrigation System).
Data sensor real-time — seperti kelembapan tanah, pH, suhu, dan intensitas cahaya — dikirim ke model untuk memprediksi jadwal irigasi yang optimal.
Dengan pendekatan ensemble RFC–DTC, sistem mampu memberikan hasil prediksi yang:
-
Lebih akurat, karena menggabungkan keunggulan dua algoritma,
-
Lebih efisien, karena mampu memproses data sensor secara cepat,
-
Lebih adaptif, terhadap perubahan kondisi lingkungan dan jenis tanaman yang berbeda.
4. HASIL DAN PEMBAHASAN
4.1 Detail Implementasi
Model dikembangkan menggunakan Python 3.19 dengan dukungan berbagai pustaka seperti:
Matplotlib, NumPy, Pandas, Scikit-Learn, dan Seaborn untuk proses analisis dan evaluasi.
Eksperimen dijalankan pada komputer workstation dengan spesifikasi:
-
Prosesor: Intel Core i7 (3.2 GHz)
-
RAM: 16 GB
-
GPU: NVIDIA Tesla
Kombinasi perangkat keras dan perangkat lunak ini digunakan untuk melatih, menguji, dan memvisualisasikan hasil model dengan efisien.
4.2 Metrik Evaluasi (Performance Metrics)
Untuk menilai efektivitas model ensemble RFC–DTC, digunakan beberapa metrik evaluasi utama, yaitu Accuracy, Precision, Recall, dan F1-Score.
-
Accuracy (Akurasi)
Mengukur persentase data yang diklasifikasikan dengan benar dibandingkan jumlah seluruh data.Nilai akurasi menunjukkan seberapa baik model mengenali kebutuhan irigasi secara umum.
-
Precision (Presisi)
Menunjukkan proporsi prediksi irigasi yang benar dari seluruh prediksi irigasi yang dikeluarkan model.Presisi tinggi berarti model jarang memberikan rekomendasi irigasi yang salah (false positive).
-
Recall (Sensitivitas)
Mengukur seberapa banyak kondisi irigasi yang benar-benar dibutuhkan berhasil dikenali model.Nilai recall tinggi menunjukkan model mampu mendeteksi hampir semua kebutuhan irigasi aktual.
-
F1-Score
Merupakan rata-rata harmonis antara Precision dan Recall, memberikan ukuran keseimbangan antara keduanya.Metrik ini sangat berguna pada dataset yang tidak seimbang, di mana jumlah data “butuh irigasi” dan “tidak butuh irigasi” tidak sama.
BAB V – KESIMPULAN DAN SARAN
5.1 Kesimpulan
Penelitian ini berhasil mengembangkan Sistem Irigasi Cerdas berbasis IoT dan model ensemble DTC–RFC yang mampu memberikan jadwal irigasi otomatis dan efisien dengan akurasi tinggi.
Model ini terbukti unggul dalam hal ketahanan, skalabilitas, dan kemampuan beradaptasi terhadap kondisi lingkungan yang dinamis.
5.2 Saran
Untuk pengembangan selanjutnya:
- Mengintegrasikan prediksi cuaca dan kebutuhan tanaman spesifik.
- Mengimplementasikan edge computing dan federated learning untuk efisiensi di area luas.
- Menggabungkan model deep learning dan data fusion untuk akurasi lebih tinggi.















