Algoritma Komputasi Machine Learning untuk Aplikasi Prediksi Nilai Total Organic Carbon (TOC)

Authors

  • Sanggeni Gali Wardhana
  • Henry Julois Pakpahan
  • Krisdanyolan Simarmata
  • Waskito Pranowo
  • Humbang Purba

Keywords:

TOC, machine learning, cross validation, hyperparameter tuning

Abstract

Total Organic Carbon (TOC) merupakan salah satu parameter penting yang digunakan untuk mengevaluasi kemampuan source rock secara kuantitas. Pada umumnya, data TOC diperoleh melalui core yang kemudian dilakukan proses pirolisis rock-eval pada setiap perconto. Namun, proses tersebut memerlukan waku yang cukup lama dan biaya yang cukup besar sehingga data yang didapatkan jumlahnya terbatas. Hal ini akan berimplikasi terhadap validitas penyebaran nilai TOC pada tahapan eksplorasi batuan induk unkonvensional. Data yang terbatas dapat diprediksi dengan pendekatan pola karakterisitik data itu sendiri. Penelitian ini dilakukan bertujuan untuk melakukan prediksi nilai TOC dengan menggunakan algoritma machine learning yaitu Artificial Neural Network, K-Nearest Neighbors, Support Vector Regression, Decision Tree, dan Random Forest dengan memanfaatkan data sumur “A” untuk membangun model dari setiap algoritma machine learning dan data sumur “B” untuk mengevaluasi model yang telah dibangun berdasarkan data sumur “A”. Pengolahan data untuk memprediksi nilai TOC dimulai dari mempersiapkan data pada sumur “A” berdasarkan korelasi yang tinggi pada prediktor dan data output yang akan diprediksi. Selanjutnya dilakukan pembagian atau splitting datasets dengan presentase 60% data digunakan untuk melakukan training dan 40% data sebagai test datasets. Setelah itu, train datasets dapat digunakan untuk membangun model algoritma machine learning. Kemudian dilakukan hyperparameter tuning dan cross validation sehingga dapat dihasilkan model algoritma machine learning dengan hyperparameter tertentu dengan hasil prediksi yang konsisten. Model terbaik diperoleh berdasarkan hasil cross validation dengan menggunakan prediktor dari test datasets hasil splitting sumur “A” dan test datasets dari sumur baru “B”. Hasil penelitian menunjukan bahwa hasil prediksi TOC terbaik pada data sumur “A” diperoleh dengan menggunaan algoritma Random Forest dan pada sumur “B” menggunakan algoritma K-Nearest Neighbors.

Downloads

Published

2021-08-30

Issue

Section

##section.default.title##