27/08/2023
Pemrograman Data Sains (1)
Pemrograman Data Sains (1)
ADA banyak bahasa pemrograman untuk data sians. Dinataranya Python, R Matlab, Javasript, dll. Python menjadi salah satu bahasa pemrograman yang paling populer karena tak hanya dibutuhkan untuk bidang data science, tapi juga berguna untuk pengembangan web dan software. Bahasa pemrograman ini termasuk object-oriented programming. Dalam data science, Python umumnya digunakan untuk pemrosesan data dan penerapan algoritma analisis data. Python juga sangat mudah dipelajari oleh data scientist atau programmer pemula karena menggunakan sintaks yang sederhana.
Berikut adalah Tahapan Data Sains:
Data science adalah ilmu yang menggabungkan matematika, statisika dengan ilmu komputer dengan tujuan analisa data (data analysis) dari suatu himpunan data baik skala kecil (sampel) maupun besar (populasi) dengan mengaplikasikan algoritma tertentu untuk tujuan menggali data (data mining) dan mendapatkan pola data serta dapat melakukan prediksi data (prediction) dengan cukup akurat yang dapat membantu dalam pengambilan keputusan dan dapat digunakan untuk membuat sistem yang cerdas (AI) yang dapat terus belajar dengan sendirinya (machine learning).
Berikut adalah materi Pengantar Pemrograman Data Sains
- Pengertian Data Sains
- Tujuan data science
- Jenis pembelajaran data science
- Tahapan data sains
- Pertama, tahap pendefinisian masalah.
- Kedua, tahap pengumpulan data.
- Ketiga, tahap eksplorasi dan penyiapan data.
- Keempat, tahap analisis data.
- Kelima, storytelling.
- Keahlian dan skill data scientist
- Perbedaan data sains (machine learning) dengan pemrograman tradisional ?
- Mengapa python?
SIlakan dibaca materi lengkapnya Pengantar Data Sains Namun sebaiknya membaca juga materi Statistik dan data sains dan pengantar algoritma pemrograman
Dalam Mata Kuliah ini materi dna praktik yang akan dipelajari
TOPIK PEMROGRAMAN DATA SAINS WITH PYTHON
- Pengantar Paket dan Library Python untuk data sains
- Numpy
- Pandas
- Matplotlib, Seaborn
- Visualisasi Data
- Machine Learning (Intro)
- Projek
22/05/2023
ANALISA TREN DENGAN ALGORITMA REGRESI
ANALISA TREN
Dalam metode statistik ini, ada tiga jenis data yang bisa digunakan dalam analisis, yaitu data cross section, data time series, dan data panel (gabungan cross section dan time series).
Data time series adalah jenis data berdasarkan waktu yang memiliki banyak titik waktu. Banyak titik waktu di sini berarti waktunya lebih dari satu periode waktu. Berbeda dengan data cross section/silang waktu yang periode waktunya hanya 1 titik waktu. Periode waktu bisa 1 detik, 1 meni, 1 jam, 1 hari, 1 minggu, 1 bulan, 1 dekade, 1 tahun, 1 abad, dan seteresunya. Misalnya, dalam kurun waktu 1 tahun (data cross section), terdiri 12 bulan (data time series).
Tren adalah pergerakan jangka panjang dalam suatu kurun waktu yang kadang-kadang dapat digambarkan dengan garis lurus atau kurva mulus. Analisis trend digunakan untuk membangun model umum kecenderungan data berkala (time series) untuk keperluan peramalan (proyeksi tren). Analisis trend dipakai untuk data dengan horison waktu yang lama (sebaiknya lebih dari 10 tahun) dan tidak mengandung komponen musiman.
Beberapa model analisis yang umum dipakai :
- Linier dan non linier (2-4)
- Kuadratik
- Eksponensial
- Kurva-S
- Tren jangka panjang adalah suatu garis (trend) yang menunjukkan arah perkembangan secara umum.
- Variasi musim adalah suatu gerakan yang naik turun secara teratur yang cenderung untuk terulang kembali dalam jangka waktu tidak lebih dari 1 tahun.
- Variasi siklis adalah suatu gerakan yang naik turun secara teratur yang cenderung untuk terulang kembali setelah jangka waktu lebih dari 1 tahun.
- Variasi random adalah suatu gerakan yang naik turun secara tiba-tiba atau mempunyai sifat yang sporadis sehingga biasanya sulit untuk diperkirakan sebelumnya
Mengapa Analisa Tren Penting?
- Mengidentifikasi Pola dan Perubahan: Analisis tren membantu mengidentifikasi pola perubahan dalam data seiring waktu. Ini dapat membantu dalam memahami arah dan kecenderungan data serta mengidentifikasi apakah ada perubahan signifikan atau pola yang konsisten.
- Prediksi dan Perencanaan: Dengan memahami tren masa lalu, analisis tren dapat digunakan untuk membuat prediksi tentang masa depan. Informasi tren yang dihasilkan dapat membantu dalam perencanaan strategis, pengambilan keputusan, dan peramalan, sehingga membantu mengurangi ketidakpastian dan meningkatkan efisiensi.
- Evaluasi Kinerja: Analisis tren dapat digunakan untuk mengevaluasi kinerja suatu variabel atau fenomena seiring waktu. Misalnya, dalam bisnis, analisis tren dapat membantu dalam melihat pertumbuhan penjualan, laba, atau pengeluaran dan membandingkannya dengan target atau periode sebelumnya.
- Deteksi Anomali: Dengan memahami tren yang normal, analisis tren dapat membantu dalam mendeteksi anomali atau perubahan yang tidak biasa dalam data. Hal ini dapat membantu dalam mengidentifikasi masalah atau kesalahan yang mungkin terjadi dan mengambil tindakan yang sesuai.
- Pengambilan Keputusan: Analisis tren memberikan wawasan yang berharga dalam tren jangka panjang dan memungkinkan pengambilan keputusan yang lebih informasi. Informasi tren dapat membantu dalam mengidentifikasi peluang, mengelola risiko, dan mengoptimalkan strategi bisnis atau kebijakan publik.
Perhatikan tren IHSG berikut
Analisis Tren Linier dengan Algoritma Regresi Linier
Memaknai model Regresi dengan Bijak
- Narasi
- Tabel
- Gambar / Kurva
- Cara Manual Eliminasi dan subtitusi persamaan
- Menggunakan aplikasi pengolah data seperti excel, evies, SPSS, STATA, dll
- Menggunakan bahasa pemrograman (koding)
- Masukkan data yang diberikan ke dalam spreadsheet Excel. Misalnya, Kita dapat menempatkan data pada kolom A hingga D, dengan kolom A untuk nomor partisipan, kolom B untuk pengeluaran makanan (X1), kolom C untuk pengeluaran transportasi (X2), dan kolom D untuk berat badan (Y).
- Selanjutnya, pada sel E2, masukkan rumus regresi menggunakan fungsi "LINEST". Misalnya, rumusnya dapat dituliskan >>>>. =LINEST(D2:D11, B2:C11) Pastikan untuk menyesuaikan rentang sel dengan data yang tepat.
- Tekan kombinasi tombol Ctrl + Shift + Enter untuk mengkonfirmasi rumus sebagai rumus matriks. Dalam beberapa versi Excel, Kita mungkin perlu menekan Enter setelah memasukkan rumus.
- Setelah itu, Excel akan menghasilkan output matriks dalam rentang sel E2:F3. Sel E2 akan berisi koefisien regresi (intersep dan koefisien X1), sedangkan sel F2 akan berisi koefisien X2.
- Untuk menampilkan persamaan regresi berdasarkan koefisien yang dihasilkan, Kita dapat memasukkan rumus berikut di sel G2="Y = "&E2&" + "&F2&" * X1 + "&G2&" * X2"