GETTING STARTED WITH MATPLOTLIB & SEABORN

Matplotlib merupakan salah satu library Python yang komprehensif digunakan sebagai visualisasi data baik statis maupun interaktif. Visualisasi yang dihasilkan oleh Matplotlib Python bisa disajikan baik dalam bentuk 2D ataupun 3D. Sedangkan Seaborn adalah library untuk membuat grafik dan statistik dengan menggunakan Python. Library ini dibangun berdasarkan library Matplotlib yang sudah ada. Kemudian terintegrasi dengan struktur data pada Pandas.

Seaborn dan Matplotlib adalah dua library visualisasi data yang populer di Python, tetapi keduanya memiliki karakteristik dan kegunaan yang berbeda. 

Berikut perbedaan keduanya:

Desain dan estetika: secara default, Seaborn memiliki tema dan palet warna yang lebih menarik dibandingkan dengan Matplotlib. Hal ini memungkinkan kamu untuk lebih mudah membuat visualisasi tanpa perlu banyak penyesuaian.

Fungsionalitas: meskipun Seaborn dibangun di atas Matplotlib dan memanfaatkannya sebagai dasar, Seaborn menawarkan berbagai jenis plot khusus yang dioptimalkan untuk analisis statistik, seperti plot distribusi, plot kategorikal, dan plot matriks. Di sisi lain, Matplotlib lebih fleksibel dan memungkinkan kamu membuat hampir semua jenis visualisasi, tetapi memerlukan lebih banyak kode.

Integrasi dengan Pandas: Seaborn bekerja dengan sangat baik dengan DataFrame Pandas, memudahkan pengguna untuk memvisualisasikan data langsung dari DataFrame. Meskipun Matplotlib juga mendukung DataFrame Pandas, Seaborn menyediakan interface yang lebih intuitif.

Kustomisasi: sebagai library dasar, Matplotlib memberikan kontrol lebih besar kepada analyst dalam hal kustomisasi. Semenetara itu, Seaborn mengoptimalkan untuk kasus penggunaan umum, tetapi mungkin tidak sefleksibel Matplotlib untuk kebutuhan kustomisasi yang sangat spesifik.

Dalam prakteknya, banyak data analyst menggunakan keduanya secara bersamaan. Seaborn untuk visualisasi cepat yang menarik dan informatif, sementara Matplotlib untuk kustomisasi lebih lanjut atau jenis visualisasi yang lebih kompleks.

VISUALISASI DATA TITANIC

1. Pertama tama silahakan load data train.csv sehingga seperti dibawah ini 

2. Coba tampilkan basic info dari data tersebut seperti di bawah ini 


1. Siapakah para penumpang titanic? (Umur, Jenis kelamin, Kelas dll)

#Mari kita visualisasikan!, silahkan coba untuk membuat visualisasi seperti gambar di bawah ini 

Jumlah penumpang Titanic berdasarkan jenis kelamin :







  • CHALLENGE!!
#Buatlah 1 kolom baru dalam contoh ini bernama 'person' yang menentukan apakah penumpang laki-laki, perempuan atau anak anak
#Semua yang dibawah 16 tahun merupakan termasuk kategori anak-anak 
\
  • Gunakan Factor plot untuk membadingkan  jumlah Pclass dan person seperti di bawah ini
 
  • Buatlah histogram tentang persebaran umur dari penumpang titanic
 
  • Hitung jumlah laki-laki, perempuan, anak-anak
 

  • Untuk mengingat kembali data, tampilkan 5 data teratas lagi
 


Komentar