blog image

Python |01 Des 2024 | Dilihat 403 Kali

Library Python Terbaik Untuk Data Science (Numpy, Pandas, Matplotlib)

NumPy, Pandas, dan Matplotlib adalah tiga pustaka Python utama yang harus dikuasai oleh setiap ilmuwan data. NumPy menyediakan dasar untuk komputasi array yang efisien, Pandas memudahkan manipulasi data tabular, dan Matplotlib memungkinkan visualisasi data yang fleksibel.

Berikut penjelasan berkaitan dengan library NumPy, Pandas, dan Matplotlib.

1.    Numpy


 
NumPy (kependekan dari Numerical Python) adalah salah satu library teratas yang dilengkapi dengan sumber daya yang berguna untuk membantu para data scientist mengubah Python menjadi alat analisis dan pemodelan ilmiah yang kuat. Libary Open source terpopuler ini tersedia di bawah lisensi BSD. Ini adalah pustaka Python dasar untuk melakukan tugas dalam komputasi ilmiah. NumPy adalah bagian dari ekosistem berbasis Python yang lebih besar dari tool open source yang disebut SciPy.

Perpustakaan memberdayakan Python dengan struktur data substansial untuk mudah melakukan perhitungan multi-dimensi (multi-dimensional arrays) dan perhitungan matrik. Selain penggunaannya dalam menyelesaikan persamaan aljabar linier (linear algebra equations) dan perhitungan matematis lainnya, NumPy juga digunakan sebagai wadah multi-dimensi serbaguna untuk berbagai jenis data generik.

Lebih hebatnya, NumPy terintegrasi dengan bahasa pemrograman lain seperti C / C ++ dan Fortran. Fleksibilitas perpustakaan NumPy memungkinkannya untuk dengan mudah dan cepat bergabung dengan berbagai database dan tools. Sebagai contoh, mari kita lihat bagaimana NumPy (disingkat np) dapat digunakan untuk mengalikan dua matriks. (sumber: belajarpython.com)


2.    Pandas


 
Pandas adalah sebuah library di Python yang bersifat open source dengan lisensi BSD pandas biasa digunakan untuk menganalisis data, manipulasi data, mengubah dimensi data, mengecek data dan masih banyak lagi. Pandas memudahkan kita untuk membaca file dengan banyak format file seperti .txt, .csv, .json, dan masih banyak lagi, untuk lebih lengkapnya bisa baca dokumentasinya disini. Fitur ini akan menjadikannya table dan juga dapat mengolah suatu data dengan menggunakan operasi seperti join, distinct, group by, agregasi, dan teknik lainnya yang terdapat pada SQL. Pandas merupakan library analisis data yang diperlukan untuk membersihkan data mentah ke dalam sebuah bentuk yang bisa untuk diolah. (sumber: wakool.id)


3.    Matplotlib

 
Matplotlib adalah salah satu library Python yang populer untuk visualisasi data. Library ini menyediakan berbagai fungsi untuk membuat grafik dan visualisasi data dalam bentuk yang informatif dan menarik. Dengan menggunakan Matplotlib, Anda dapat membuat berbagai jenis plot, seperti line plot, scatter plot, bar plot, pie chart, histogram, dan masih banyak lagi. Matplotlib memberikan tingkat fleksibilitas dan kustomisasi yang tinggi dalam pembuatan visualisasi. Anda dapat mengontrol hampir setiap aspek tampilan grafik, mulai dari jenis plot, skala sumbu, warna, gaya garis, hingga anotasi.


Cara Install Numpy, Pandas, Matplotlib dengan Visual Studio Code
Berikut tutorial cara menginstal 3 library data analisis yaitu: Numpy, Pandas, Matplotlib:
Menginstal Numpy untuk Pengguna PIP


Pengguna yang lebih suka menggunakan pip dapat menggunakan perintah di bawah ini untuk menginstal NumPy:


1. Menggunakan visual Studio Code klik menu terminal >> new terminal



 
2.    Kemudian di terminal, ketikkan : pip install numpy

 

Proses install sudah selesai


 
Lakukan perintah yang sama untuk melakukan penginstalan pada library pandas dan Matplotlib.

.

blog-img

Diposting oleh:

Dafit Afianto

Lecturer, Writing and Editing | Work hard in silence. Let your success in the noise.

Artikel Terkait

List Surah AL-QUR'AN


List Juz AL-QUR'AN