Scraping dan Analisis Data Visualisasi terhadap data e-commerce novel dengan tableau
Pada kesempetana kali ini saya akan meakukan analisis data dengan data e-comerce yaitu shopee terkait dengan penjual buku novel dengan link berikut https://shopee.co.id/search?keyword=buku%20novel%20%26%20sastra&labelIds=1000006&noCorrection=true&page=4&ratingFilter=3&showItems=true&sortBy=relevancy. Untuk sraping data saya menggunakan aplikasi data miner dengan cara dan tahap seperti pada tulisan medium saya sebelumnya yang bisa diakses pada link berikut https://falahadlin.medium.com/text-mining-data-konten-youtube-4f8c684657b4.
Maka saya telah mendapatkan hasil dari scraping data tersebut dalam bentuk file excel seperti dibawah ini.
Terdapat 93 baris data yang dimana merupakan buku novel yang terjual. Dilihat bahwa ada 4 variabe; yaitu judul buku, harga, kota toko dan terjual. Kemudian yang kita lakukan merapihkan data terhadap variabel terjual. Pertama kita menghapuskan tulisan ”Terjual” pada variabel terjual dengan perintah replace. Pertama seleksi kolom variabel terjual. Lalu klik menu Home > Find & Select > replace. Maka akan muncul jendela baru dimana pada kolom Find what isi objek yang ingin dihilangkan atau diganti untuk saat ini kita kata “Terjual”. Lalu pada kolom Replace with kita isi dengan objek apa yang akan menggantikan objek sebelumnya ubtuk kali ini kolom tersebut dikosongka karena kita ingin menghilangkan kata “Terjual”. Berikutnya klik Replace All.
Maka didapatkan output seperti berikut,
Selanjutnya kita hilangkan tanda koma dan gantikan kata “RB” menjadi 00/000 sesuai nominalnya. Dengan perintah replace seperti sebelumnya maka didapatkan seperti berikut.
Berikutnya pisahkan nominal harga pada variabel harga dengan perintah delimeted dengan cara klik menu Data > Text To Coumn maka akan muncul jendela seperti berikut,
Setelah kik Delmitied lalu klik Next , lalu pilih space lalu klik Next
Kemudian pilih centang space agar memisahkan nomil terhadap spasi.
Lalu kli Next.
Lalu pilih General dan akhri klik finish. Maka akan didapatkan output seperti berikut,
Kemudian rata-ratakan 2 nominal maka didapatkan data seperti berikut.
Kemudian kita rapihkan judul-judul buku tersebut dengan perintah replace.
Maka hasil data set akhir seperti berikut.
Selanjutnya kita mebuat analisis data visualisasi menggunakan tableau. Pertama buka aplikasi tableau. Kemudian klik Microsoft Excel untuk memasukan data penjualan buku novel tersebut dalam bentuk file excel.
Lalu pilih file tersebut lalu klik open.
Kemudian klik sheet 1 untuk memulai membuat visualisasi data.
Pertama masukan variabel judul ke dalam Colums lalu variabel terjual masuk ke dalam Rows . Kemudian variabel kota_toko masukan ke dalam identifikasi color. Dapat diikuti dan dihasilkan output seperti berikut,
Didapatkan sheet pertama merupakan visualisasi data terkait jumlah buku yang terjual.
Selanjutnya membuat sheet ke dua dengan memasukan judul ke dalam Colums lalu variabel harga masuk ke dalam Rows . Kemudian variabel kota_toko masukan ke dalam identifikasi color. Dapat diikuti dan dihasilkan output seperti berikut,
Kemudian kita dapat membuat dashboard dimana menggambungkan antara du sheet tersebut agar dapat divisualisasikan lebih jelas lagi. Maka klik +dasboard. Kemudian masukan sheet 1 dan 2 ke dalam dashbiard dengan posisi kana dan kiri. Maka dapat dilihat output seperti berikut,
Dapat dilihat pada grafik Penjualan buku dimana terdapat novel terlaris dari 93 data novel yang ada. Dimana terdapat 5 novel terlaris yaitu novel berjudul Septihan, Let Me Tell You A Story About Zodiac, Antariksa, Antares, My Lecturer My Husband. Dapat dilihat grafik penulana buku lebih jelas seperti berikut.
Dapat dilihat juga kota toko buku tersebut paling banyak terdapat di Depok, Tangerang Selatan, Tangerang, Bekasi, Yogyakarta.
Selanjtnya kita lihat pada data harga buku novel dimana dari mulai harga 5.000 sampai 360.000. Adapun novel termahal yaitu novel berjudul sheerlock, akan tetapi dengan harga tersebut tidak menjamin novel tersebut laku dipasaran indonesia. Maka kita akan melihat bagaimana interval harga buku novel yang selayaknya dimana novel tersebut laris dipasaran. Maka dibuat visualisasi data seperti berikut
Didapatkan bahwa dari 5 buku terlaris maka diperoleh interval harga novel yaitu 79.500–148.500. Disimpulkan bahwa jumlah novel terlaris berkolerasi poritif terhadap harga novel yang berarti jika novel semakin banyak terjual makan harga novel pun semakin tinggi.