Rangkuman “Tableau for Data Science” — Part I

Ahmad Ilham Habibi
14 min readOct 10, 2022

--

Catatan ini adalah rangkuman dari kursus Udemy berjudul : Tableau A-Z : Hands-On Tableau Training for Data Science karya Kirill Eremenko, dkk. Jika ingin belajar lebih detail, saya sarankan untuk belajar di kursus tersebut.

Catatan ini akan menjadi dua bagian.
Bagian pertama akan membahas tentang:
- Pengenalan Tableau
- Tableau Basic: Your First Bar Chart
- Time Series, Aggregation, dan Filters
- Map, Scatterplots, dan Dashboard
- Joining, Blending, and Relationships

Bagian kedua akan membahas tentang:
- Table Calculations, Advanced Dashboard, Storytelling
- Advanced Data Preparation
- Clusters, Custom Territories, Design Features

1. Pengenalan Tableau

Tableau Desktop memberikan semua yang Anda butuhkan untuk mengakses, memvisualisasikan, dan menganalisis data Anda. Dengan antarmuka seret dan lepas (drag adn drop) yang intuitif, Anda dapat mengungkap wawasan tersembunyi yang Anda butuhkan untuk membuat keputusan bisnis yang berdampak (impacful) secara lebih cepat, bahkan saat Anda offline. (tableau.com)

Tableau adalah software yang digunakan untuk memfisualisasikan data. Biasanya, seseorang menggunakan Tableau untuk memvisualisasikan data dan menyederhanakan pola analisis business intelligence (BI). Maka, tidak heran jika Tableau menjadi salah satu tools andalan para BI. (glints)

Ada berbagai produk yang ditawarkan Tableau untuk menganalisis dan memvisualisasikan data, yaitu: Tableau Desktop, Tableau Public, Tableau Online, Tableau Server, dan Tableau Mobile.

Pada tutorial kali ini, saya menggunakan versi gratis dari Tableau, yaitu Tableau Public. Untuk mengaksesnya bisa mengklik link berikut : https://public.tableau.com/app/discover

2. Tableau Basic: Your First Bar Chart

Pada bagian kedua kita diberi tantangan bisnis, “Siapa yang berhak mendapatkan annual bonus?”. Sebuah perusahaan beroperasi di tiga wilayah, seorang top-performing di setiap wilayah akan mendapatkan annual bonus. Penentuan top-performing dilihat dari total penjualan (sales($)).

Kita akan menyelesaikan tantangan bisnis ini dengan memvisualisasikan data menggunakan Tableu. Diakhir bagian ini kita bisa melihat siapa saja top-performing pada masing-masing wilayah.

Pertama, buka Tableau Public kemudian masukkan data yang ingin dianalisis.

2.1 Tampilan ketika pertama kali membuka Tableau

Pada bagian kiri Tableau terdapat pilihan Connect yang bisa digunakan untuk menghubungkan data yang ingin dianalisis atau divisualisasikan. Ada beberapa jenis file yang dibisa dihubungkan dengan Tableau, diantaranya: Microsoft excel, Text file (csv, dll), JSON, Microsoft Access, PDF, dan lain sebagainya. Kali ini kita akan menggunakan jenis file text dengan nama P1-OfficeSupplies.csv.

Pada tab Data Source kita bisa melihat informasi tentang data yang akan dianalisis. Seperti nama kolom, jenis data pada kolom, jumlah baris, dan lain sebagainya. Berikut adalah tampilan pada tab Data Source setelah menghubungkan data.

2.2 Tab Data Source pada Tableau

Pada tab Data Source ini kita juga bisa membuat hubungan antar data dan menggabungkan (union) data jika kita memasukkan lebih dari satu data. Mirip konsep Data Modelling pada Power BI. Pembahasan tenang pengolahan data pada Data Source akan dibahas pada materi selanjutnya.

Mari kita beralih ke Worksheet pada Tableau. Setidaknya ada empat element pada Tableau yang berguna untuk membuat visualisasi data, yaitu: 1) Data tab, 2) Working Area, 3) Filter Mark tab, serta 4) Show Me.

2.3 Tampilan worksheet pada Tableau

a. Data Tab
Pada Data tab, kita bisa melihat data (tabel) yang terhubung dengan Tableau beserta kolom-kolomnya. Pada Data tab dikenal istilah Dimension dan Measure. Dimension merupakan kolom yang berisi data kategorikal, ditandai dengan warna biru pada Tableau. Sedangkan Measure merupakan kolom yang berisi data numerikal (simbol #), ditandai dengan warna hijau pada Tableau.

2.4 Tampilan Data tab pada Tableau

b. Working Area
Working Area merupakan tempat untuk mengedit dan menampilkan visualisasi. Disinilah kita menentukan kolom dan baris yang akan divisualisasikan. Pada contoh kali ini kita menentukan Region dan Rep pada Columns serta Units pada Rows.

2.5 Tampilan Working Area pada Tableau

c. Filter Mark Tab
Kita bisa menambahkan Filter dan Mark untuk menambah informasi pada visualisasi yang dibuat. Seperti menambahkan warna, ukuran, label, serta tooltip. Ketika kita menambahkan Region pada Color dan Units pada Label. Maka visualisasinya menjadi seperti berikut:

2.7 Tampilangambar setelah ditambah color dan label

d. Show Me
Show Me berfungsi untuk memberikan rekomendasi jenis chart atau visualisasi yang sesuai dengan data yang ada pada working area. Pada materi selanjutnya kita akan membuat visuliasisai Tree Map memanfaatkan fitur Show Me.

Membuat Calculated Fields
Sama seperti pada Power BI, pada Tableau kita juga bisa membuat Calculated Fields. Fungsinya adalah membuat fields berdasarkan kolom yang ada menggunakan kaidah matematika. Fields yang telah dibuat bisa digunakan untuk memvisualisasikan data secara berulang-ulang.

Pada tantangan bisnis diawal materi, kita diminta menentukan siapa yang mendapat annual bonus berdasarkan nilai penjualannya berdasarkan total sales atau revenue yang diperoleh. Sedangkan pada data tidak terdapat kolom Sales, namun ada kolom Units dan Unit Price. Kita bisa membuat Calculated Fields dengan nama TotalSales dengan mengalikan Units dengan Unit Price.

Klik kanan pada Data Tab, kemudian pilih Calculated Fields. Sesuaikan nama fields dan rumus yang akan digunakan. Perhatikan gambar dibawah ini.

2.8 Cara membuat Calculated Fields pada Tableau

Letakkan TotalSales pada Rows untuk memperoleh visualisasi yang sesuai degan tantangan bisnis yang ingin diselesaikan. Maka hasilnya akan seperti berikut ini:

2.9 Visualisasi data dengan TotalSales pada Rows

Menambahkan Warna dan Label
Pada Visualisasi diatas sebenarnya sudah bisa menjawab tantangan bisnis yang diberikan. Namun kita bisa membuat visualisasi yang menarik dengan menambahkan keterangan warna dan label pada gambar.

Warna dan label sudah sedikit dibahas pada penjelasan Filter Mark Tab. Dengan memasukkan kolom Region pada Color kita bisa membedakan warna pada setiap wilayah, karena kita ingin mencari top-performance di setiap wilayah. Kemudian tambahkan label pada data agar lebih mudah dibaca. Pada wilayah West puncak bar chart hampir menunjukkan nilai yang sama. Agar lebih terlihat jelas maka diberi label pada data yang berisi TotalSales untuk masing-masing sales person.

2.10 Hasil akhir dari annual bonus analysis

Dari gambar diatas kita bisa menentukan siapa saja yang berhak mendapat annual bonus.
- Central = Matthew, total sales : $3.1 K
- East = Susan, total sales : $3.1 K
- West = James total sales : $1.3 K

3. Time Series, Aggregation, dan Filters

Time Series merupakan salah satu tipe data yang unik. Pada Tableau tipe data Time Series bisa diekstrak menjadi jenis data dimension (kategorikal) dan measure (numerikal).

Hubungkan Tableau dengan dataset seperti pada materi sebelumnya.Kali ini kita akan menggunakan data Long Term Unemployment Statistics di Amerika pada tahun 2005–2015. Kemudian masukkan Period pada Columns dan Unemployment pada Rows.

3.1 Visualisasi dari unemployment pada periode waktu tertentu

Kolom Period merupakan data dengan tipe Time Series bisa menampilkan Year, Quarter, Month, serta Day. Kolom Period juga bisa diubah menjadi dimension (warna biru) atau measure (warna hijau).

Klik kanan pada pada Period pada Rows kemudian akan ada pilihan untuk mengubah format yang ditampilkan. Disini kita bisa melihat ada dua kotak yang berisi Year, Quarter, Month, Day. Bedanya, kotak pertama (atas) menjadi dimension, sedangkan kotak kedua menjadi measure.

3.2 Pilihan untuk mengubah tampilan pada time series

Ketika kolom menunjukkan Year, perbedaan antara dimension dan measure tidak terlalu terlihat. Tetapi akan kelihatan bedanya ketika kolom Period diubah menjadi Month. Perhatikan gambar berikut:

3.3 Visualisasi ketika Period diubah menjadi Month dalam bentuk dimension

Jenis data dimension akan menampilkan data kategorikal. Ketika Month ditampilkan dalam bentuk dimension akan menampilkan data kategorikal berupa Januari sampai Desember. Pada Time Series hal ini bisa menjadi masalah. Di visualisasi sebelumnya kita tahu bahwa data kita memuat data tahun 2005–2015. Ketika ditampilkan dalam bentuk dimension, nilai yang ditampilkan pada bulan Januari adalah data bulan Januari pada tahun 2005–2015. Tentu bukan seperti ini yang diinginkan ketika memvisualisasikan Time Series, maka kita perlu mengubahnya ke dalam bentuk measure.

3.4 Visualisasi ketika Period diubah menjadi Month dalam bentuk measure

Setelah dibuat menjadi measure maka datanya akan menjadi seperti pada gambar diatas. Data dikelompokkan berdasarkan Month, tetapi tetap menampilkan data pada tahun 2005–2015. Perhatikan bedanya dengan gambar 3.1 yang dikelompokkan berdasarkan tahun.

Membuat Area Chart
Visualisasi sebelumnya telah menggambarkan jumlah unemployment para rentang waktu 2005 — 2015. Namun, kita masih bisa menambah informasi pada gambar dengan menambahkan kolom Age dan Gender untuk lebih memperdalam analisis.

Setelah mengubah Marks menjadi Shape, menambahkan kolom Gender pada Color, serta menambahkan Age pada Details, maka visualisasinya menjadi seperti berikut:

3.5 Visualisasi dengan menambahkan Gender dan Age

Dari visualisasi diatas kita bisa memperoleh informasi lebih detail tentang Gender dan Age. Namun visualisasinya kurang enak dipandang dan menjadi lebih membingungkan. Mari kita ubah menjadi Area Chart, untuk memperoleh visualisasi yang lebih baik. Tambahkan Age pada Color dan Label agar lebih mudah dipahami.

3.6 Area Chart untuk visualisasi yang lebih mudah dipahami

Selanjutnya kita tambahkan kolom Gender untuk memfilter data untuk berinteraksi dengan visualisasi yang telah kita buat. Masukkan kolom Gender pada Filters di sebelah kiri. Klik kanan pada Gender, kemudian pilih Show Filter. Kemudian akan muncul filter pada bagian kanan atas visualisasi. Maka hasilnya akan menjadi seperti berikut:

3.7 Visualisasi area chart dari data unemployment statistics

4. Map, Scatterplots, dan Dashboard

Pada materi kali ini kita akan membuat Map, Scatterplots, dan menggabungkan keduanya menjadi sebuah Dashboard sederhana.

Kali ini kita juga akan dikenalkan dengan konsep JOIN pada Tableau. Pada dasarnya sama dengan konsep JOIN pada SQL maupun Power BI, ada Inner Join, Left Join, Right Join, serta Full Outer Join. Serta harus ada kolom yang sama pada masing-masing data yang akan dilakukan JOIN, seperti penentuan ON pada JOIN di SQL.

Pada Tableau proses JOIN dilakukan ketika proses menghubungkan data di Data Source.

4.1 Contoh penggunaan JOIN pada Tableau

Pada contoh diatas kita melakukan Inner Join pada tabel ListOfOrder dan OrderBreakdown, dengan kolom Order ID sebagai acuannya.

Setelah berhasil melakukan JOIN maka kedua kolom dari kedua tabel bisa dimanfaatkan untuk memvisualisakikan data.

4.2 Kolom-kolom yang telah berhasil dilakukan JOIN

Pada gambar diatas ada kolom Hierarchy yang menggabungkan Country, State, City. Ketika kolom Hierarchy dimasukkan kedalam Working Area, kita bisa menentukan data yang ingin ditampilkan. Karena datanya merupakan data geography maka otomatis akan ditampilkan sebagai Map.

4.3 Visualisasi map yang menampilkan Country
4.4 Visualisasi map yang menampilkan State

Tambahkan kolom Order Date ke dalam Filter, tampilkan dalam bentuk Year. Klik kanan pada Order Date pilih Show Filter. Kemudian tampilkan filter sebagai Single Value (slider).

Ubah ukuran Mark dengan menambahkan kolom Sales ke dalam Size. Maka visualisasi akan berubah menjadi seperti berikut:

4.5 Visualisasi map setelah ditentukan ukuran sesuai dengan kolom sales

Buat Calculated Fields dengan nama Profit Margin yang menghitung total Profit dibagi dengan total Sales. Kemudian masukkan kedalam Color untuk melihat Profit Margin di setiap State.

4.6 Visualisasi map setelah ditambahkan warna pada label

Visualisasi Map telah selesai dibuat, selanjutnya kita akan membuat Scatterplot untuk melihat sebaran Profit Margin. Ubah nama sheet1 dengan nama Map of Europe. Buat sheet baru dengan nama Customer Scatter Plot.

Ketika membuat banyak visualisasi (lebih dari satu worksheet), kita bisa memanfaatkan satu filter saja. Tidak perlu membuat filter berulang-ulang pada setiap worksheet. Caranya klik kanan pada Filter, pilih Apply to Worksheet, kemudaian pilih All Using This Data Source.

4.7 Cara membuat filter untuk semua worksheet

Pada sheet Customer Scatter Plot letakkan Sales di Columns, Profit di Rows, dan Customer Name di Detail. Maka kita akan mendapat visualisasi berupa Scatterplot yang menunjukkan posisi Customer Name berdasarkan Sales dan Profit.

4.8 Visualisasi scatterplot

Tambahkan Profit Margin yang telah kita buat sebelumnya pada Color untuk membedakan warna pada scatterplot.

4.9 Visualisasi scatterplot dengan profit margin sebagai color

Sampai tahap ini kita telah memiliki dua visualisasi, Map dan Scatterplot. Selanjutnya gabungkan kedua visualisasi tersebut kedalam Dashboar sederhana agar bisa mendapat informasi secara utuh.

Pada tab di kiri bawah ada pilihan untuk menambah dasboard. Setelah diklik maka akan menampilkan dasboard kosong. Interfacenya berbeda dengan sheet untuk memvisualisasikan data. Di sebelah kanan Dashboard terdapat 1) Size, yang berfungsi untuk menentukan ukuran dasboard, bisa disesuaikan untuk tampilan Desktop, Tablet, atau Phone. 2) Sheets yang telah dibuat sebelumnya bisa dimasukkan kedalam dashboard, kali ini kita punya dua sheet yaitu Map of Europe dan Customer Sactter Plot. 3) Object, yang bisa ditambahkan dalam dashboard.

4.10 Tampilan awal dashboard

Untuk membuat dashboard kita cukup drag and drop sheet yang ingin dimasukkan kedalam dashboard dan sesuaikan fitur yang ingin ditampilkan dalam dasboard.

Masukkan sheet Map of Europe dan Customer Sactter Plot kedalam dashboard, kemudian atur pada posisi Vertical. Di sisi kiri tambahkan filter untuk melihat sebaran data pertahun. Lakukan seperti pada sheet sebelumnya, tampilkan dalam Single Value (slider) serta Apply to Worksheet => All Using This Data Source.

4.11 Tampilan dashboard setelah disesuaikan kontennya

Tableau punya fitur untuk berinteraksi dengan dashboard dengan menambahkan fitur Filter dan Highlight. Kedua fitur ini berguna untuk menampilkan data tertentu, misalnya ingin menampilkan data yang berasal dari Bavaria di Jerman.

Klik menu Dashboard pada Tableau, kemudian pilih Actions, atau pakai shortcut Ctrl+Shift+D. Perhatikan gambar dibawah:

4.12 Cara menampilkan menu actions

Kemudian akan muncul prompt Actions. Disini kita bisa membuat Filter dan Highlight. Seperti pada gambar dibawah.

4.13 Actions prompt untuk membuat Filter dan Highlight

Pilih Filter, kemudian akan muncul prompt Add Filter Action. Disini kita bisa menyesuaikan beberapa hal berikut: 1) Source Sheets, yang digunakan sebagai acuan untuk melakukan filter. 2) Run action on, untuk menentukan kapan filter akan diterapkan, misalnya Hover atau Select. 3) Target Sheet, adalah sheet yang akan terdampak atau dipengaruhi oleh filter yang dibuat. Serta 4) Clearing the selection will, yang menentukan keadaan setelah selesai melakukan filter.

4.14 Prompt add filter action untuk menyesuaikan filter

Setelah filter berhasil dibuat maka kita bisa menggunakannya pada dashboard seperti pada gambar 4.15. Selain itu kita juga bisa memilih beberapa lokasi dengan cara klik Ctrl+Klik posisi pada Map.

4.15 Contoh penggunaan filter pada dashboard

Untuk membuat Highlight caranya hampir sama Filter. Namun pada saat Add Action pilih Highlight. Maka akan muncul prompt Edit Highlight Action seperti pada gambar 4.16. Disini kita menentukan Source Sheets, Run action on, Target Sheets, serta Target Highlight.

4.16 Prompt add highlight action untuk menyesuaikan highlight

Berikut adalah contoh penggunaan Highlight pada dashboard. Berbeda dengan Filter yang hanya menampilkan data tertentu saja, pada Highlight semua data tetap ditampilkan, namun hanya data tertentu yang mendapat sorotan dan data lainnya menjadi samar. Perhatikan gambar 4.17 kemudian bandingkan dengan gambar 4.15 untuk melihat perbedaan Filter dan Highlight.

4.17 Contoh penggunaan highlight pada dashboard

5. Joining, Blending, and Relationships

Konsep JOIN pada Tableau sama dengan konsep JOIN pada SQL maupun Power BI, ada Inner Join, Left Join, Right Join, serta Full Outer Join. Serta harus ada kolom yang sama dimasing-masing data yang akan dilakukan JOIN, seperti penentuan ON pada JOIN di SQL. Penjelasan tenang JOIN bisa dibaca pada ulasan berikut SQL Queries — Part II.

Tableau punya fitur Blending yang hampir sama dengan JOIN. Namun, Blending tidak langsung menggabungkan data pada Data Source, tetapi digunakan untuk melakukan JOIN data pada worksheet. Blending disebut juga Smart JOIN. Dalam Blending berlaku LEFT JOIN, tabel pertama ditandai dengan warna hijau di depan tabel sedangkan tabel kedua ditandai dengan warna merah.

Ada dua alasan mengapa kita menggunakan Blending daripada JOIN. Pertama, ketika kita tidak ingin kehilangan informasi dari tabel, karena JOIN hanya akan menampilkan data yang sesuai dengan data pertama dan tidak menampilkan data kedua yang tidak sesuai. Kedua, ketika tabel berasal dari Data Source yang berbeda, misalnya dari dua file Excel.

Kali ini kita akan mempraktikan Blending pada Tableau menggunakan data dari dua tabel sederhana. Tabel Arline1 dengan kolom Period, Region, Revenue dan Arline2 dengan kolom Year, Region, Revenue. Kolom Period dan Year sama-sama berisi data tahun, hanya beda nama kolom saja.

5.1 Data Airline1 dan Airline2 telah dibungkan dengan Tableau

Mari kita buat visualisasi data dari tabel Airline1 berupa Bar Chart dengan memasukkan kolom Revenue pada Columns dan kolom Region pada Rows.

5.2 Visualisasi bar chart dari kolom revenue dan region

Kemudian pindah ke tabel Airline2. Tambahkan kolom Revenue pada Columns. Disini kita mulai melihat tanda-tanda fitur Blending. Pada Airline1 terdapat tanda warna hijau sebagai tanda tabel pertama untuk LEFT JOIN, sedangkan Airline2 terdapat tanda warna merah sebagai tanda tabel kedua.

Disamping kolom Region terdapat tanda rantai berwarna merah sebagai tanda Blending sudah aktif pada kolom Region.

Pada visualisasi Bar Chart kolom kedua hanya menampilkan empat bar dan dua bar yang kosong. Jumlah bar ini merujuk pada kolom pertama yang ada enam bar. Karena Blending merujuk pada LEFT JOIN maka jumlah data merujuk pada tabel pertama.

5.3 Visualisasi bar chart dengan dua kolom revenue

Kolom Region bisa divisualisasikan dengan baik pada kedua tabel karena sudah di Blending. Sedangkan pada kolom Period dan Year belum dilakukan Blending, maka ketika divisualisasikan akan terjadi error. Tambahkan kolom Period kedalam Rows serta tambahkan Revenue pada Label untuk melihat visualisasinya.

5.4 Visualisasi bar chart setelah ditambahkan kolom period

Seperti dugaan sebelumnya visulisainya akan terjadi error karena belum di lakukan Blending. Pada kolom pertama data pada tahun 2015 dan 2016 sudah menunjukkan data yang sesuai. Namun pada kolom kedua datanya tidak sesuai, tahun 2015 dan 2016 menunjukkan nilai yang sama. Karena pada tabel kedua (Airline2) tidak mengenal kolom Period.

Disinilah kita perlu melakukan Blending untuk kolom Period dan Year.
- pada menu bar pilih Data
- kemudian pilih Edit Blending Relationships
- disini kita melihat telah dibuatkan Blending antara Region, kemudian ketik Add untuk menambah Blending baru
- klik Period pada tabel pertama dan Year pada kolom kedua
- klik OK untuk menerapkan Blending

5.5 Cara membuat blending pada data

Setelah dilakukan Blending maka datanya akan berubah sesuai dengan data yang ada, karena tabel kedua sudah mengenal Period setelah dilakukan Blending dengan Year.

5.6 Visualisasi data setelah dilakukan blending

Tableau secara otomatis melakukan Blending pada kolom yang memiliki nama yang sama, seperti pada kolom Region. Sedangkan kolom Period dan Year meniliki nama yang sama. Cara sederhana melakukan Blending adalah dengan menyamakan nama kolom. Misal sama-sama bernama Period atau sama-sama Year. Maka akan otomatis dilakukan Blending.

Materi terakhir pada bagian ini adalah Relationship, yang berfungsi menghubungkan data antar tabel. Konsepnya sama dengan pada Power BI. Penjelasan lengkap bisa dibaca pada pada ulasan yang berjudul Step-By-Step Visualisasi Data dengan Power BI di bagian 3. DATA MODELLING.

Sebagai contoh kita akan membuat Relationship seperti Data Schema berikut:

5.7 Data Schema

Cara membuat Relationship pada Tableau juga cukup mudah, tinggal drag and drop data yang ingin dihubungkan kemudian sesuaikan kolom yang dijadikan acuan untuk mambuat Relationship.

5.8 Contoh membuat relationship

Sesuaikan tabel-tabel dan kolom yang ada hingga semua tabel terhubung. Maka hasilnya seperti pada gambar berikut:

5.9 Hasil membuat relationship sesuia dengan data schema

Sampai disini catatan tentang Rangkuman “Tableau for Data Science” — Part I. Pembahasan selanjutnya akan dilanjutkan pada part kedua.

Terima kasih

--

--

Ahmad Ilham Habibi
Ahmad Ilham Habibi

Written by Ahmad Ilham Habibi

Aspiring Data Analyst and Data Scientist

No responses yet