System Usability Scale (SUS) adalah metode standar untuk mengevaluasi kegunaan antarmuka pengguna (UI) dan pengalaman pengguna (UX). Dikembangkan oleh John Brooke pada tahun 1986, SUS memberikan cara cepat, sederhana, dan efektif untuk mengukur seberapa baik suatu sistem diterima oleh pengguna. Dengan hanya menggunakan 10 pertanyaan, metode ini memberikan skor yang mencerminkan persepsi pengguna terhadap kegunaan suatu produk atau sistem.
Apa Itu SUS?
System Usability Scale adalah kuesioner sederhana yang terdiri dari 10 pernyataan yang dirancang untuk mengukur kegunaan sistem atau produk. SUS dapat digunakan untuk aplikasi, situs web, perangkat lunak, atau bahkan perangkat keras. Skor SUS memberikan gambaran seberapa mudah digunakan suatu sistem dari perspektif pengguna.
Mengapa Harus 10 Pertanyaan?
Penggunaan 10 pertanyaan dalam SUS didasarkan pada prinsip keseimbangan antara kelengkapan evaluasi dan efisiensi waktu. Berikut alasannya:
Struktur dan Format SUS
Skala Likert 1-5:
Pernyataan SUS:
Berikut adalah contoh pernyataan dalam SUS:
Cara Menghitung Skor SUS
Interpretasi Skor SUS:
Keunggulan SUS
Tantangan dalam SUS
Contoh Penerapan SUS
Studi Kasus: Pengujian Aplikasi Pemesanan Tiket Online
Mengapa SUS Penting dalam Pengujian UI/UX?
Metode Pengujian UI/UX Lainnya
Selain SUS, terdapat berbagai metode lain untuk menguji UI/UX:
Kesimpulan
System Usability Scale (SUS) adalah alat pengujian yang sangat berguna untuk mengukur kegunaan produk atau sistem secara cepat dan efisien. Namun, metode ini bukan satu-satunya cara untuk mengevaluasi UI/UX.
Berikut adalah beberapa kekurangan metode System Usability Scale (SUS) yang perlu dipertimbangkan:
1. Tidak Memberikan Detail Mendalam. SUS hanya memberikan gambaran umum tentang kegunaan suatu sistem melalui skor keseluruhan. Metode ini tidak mengidentifikasi secara spesifik bagian mana dari sistem yang bermasalah. Implikasi: Tim pengembang atau desainer mungkin perlu menggunakan metode tambahan untuk mendapatkan wawasan lebih mendalam tentang masalah usability.
2. Subjektivitas Pengguna. SUS bergantung sepenuhnya pada persepsi pengguna, yang dapat bervariasi tergantung pada pengalaman, ekspektasi, dan latar belakang individu. Implikasi: Hasilnya bisa berbeda-beda meskipun sistem yang diuji sama, sehingga memerlukan jumlah responden yang cukup untuk mendapatkan hasil representatif.
3. Terbatas pada Pengguna Akhir. SUS dirancang untuk mengevaluasi pengalaman pengguna akhir, sehingga kurang relevan untuk mengukur kegunaan sistem yang lebih teknis atau digunakan oleh pengguna tingkat lanjut. Implikasi: Sistem kompleks mungkin memerlukan pendekatan evaluasi usability lain yang lebih mendalam.
4. Tidak Mempertimbangkan Konteks Penggunaan. SUS tidak memberikan ruang untuk mempertimbangkan faktor lingkungan atau situasi saat pengguna menggunakan sistem. Implikasi: Misalnya, skor SUS mungkin tinggi dalam kondisi ideal, tetapi rendah jika pengguna bekerja dalam situasi yang penuh tekanan atau gangguan.
5. Validasi Kuesioner Tertentu. Format pertanyaan SUS cenderung generik sehingga tidak selalu cocok untuk semua jenis produk atau aplikasi. Implikasi: Ada kemungkinan pengguna merasa bingung atau sulit memahami pernyataan tertentu, terutama jika mereka tidak berpengalaman dalam menggunakan sistem.
6. Rentan terhadap Bias Skala Likert. SUS menggunakan skala Likert 1-5, yang bisa memicu bias seperti: Central Tendency Bias: Responden cenderung memilih nilai tengah untuk menghindari ekstrem. Atau Acquiescence Bias: Responden mungkin lebih sering menyetujui daripada tidak setuju, tanpa benar-benar memahami pernyataan. Sehingga memberikan implikasi: Hal ini dapat memengaruhi akurasi skor.
7. Tidak Cocok untuk Evaluasi Performa Non-Usability. SUS hanya fokus pada kegunaan (usability) dan tidak mencakup aspek lain seperti kinerja teknis, estetika, atau fitur inovatif. Implikasi: Sistem yang mungkin memiliki estetika tinggi atau inovasi unik tidak akan mendapatkan apresiasi melalui SUS.
8. Membutuhkan Responden Cukup. SUS membutuhkan minimal 10-12 responden untuk hasil yang valid, meskipun lebih banyak responden akan lebih baik. Jika jumlah responden terlalu sedikit, hasilnya bisa kurang representatif. Implikasi: Untuk proyek kecil dengan sumber daya terbatas, pengumpulan responden ini bisa menjadi tantangan.
9. Interpretasi Skor yang Kompleks. Meski hasilnya berupa skor 0-100, interpretasi skor SUS bisa membingungkan bagi mereka yang tidak terbiasa dengan metrik ini. Implikasi: Tim mungkin perlu bantuan tambahan untuk memahami bagaimana skor SUS dibandingkan dengan standar industri atau produk serupa.
10. Tidak Mengukur Kepuasan Emosional. SUS tidak mempertimbangkan elemen emosional, seperti kesenangan atau keterlibatan, yang juga penting dalam pengalaman pengguna modern. Implikasi: Produk dengan usability yang baik tapi tidak memberikan pengalaman menyenangkan bisa mendapatkan skor tinggi, meskipun pengguna mungkin tidak puas secara keseluruhan.
Meskipun SUS adalah alat yang sederhana dan cepat untuk mengukur kegunaan, kekurangannya perlu dipahami agar tidak digunakan secara berlebihan atau di luar konteks. Untuk evaluasi yang lebih menyeluruh, SUS sebaiknya digunakan bersama metode lain seperti heuristic evaluation, user testing, atau cognitive walkthrough.
Referensi Buku
Handbook of Usability Testing: How to Plan, Design, and Conduct Effective Tests
Ditulis oleh Jeffrey Rubin dan Dana Chisnell, 2008, Wiley Publishing