[UX리서치/UXR] ❶ 사용성 평가(Usability Test) :: 테스트 종류가 이렇게 다양하다고요?

2023. 4. 16. 08:09UX 아티클 ✏️/② UX 리서치

 

 
학부생 시절. 여러 팀 프로젝트를 통해 UX 리서치를 경험해 볼 수 있었다. 직접 설계하고 모더레이팅 해보는 흔치 않은 경험을 빠른 시기에 해본 샘이다. 그때의 난 '만드는 것'에 더 큰 흥미를 갖고 있어서 UXR분야에서 더 나아지려는 시도를 많이 하지 못했다. 어떻게 인뎁스 인터뷰를 이끌어가야 하는지, UT는 어떻게 설계해야 하는지, 각각의 리서치는 어떤 목적을 갖고 시작해야 하는지는 잘 몰랐지만 우당탕탕 공유받은 자료들을 참고하며 그저 해나갔다. 

시간이 지나고 대학원에 들어와 더 많은 경험을 하면서 문뜩 깨달은 것이 하나 있다. 흥미로운 솔루션을 찾아내는 것도 중요하지만, 문제를 발견하고 명확히 정의하는 것에도 노력해야 한다는 것.

늦었지만 2021년 말부터 비로소 UXR의 중요성을 깨닫고 더 나아지려는 시도를 할 수 있어 기쁘다. 올초 읽었던 '유저플랜들리'라는 책에도 비슷한 문장이 나와 공감되었다.

“(p. 215) 가장 뛰어난 학생들은 문제 해결이 아니라 문제 발견에 창의력을 발휘하고 있었다.”
“(p. 216) 늘 흥미로운 해결안을 찾기보다 흥미로운 문제를 찾으려 애써야 한다.”
 


가장 흔히 하는 UX 리서치 방법에는 사용성 평가(UT; Usability Test)와 인뎁스 인터뷰(Indepth Interview)가 있다. 

이번 아티클에서는 전자에 초점을 맞춰 내가 배우고 경험한 사용성 평가에 대해 소개하고자 한다. UXR 시리즈도 꼭 써봐야지!!

UX 리서치 사용성 평가(Usability Test) 시리즈

1편. [UXR] 사용성 평가(Usability Test) - ❶ 개념/테스트 종류 - 👈👀 now
2편. [UXR] 사용성 평가(Usability Test) - ❷ 정량 UT-  
3편. [UXR] 사용성 평가(Usability Test) - ❸ 어떤 표현과 단어로 태스크를 요청할까? -
4편. [UXR] 사용성 평가(Usability Test) - ❹ UT는 어떤 태스크로 구성해야할까?-
5편. [UXR] 사용성 평가(Usability Test) - ❺ UT 전, 안내하기 - 
6편. [UXR] 사용성 평가(Usability Test) - ❻ 사용자 실제 데이터로 사용성 평가하기-
7편. [UXR] 사용성 평가(Usability Test) - ❼ UT 참여 유도-

 

User 가 아닌
사용성(Usability) 평가

UT를 이야기하며 가장 먼저 언급하고 넘어가고 싶은 내용이 있다. UT는 절대 User Test가 아니라는 점..
그래서 UT 시작 전 꼭 참여자에게 안내하는 부분이기도 하다.

"오늘 인터뷰는 사용자분의 기능 활용 능력을 평가하는 것이 절대 아니에요. 해당 서비스에 불편한 점이 없는지 파악하는 것이 주목적이니 편안한 마음으로 조사에 임해주세요."

UT는 사용자를 평가하는 것이 절대 아니다. User가 테스트의 대상이고 사용 모습을 관찰하는 것이 주 목적이지만 우리가 관찰해야 할 대상은 사용자가 아닌 사용성을 파악하기 위해 UT를 진행한다는 점을 잊지 말자.

UT는 일반적인 인터뷰와 다르게 리서치 참여자에게 특정한 Context를 부여해야한다. 충분한 사용맥락을 설명하기 위해 시나리오를 잘 설정하고 태스크를 잘 설계하는 것이 테스트의 핵심이다.


Context 예시
내일 합정역에서 아르바이트를 하는 친구와 함께 영화를 볼 예정이에요. 평소에 미리 예매해 놓는 것을 좋아하는 당신은 롯데시네마 앱을 통해 티켓을 미리 예약해두려고 합니다. 
+ 영화는 합정역에서 볼지 {현위치} 근처에서 볼지 아직 정해지지 않아 영화관을 비교 후, 선택할 예정입니다. 

Task 예시
영화 예매하기 전, 보고 싶은 영화를 탐색하고 정보를 확인해 보세요.



특정 태스크를 수행하도록 요청한 후, 사용자가 서비스를 특정 목적을 달성하기 위해 사용할 때 ‘사용하기 쉬운가(easy to use)’를 살펴본다.

UT는 일반적으로 문제를 발견하기 위해 진행되며, 문제를 해결하기 위해 도출한 해결방안이 인지/이해 측면에서 문제가 없는지 검증하기 위한 목적으로도 진행된다. 단, 기능 자체의 유용성(아이디어가 좋은지 아닌지)을 검증하는 목적으로 사용되는 것은 옳지 않다.
 


 

사용성 평가(UT) 종류

UT는 수집 데이터 유형에 따라 🅐 정량 UT, 🅑 정성 UT / 진행 방식에 따라 대면실험실 조사(Laboratory testing), 원격 동시 진행 조사(Remote synchronous testing), ❸ 원격 비동시 진행 조사(Remote asynchronoustesting)로 나눌 수 있다. 
 

수집 데이터 유형에 따라

🅐 정량 UT
- Task Time(작업시간), Errors(오류 횟수), Success Rate(완료율) 등의 정량적인 데이터를 얻기 위해 진행
- 정량 데이터 수집을 목표로 하기 때문에 20명 이상의 사용자를 리서치 함 (40명 권장)
- UX 개선의 지표(Metrics)로 활용하기 위해 진행
(+참고:
https://www.nngroup.com/articles/benchmarking-ux/)
 
🅑 정성 UT
- 통계적인 데이터를 얻기보다 사용자 개개인의 반응을 수집하기 위해 진행
- 정량 UT보다 더 적은 사용자를 리서치해도 됨 (3~5명)
- 주로 사용성 개선을 목적으로 하고, 사용자의 인지/이해 여부를 확인하고 사용성 문제를 발견하여 개선하기 위한 목적으로 진행
 
🅐 + 🅑 두 가지를 동시에 수집하는 UT도 진행할 수 있다! 
↘️  ↘️ ↘️ 실제로 정량+정성 데이터를 UT로 수집했던 프로젝트 ↘️  ↘️  ↘️

 

[UX 프로젝트] 롯데시네마 iOS APP- Usability Test

* 본 게시글은 PC 화면으로 보는 것을 추천드립니다. Overview. 롯데시네마 애플리케이션만의 차별점은 무엇인가? 더 높은 체류시간을 위해 롯데시네마 애플리케이션을 사용성 측면에서 진단하고

design-tra.tistory.com

 


진행 방식에 따라

UT는 대면-비대면 / 동시 진행-비동시 진행에 따라 크게 3가지 유형의 UT로 구분할 수 있다.

 
 
 대면실험실 조사(Laboratory testing)
대면하여 진행되며, 같은 공간에서 모더레이터가 시나리오와 태스크를 수행하도록 요청한 직후 참여자가 서비스를 사용해 봄

- 기존의 Think-Aloud 기법을 활용하여 최첨단 UT 실험실에서 수행
- A에서 사용자와 연구원은 비디오카메라와 마이크가 설치된 지정된 테스트 룸에서 테스트 수행 (모두 PC 앞에 앉아 테스트 수행)
- C에서 모더레이터 외 관찰 연구원이 사용 모습을 관찰하기도 함

 

❷ 원격 동시 진행 조사(Remote synchronous testing)
다른 장소에서 비대면으로 진행되며, 시나리오와 태스크를 수행하도록 요청한 직후 참여자가 서비스를 사용해 봄
우) 오프라인 조사 / 좌) 온라인 비대면

- 모더레이터가 참여하고, 오프라인/온라인 진행 두 가지로 나눌 수 있음.

오프라인 조사 :
- 원격 테스트 환경을 시뮬레이션한 설정을 사용하여 UT 실험실에서 테스트 수행
- 연구원은 룸 A, 사용자는 룸 B에 따로 있으며 웹캠과 오디오 연결을 통해서만 통신이 가능)

온라인 조사 :
- 원격 사용성 평가 도구(Tool)를(Tool) 활용하여 온라인 환경에서 테스트 진행
 

❸ 원격 비동시 진행 조사(Remote asynchronoustesting)
연구원이 미리 시나리오와 태스크를 작성하고 참여자는 가능한 시간에 언제든 참여하여 비동시에 테스트 진행

- 사용자가 원격으로 테스트를 진행하며, 모더레이터 없이 서비스를 사용해 봄
- 사용성에 대한 이해도의 차이에 따라 테스트 결과가 달라질 수 있기 때문에, 사용성 전문가(AE)와 일반 사용자(AU)의 두 가지 테스트 대상 그룹으로 두 가지 조건에서 테스트를 수행
- 녹화된 사용 화면이나 모습을 수집하고 문제가 발생한 위치를 프로그램에 기록하고 작업 완료에 어떤 영향을 미쳤는지 작성하도록 요청하고 사용 후 온라인 설문에 응답해야 함
 


✔️ 참고

 

Benchmarking UX: Tracking Metrics

Quantitatively evaluate a product or service’s user experience by using metrics to gauge its relative performance against a meaningful standard.

www.nngroup.com

 

Why You Only Need to Test with 5 Users

Elaborate usability tests are a waste of resources. The best results come from testing no more than 5 users and running as many small tests as you can afford.

www.nngroup.com

 

Quantifying UX Improvements: A Case Study

A research-driven overhaul of a metal and woodworking machinery B2B site’s information architecture resulted in an 85% improvement of findability.

www.nngroup.com

 

How Many Participants for Quantitative Usability Studies: A Summary of Sample-Size Recommendations

40 participants is an appropriate number for most quantitative studies, but there are cases where you can recruit fewer users.

www.nngroup.com

 

Remote Moderated Usability Tests: Why to Do Them

Remote moderated usability tests are fast, easy, and deliver better-quality findings than unmoderated tests

www.nngroup.com

 

728x90