Testando usabilidade - Usability testing

O teste de usabilidade é uma técnica usada no design de interação centrado no usuário para avaliar um produto testando-o nos usuários. Isso pode ser visto como uma prática de usabilidade insubstituível , uma vez que fornece informações diretas sobre como os usuários reais usam o sistema. Ele está mais preocupado com a intuitividade do design do produto e testado com usuários que não tiveram contato prévio com ele. Esse teste é fundamental para o sucesso de um produto final, pois um aplicativo totalmente funcional que cria confusão entre seus usuários não durará muito. Isso contrasta com os métodos de inspeção de usabilidade , em que os especialistas usam métodos diferentes para avaliar uma interface de usuário sem envolver os usuários.

Os testes de usabilidade se concentram em medir a capacidade de um produto feito pelo homem de atender a sua (s) finalidade (ões) pretendida (s). Exemplos de produtos que normalmente se beneficiam de testes de usabilidade são alimentos , produtos de consumo, sites ou aplicativos da web, interfaces de computador , documentos e dispositivos. O teste de usabilidade mede a usabilidade, ou facilidade de uso, de um objeto específico ou conjunto de objetos, enquanto os estudos gerais de interação humano-computador tentam formular princípios universais.

O que não é

A simples coleta de opiniões sobre um objeto ou documento é uma pesquisa de mercado ou pesquisa qualitativa, em vez de um teste de usabilidade. O teste de usabilidade geralmente envolve observação sistemática sob condições controladas para determinar o quão bem as pessoas podem usar o produto. No entanto, muitas vezes tanto a pesquisa qualitativa quanto os testes de usabilidade são usados ​​em combinação, para melhor compreender as motivações / percepções dos usuários, além de suas ações.

Em vez de mostrar aos usuários um rascunho e perguntar: "Você entende isso?", O teste de usabilidade envolve observar as pessoas tentando usar algo para o propósito pretendido. Por exemplo, ao testar as instruções para a montagem de um brinquedo, os sujeitos do teste devem receber as instruções e uma caixa de peças e, em vez de serem solicitados a comentar sobre as peças e materiais, eles devem ser solicitados a montar o brinquedo. O fraseado das instruções, a qualidade da ilustração e o design do brinquedo afetam o processo de montagem.

Métodos

A configuração de um teste de usabilidade envolve a criação cuidadosa de um cenário , ou situação realista, em que a pessoa executa uma lista de tarefas usando o produto que está sendo testado enquanto os observadores observam e fazem anotações ( verificação dinâmica ). Vários outros instrumentos de teste , como instruções com script, protótipos de papel e questionários pré e pós-teste também são usados ​​para coletar feedback sobre o produto que está sendo testado ( verificação estática ). Por exemplo, para testar a função de anexo de um programa de e-mail , um cenário descreveria uma situação em que uma pessoa precisa enviar um anexo de e-mail e pedir-lhe para realizar essa tarefa. O objetivo é observar como as pessoas funcionam de maneira realista, para que os desenvolvedores possam identificar as áreas problemáticas e corrigi-las. As técnicas comumente usadas para coletar dados durante um teste de usabilidade incluem o protocolo think aloud , co-discovery learning e eye tracking .

Teste de corredor

O teste de corredor , também conhecido como usabilidade de guerrilha , é um método rápido e barato de teste de usabilidade no qual as pessoas - por exemplo, aquelas que passam no corredor, são solicitadas a tentar usar o produto ou serviço. Isso pode ajudar os designers a identificar "paredes de tijolos", problemas tão sérios que os usuários simplesmente não conseguem avançar, nos estágios iniciais de um novo design. Qualquer pessoa, exceto designers e engenheiros de projeto, pode ser usado (eles tendem a agir como "revisores especializados" porque estão muito próximos do projeto).

Este tipo de teste é um exemplo perfeito de amostragem de conveniência , os resultados tendem a ter um viés forte.

Teste de usabilidade remoto

Em um cenário onde os avaliadores de usabilidade, desenvolvedores e possíveis usuários estão localizados em diferentes países e fusos horários, a realização de uma avaliação de usabilidade de laboratório tradicional cria desafios tanto do ponto de vista de custo quanto de logística. Essas preocupações levaram a pesquisas sobre avaliação de usabilidade remota, com o usuário e os avaliadores separados no espaço e no tempo. O teste remoto, que facilita as avaliações no contexto de outras tarefas e tecnologias do usuário, pode ser síncrono ou assíncrono. O primeiro envolve a comunicação individual em tempo real entre o avaliador e o usuário, enquanto o último envolve o avaliador e o usuário trabalhando separadamente. Numerosas ferramentas estão disponíveis para atender às necessidades de ambas as abordagens.

As metodologias de teste de usabilidade síncrona envolvem videoconferência ou empregam ferramentas de compartilhamento de aplicativos remotos, como WebEx. WebEx e GoToMeeting são as tecnologias mais comumente usadas para conduzir um teste de usabilidade remoto síncrono. No entanto, o teste remoto síncrono pode não ter o imediatismo e a sensação de "presença" desejados para dar suporte a um processo de teste colaborativo. Além disso, o gerenciamento de dinâmicas interpessoais através das barreiras culturais e linguísticas pode exigir abordagens sensíveis às culturas envolvidas. Outras desvantagens incluem ter controle reduzido sobre o ambiente de teste e as distrações e interrupções experimentadas pelos participantes em seu ambiente nativo. Um dos métodos mais recentes desenvolvidos para conduzir um teste de usabilidade remoto síncrono é o uso de mundos virtuais.

As metodologias assíncronas incluem coleta automática de fluxos de cliques do usuário, logs do usuário de incidentes críticos que ocorrem durante a interação com o aplicativo e feedback subjetivo dos usuários sobre a interface. Semelhante a um estudo em laboratório, um teste de usabilidade remoto assíncrono é baseado em tarefas e a plataforma permite que os pesquisadores capturem cliques e tempos de tarefas. Portanto, para muitas grandes empresas, isso permite que os pesquisadores entendam melhor as intenções dos visitantes ao visitar um site ou site móvel. Além disso, esse estilo de teste de usuário também oferece uma oportunidade de segmentar o feedback por tipo demográfico, atitudinal e comportamental. Os testes são realizados no próprio ambiente do usuário (em vez de em laboratórios), ajudando a simular ainda mais os testes de cenários da vida real. Essa abordagem também fornece um veículo para solicitar facilmente feedback de usuários em áreas remotas, de forma rápida e com menores despesas organizacionais. Nos últimos anos, a realização de testes de usabilidade de forma assíncrona também se tornou predominante e permite que os testadores forneçam feedback em seu tempo livre e no conforto de sua casa.

Avaliação de especialista

A revisão especializada é outro método geral de teste de usabilidade. Como o nome sugere, esse método depende da contratação de especialistas com experiência na área (possivelmente de empresas especializadas em testes de usabilidade) para avaliar a usabilidade de um produto.

Uma avaliação heurística ou auditoria de usabilidade é uma avaliação de uma interface por um ou mais especialistas em fatores humanos. Os avaliadores medem a usabilidade, eficiência e eficácia da interface com base em princípios de usabilidade, como as 10 heurísticas de usabilidade originalmente definidas por Jakob Nielsen em 1994.

As heurísticas de usabilidade da Nielsen, que continuaram a evoluir em resposta à pesquisa do usuário e aos novos dispositivos, incluem:

  • Visibilidade do status do sistema
  • Combine entre o sistema e o mundo real
  • Controle e liberdade do usuário
  • Consistência e padrões
  • Prevenção de erros
  • Reconhecimento em vez de recordação
  • Flexibilidade e eficiência de uso
  • Design estético e minimalista
  • Ajude os usuários a reconhecer, diagnosticar e se recuperar de erros
  • Ajuda e documentação

Revisão automatizada de especialistas

Semelhante às revisões de especialistas, as revisões de especialistas automatizadas fornecem testes de usabilidade, mas através do uso de programas fornecem regras para um bom design e heurística. Embora uma revisão automatizada possa não fornecer tantos detalhes e percepções quanto as revisões das pessoas, elas podem ser concluídas de forma mais rápida e consistente. A ideia de criar usuários substitutos para testes de usabilidade é uma direção ambiciosa para a comunidade de inteligência artificial.

Teste A / B

No desenvolvimento e marketing da web, o teste A / B ou teste de divisão é uma abordagem experimental para web design (especialmente design de experiência do usuário), que visa identificar alterações em páginas da web que aumentam ou maximizam um resultado de interesse (por exemplo, taxa de cliques para um anúncio em banner). Como o nome indica, duas versões (A e B) são comparadas, que são idênticas, exceto por uma variação que pode impactar o comportamento do usuário. A versão A pode ser a usada atualmente, enquanto a versão B é modificada em algum aspecto. Por exemplo, em um site de comércio eletrônico, o funil de compra é normalmente um bom candidato para o teste A / B, pois mesmo melhorias marginais nas taxas de desistência podem representar um ganho significativo nas vendas. Melhorias significativas podem ser vistas testando elementos como texto de cópia, layouts, imagens e cores.

O teste multivariável ou teste de bucket é semelhante ao teste A / B, mas testa mais de duas versões ao mesmo tempo.

Número de assuntos de teste

No início da década de 1990, Jakob Nielsen , na época um pesquisador da Sun Microsystems , popularizou o conceito de usar vários pequenos testes de usabilidade - normalmente com apenas cinco assuntos de teste cada - em vários estágios do processo de desenvolvimento. Seu argumento é que, uma vez descoberto que duas ou três pessoas estão totalmente confusas com a home page, pouco se ganha em ver mais pessoas sofrendo com o mesmo design defeituoso. "Testes de usabilidade elaborados são um desperdício de recursos. Os melhores resultados vêm de testar no máximo cinco usuários e executar tantos testes pequenos quanto você puder pagar."

A afirmação de "Cinco usuários é suficiente" foi posteriormente descrita por um modelo matemático que estabelece a proporção de problemas descobertos U

onde p é a probabilidade de um sujeito identificar um problema específico e n o número de sujeitos (ou sessões de teste). Este modelo aparece como um gráfico assintótico em relação ao número de problemas reais existentes (veja a figura abaixo).

Virzis Formula.PNG

Em pesquisas posteriores, a afirmação de Nielsen foi questionada usando evidências empíricas e modelos matemáticos mais avançados . Dois desafios principais para esta afirmação são:

  1. Uma vez que a usabilidade está relacionada ao conjunto específico de usuários, é improvável que um tamanho de amostra tão pequeno seja representativo da população total, então os dados de uma amostra tão pequena são mais propensos a refletir o grupo de amostra do que a população que eles podem representar
  2. Nem todo problema de usabilidade é igualmente fácil de detectar. Problemas intratáveis ​​acontecem para desacelerar o processo geral. Nessas circunstâncias, o andamento do processo é muito mais superficial do que o previsto pela fórmula de Nielsen / Landauer.

É importante notar que a Nielsen não defende a parada após um único teste com cinco usuários; seu ponto é que testar com cinco usuários, corrigir os problemas que eles descobriram e, em seguida, testar o site revisado com cinco usuários diferentes é um uso melhor de recursos limitados do que executar um único teste de usabilidade com 10 usuários. Na prática, os testes são executados uma ou duas vezes por semana durante todo o ciclo de desenvolvimento, usando três a cinco assuntos de teste por rodada, e com os resultados entregues aos designers em 24 horas. O número de usuários realmente testados ao longo do projeto pode facilmente chegar a 50 a 100 pessoas. A pesquisa mostra que os testes de usuários conduzidos por organizações geralmente envolvem o recrutamento de 5 a 10 participantes.

No estágio inicial, quando é mais provável que os usuários encontrem imediatamente problemas que os façam parar, quase qualquer pessoa com inteligência normal pode ser usada como cobaia. No estágio dois, os testadores recrutarão assuntos de teste em um amplo espectro de habilidades. Por exemplo, em um estudo, usuários experientes não mostraram problemas ao usar qualquer design, do primeiro ao último, enquanto usuários ingênuos e usuários avançados autoidentificados falharam repetidamente. Mais tarde, à medida que o design for suavizando, os usuários devem ser recrutados na população-alvo.

Quando o método é aplicado a um número suficiente de pessoas ao longo de um projeto, as objeções levantadas acima são abordadas: O tamanho da amostra deixa de ser pequeno e problemas de usabilidade que surgem apenas com usuários ocasionais são encontrados. O valor do método reside no fato de que problemas específicos de projeto, uma vez encontrados, nunca mais são vistos porque são imediatamente eliminados, enquanto as partes que parecem bem-sucedidas são testadas continuamente. Embora seja verdade que os problemas iniciais no design possam ser testados por apenas cinco usuários, quando o método for aplicado corretamente, as partes do design que funcionaram naquele teste inicial serão testadas por 50 a 100 pessoas.

Exemplo

Um manual do Apple Computer de 1982 para desenvolvedores aconselhado sobre testes de usabilidade:

  1. "Selecione o público-alvo. Comece seu design de interface humana identificando seu público-alvo. Você está escrevendo para homens de negócios ou crianças?"
  2. Determine o quanto os usuários-alvo sabem sobre os computadores Apple e o assunto do software.
  3. As etapas 1 e 2 permitem projetar a interface do usuário para atender às necessidades do público-alvo. O software de preparação de impostos desenvolvido para contadores pode presumir que seus usuários não sabem nada sobre computadores, mas são especialistas no código tributário, enquanto esse software desenvolvido para consumidores pode presumir que seus usuários não sabem nada sobre impostos, mas estão familiarizados com os conceitos básicos dos computadores Apple.

A Apple aconselhou os desenvolvedores: "Você deve começar a testar o mais rápido possível, usando amigos, parentes e novos funcionários recrutados":

Nosso método de teste é o seguinte. Montamos uma sala com cinco a seis sistemas de computador. Agendamos dois a três grupos de cinco a seis usuários por vez para testar os sistemas (muitas vezes sem que eles saibam que é o software e não o sistema que estamos testando). Temos dois dos designers na sala. Qualquer coisa menos e eles perderão muito do que está acontecendo. Qualquer coisa a mais e os usuários sentirão como se sempre houvesse alguém respirando em seus pescoços.

Os designers devem observar as pessoas usarem o programa pessoalmente, porque

Noventa e cinco por cento dos obstáculos são encontrados observando a linguagem corporal dos usuários. Observe se há olhos semicerrados, ombros curvados, cabeças balançando e suspiros profundos e sinceros. Quando um usuário atinge um obstáculo, ele presumirá que é "porque ele não é muito inteligente": ele não relatará; ele irá ocultá-lo ... Não faça suposições sobre por que um usuário ficou confuso. Pergunte a ele. Freqüentemente, você ficará surpreso ao saber o que o usuário pensou que o programa estava fazendo no momento em que se perdeu.

Educação

O teste de usabilidade tem sido um assunto formal de instrução acadêmica em diferentes disciplinas. O teste de usabilidade é importante para estudos de composição e instrução de escrita online (OWI). O acadêmico Collin Bjork argumenta que o teste de usabilidade é "necessário, mas insuficiente para desenvolver OWI eficaz, a menos que também seja acoplado às teorias da retórica digital ".

Veja também

Referências

links externos