Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Agentes de IA para pruebas web: un estudio de caso práctico

Created by
  • Haebom

Autor

Naimeng Ye, Xiao Yu, Ruize Xu, Tianyi Peng, Zhou Yu

Describir

Este artículo presenta WebProber, un marco de pruebas web basado en modelos de lenguaje a gran escala (LLM) y agentes de IA, para identificar eficazmente problemas de usabilidad en sitios web. A diferencia de los enfoques existentes que se centran en la cobertura de código y las pruebas de carga, WebProber navega e interactúa con los sitios web de forma similar a la de los usuarios reales, identificando errores y problemas de usabilidad y generando informes legibles. En un estudio de caso de 120 sitios web académicos, WebProber identificó 29 problemas de usabilidad que las herramientas existentes no detectaban. Esto demuestra el potencial de las pruebas basadas en agentes de IA y sugiere directrices para el desarrollo de marcos de pruebas centrados en el usuario de nueva generación.

Takeaways, Limitations

Takeaways:
Las pruebas web basadas en agentes de IA pueden descubrir problemas de usabilidad de manera más efectiva que los métodos tradicionales.
WebProber imita el comportamiento del usuario real, lo que permite realizar pruebas más realistas.
Las pruebas automatizadas pueden reducir el tiempo y los costos de desarrollo.
Presenta una nueva dirección en el desarrollo de marcos de pruebas centrados en el usuario.
Limitations:
WebProber es un prototipo y requiere tecnología y funciones más avanzadas.
Se necesita una mayor validación de la generalización en diversos entornos de sitios web.
Debido a las limitaciones de los agentes de IA, es posible que no puedan detectar todos los problemas de usabilidad.
El tamaño del estudio de caso es limitado y se necesita más investigación sobre diferentes tipos de sitios web.
👍