Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

AI Agents for Web Testing: A Case Study in the Wild

Created by
  • Haebom

作者

Naimeng Ye, Xiao Yu, Ruize Xu, Tianyi Peng, Zhou Yu

概要

本稿では、Webサイトのユーザビリティの問題を効果的に見つけるために、大規模言語モデル(LLM)とAIエージェントベースのWebテストフレームワークであるWebProberを紹介します。従来のコードカバレッジや負荷テスト中心のアプローチとは異なり、WebProberは実際のユーザーと同様の方法でWebサイトを閲覧、対話し、バグとユーザビリティの問題を特定し、人間が理解できるレポートを生成します。 120の学術ウェブサイトを対象としたケーススタディで、WebProberは既存のツールが見つからなかった29のユーザビリティ問題を発見しました。これは、AIエージェントベースのテストの可能性を示し、次世代のユーザー中心のテストフレームワークの開発方向を提示します。

Takeaways、Limitations

Takeaways:
AIエージェントベースのWebテストは、従来の方法よりもユーザビリティの問題をより効果的に見つけることができます。
WebProberは実際のユーザーの行動を模倣し、より現実的なテストを可能にします。
自動化されたテストにより、開発時間とコストを削減できます。
ユーザー中心のテストフレームワークの開発に新しい方向性を提示します。
Limitations:
WebProberはプロトタイプであり、より高度な技術と機能が必要です。
さまざまなウェブサイト環境の一般化の可能性をさらに検証する必要があります。
AIエージェントの制限により、すべてのユーザビリティの問題が見つからない可能性があります。
ケーススタディの規模は限られており、さまざまな種類のウェブサイトに関する追加の研究が必要です。
👍