Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

RBT4DNN: Kiểm tra mạng nơ-ron dựa trên yêu cầu

Created by
  • Haebom

Tác giả

Nusrat Jahan Mozumder, Felipe Toledo, Swaroopa Dola, Matthew B. Dwyer

Phác thảo

Bài báo này đề xuất một phương pháp kiểm thử theo yêu cầu (RBT4DNN) tận dụng các thông số kỹ thuật yêu cầu ngôn ngữ tự nhiên để giải quyết khó khăn trong việc xây dựng các yêu cầu chức năng cho mạng nơ-ron sâu (DNN). RBT4DNN định nghĩa một không gian đặc trưng ngữ nghĩa bằng cách sử dụng một bảng thuật ngữ và chính thức hóa các điều kiện tiên quyết của các yêu cầu chức năng thành các tổ hợp logic của các đặc điểm này. Sử dụng dữ liệu đào tạo phù hợp với các tổ hợp đặc điểm này, nó tinh chỉnh một mô hình tạo ra để tạo ra các đầu vào kiểm thử đáng tin cậy đáp ứng các điều kiện tiên quyết. Sau đó, các bài kiểm thử này được chạy trên DNN đã đào tạo, so sánh đầu ra với hành vi dự kiến ​​của các điều kiện hậu yêu cầu. RBT4DNN trình bày hai trường hợp sử dụng: phát hiện lỗi trong DNN và cung cấp phản hồi về tổng quát hóa mô hình thông qua việc khám phá hành vi của mô hình theo yêu cầu trong quá trình phát triển. Kết quả đánh giá chứng minh rằng các bài kiểm thử do RBT4DNN tạo ra là thực tế, đa dạng và phù hợp với các điều kiện tiên quyết của yêu cầu, cho phép phân tích có mục tiêu về hành vi của mô hình và phát hiện lỗi hiệu quả.

Takeaways, Limitations

Takeaways:
Một phương pháp thử nghiệm dựa trên yêu cầu mới được trình bày để giải quyết những thách thức của thử nghiệm DNN.
Tạo đầu vào thử nghiệm DNN bằng cách sử dụng thông số kỹ thuật ngôn ngữ tự nhiên.
Phân tích mục tiêu về hành vi của mô hình và phát hiện lỗi hiệu quả có thể
Cung cấp phản hồi về khái quát hóa mô hình trong quá trình phát triển.
_____T279077____-:
Cần có thêm các thí nghiệm và xác minh để xác định tính khả thi và hiệu quả của phương pháp đề xuất.
Độ Chính xác và tính toàn diện của thuật ngữ có thể ảnh hưởng đến kết quả kiểm tra.
Cần nghiên cứu thêm về khả năng ứng dụng và khả năng mở rộng của DNN phức hợp và các yêu cầu của chúng.
Có thể có sự không chính xác trong quá trình tạo đầu vào thử nghiệm do lỗi trong quá trình xử lý ngôn ngữ tự nhiên
👍