Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Khi học bắt chước vượt trội hơn học tăng cường trong lập kế hoạch hành động phẫu thuật

Created by
  • Haebom

Tác giả

Maxence Boels, Harry Robertshaw, Thomas C Booth, Prokar Dasgupta, Alejandro Granados, Sebastien Ourselin

Phác thảo

Bài báo này so sánh hiệu suất của học bắt chước (IL) và học tăng cường (RL) đối với việc lập kế hoạch hành động phẫu thuật, dự đoán các hành động phẫu thuật trong tương lai (bộ ba dụng cụ-động từ-mục tiêu) trong phẫu thuật nội soi. Sử dụng tập dữ liệu CholecT50, chúng tôi đã so sánh và đánh giá Học bắt chước tự hồi quy kép (DARIL) dựa trên học bắt chước với ba biến thể học tăng cường (RL dựa trên mô hình thế giới, RL video trực tiếp và học tăng cường ngược được tăng cường). Kết quả cho thấy tất cả các kỹ thuật học tăng cường đều kém hiệu quả hơn DARIL dựa trên học bắt chước (ví dụ: RL mô hình thế giới đạt 3,1% mAP sau 10 giây) và việc khớp phân phối trên tập kiểm tra có chú thích của chuyên gia có xu hướng ủng hộ học bắt chước. Phát hiện này thách thức giả định thông thường về tính ưu việt của học tăng cường trong việc ra quyết định tuần tự.

Takeaways, Limitations

Takeaways:
Chúng tôi đã chứng minh bằng thực nghiệm tính ưu việt của phương pháp học bắt chước trong lập kế hoạch hành động phẫu thuật.
Chúng tôi đã phân tích nguyên nhân gây suy giảm hiệu suất trong học tăng cường là do sai lệch khớp phân phối trong tập dữ liệu chú thích của chuyên gia.
Cung cấp những hiểu biết quan trọng về sự phát triển của AI phẫu thuật.
ĐIều này cho thấy các giả định hiện tại về tính ưu việt của học tăng cường trong quá trình ra quyết định tuần tự cần được xem xét lại.
Limitations:
Chỉ sử dụng một tập dữ liệu CholecT50 có thể có khả năng khái quát hóa hạn chế.
Có thể cần thảo luận thêm về chỉ số đánh giá (mAP).
Cần nghiên cứu thêm về nhiều thuật toán học tăng cường và điều chỉnh siêu tham số.
Cần có một cách tiếp cận mới để khắc phục sai lệch về sự phù hợp phân phối trong các tập dữ liệu chú thích của chuyên gia.
👍