Bài báo này khám phá việc tự động hóa kiểm thử xâm nhập Android bằng trí tuệ nhân tạo (AI) và các mô hình ngôn ngữ quy mô lớn (LLM), đặc biệt là việc phát hiện và thực thi các kỹ thuật root bằng PentestGPT. Chúng tôi so sánh các quy trình root thủ công hiện có với các phương pháp tạo khai thác dựa trên AI để đánh giá hiệu quả, độ tin cậy và khả năng mở rộng của kiểm thử xâm nhập tự động dựa trên AI. Chúng tôi sử dụng trình giả lập Android Genymotion để triển khai cả các tập lệnh thủ công và do AI tạo ra cho việc root tự động, đồng thời phát triển một ứng dụng web tích hợp API OpenAI để tự động tạo tập lệnh dựa trên LLM. Chúng tôi đánh giá hiệu quả của các khai thác dựa trên AI, phân tích điểm mạnh và điểm yếu của chúng, đồng thời đưa ra các khuyến nghị bảo mật, bao gồm các khía cạnh đạo đức và khả năng khai thác. Những phát hiện của chúng tôi chứng minh rằng mặc dù LLM đơn giản hóa quy trình khai thác, nhưng sự can thiệp của con người là cần thiết để ứng dụng chính xác và có đạo đức.