Bài báo này nghiên cứu hiệu quả của các mô hình ngôn ngữ quy mô lớn (LLM) nguồn mở trong việc trích xuất các sự kiện chính (lý do nhập viện, các biến cố lớn trong bệnh viện và các biện pháp theo dõi quan trọng) từ các bản tóm tắt y khoa, đặc biệt là báo cáo xuất viện. Chúng tôi cũng đánh giá tỷ lệ ảo giác, yếu tố có thể ảnh hưởng đến độ chính xác và độ tin cậy của LLM. Các thí nghiệm sử dụng LLM như Qwen2.5 và DeepSeek-v2 cho thấy hiệu suất tuyệt vời trong việc trích xuất lý do nhập viện và các biến cố xảy ra trong quá trình nằm viện, nhưng lại cho thấy sự thiếu nhất quán trong việc xác định các khuyến nghị theo dõi. Điều này làm nổi bật những thách thức của việc tận dụng LLM để tóm tắt toàn diện.