Bài báo này đề xuất phân tích dữ liệu phi cấu trúc từ các nền tảng mạng xã hội như Reddit như một giải pháp cho cuộc khủng hoảng quá liều opioid, một vấn đề sức khỏe cộng đồng nghiêm trọng tại Hoa Kỳ. Dựa trên dữ liệu người dùng Reddit chia sẻ kinh nghiệm sử dụng opioid, chúng tôi trích xuất thông tin bằng kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) tận dụng Nhận dạng Thực thể có Tên Opioid (ONER-2025). Chúng tôi xây dựng một tập dữ liệu độc đáo, được chú thích thủ công gồm 331.285 mã thông báo và trình bày chi tiết quy trình chú thích cũng như các thách thức liên quan, bao gồm tám danh mục thực thể opioid chính. Hơn nữa, chúng tôi phân tích các thách thức về ngôn ngữ trong các cuộc thảo luận liên quan đến opioid, chẳng hạn như tiếng lóng, sự mơ hồ, câu rời rạc và ngôn ngữ mang tính cảm xúc. Chúng tôi đề xuất một hệ thống giám sát thời gian thực tích hợp học máy, học sâu, mô hình ngôn ngữ dựa trên Transformer và nhúng ngữ cảnh nâng cao. Trong 11 thí nghiệm được tiến hành với xác thực chéo 5 lần, các mô hình dựa trên Transformer như bert-base-NER và roberta-base đạt độ chính xác 97% và điểm F1, hiệu suất tốt hơn 10,23% so với mô hình cơ sở (RF = 0,88).