Trong bài báo này, chúng tôi đề cập đến nhiệm vụ thực tế nhưng đầy thách thức của nhận dạng cảm xúc (ERC) trong hội thoại, và đề xuất một phương pháp tiếp cận đa phương thức mới, mạng nơ-ron đồ thị tầm ngắn (LSDGNN). Dựa trên đồ thị phi chu trình có hướng (DAG), chúng tôi xây dựng một mạng nơ-ron đồ thị tầm dài và một mạng nơ-ron đồ thị tầm ngắn để thu được các đặc trưng đa phương thức của các phát ngôn ở xa và liền kề. Chúng tôi sử dụng một bộ điều chỉnh vi phân để làm cho các đặc trưng tầm xa và tầm ngắn trở nên khác biệt nhất có thể trong các biểu thức, đồng thời cho phép ảnh hưởng lẫn nhau giữa hai mô-đun, và tích hợp các mô-đun song tuyến tính để tạo điều kiện cho tương tác đặc trưng. Chúng tôi cũng đề xuất một phương pháp học tập chương trình giảng dạy cải tiến (ICL) để giải quyết vấn đề mất cân bằng dữ liệu. Chúng tôi thiết kế một chỉ số "thay đổi cảm xúc có trọng số" nhấn mạnh vào những thay đổi trong các cảm xúc tương tự bằng cách tính toán sự tương đồng giữa các cảm xúc khác nhau, và phát triển một thước đo độ khó để cho phép một quá trình học tập học các mẫu dễ trước. Kết quả thực nghiệm trên các tập dữ liệu IEMOCAP và MELD cho thấy mô hình đề xuất vượt trội hơn các chuẩn mực hiện có.