본 연구는 뇌종양 분할의 정확도와 경계 윤곽을 개선하기 위해 공간-언어-시각 정보를 양방향 상호 작용 어텐션 메커니즘을 통해 통합하는 새로운 다중 모달 융합 프레임워크를 개발하는 것을 목표로 합니다. 핵심 구성 요소는 계층적 의미 분리를 통해 3D MRI 데이터와 임상 텍스트 설명을 통합하는 다중 모달 의미 융합 어댑터(MSFA)와 모달 간의 반복적인 정보 교환을 가능하게 하는 양방향 상호 작용 시각-의미 어텐션(BIVA)입니다. BraTS 2020 데이터셋(369개의 다기관 MRI 스캔)을 사용하여 프레임워크를 평가했습니다. 제안된 방법은 향상된 종양, 종양 중심 및 전체 종양 영역에서 평균 Dice 계수 0.8505 및 95% Hausdorff 거리 2.8256mm를 달성하여 SCAU-Net, CA-Net 및 3D U-Net을 포함한 최첨단 방법을 능가했습니다. 에이블레이션 연구는 경계 정밀도에 대한 의미 및 공간 모듈의 중요한 기여를 확인했습니다. 결론적으로, 양방향 상호 작용 어텐션과 결합된 다중 모달 의미 융합은 뇌종양 분할 성능을 크게 향상시켜 임상 지식을 의료 영상 분석에 통합하는 새로운 패러다임을 구축합니다.