본 논문은 부동산 거래 및 서비스 분야에서 대규모 언어 모델(LLM)의 에이전트 역할 수행 가능성을 평가하기 위한 최초의 평가 도구인 REAL(Real Estate Agent Large Language Model Evaluation)을 제시합니다. REAL은 기억, 이해, 추론, 환각 등 4가지 주제에 걸쳐 5,316개의 고품질 평가 항목을 포함하며, 이는 부동산 거래 및 서비스 시나리오에서 LLM의 지식 및 능력을 평가하기 위한 14개의 범주로 구성됩니다. 실험 결과, 현존하는 최첨단 LLM들도 부동산 분야에 적용되기 위해서는 상당한 개선의 여지가 있음을 보여줍니다.