본 논문은 의료 분야의 호라이즌 스캐닝(horizon scanning) 효율을 높이기 위한 두 가지 오픈소스 파이썬 기반 도구, SCANAR과 AIDOC를 소개한다. SCANAR은 뉴스 기사와 같은 비정형 데이터 소스에서 정보를 자동으로 수집하고 처리하며, 중복 제거 및 비지도 학습 기반의 관련성 순위 매김 기능을 제공한다. AIDOC는 인공지능을 활용하여 텍스트 데이터의 관련성에 따라 재정렬하고, 신경망을 이용하여 의미적 유사성을 분석하여 사람의 검토가 필요한 항목을 우선순위로 정렬한다. 12개의 내부 데이터셋과 4개의 외부 벤치마킹 데이터셋을 사용한 실험 결과, SCANAR은 기존의 수작업에 의존하던 정보 검색 과정의 효율성을 높였으며, AIDOC는 95%의 재현율(recall)에서 수동 검토 작업량을 약 62% 줄이는 효과를 보였다. AIDOC의 성능은 기존의 체계적 문헌 검토 자동화 도구와 유사했지만, 데이터셋의 특성에 따라 성능 차이가 있었다. 또한 뉴스 데이터셋을 이용한 소규모 사례 연구는, 능동 학습 과정에서 대규모 언어 모델을 활용하면 뉴스 데이터셋에서 관련 기사를 더 빠르게 탐색할 수 있음을 보여준다. 결론적으로 SCANAR과 AIDOC는 데이터 검색 및 우선순위 지정을 간소화하여 호라이즌 스캐닝의 효율성을 높일 가능성을 보여준다.