본 논문은 자연어 명세를 기반으로 선언적이고 범용적인 AI 기반 변환을 위한 최초의 형식인 의미 연산자(semantic operators)를 제시한다. 기존 시스템의 한계인 비용 최적화의 성능 보장 부족 및 제한적인 행 단위 LLM 연산 제공을 극복하기 위해, 필터링, 정렬, 조인, 집계 등의 레코드 조작을 자연어 기준으로 수행하는 의미 연산자를 제안한다. 각 연산자는 관계형 연산자와 유사하게 다양한 실행 계획을 허용하며, 고품질 골드 알고리즘으로 각 연산자의 예상 동작을 명시하고, 골드 알고리즘에 대한 정확도 보장과 함께 비용을 절감하는 최적화 프레임워크를 개발하였다. 이를 통해 의미 필터링, 조인, 그룹화, top-k 연산을 최대 1,000배까지 가속화하는 여러 가지 새로운 최적화 기법을 제안한다. LOTUS 시스템에 의미 연산자를 구현하고, 사실 확인, 생의학 다중 레이블 분류, 검색, 주제 분석 등 실제 대량 의미 처리 애플리케이션에서 LOTUS의 효과를 보여준다. 몇몇 연산자 호출만으로 최첨단 AI 파이프라인을 포착하고, 최신 LLM 기반 분석 시스템의 품질을 최대 170%까지 능가하는 새로운 파이프라인을 쉽게 표현할 수 있음을 보여주며, 정확도 보장을 제공한다. 각 작업에 대해 최첨단 AI 파이프라인의 정확도를 충족하거나 능가하는 LOTUS 프로그램은 최고 품질의 기준보다 최대 3.6배 빠르게 실행된다. LOTUS는 https://github.com/lotus-data/lotus 에서 공개적으로 이용 가능하다.