본 논문은 제한된 자원 집합을 두 개의 이기적인 자율 에이전트가 순차적으로 거래하는 상황에서 자원 배분을 위한 순차적 거래를 탐구합니다. 각 에이전트는 자원 소유량에 따라 달라지는 효용 함수를 가지고 있으며, 제안 에이전트는 상대 에이전트의 효용 함수를 모르는 상태에서 자신의 효용을 향상시키는 거래 제안을 합니다. 상대 에이전트는 자신의 효용을 향상시키는 제안만 수락합니다. 자율 에이전트 간 또는 자율 에이전트와 인간 간의 협력을 용이하게 하기 위해, 제안 에이전트는 상대 에이전트의 기울기(선호도)를 추정하고 이전 수락/거절 반응을 바탕으로 제안을 하는 알고리즘을 제시합니다. 이 알고리즘은 매 거래 수락 후 두 에이전트의 효용이 모두 향상되도록 하면서 파레토 최적 자원 배분 상태에 도달하는 것을 목표로 합니다. 거절된 제안과 이기적인 합리성 가정을 활용하여 잠재적 기울기 공간을 가지치기하여 상대 에이전트의 기울기를 추정합니다. 유한한 횟수의 거절된 제안 후, 알고리즘은 상호 이익 거래를 찾거나 현재 상태가 ε-약한 파레토 최적임을 인증합니다. 연속 및 이산 거래 시나리오에서 다양한 기준과 비교하여 사회적 이익을 더 적은 제안으로 향상시키는 것을 보여주고, 인간 참여자를 대상으로 한 사용자 연구에서도 높은 성능을 달성함을 확인합니다. 특히, 에이전트 목표가 일치하여 자원 충돌이 높은 시나리오에서 효과적임을 보였습니다.