본 논문은 단봉(unimodal) 밴딧 문제에서 고정 신뢰도 최적 팔 식별 문제를 연구합니다. 팔의 평균은 인덱스가 증가함에 따라 최댓값까지 증가한 후 감소하는 단봉 구조를 가집니다. 알고리즘의 정지 시간에 대한 두 가지 하한을 유도합니다. 인스턴스 의존적 하한은 단봉 구조로 인해 주요 신뢰도 의존 비용에 세 개의 팔만 기여함을 시사합니다. 그러나 최악의 경우 하한은 신뢰도 독립적 비용에서 팔의 수에 대한 선형 의존성을 피할 수 없음을 보여줍니다. 단봉 구조를 활용하는 Track-and-Stop 및 Top Two 알고리즘의 수정 버전을 제안합니다. Track-and-Stop의 두 가지 버전 모두 단일 매개변수 지수족에 대해 점근적으로 최적입니다. Top Two 알고리즘은 가우시안 분포에 대해 점근적으로 거의 최적이며, 최악의 경우 하한과 일치하는 비점근적 보장을 증명합니다. 알고리즘은 효율적으로 구현할 수 있으며 경쟁력 있는 실험적 성능을 보여줍니다.