본 연구는 의미 보존 변환을 사용하여 결함 탐지 도구의 테스트 단계 성능을 향상시킬 수 있는지 여부를 조사하였다. 기존의 의미 보존 변환을 구현한 28편의 논문에서 94개의 변환 방법을 수집하고, 이 중 39개를 구현하여 Devign 데이터셋과 두 개의 미세 조정된 대규모 언어 모델(VulBERTa, PLBART)에 적용하였다. 그러나 수동 검증 결과 23개의 변환이 코드 의미를 변경하는 것으로 나타났으며, 나머지 16개의 의미 보존 변환과 세 가지 앙상블 전략을 사용하여 결함 탐지 모델의 정확도를 향상시키지 못했다. 결론적으로, 기존의 의미 보존 변환을 재사용하는 것은 어렵고, 때로는 의미를 잘못 변경할 수 있다는 것을 발견하였다.