Dialz는 오픈소스 대규모 언어 모델(LLM)의 조향 벡터(steering vectors) 연구를 위한 파이썬 기반 프레임워크입니다. 조향 벡터는 추론 시 활성화를 수정하여 '개념'(예: 정직성, 긍정성)을 증폭 또는 약화시켜 프롬프트 또는 미세 조정보다 강력한 대안을 제공합니다. Dialz는 대조쌍 데이터셋 생성, 조향 벡터 계산 및 적용, 시각화 등 다양한 작업을 지원하며, 모듈성과 사용 편의성을 강조하여 빠른 프로토타이핑과 심층 분석을 가능하게 합니다. 유해한 출력(예: 고정관념)을 줄이고, 다양한 계층에서 모델의 동작에 대한 통찰력을 제공합니다. 전체 문서, 튜토리얼, 인기 오픈소스 모델 지원과 함께 공개되어 안전하고 제어 가능한 언어 생성에 대한 추가 연구를 장려합니다. 더 빠른 연구 주기를 가능하게 하고 모델 해석성에 대한 통찰력을 제공하여 더 안전하고 투명하며 신뢰할 수 있는 AI 시스템을 위한 길을 열어줍니다.