Este artículo presenta DeepTrans, un modelo de traducción libre que utiliza LLM de inferencia profunda (p. ej., OpenAI o1 y DeepSeek-R1). Dado que la traducción libre está poco estudiada en los LLM de inferencia profunda existentes, presentamos DeepTrans, que aprende traducción libre mediante aprendizaje por refuerzo (RL). Utilizando criterios de evaluación predefinidos tanto para los resultados de la traducción como para los procesos de pensamiento, construimos un modelo de recompensa que permite a DeepTrans aprender a razonar y traducir libremente. Además, elimina la necesidad de datos de traducción etiquetados, evitando la laboriosa y exigente tarea de generar datos. Los resultados experimentales muestran que DeepTrans, basado en Qwen2.5-7B, mejora el rendimiento de la traducción literaria en un 16,3 %, superando a los potentes LLM de inferencia profunda existentes. También resumimos los fallos y los hallazgos interesantes del proceso de exploración del RL.