Este artículo presenta un sistema de control bidireccional de cuatro canales para manipulación remota de alta velocidad con un manipulador de bajo costo. Si bien los métodos convencionales de control unidireccional presentan dificultades en tareas de alta velocidad o con contacto intensivo debido a la falta de retroalimentación de fuerza, el sistema de este artículo proporciona retroalimentación de fuerza mediante compensación de términos no lineal, estimación de velocidad y fuerza externa, y control de ganancia variable según el cambio de inercia, basado en el modelo dinámico del manipulador sin sensores de fuerza. Además, muestra una mejora en el rendimiento al integrar la información de fuerza en la entrada y salida de la política de aprendizaje por refuerzo utilizando los datos recopilados. Con esto, se enfatiza la viabilidad de la manipulación remota de alta precisión y la recopilación de datos con hardware de bajo costo.