Este trabajo busca desarrollar una representación de grafos de escena 3D que identifique la ubicación y el uso de elementos de interacción funcional, permitiendo a los robots interactuar directamente con sus entornos. En lugar de basarnos en la resolución tradicional a nivel de objeto, nos centramos en detectar y almacenar objetos con una resolución más precisa, priorizando su importancia funcional. Para abordar la escasez de datos y los desafíos de capturar características detalladas de los objetos mediante sensores robóticos, aprovechamos los recursos 3D existentes para generar datos 2D y entrenar detectores, optimizando así el proceso estándar de generación de grafos de escena 3D. Los resultados experimentales demuestran que nuestro enfoque logra un rendimiento de segmentación de elementos funcionales comparable al de los modelos 3D de vanguardia y permite asociaciones semánticas funcionales basadas en tareas con mayor precisión que las soluciones existentes.