Cet article aborde le problème de l'attribution de missions et du déchargement de tâches, où les véhicules autonomes utilisent l'informatique mobile de périphérie pour effectuer un traitement efficace dans un système de transport intelligent (STI) basé sur un RAN ouvert. Les études existantes présentent des limites, notamment l'absence de prise en compte des interdépendances entre missions et du coût du déchargement des tâches vers des serveurs périphériques, ce qui conduit à des prises de décision sous-optimales. Pour remédier à ces limites, cet article propose Oranits, un nouveau modèle système qui optimise les performances grâce à la coopération des véhicules tout en prenant explicitement en compte les dépendances entre missions et les coûts de déchargement. Pour y parvenir, nous développons d'abord un algorithme de calcul évolutif basé sur des métaheuristiques appelé Chaotic Gaussian-Based Global ARO (CGG-ARO) comme référence pour l'optimisation au sein d'un seul emplacement. Ensuite, nous concevons un cadre d'apprentissage par renforcement appelé Multi-Agent Double-Deep Q-Network (MA-DDQN) qui intègre des mécanismes de coordination multi-agents et de sélection multi-actions afin de réduire le temps d'attribution des missions et d'améliorer l'adaptabilité par rapport aux méthodes de référence. Des résultats de simulation approfondis montrent que CGG-ARO améliore le nombre de missions terminées et le bénéfice global d'environ 7,1 % et 7,7 % respectivement, tandis que MA-DDQN améliore le nombre de missions terminées et le bénéfice global de 11,0 % et 12,5 % respectivement. Ces résultats soulignent la capacité d'Oranits à permettre un traitement des tâches plus rapide, plus adaptatif et plus efficace dans les environnements ITS dynamiques.