[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MATE : LLM - Environnement de traduction multi-agents optimisé pour les applications d'accessibilité

Created by
  • Haebom

Auteur

Alexandr Algazinov, Matt Laing, Paul Laban

Contour

Dans cet article, nous présentons un système multi-agents accessible multimodal (MATE) pour répondre aux problématiques d'accessibilité. MATE aide les utilisateurs présentant divers handicaps à interagir avec les environnements numériques en effectuant des transformations modales adaptées à leurs besoins, comme la conversion d'images en parole pour les malvoyants. Il prend en charge divers modèles, des appels d'API LLM aux classificateurs d'apprentissage automatique personnalisés, et préserve la confidentialité et la sécurité grâce à une exécution locale. De plus, il extrait des tâches de transformation modale précises à partir des saisies utilisateur grâce au modèle ModCon-Task-Identifier, et offre une assistance en temps réel grâce à son intégration aux technologies institutionnelles telles que les services de santé. Nous avons rendu le code et les données accessibles en les rendant accessibles sur GitHub.

Takeaways, Limitations_

Takeaways:
Offrir un soutien complet en matière d’accessibilité aux utilisateurs souffrant de divers handicaps.
Améliorer l’accessibilité de l’environnement numérique grâce à des transitions modales personnalisées.
Flexibilité grâce à l'API LLM et à la prise en charge du modèle ML personnalisé.
Confidentialité et sécurité améliorées grâce à l’exécution locale.
Possibilité de support en temps réel grâce à l'intégration avec les technologies institutionnelles.
ÉLargir la participation à la recherche et au développement grâce à la divulgation de sources ouvertes.
Les excellentes performances du modèle ModCon-Task-Identifier permettent une identification précise des tâches.
Limitations:
Des tests et une validation approfondis dans des environnements réels sont nécessaires.
Des développements et des améliorations supplémentaires du modèle sont nécessaires pour répondre aux différents types de handicap et aux besoins des utilisateurs.
Les performances du modèle ModCon-Task-Identifier peuvent dépendre de l'ensemble de données défini par l'utilisateur.
Des recherches supplémentaires sont nécessaires sur l’évolutivité et la dégradation potentielle des performances du système.
👍