Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
ViTally Consistent : Adaptation de l'apprentissage des représentations biologiques à la microscopie cellulaire
Created by
Haebom
Auteur
Kian Kenyon-Dean, Zitong Jerry Wang, John Urbanik, Konstantin Donhauser, Jason Hartford, Saber Saberian, Nil Sahin, Ihab Bendidi, Safiye Celik, Marta Fay, Juan Sebastian Rodriguez Vera, Imran S Haque, Oren Kraus
Contour
Dans cet article, nous présentons un nouveau modèle basal à grande échelle basé sur ViT-G/8 MAE pour les données de microscopie cellulaire à grande échelle, avec 1,9 milliard de paramètres, entraîné à l'aide de plus de 8 milliards de fragments d'images de microscopie. Il améliore la séparabilité linéaire de la variation génétique de 60 % par rapport au modèle ViT-L/8 MAE existant et atteint des performances de pointe sur les critères de représentation des relations biologiques à l'échelle du génome et de cohérence de la réplication. Pour améliorer les performances, nous développons deux approches principales : (1) l'entraînement sur des ensembles de données organisés et diversifiés, et (2) l'utilisation de tâches de sondage linéaire à motivation biologique pour trouver des représentations optimales des criblages à l'échelle du génome. Nous constatons que de nombreux transformateurs de vision auto-supervisés pré-entraînés sur des images naturelles ou microscopiques produisent des représentations d'images de microscopie plus significatives biologiquement dans les blocs intermédiaires que dans les blocs finaux. Cette étude fournit un aperçu des stratégies générales pour construire avec succès des modèles basaux pour les données biologiques à grande échelle.
Takeaways, Limitations
•
Takeaways:
◦
Présentation du modèle fondamental à plus grande échelle pour l'analyse des données de microscopie cellulaire à grande échelle.
◦
Amélioration de la séparabilité linéaire de la variation génétique et des performances dans la reproduction des relations biologiques.
◦
Une méthode d’extraction de représentations optimales par sondage linéaire motivé biologiquement est présentée.
◦
L’importance d’utiliser les blocs intermédiaires du transformateur de vision d’apprentissage autodirigé est présentée.
◦
Fournit des informations sur les stratégies de base de création de modèles pour les données biologiques à grande échelle.
•
Limitations:
◦
Le Limitations spécifique n’est pas explicitement mentionné dans l’article, ce qui suggère qu’il y a place à des améliorations supplémentaires grâce à des recherches futures.