Pelican-VL 1.0은 70억에서 720억 개의 매개변수를 가진 오픈소스 구체화된 뇌 모델 제품군입니다. 다양한 구체화에 강력한 인텔리전스를 임베딩하는 것을 목표로 하며, 데이터와 지능형 적응 학습 메커니즘을 심층적으로 통합한 것이 특징입니다. 40억 개 이상의 토큰을 포함하는 원시 데이터 세트에서 고품질 데이터 세트를 추출했으며, 1000개 이상의 A800 GPU 클러스터에서 5만 개 이상의 A800 GPU 시간을 소비하여 훈련되었습니다. DPPO (Deliberate Practice Policy Optimization)라는 인간의 메타 인지에서 영감을 얻은 새로운 프레임워크를 사용하여 훈련되었습니다.
시사점, 한계점
•
최대 규모의 오픈소스 구체화된 다중 모드 뇌 모델
•
베이스 모델 대비 20.3% 성능 향상 및 1000억 수준의 오픈소스 모델 대비 10.6% 성능 우위