오픈AI는 챗GPT의 멀티모달 기능을 지속적으로 개발하고 있으며, 곧 파일 업로드 및 이미지, 비디오 촬영 기능을 포함한 업데이트가 있을 것으로 보입니다. 특히, Audio, Video, Image의 멀티모달 대응이 가능해질 전망이며, 이는 진정한 옵니모델로서의 작동을 의미합니다. Sora 플랫폼에서도 이미지 생성 기능이 준비 중인 만큼, 대규모 업데이트가 예상됩니다.
오픈AI 챗GPT 멀티모달 출시 임박 오픈AI에서 지속적으로 네이티브 멀티모달 관련 작업을 하는 것으로 보입니다 특히 파일 업로드에 사진 또는 영상 촬영 기능을 작업하고 있으며 코드에는 Audio Video Image의 멀티모달 대응관련 내용이 추가되어 Gemini 처럼 비디오오디오 인풋이 가능해질 것으로 보이는데요 Dalle와 같은 별도 모델을 벗어나 진정한 gpt4o의 옵니모델로 작동될 것으로 보입니다 작년 5월 gpt4o 발표시 사례로만 발표되었던 옵니모델 기능이 조만간 출시가 될 것으로 보이는데 성능을 기대해봐야겠습니다 Sora 플랫폼 내에서도 이미지 생성 기능을 준비중인 것으로 보아 서비스적으로 대규모 업데이트가 조만간 진행되지 않을까 생각해봅니다