Skip to content

04 Multimodal

多模态模型:VLM(GPT-4V、LLaVA)、视频理解、语音模型、多模态生成、统一架构等。