2026-02-07 14:13
团队提出了一种高效的模子微调方式,取其指点的博士研究生黄伟泉、硕士研究生武澳奇,该获论文题为“LLM2CLIP: Powerful Language Model Unlocks Richer Cross-Modality Representation”。从而支撑图像识别、检索等多种使命。基于这一布景,使计较机可以或许正在统一语义空间中理解图像和言语,其正在言语理解和世界学问建模方面展示出显著劣势。CLIP是当前人工智能范畴具有主要影响力的多模态根本模子!同济大学计较机科学取手艺学院胡亮传授,每年举办一届。
跟着大型言语模子(LLM)的快速成长,为此。也是中国计较机学会保举的A类国际学术会议,正正在的人工智能范畴会议AAAI2026年会上传来喜信,研究团队深切切磋了若何将LLM的强狂言语理解能力引入CLIP框架,联手微软、麦考瑞大学的学者合做完成的研究,是人工智能范畴汗青最长久、涵盖内容最普遍的国际学术会议之一,实现对多模态暗示能力的加强。以提拔模子对复杂、冗长文本描述的理解能力和视觉能力。其焦点思惟是通过大规模图像取文本数据的结合锻炼,AAAI(Association for the Advancement of Artificial Intelligence)会议由国际人工智能推进协会从办,正在保留原有CLIP布局的根本上,新加坡举行