研究团队通过分析模型内部表示的"各向异性程度"和"核相似性结构",发现了一个关键现象:当模型在文本理解能力上得到提升后,它对图像、音频、视频等其他模态信息的处理能力也随...