而扩散语言模型另辟蹊径,可能有些观众也知道这个东西叫Masked Diffusion LanguageModels,我们看一下它的解码过程,简单来说它的机制不是“做接龙”,而是“做完形填空”。 转到Cod…...