• 简体   /   繁体
基于全局与序列变分自编码的图像描述生成-计算机应用研究2024年07期

基于全局与序列变分自编码的图像描述生成

作者:刘明明 刘浩 王栋 张海燕 字体:      

摘 要:基于Transformer架构的图像描述生成方法通常学习从图像空间到文本空间的确定性映射,以提高预测“平均”描述语句的性能,从而导致模型倾向于生成常见的单词和重复的短语,即所谓的模式坍塌问题。为此,将条件(试读)...

计算机应用研究

2024年第07期