Valence-Arousal 情感模型

定义

Valence-Arousal (V-A) 模型是心理学中广泛使用的连续情感表示模型(Russell, 1980)。它在二维笛卡尔空间中表示情感:

  • Valence(效价):愉悦度,从负向 (unpleasant) 到正向 (pleasant)
  • Arousal(唤醒度):激活度,从平静 (calm) 到兴奋 (excited)

与离散情感的关系

V-A 空间中的不同区域对应不同的离散情感:

区域ValenceArousal典型情感
第一象限++Excited, Happy, Amused
第二象限-+Angry, Alarmed, Afraid
第三象限--Sad, Depressed, Bored
第四象限+-Calm, Content, Relaxed

在图像生成中的应用

离散 vs 连续

属性离散情感 (EmoEdit)连续 V-A (EmotiCrafter)
粒度8 类固定任意精度 (如 0.2 步长)
过渡不可渐变平滑连续过渡
可解释性高(直觉理解)中(需熟悉 V-A 空间)
Arousal 控制N/A挑战更大(人类标注一致性低)

关键方法

  • EmotiCrafter:用 V-A 值直接控制 SDXL 生成,emotion injection transformer 注入 V-A 特征
  • EmoArt:为 132K 艺术作品标注二值 A-V 标签 + 12 类离散情感
  • AIEdiT:构建连续情感谱,与 V-A 空间思路相近

EmoArt 数据中的 V-A 分布

  • 87.93% 正向 Valence、76.41% 低 Arousal → 艺术图像偏向”平静愉悦”
  • 中国画极端偏向低 Arousal + 正向 Valence (99%+)
  • 表现主义/超现实主义则有更多高 Arousal 和负向情感

开放问题

  • Arousal 的视觉表达更难预测和控制(inter-annotator agreement 低)
  • V-A 空间的哪些区域最适合情感增强的图像编辑?
  • 是否可以学习从离散情感标签自动映射到 V-A 坐标?