Blog1

❯

❯

❯

Generating Fearful Images: Investigating Potential Emotional Biases in Image Generation Models

Generating Fearful Images: Investigating Potential Emotional Biases in Image-Generation Models

2026年4月30日2分钟阅读

emotion
bias
AI-safety
image-generation
evaluation

Generating Fearful Images: Investigating Potential Emotional Biases in Image-Generation Models

独立研究员 + 马里兰大学，2024。

核心结论

AI 生成图像存在显著的情感偏差：无论 prompt 是什么，生成图像常偏向负面情感（特别是 fear）。
比较了三种图像情感识别方法：传统监督学习（ViT 微调最优）、零样本 VLM、跨模态 auto-captioning。
Google ViT 在图像情感识别上显著优于零样本和 caption 方法。
跨模态对比：文本 prompt 的情感 vs 生成图像的情感 → 生成图像系统性地更负面。

关键发现

情感识别方法比较：微调 ViT > 零样本 VLM > auto-captioning
情感偏差方向：AI 生成图像偏向 fear（恐惧），独立于 prompt 情感
社会影响：这种偏差可能在数字空间中放大负面情感内容

与现有 Wiki 的关系

关联：情感计算与图像生成、AI 生成图像的情感偏差
这是一个元层次的研究：不提出新的生成方法，而是审视现有生成模型的情感安全问题
与 EmoEdit、EmotiCrafter 等方法形成对照：这些方法试图精确控制情感，但底层模型本身可能存在未被察觉的情感偏差

限制与后续问题

仅评估了 8 类离散情感，未涉及连续情感空间
情感偏差的来源是什么？训练数据、模型架构、还是安全过滤？
如何在保持安全对齐的同时减少不必要的情感偏差？

关系图谱

Generating Fearful Images: Investigating Potential Emotional Biases in Image-Generation Models
核心结论
关键发现
与现有 Wiki 的关系
限制与后续问题

反向链接

情感计算与图像生成
index
log

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community