100% 本地处理 • 图片不会离开您的设备
返回博客

检测 AI 生成图片的 7 种方法 (2026)

没有什么魔法按钮能 100% 判定"这张图是 AI 生的"。谁跟你说有,要么在吹牛要么在卖东西。但把多种检测方法叠在一起——每种有不同的长处和盲区——你能拿到一个相当靠谱的综合判断。

PixPipe 的检测器同时跑七项检查。下面挨个说它们到底在干什么、擅长抓什么、又在哪里会栽。

EXIF 元数据:相机留下的指纹

每张真实相机拍的照片都带 EXIF 元数据——相机型号、镜头、快门速度、ISO、GPS 坐标。就像照片的身份证。

AI 生成的图片要么完全没有 EXIF(本身就可疑),要么带着对不上号的合成元数据。一张声称来自 iPhone 15 的图,却缺少苹果必定写入的那几个特定字段?这就是疑点。

弱点:这太容易造假了。用免费工具就能往 AI 图里注入一套看起来合理的 EXIF。而且我们自己的 EXIF 去除工具也会让真实照片变得"可疑"。单独用这个方法,永远下不了定论。

SynthID:Google 的隐形签名

这是我们手里最确定的检查——但只对一家生成器有效。Google 在每张 Gemini 图片里嵌入了叫 SynthID 的隐形统计图案。抗裁剪、抗缩放、抗压缩。检测到就是 Gemini 的,没跑。

明显的局限:Midjourney、DALL-E、Stable Diffusion 都不用 SynthID。没检测到不代表"不是 AI"——只代表"不是 Gemini"。

C2PA:数字版的监管链

C2PA 是一种记录图片创建历史的行业标准——想象成嵌在文件里的溯源文件。Adobe Firefly 在用,部分版本的 DALL-E 在用,少量相机厂商也开始支持。

有的话,信息量很大。你能看到是什么工具创建的、之后做了什么编辑。

问题是:它是元数据,不是像素。去掉元数据 C2PA 就没了。而且大多数生成器还不支持。有就很好用,没有也说明不了什么。

分辨率规律:AI 生成器有"习惯"

这个比较微妙。AI 生成器不会输出随机分辨率——它们有默认值。Midjourney v6 偏爱 1024×1024 和 1536×1024。DALL-E 3 输出精确的 1024×1024、1024×1792 或 1792×1024。

所以如果一张图恰好是 1024×1024 且没有裁剪痕迹,这是个弱信号。不是证据——很多真实照片也会裁成正方形——但它给综合判断加了一点分。

一旦有人调整了尺寸就完全失效了。

文件名规律:懒惰是可以被检测的

人们懒得改文件名。Midjourney 导出时用特定的哈希格式。DALL-E 文件名里字面意思就写着"DALL-E"。Stable Diffusion 的 UI 经常带着种子数字。

大概是最弱的信号——改个名就绕过了——但也是最快的检查,而且抓到的比你想象的多。大部分人就是下载、上传,根本不看文件名。

视觉伪影:那些不太对劲的细节

AI 图片有破绽。手指数量不对。文字看着像对但仔细看不通。反射跟场景对不上。纹理以真实表面不会有的方式重复。

我们的检测器找的是这些统计规律——光照方向不一致、不可能的几何关系、跟真实相机传感器不同的噪声特征。

问题:最新的生成器越来越强了。GPT-4o 和 Midjourney v6 产出的图伪影极少。反过来,压缩得很厉害的真实照片也可能触发误报。这个方法最适合作为其他信号模糊时的裁判。

频率分析:数学看到了什么

最技术的一项检查。真实照片和 AI 图片在频域上有不同的特征——像素值在不同尺度上如何变化。AI 生成器在高频细节上的模式跟真实相机传感器有微妙差异。

它给的是概率分数,不是是非判断。"这张图的频率特征更像 AI 生成而非相机拍摄,置信度 X%。"

大量后处理可能把这个信号搞乱——真实照片锐化过头可能看着像 AI,AI 图反复压缩保存可能洗掉特征图案。

为什么组合使用才靠谱

单独任何一种方法都容易被骗或产生误报。力量在于组合。

EXIF 分析抓不到假元数据——但频率分析能抓到。SynthID 只对 Gemini 有效——但文件名规律能抓到 Midjourney。视觉伪影检测对高质量生成无能为力——但 C2PA 在元数据完整时能抓到。

三四种方法一致认定时,置信度飙升。当它们意见不一时,这本身也是有用信息——通常意味着图片经过了大量后处理,无论是不是 AI 生成的,这都值得了解。

没有完美的检测系统。但七种不完美的方法协同工作,远胜于任何单一方法。

PixPipe AI 检测器 试试全部七项分析——完全在浏览器里运行。