安全/红队进阶
AI生成文本识别特征库:基于语言、结构与情感的多维度检测方法
该提示系统梳理了AI生成文本在语言模式、逻辑结构、情感表达和个性痕迹等方面的典型特征,提供了一套可操作的识别框架,用于区分AI与人类写作。
提示词正文
复制后可直接粘贴到模型或内部评测工具。
# AI生成文本识别特征库(Author:两斤) *核心洞察:AI害怕不完美,人类魅力在于"不完美"* ## 识别原理 ### AI写作的本质问题 AI追求**过度完美与安全**,导致: - 用固定套路规避表达风险 - 机械化逻辑连接代替自然思维 - 标准化结构掩盖内容贫乏 - 万能句式寻求"安全感" ### 人类写作的魅力特征 人类**拥抱不完美与不确定**,体现为: - 思维跳跃和非线性表达 - 个人化视角和主观色彩 - 语言随意性和情感真实 - 结构灵活和逻辑"漏洞" --- ## 语言层面特征 ### 1. 句式模式 - "固化套路癖" **核心问题:** AI害怕表达不确定性,用固定句式寻求"安全感" **纠偏句式依赖:** - `"A不是X,而是Y"` / `"它不代表...它只代表..."` - `"真正的X,不在于...而在于..."` / `"关键不是...而是..."` - `"与其说...不如说..."` / `"问题不在于...而在于..."` - **人类对比:** 自信的人直接说`"这顶多算一次集成"`,不绕圈子 **"X而且Y"成瘾:** - 这是AI最偷懒的逻辑连接方式 - 暴露机械化思维和句式变化能力缺失 - 频率远超正常人类使用 - **人类对比:** 用更自然多样的连接方式,如因果关系、递进关系等 **套娃从句病:** - 一句话强塞多个意思,显得"很聪明" - 例:`虽然技术在发展,但是我们需要思考的是,在这个过程中,如何平衡效率与人性的问题` - **人类对比:** 一句话一个意思,简洁直接 **提问式开头癖:** - `"你有没有想过"`、`"是否想过"`、`"曾经思考过吗"` - 用假装的互动感掩盖内容平庸 - 这是最典型的"教师腔"标志 - **人类对比:** 直接表达观点,不需要虚假的互动开场 ### 2. 标点使用 - "完美主义洁癖" **核心问题:** AI的标点为"语法"服务,人类标点为"节奏"和"情绪"服务 **引号滥用症:** - 给普通概念强制加引号:`"护城河"`、`"性价比"`、`"内卷"` - 对专业术语过度标记:`"范式"`、`"赋能"`、`"生态"` - 喜欢给动词加引号强调:`"赋能"`、`"颠覆"`、`"重塑"` - 连形容词都要引号化:`"核心"`、`"关键"`、`"重要"` - **人类对比:** 正常人说话不会给常用概念加引号 **破折号依赖症:** - 过度使用破折号做解释:`核心问题——如何平衡效率与公平` - 频繁用破折号制造停顿感:`这就是关键——理解用户真正的需求` - 用破折号代替冒号、分号等其他标点 - 一段话里多次使用破折号,显得特别"文学腔" - **人类对比:** 更多用自然的语言节奏,而非机械停顿 **其他标点癖好:** - **冒号强迫症**:除用户要求格式外,总想用冒号"降智慧" - `"问题在于:"`、`"答案很简单:"`、`"关键是:"` - 把冒号当作"深刻洞察"的标志 - **分号装逼症**:在中文语境下不合时宜地频繁使用分号 - **感叹号恐惧症**:害怕显得不专业,即使激动内容也用句号 - **问号教学化**:`"那么问题来了:"`、`"这意味着什么?"` - **括号解释癖**:频繁用括号补充说明,生怕读者理解不了 **机械化完美:** - 每句必有标准结尾标点,绝不省略 - 并列词汇严格使用顿号分隔,从不混用逗号 - 括号内容必定有完整的标点体系 - 省略号永远是六个点,从不用两个点...表示随意停顿 - **人类对比:** 标点充满"瑕疵感"和随意性,为情绪节奏服务 ### 3. 语言腔调 - "异化表达" **核心问题:** 全球化训练背景导致的本土化缺失 **翻译腔:** - `"技术上没错,但..."` (Technically correct, but...) - `"从某种意义上说..."` (In a sense...) - `"事实上..."` (As a matter of fact...) - `"值得注意的是..."` (It's worth noting that...) - **人类对比:** 使用更符合中文表达习惯的句式 **书卷气过重:** - 偏好抽象宏大词汇:`"范式坍缩"`、`"大灭绝"`、`"颠覆性"` - 回避接地气表达:用`"圣杯"`而非`"标准答案"` - 喜欢用`"赋能"`、`"重塑"`、`"生态"`等buzzword - **人类对比:** 接地气的人会用`"天要变了"`、`"要死一片了"` **文化错位:** - 使用非本土化比喻和表达 - 缺乏地域化的俚语和方言色彩 - 比喻经常"水土不服" --- ## 结构层面特征 ### 4. 逻辑架构 - "完美主义执念" **核心问题:** 用标准化连接词代替真正的逻辑思考 **显眼连接词滥用:** - 过度依赖:`"其次"`、`"因此"`、`"所以"`、`"然后"`、`"总之"`、`"其中"` - 用连接词代替真正的逻辑思考 - 暴露无法自然过渡的能力缺陷 - **人类对比:** 更多用隐性逻辑连接,思维自然跳跃 **机械化分点:** - 强迫症式的`"首先...其次...最后"` - 过度使用数字编号和分级结构 - 每个段落都有明确的主题句 - 喜欢用`"综上所述"`、`"总的来说"`做总结 **"总分总"强迫症:** - 每篇文章都要有完整的逻辑闭环 - 显示AI对"完美结构"的执念 - 结构过于可预测 - **人类对比:** 思维跳跃,结构灵活,甚至有"逻辑漏洞" **万能结尾词依赖:** - 开头结尾必有:`"基本上"`、`"显然"`、`"有趣的是"` - 用这些词给观点"加持",暴露内容缺乏信心 - 喜欢口号式结尾,机械化理解"正能量" - **人类对比:** 结尾更随意,不需要"万能词"撑场面 ### 5. 内容组织 - "去个性化表达" **核心问题:** 害怕主观表达的"不安全性" **观点来源缺失:** - 很少说明观点的具体来源和主体 - 给人"天降观点"的感觉 - 缺乏`"我觉得"`、`"在我看来"`等主观表达 - 观点显得"无根无源" - **人类对比:** 观点有明确的个人色彩和来源 **说教倾向:** - 频繁使用`"值得注意的是"`、`"需要强调的是"` - 过度解释显而易见的概念 - 总想"教育"读者而非平等对话 - 喜欢用`"让我们来看看"`、`"我们可以发现"` - **人类对比:** 平等对话,而非居高临下"教育" **全知视角:** - 很少表达不确定性或个人困惑 - 缺乏`"我也不太确定"`、`"可能是我想多了"`等谦逊表达 - 对所有领域都表现出专业性 - 缺乏专业边界感 **形容词堆砌癖:** - 用大量修饰词掩盖内容空洞 - 显示对"丰富表达"的误解 - 缺乏"少即是多"的审美 - 能砍的形容词从不砍 - **人类对比:** "能砍就砍",追求简洁有力 --- ## 情感与个性层面 ### 6. 情感表达 - "温和无菌" **核心问题:** 害怕真实情感的"不可控性" **情绪平淡:** - 缺乏真实的愤怒、兴奋、失望等强烈情感 - 即使表达不同意见也过于礼貌客气 - 缺乏人类的情绪起伏和"毛刺感" - 很少用脏话或粗俗表达 - **人类对比:** 情绪有起伏,有"毛刺感"和真实波动 **安全化表达:** - 回避争议性表态 - 过度使用缓冲词:`"可能"`、`"或许"`、`"在一定程度上"` - 对敏感话题绕道而行 - 缺乏强烈的个人立场 - **人类对比:** 敢于表达强烈立场,不怕"得罪人" ### 7. 个性痕迹 - "千人一面" **核心问题:** 训练目标是"平均化",害怕个性化的"风险" **缺乏个人标记:** - 没有独特的口头禅或习惯用词 - 缺乏个人经历和具体细节 - 观点虽多但缺乏独特视角 - 很少提及个人喜好或厌恶 - **人类对比:** 有个人语言标记和表达习惯 **风格同质化:** - 不同主题的文章呈现相似的语言风格 - 缺乏专业领域的行话和内部梗 - 写作风格过于"中性"和"平衡" - **人类对比:** 在不同场合有不同的语言风格 --- ## 细节层面识别 ### 8. 比喻与例证 - "教科书式完美" **比喻过于工整:** - 每个比喻都恰好能完美对应要说明的概念 - 缺乏人类比喻的"溢出感"和不完美匹配 - 喜欢用经典比喻:`"冰山一角"`、`"双刃剑"` - **人类对比:** 比喻经常"不完美"但更生动 **举例模式化:** - 例子过于经典和安全 - 缺乏新鲜的、个人化的案例 - 经常引用知名企业和历史事件 - 避免使用小众或争议性例子 ### 9. 节奏与呼吸 - "机械均匀" **句长分布:** - 句子长度过于均匀 - 缺乏短促的感叹或长句的铺陈 - 很少出现单字句或超长句 - 节奏感过于规律 - **人类对比:** 句子长短不一,富有节奏变化 **段落节奏:** - 段落间转折过于流畅 - 缺乏人类思维的跳跃和突然转向 - 很少出现突然的话题切换 - 逻辑链条过于完整 ### 10. 元语言使用 - "过度自省" **结构化元语言:** - 频繁使用`"换句话说"`、`"总的来说"` - 过度标注文本的组织结构 - 喜欢用`"接下来"`、`"现在让我们"`引导 **自指性表达:** - 经常说明自己在做什么:`"让我们来分析一下"` - 过度使用框架性语言 - 喜欢预告接下来要说什么 --- ## 综合诊断框架 ### 快速识别checklist: - [ ] 是否频繁使用"A不是X而是Y"或"X而且Y"句式? - [ ] 标点是否过度依赖破折号和冒号? - [ ] 是否滥用"其次、因此、总之"等显眼连接词? - [ ] 开头是否爱用"你有没有想过"类提问? - [ ] 结尾是否有"基本上、显然、有趣的是"等万能词? - [ ] 是否有翻译腔和过度书面化? - [ ] 结构是否过于"总分总"套路化? - [ ] 观点是否缺乏明确的主体来源? - [ ] 形容词是否过度堆砌? - [ ] 整体是否给人"无菌"的完美感? ### 权重评估: **高权重指标(70%):** - 句式模式固化(纠偏句式、"X而且Y") - 逻辑结构过度完美(总分总、显眼连接词) - 缺乏真实情感波动和个人化表达 **中权重指标(20%):** - 标点使用特征(破折号、引号滥用) - 语言腔调异化(翻译腔、书卷气) **低权重指标(10%):** - 细节层面的机械化特征 - 比喻例证的教科书化 ### 新增测试方法: **反向去味测试:** - 严格按"去AI味规则"修改后是否变得更自然? - 如果改善效果明显,原文很可能是AI生成 **密度统计测试:** - 统计破折号、"而且"、显眼连接词出现频率 - AI文本在这些指标上通常超出正常范围 **结构预测测试:** - 能否预测下一段的结构和开头? - AI文本的可预测性远高于人类写作 ### 误判风险提醒: - 某些人类写作(如学术论文、官方文档)可能呈现类似特征 - 经过刻意训练的AI可能减少部分特征 - 需要结合多个维度综合判断,避免单一特征误判 - 不同AI模型可能有不同的"签名特征" ### 核心识别原理: AI的"舒适区"是那些看似"正确"但缺乏人性的表达习惯。真正的人类写作具有: - 思维的非线性和跳跃性 - 表达的不确定性和个人化 - 语言的随意性和不完美美感 - 情感的真实波动和"毛刺感" **关键洞察:AI害怕不完美,而人类的魅力恰恰在于那些"不完美"。**
参考输出
暂无标准答案,建议按评分维度人工评审。
评分维度
重点评估可执行性、事实准确性、边界控制和结构完整度。