大模型为什么偏爱引用YouTube了?

蓝鲸财经
10 hours ago

文/刀客doc

品牌做GEO的主战场已经从新闻网站、问答图文社区,逐渐偏向YouTube。

从目前来看,GEO的引用来源做一个简单的划分有几类:

第一类是权威资料,比如百科、政府与科研站点,外加各类标准文档、白皮书、产品说明书。

第二类是经验社区,Reddit、Quora、StackOverflow 这类以问答、讨论串为单位的内容池。

第三类是视频类内容:YouTube 、TikTok这一类,一些拆箱、横测视频、教程等等。

第四类是新闻媒体:主流媒体、行业媒体、公司公告、财报解读、监管与政策报道。

第五类是电商内容:电商详情页、评测站、论坛测评、App Store/Google Play 评论、地图与点评。

近段时间,一些公司的数据指出,YouTube的引用得到明显提升。

根据 SEO 公司 BrightEdge 的数据,YouTube 现在已经是大语言模型(LLM)的核心内容源之一:在 29.5% 的 Google AI 概览中,都会引用到 YouTube 的内容;像 Gemini、ChatGPT 这样的工具使用 YouTube 的频率,已经高于 Reddit。

另一个做 GEO 的供应商提到,今年 1 月,在被各大 LLM 调用作为信息来源的频次上,YouTube 已经超过了 Reddit。

还有一家为某头部品牌提供 GEO 服务的机构发现,就这家客户所在的细分品类而言,Google 的 AI 概览中,将 YouTube 作为主要信息源的比例已经接近 60%。

各个机构的统计口径不一,比如对高度监管的行业(比如医疗、金融)以及很多 B2B 领域,权威站点和专业机构仍然占据主导,YouTube 的影响更多体现在怎么做、怎么买这一类决策环节,而不是所有问题的起点。

不过,有个事儿是基本确定的,YouTube在GEO理的重要性,目前来看是逐步上升的。

2025 年的一项基于 Semrush 关键词样本的研究统计了大模型回答里的来源引用,Reddit 在被分析样本里大约占到40% 左右的引用份额,排在最前面。Wikipedia 大约 26% 左右,后面才是其他来源。

当然,这可能是由于2024 年 Reddit 与 Google 签了每年 6000 万美元的内容授权协议,用于 AI 训练与相关用途;随后 Reddit 也与 OpenAI 达成类似的数据合作。

在 GEO 这件事儿上,Reddit 确实很重要。它的特点是活人感。模型需要人话、需要真实使用情境、需要多视角争论时,Reddit 往往比任何媒体评测、品牌官网都更重要。

Reddit上的标题往往就是自然语言提问,下面是一串具体情境:预算、地区、替代方案、失败经历、情绪反应。对大模型来说,这比传统网页更像可直接拿来回答的样本,因为它天然贴着用户提问的语义走。

再叠加 Reddit 的投票排序机制(高赞靠前)和楼中楼对质,它等于把同一问题的多种答案做了一个粗糙但有效的群体筛选。

模型喜欢这种既有多视角,又有用户人群评审的数据,可以用来判断哪段话更像共识、哪段话可能是极端个案。

更关键的是这个社区有不少长尾内容。

在Reddit ,一些细碎、生活化、非主流的问题,也容易在某个小圈子里被认真讨论。很多品类的决策关键句,可能在某个帖子的三楼:用了一周哪里不爽、哪个型号在北方冬天会出问题、某个品牌售后怎么扯皮、同价位有没有更稳的替代。

对 GEO 来说,这些句子价值极高,总之Reddit有经验密度很高的语料。

不过,在GEO上,Reddit的不足也同样源于他的活人感,也就是噪音和偏见。

因为活人感太重,用户的情绪、立场、身份认同、品牌站队经常盖过事实讨论。

用户在上面看到的是经验、观点、情绪、梗、互喷。大模型要把它变成可引用的答案,就必须投入更多过滤成本,平台方一旦在质量和安全上收紧,Reddit 会首当其冲。

还有个问题是,Reddit在做GEO的时候,可控性差。对品牌而言,Reddit 的内容生产权在社区用户。品牌可以参与讨论,但你无法像运营自有内容那样系统铺设问题空间,更无法保证讨论方向不跑偏,甚至在很多内容里,商业身份天然不受欢迎,稍有营销味就会被群嘲、被删除、被封禁。

对 GEO 来说,这意味着 Reddit 能放大口碑,也能放大负面,而且往往不可预测。

还有个问题,为什么短视频、音频播客。

大模型为什么更“爱吃”YouTube、而不是短视频和播客,本质不是“视频更流行”,而是YouTube把内容加工成了机器最省事的那种形态:能检索、能切片、能对齐问题、还能较低风险地引用。

你看一组很扎眼的数据就明白了:BrightEdge 监测了 2024 年 5 月到 2025 年 9 月之间,Google 的 AI Overviews / AI Mode、ChatGPT、Perplexity 这些产品在答案里引用视频内容的情况。

YouTube平均拿走约 20% 的引用份额,在 Google AI Overviews 里更是29.5% 的结果会引用 YouTube,并且“被引用次数”大约是其它视频平台的200 倍;对照组里,Vimeo、TikTok 这种平台的引用占比只有0.1%左右,Twitch、Dailymotion 甚至基本不出现。

短视频平台内容的核心能力是情绪和节奏,镜头碎切、强依赖BGM与画面反转。对人类来说这是爽点;对模型来说,这是噪音。

因为模型真正能稳定吃到的,一般还是是文本层。大部分短视频的问题就在于,画面大于文本:文本的作用是配合画面。

很多短视频的内容是片段化的,缺少可索引的长文本。大模型从一个 20~60 秒的字幕里拼一个完整回答,它得跨很多条视频去拼接,比起直接拿一条 10~20 分钟的YouTube文字稿,成本高太多。

另外,播客的问题更微妙:播客里有大量高质量信息,甚至比 YouTube密度更高,不过它在机器侧的最大障碍是——文本化和结构化不统一。

YouTube的视频天然带一个可抓取的全文:自动转写。哪怕里头有口头语、听写错误,但对机器来说已经足够形成一份带时间戳的粗加工文稿,方便按主题切片、对齐问题,再从中挑出可以引用的句子。

播客则长期缺这套工业化包装:Apple Podcasts虽然从 iOS 17.4 开始提供自动转写,并且在 2025 年说已转写超过 1 亿期节目,但它也明确了语言与系统版本等条件,并且这份转写主要服务于 Apple 自己的App体验,生态外部并不一定可用、可索引。

Spotify 也有转写,但同样强调,转写并不是对所有创作者都开放,并且与不同托管平台的同步能力有限,还可能被自动转写覆盖。

这会导致一个现实:播客文本的稳定性有时候也不高。

大模型想引用一段播客观点时,常常拿不到稳定的可引用文本片段。当然,即便拿到了,定位、对齐、验证也更难。于是它更愿意引用那种——天然就是文本、天然有章节、天然可切片的来源。YouTube恰好满足了。

应该这么说,对大模型来说,YouTube赢在了对机器友好的工业化标准上。

所谓的GEO ,其实是让大模型在回答问题时更容易捞到品牌的内容,这个和之前基于搜索引擎的优化SEO在目标上是一致的。

如果把大模型拟人化,GEO就是一个只看好读文本的挑剔读者。

这个读者不喜欢噪音多、没有重点的内容,更喜欢别人提前帮它分好段、打好标签、写好小标题的材料,还偏爱那种一篇内容解决一个问题的结构。

机器先看的是结构。YouTube的内容长得都差不多:有标题、有简介、有标签,有时还有清晰的时间轴和章节。标题往往就是一个问题或主题,简介相当于摘要和补充说明,标签和分类是现成的语义标记,章节和时间点把一条长视频切成若干段。

加上自动生成的文字稿,一条 10~20 分钟的视频对大模型来说,就是一篇格式统一、已经分好段的长文。模型通过读标题判断大类,扫一遍文字稿理解在讲什么,再用章节时间点去对齐不同话题片段。

YouTube 的主流内容类型,比如评测、横评、教程、拆解、开箱,这些天然是一个问题和一段完整回答的形态,而且一条视频的文字稿往往能抽出一整串可以直接引用的句子。

对大模型和 GEO 来说,YouTube 在模型友好度上,已经站定了一个很好的生态位。

当然,这套偏好本身也有明显的副作用。

一方面,YouTube 的推荐和创作环境,会把内容一步步推向更AI友好的方向上,比如结构要清楚、逻辑要顺、关键词要齐、章节要分好。

这对品牌的现实影响是:为了让大模型更容易引用品牌,内容可能要变得更规矩、更像说明书;但越规矩,也越容易牺牲一部分锋芒和个性。

GEO 友好的内容,并不总是最有记忆点、最打动人的那种表达,这两件事本身就有些矛盾。

所以,今天的数据看起来是 YouTube 在走高,可能也只是一个阶段性的事实。

大模型的引用逻辑、平台之间的数据合作、监管和舆论风向,随时可能改变权重。毕竟AI行业的发展太快了。

谁都没有永久头牌的资格。品牌做GEO 真正需要的,是在多源信息栈里建立冗余和弹性。同一套关键信息,在权威资料、社区讨论、长视频、电商与评测页面里,都有可以被机器捞到的版本。

即便某一层权重被调低,整体的可被引用性也不会塌方。

这样做,比单纯过度偏向一个平台,要安全得多。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10