Herline 教育底层 thesis · #6

从报纸版面到深度数据 — 广告的尽头是数据的深度

广告每一代都在缩短「知道」到「行动」的距离。精细化收集已经到顶,而需求、认知、价值判断这层深度数据,只在深度训练里产生 — 教育是第一个可触达的节点。

张飞8 分钟阅读 · 2961

TL;DR

广告史五代迁徙的主线是缩短「知道」到「行动」的距离,Agent 层让推荐即行动。但真正的下一道分水岭是数据的深度:TikTok(线上)与茑屋(线下)把浅层偏好数据收得极细,却都停在「你偏好消费什么」。只有逼人深度表达与思考的训练场景,加上能模拟真实场景的 world model 技术,才能沉淀需求、认知与价值判断这层信号。教育是这个未来第一个能真实跑起来的节点 — 在学习里,推荐本来就是产品,深度互动本来就是数据。

核心论点

  1. 广告的五代迁徙(报纸 → 广播电视 → 搜索 → 算法 → Agent)本质是同一件事:把「知道」到「行动」的距离从数天压缩到归零,终点是「推荐即行动」
  2. 用户数据的收集精细化已经到顶,但深度停在娱乐浅层 — TikTok 与茑屋只是线上 / 线下渠道之分,采集的同样是「你偏好消费什么」的浅层偏好数据
  3. 突破浅层天花板需要两件事:逼人深度表达与思考的训练场景产生深层数据,加上能模拟真实场景的 world model 技术让采集与利用规模化
  4. 教育是这个未来第一个可触达的节点 — 训练场景天然存在、信号密度高、决策者(家长)接受被引导
  5. Agent 层把广告激励第一次和用户利益对齐:收入随任务完成质量增长,而非随停留时长 / 收视率;Herline 以十几年超演沉淀的 world model 引擎构成数据护城河

背景:广告的五次迁徙与现在的机会

一、五代广告,一条直线

广告史只有一条主线:缩短从「知道」到「行动」的距离。每一代都把这段距离压缩一个数量级。

代际 时间窗口 核心创新 知道→行动的距离
报纸 / 印刷 1700s–1990s 按版块分流读者 数日
广播电视 1920s–2000s+ 情感穿透 + 本地台规模触达 数小时到数日
搜索意图 2000–至今 用户主动声明需求 数分钟
内容算法 2007–至今 行为画像预测兴趣 数秒
Agent 任务完成 正在浮现 任务上下文 + 全链路状态 归零

从数天到零。终点是:推荐即行动。

二、每一代加了什么,又留了什么缺口

  • 报纸 加了「按版块分流读者」。缺口:不知道谁真的看了,更不知道谁因此行动。
  • 广播电视 加了「情感穿透 + 本地化规模触达」。缺口和报纸同源:知道「谁大概在看」,不知道「谁想要什么」。
  • 搜索 加了「用户主动声明需求」,广告从推送变成响应。缺口:只抓得到说得出口的需求。
  • 算法 加了「比你更早知道你的偏好」。缺口:它知道你想要什么,却不参与你的行动,中间仍隔着一次跳转。
  • Agent 补上最后一步——它就在行动里,推荐并完成任务直接被执行。

三、现阶段的机会:Agent 层,商业触点内生

当学生对学习 Agent 说「帮我找一本训练逻辑论证的书」,Agent 不是给一个列表,而是结合他的能力水平、阅读轨迹、老师刚布置的任务、上一次练习暴露的弱项,选出一本,直接放进学习计划。没有中断,没有跳转。Agent 的每一次选择,本身就是一个商业触点。

用户对刷屏式低质内容与高频广告的厌烦,这种心理的迁移,为 Agent 打开了一道质量闸门:推荐必须真的好用,否则不存在。Feed 流里一条劣质广告只是被划走;Agent 层里一次劣质推荐损失的是用户对整个 Agent 的信任。激励天然指向把推荐做准,而非做多。

这是现阶段看得见的机会。但所有冲着这个机会去的玩家,都会撞上同一堵墙——下面三节是这篇的重点。


核心:数据的深度,才是下一道分水岭

四、精细化已经到顶,但数据深度停在娱乐浅层

过去二十年,用户数据的收集精细化做到了极致,可它的深度几乎没动过。

把两个最强的玩家放在一起看:

  • TikTok(线上) 记录你每一次滑动、停留、重播、完播、点赞,把兴趣画像切得极细。
  • 茑屋书店 / T-Point(线下) 用跨商户的消费记录把人按生活方式分层,是线下数据运营做得最透的样本之一。

一个在线上,一个在线下,渠道不同,但它们收集的是同一类型的数据:你偏好消费什么。兴趣、偏好、消费倾向——再精细的分类,也是在同一个浅层平面上切得更细。

它们都没有碰到另一层信号:你怎么想、你看重什么、你如何在两难里做判断。

这不是哪家公司不够努力,而是形式决定的天花板。娱乐与消费的场景天然只产生浅层偏好数据——你刷视频、买东西,不会在这个过程里暴露你的论证方式或价值排序。形式停在娱乐,数据就停在浅层。 精细化解决了「分得多细」,没解决「挖得多深」。

五、突破口:深度表达与思考的训练 + Agent 技术实现

要拿到深层数据——需求、认知、价值判断——需要一个逼着人深度表达与思考的场景。娱乐不产生这种数据,训练才产生。

这里的技术拐点是 World Model 驱动的对话排练引擎:学生用 AI 排练真实世界里的高风险对话——一场关键辩论、一次面试、一次说服、一次冲突调解,AI 扮演「对方」,学生本人每回合上场。

为什么这个场景能突破浅层天花板?因为人在压力下做真实选择时,会暴露行为数据永远反推不出来的内核:他如何组织论证、在哪一步退让、为什么这么权衡。每一次排练,都是对一个人「怎么想、看重什么、想成为谁」的一次窗口。

而 Agent / World Model 技术,让这件事第一次具备了可规模化的实现路径——AI 可以扮演对方、按回合陪练、把过程结构化地沉淀下来。深度训练负责产生深层数据,Agent 技术负责让采集与利用可规模化。 两者合起来,才是浅层天花板之上的下一层。

六、教育,是这个未来第一个可触达的节点

深度训练 + Agent 技术能落到很多行业,但教育是第一个能真实跑起来的节点,原因有三:

  1. 场景天然存在,不用硬造。 深度表达与思考的训练,本来就是教育该做的事。在别的行业你得先创造训练动机,在教育里它是刚需。
  2. 信号密度 + 决策者接受被引导。 学习 Agent 知道的不止「你搜了什么」,而是你的能力分布、进步轨迹、卡点位置;同时家长本就在找「什么对孩子有帮助」的专业建议,值得信任的推荐对他们不是广告,是服务。
  3. 训练需求真实且高频。 青少阶段正是判断力与表达力成形期,深度训练有真实、反复的发生场景,数据因此能持续沉淀,而非一次性。

教育,是让「深度训练产生深度数据」这件事第一个能站住脚的地方。


落地:Herline 的位置

七、Herline 的位置与数据护城河

Herline 是一个培养 AI 抗体的素质教育平台——训练青少年不被 AI 替代的判断力、表达力、品味与定力。六个 AI Agent 构成从找书、读书、上课、练习到输出作品的完整链路;对话排练引擎是这条链路下一阶段的延伸方向。

链路里每个节点都是任务完成型交互:Helena 选书、Holly 选素材、Harmon 推荐补充训练、Hypatia 引用信息源——每一个都是商业触点,也是一次数据沉淀面。而这些互动沉淀下来的,是需求、认知、价值判断这一层别处采集不到的信号。

我们没有在教育里插入广告。我们在建一个让人深度表达与思考的 Agent 学习平台——它的每一次有效推荐天然具有商业价值,每一次深度互动天然沉淀别人拿不到的深层数据。 而支撑对话排练引擎的,是通过十几年超演、百亿流量与上万选手访谈沉淀并训练出来的 world model 引擎——以此,Herline 形成了自己的护城河。这构成的不是广告位,是数据壁垒。

问题从来不是「怎么在教育产品里加广告」,而是「如果你的教育产品本身就在帮人完成深度学习与成长,商业价值和数据壁垒都是内生的」。

八、推荐经济:激励第一次和用户同向

回看五代广告,被忽略的一条线是「谁付费」。报纸时代读者和广告主都付;电视之后,用户免费、广告主付费;搜索与 Feed 流延续了这个模型。Agent 层把它带进教育:不向学生收全部费用,向被推荐方收费。

被推荐方也远不止书和课程——契合一个学生成长路径的,可以是一套训练工具、一场营地、一次赛事、一位导师、一条真实机会。一个每天帮大量学生选书的 Agent,对出版商的价值远大于一处货架;一个帮大量老师匹配备课素材的 Agent,是精准到个人能力缺口的渠道。

而这不以牺牲学习质量为代价:只有学生真的读了、用了、进步了,推荐才有商业价值。这和过往的激励正好相反——Feed 流随停留时长赚钱,所以让你多刷;电视随收视率赚钱,所以做吸睛内容;Agent 层随任务完成质量赚钱,所以让你真正学到东西。这可能是广告史上第一次,商业激励和用户利益同向。

九、时间窗口

深度数据这层的基础设施还没成型——没有标准化的推荐接口,没有归因体系,没有衡量「深度训练产生了多少深层价值」的方法。正如 2000 年 AdWords 刚上线时,没人料到「搜索广告」会长成千亿美元级的市场。

Herline 的判断:先把深度训练的体验做到用户信任的程度,深层数据与商业化都是信任的自然延伸。 在用户信任之前谈广告收入与数据变现,是在地基打好之前讨论楼顶花园。当前阶段,平台收入来自会员订阅与 Her能消耗;对话排练引擎、深层数据沉淀、推荐经济都是在建的下一程。但架构上,我们已经在按「每一次 Agent 交互都是一次高质量推荐、一次深度数据沉淀」的逻辑搭系统——不是为了卖广告,而是因为这是做好教育 Agent 的正确方式。

十、一句话

广告史压缩的是距离,下一道分水岭是深度。TikTok 与茑屋把浅层数据收得极细,却都停在「你偏好消费什么」;只有逼人深度表达与思考的训练场景,加上能模拟真实场景的 world model 技术,才能沉淀需求、认知与价值判断这层信号。教育是这个未来第一个可触达的节点——因为在学习里,推荐本来就是产品,深度互动本来就是数据。

分享 / SHARE微博