总安装量
5
今日新增
+0
用户评分
- / 5.0 (0)
当前版本
1.0
小红书长尾词采集器 v1.0 — 使用说明
简介
自动采集小红书的搜索联想词(长尾关键词),支持两层递归采集 + 热搜采集,并导出为 Excel 文件。
适用于 SEO 优化、关键词布局、内容运营等场景。
安装方法
前置条件
浏览器需安装以下任一脚本管理器:
- Tampermonkey(推荐):官网安装
- 脚本猫:国产替代,功能类似
安装脚本
- 打开脚本管理器(浏览器右上角图标)
- 新建脚本,完全覆盖粘贴本脚本代码
- 保存(Ctrl+S / Cmd+S)
- 打开 小红书首页,页面右上角出现红色面板即安装成功
界面说明

元素说明
| 元素 | 说明 |
|---|---|
| 标题栏 | 显示"长尾词采集器",可拖拽移动面板位置 |
| 折叠按钮 | − 折叠面板 / + 展开面板 |
| 关键词输入框 | 输入种子词,如"问卷"、"考研"、"护肤" |
| 延迟设置 | 每次请求间隔,默认 4~6 秒,值越大越安全 |
| 开始按钮 | 开始采集(绿色标注为暂停状态) |
| 暂停/继续 | 运行时可用,用于临时停等 |
| 停止按钮 | 立即终止采集,已采数据可导出 |
| 进度条 | 显示第二层采集进度 |
| 日志区域 | 实时显示采集状态和结果 |
| 导出按钮 | 采集完成后出现,关键词和热搜分开导出 |
使用方法
基本流程
- 在小红书页面打开面板
- 输入种子关键词(如"小红书运营")
- 点击 ▶ 开始
- 等待采集完成
- 点击 📥 导出关键词 和/或 📥 导出热搜
采集逻辑
种子词 "女装"
│
├─ 输入搜索框 → 获取第一层联想词
│ ["女装搭配", "女装穿搭", "女装品牌", ...]
│
├─ 对每个第一层词,再次输入搜索框 → 获取第二层联想词
│ "女装搭配" → ["女装搭配技巧", "女装搭配显瘦", ...]
│ "女装穿搭" → ["女装穿搭博主推荐", ...]
│ ...
│
└─ 采集热搜
["今日热点1", "今日热点2", ...]
导出格式
关键词 Excel(文件名:小红书_长尾词_{种子词}.xlsx)
| 种子词 | 第一层 | 第二层 |
|---|---|---|
| 女装 | 女装搭配 | 女装搭配技巧 |
| 女装 | 女装搭配 | 女装搭配显瘦 |
| 女装 | 女装穿搭 | 女装穿搭博主推荐 |
热搜 Excel(文件名:小红书_热搜_{日期}.xlsx)
| 热搜词 |
|---|
| 今日热点... |
功能详解
防检测机制
| 机制 | 说明 |
|---|---|
| 随机延迟 | 每次请求间隔在设定范围内随机,带额外抖动 |
| 逐字输入 | 模拟真人打字节奏,每个字间隔 35-80ms |
| 模拟暂离 | 15% 概率触发 8-15 秒停顿,模拟离开电脑 |
| 滚动页面 | 每次采集前随机上下滚动 |
| 纠错模拟 | 5% 概率故意输错再删除修正 |
| 失焦重激活 | 每次输入前 click + focus + select 完整激活 |
去重机制
- 第二层自动过滤已在第一层出现的词
- 使用
Set去重,避免同一词多次采集
容错处理
| 场景 | 行为 |
|---|---|
| 搜索框不存在 | 日志提示"未找到搜索输入框",跳过 |
| 输入异常 | 重试,不中断流程 |
| 联想词为空 | 日志提示"无新词",继续下一个 |
| 网络慢 | 等待 8 秒,超时返回空 |
| 采集被中止 | 已采数据保留,可导出 |
键盘快捷键
| 动作 | 操作 |
|---|---|
| 开始/重新开始 | 点击 ▶ 开始 |
| 暂停 | 点击 ⏸ 暂停 |
| 继续 | 点击 ▶ 继续 |
| 停止 | 点击 ⏹ 停止 |
配置说明
延迟设置
面板上的 延迟 输入框控制请求间隔:
| 设置 | 适用场景 |
|---|---|
| 3~5 秒 | 少量采集(< 20 个词),风险低 |
| 4~6 秒 | 推荐,适中速度和安全性 |
| 6~10 秒 | 大量采集,更不易被检测 |
建议 min 不低于 3 秒,过短可能被小红书限制。
常见问题
1. 为什么没有出联想词?
可能原因:
- 输入的词太冷门,小红书没有联想词
- 页面结构更新,选择器不匹配(联系作者更新)
- 网络太慢,等待超时
- HP 浏览器扩展干扰(尝试禁用后刷新)
2. 采集时能不能做其他操作?
不建议。采集过程中脚本会操作搜索输入框,切换标签页或点击页面可能干扰流程。建议让页面保持在前台。
3. 采集到一半停了怎么回事?
- 检查网络是否正常
- 查看日志是否有错误提示
- 点击 停止 后重新开始
4. 能同时采集多个关键词吗?
当前版本一次只支持一个种子词。如需采集多个,请分批操作。
5. 导出按钮没出现?
- 需要先点击 开始 完成一轮采集
- 如果中途停止了,只要有已采数据也会出现
- 至少需要采集到数据才会显示
技术说明
- 运行环境:Tampermonkey / 脚本猫
- 外部依赖:SheetJS (xlsx) — 用于 Excel 导出(自动从 CDN 加载)
- 框架兼容:小红书使用 Vue.js,脚本通过原生 value setter + input 事件模拟用户输入
- 兼容性:仅适用于
xiaohongshu.com域名
版本历史
| 版本 | 说明 |
|---|---|
| v5.0 | 逐字输入、去重、进度条、停止按钮、双 Sheet 导出、UI 优化 |
| v4.9 | 原版 UI 重构版 |
免责声明
本脚本仅用于学习和研究目的。使用者应遵守小红书平台的服务条款,合理使用,不得用于任何违法违规用途。作者不对使用本脚本产生的任何后果负责。