小红书长尾词采集器 v1.0

创建于 2 天前
更新于 2 天前
优化版:逐字真实输入、去重、进度条、停止功能、双Sheet导出、强化防检测
总安装量
5
今日新增
+0
用户评分
- / 5.0 (0)
当前版本
1.0
脚本详情
适用网站

小红书长尾词采集器 v1.0 — 使用说明

简介

自动采集小红书的搜索联想词(长尾关键词),支持两层递归采集 + 热搜采集,并导出为 Excel 文件。

适用于 SEO 优化、关键词布局、内容运营等场景。


安装方法

前置条件

浏览器需安装以下任一脚本管理器:

  • Tampermonkey(推荐):官网安装
  • 脚本猫:国产替代,功能类似

安装脚本

  1. 打开脚本管理器(浏览器右上角图标)
  2. 新建脚本,完全覆盖粘贴本脚本代码
  3. 保存(Ctrl+S / Cmd+S)
  4. 打开 小红书首页,页面右上角出现红色面板即安装成功

界面说明


![ScreenShot_2026-05-15_173633_070.png](https://scriptcat.org/api/v2/resource/image/heedgHhmZ0N725o8)

元素说明

元素 说明
标题栏 显示"长尾词采集器",可拖拽移动面板位置
折叠按钮 折叠面板 / + 展开面板
关键词输入框 输入种子词,如"问卷"、"考研"、"护肤"
延迟设置 每次请求间隔,默认 4~6 秒,值越大越安全
开始按钮 开始采集(绿色标注为暂停状态)
暂停/继续 运行时可用,用于临时停等
停止按钮 立即终止采集,已采数据可导出
进度条 显示第二层采集进度
日志区域 实时显示采集状态和结果
导出按钮 采集完成后出现,关键词和热搜分开导出

使用方法

基本流程

  1. 在小红书页面打开面板
  2. 输入种子关键词(如"小红书运营")
  3. 点击 ▶ 开始
  4. 等待采集完成
  5. 点击 📥 导出关键词 和/或 📥 导出热搜

采集逻辑

种子词 "女装"
  │
  ├─ 输入搜索框 → 获取第一层联想词
  │  ["女装搭配", "女装穿搭", "女装品牌", ...]
  │
  ├─ 对每个第一层词,再次输入搜索框 → 获取第二层联想词
  │  "女装搭配" → ["女装搭配技巧", "女装搭配显瘦", ...]
  │  "女装穿搭" → ["女装穿搭博主推荐", ...]
  │  ...
  │
  └─ 采集热搜
     ["今日热点1", "今日热点2", ...]

导出格式

关键词 Excel(文件名:小红书_长尾词_{种子词}.xlsx

种子词 第一层 第二层
女装 女装搭配 女装搭配技巧
女装 女装搭配 女装搭配显瘦
女装 女装穿搭 女装穿搭博主推荐

热搜 Excel(文件名:小红书_热搜_{日期}.xlsx

热搜词
今日热点...

功能详解

防检测机制

机制 说明
随机延迟 每次请求间隔在设定范围内随机,带额外抖动
逐字输入 模拟真人打字节奏,每个字间隔 35-80ms
模拟暂离 15% 概率触发 8-15 秒停顿,模拟离开电脑
滚动页面 每次采集前随机上下滚动
纠错模拟 5% 概率故意输错再删除修正
失焦重激活 每次输入前 click + focus + select 完整激活

去重机制

  • 第二层自动过滤已在第一层出现的词
  • 使用 Set 去重,避免同一词多次采集

容错处理

场景 行为
搜索框不存在 日志提示"未找到搜索输入框",跳过
输入异常 重试,不中断流程
联想词为空 日志提示"无新词",继续下一个
网络慢 等待 8 秒,超时返回空
采集被中止 已采数据保留,可导出

键盘快捷键

动作 操作
开始/重新开始 点击 ▶ 开始
暂停 点击 ⏸ 暂停
继续 点击 ▶ 继续
停止 点击 ⏹ 停止

配置说明

延迟设置

面板上的 延迟 输入框控制请求间隔:

设置 适用场景
3~5 秒 少量采集(< 20 个词),风险低
4~6 秒 推荐,适中速度和安全性
6~10 秒 大量采集,更不易被检测

建议 min 不低于 3 秒,过短可能被小红书限制。


常见问题

1. 为什么没有出联想词?

可能原因:

  • 输入的词太冷门,小红书没有联想词
  • 页面结构更新,选择器不匹配(联系作者更新)
  • 网络太慢,等待超时
  • HP 浏览器扩展干扰(尝试禁用后刷新)

2. 采集时能不能做其他操作?

不建议。采集过程中脚本会操作搜索输入框,切换标签页或点击页面可能干扰流程。建议让页面保持在前台。

3. 采集到一半停了怎么回事?

  • 检查网络是否正常
  • 查看日志是否有错误提示
  • 点击 停止 后重新开始

4. 能同时采集多个关键词吗?

当前版本一次只支持一个种子词。如需采集多个,请分批操作。

5. 导出按钮没出现?

  • 需要先点击 开始 完成一轮采集
  • 如果中途停止了,只要有已采数据也会出现
  • 至少需要采集到数据才会显示

技术说明

  • 运行环境:Tampermonkey / 脚本猫
  • 外部依赖:SheetJS (xlsx) — 用于 Excel 导出(自动从 CDN 加载)
  • 框架兼容:小红书使用 Vue.js,脚本通过原生 value setter + input 事件模拟用户输入
  • 兼容性:仅适用于 xiaohongshu.com 域名

版本历史

版本 说明
v5.0 逐字输入、去重、进度条、停止按钮、双 Sheet 导出、UI 优化
v4.9 原版 UI 重构版

免责声明

本脚本仅用于学习和研究目的。使用者应遵守小红书平台的服务条款,合理使用,不得用于任何违法违规用途。作者不对使用本脚本产生的任何后果负责。