VidiBot:视频或图文帖子的说明文字内容要如何获取?

一、文字内容来源(优先级从高到低)

1. 配置的说明库文件(最高优先级)

  • 如果配置了统一的 description_file,优先使用
  • 支持两种读取模式:
    • 按行读取:可随机或顺序读取单行
    • 全部读取:读取整个文件内容

2. 同目录同名txt文件(备用方案)

  • 如果视频文件是 video_001.mp4,会查找同目录下的 video_001.txt
  • 读取整个文件内容作为描述

3. 无描述文件(直接返回)

二、为说明文字添加前缀和后缀(可选功能)

二、其他平台限制

  • B站:2000字符
  • Facebook:通过role=”textbox”定位
  • Instagram:2000字符
  • 小红书:900字符(平台限制1000)
  • 百家号:100字符
  • LinkedIn:4095字符
  • 微博:2000字符
  • Pinterest:2000字符
  • VK:无特殊限制
  • 快手:无特殊限制

三、核心流程图

开始
  ↓
检查description_file配置
  ↓ (有)          ↓ (无)
读取说明库      查找同名txt文件
  ↓               ↓ (存在)     ↓ (不存在)
随机/顺序读取    读取全部内容  返回
  ↓
处理前缀/后缀(可选)
  ↓
根据平台适配:
  - 获取现有描述(如果平台支持)
  - 应用插入规则
  - 限制字符长度
  - 过滤特殊字符
  ↓
输入到平台文本框
  ↓
结束

四、关键设计思想

  1. 灵活性:支持多种描述来源和读取方式
  2. 平台适配:每个平台独立处理,适应不同UI
  3. 稳定性:使用复制粘贴而非send_keys,避免长文本丢失
  4. 内容控制:自动截断超长文本,过滤非法字符
  5. 扩展性:容易添加新平台支持

这个函数是整个自动上传系统的核心组件之一,确保了文字内容能够正确地、稳定地发布到各个平台。

图片和文字说明确实没有关联性,这是因为系统的设计逻辑是“内容库随机组合”,而不是“图片与描述一一匹配”。

核心原因:内容随机组合机制

日志清楚显示了这一过程:

  1. 图片来源781_1.png 来自任务目录 【000781】【初中英语】...。系统从该目录的 24,891 个文件中随机抽取了 1 个。
  2. 文字来源:说明文字并非来自同一目录,而是来自一个完全不相关的路径:D:\...\【初中物理】知伴物理靶向拔高+高阶提分课\【初中物理】知伴物理靶向拔高+高阶提分课.txt

这说明系统在运作时,将“图片获取”和“文字获取”作为两条独立的流水线处理:

  • 图片:从任务配置的 upload_dir(任务目录)中随机选取。
  • 文字:优先从配置的 description_file(说明库文件)中读取。在你的日志里,它找到并使用了另一个目录下的全局说明文件。

为什么会这样设计?

这种“随机组合”的设计,在自动化批量发布中很常见,主要目的是:

  • 提高内容唯一性:通过将不同来源的图片、标题、描述随机组合,可以生成大量看似不同的内容,避免重复。
  • 资源最大化利用:让一个庞大的媒体库(如你的24,891个文件)与一个独立的文案库配对,能产生的组合数量是两者数量的乘积,极大扩展了内容量。
  • 效率优先:对于需要高频发布的海量内容任务,系统优先保证执行效率,而不是为每个文件单独维护对应的文案。

如何让图片和文字关联?

如果你希望图片和说明文字能对应起来,可以参考以下方案:

方案核心逻辑适用场景
同名文件匹配将说明文字保存在与图片同目录、同名的 .txt 文件中(例如 781_1.png 旁放一个 781_1.txt)。系统会优先使用这个文件。需要为每个或每组媒体文件单独撰写特定说明。
统一文案库这正是你当前日志中的情况。所有图片共用一套或随机从文案库中抽取的说明。内容主题高度一致,允许泛化描述的批量发布。
文件夹分类为不同主题的图片建立不同文件夹,并为每个文件夹单独配置 description_file有不同内容主题,但每个主题内的文案可以通用。

你可以根据实际需求,选择最合适的方案来调整配置。

© 版权声明
THE END
喜欢就支持一下吧
点赞14 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容