Skip to content

xiaoshame/script

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

日常脚本介绍

  • get_summary: 利用gpt3.5获取文章摘要
  • push_to_gzh: 同步文章到微信公众号脚本
  • push_to_xiaohongshu: 将html按照文章章节转换成图片,然后通过图文模式发布到小红书
  • copyBook: 小说爬虫脚本和Django图书网站,样式与一般网络小说网站类似
  • mytools: windows日常工具,包含加解密/时间戳转换/pdf合并/汇率计算
  • gzh_to_rss: 公众号内容转换成RSS,用于feedly订阅
  • xiaohongshu: 支持搜索小红书,搜索到的文章导出为execel
  • m3u8: mu38视频下载脚本
  • xs: 香色闺阁书源和语音tts相关脚本

脚本详情

get_summary

  • 遍历博客目录,未生成简介的文章,使用GPT3.5 API获取简介

push_to_gzh

  1. 此项目本质上是将md文件转换成html文件,然后通过公众号的接口推送到公众到草稿箱,通过手动点击发布
  2. push_to_gzh\config.ini 中md_dir为需要推送到公众号的文章目录,文章目前只支持md格式
  3. push_to_gzh\app.py 为启动文件
  4. push_to_gzh\styles_renderer.py中render_article函数将md文件按照指定个模板转换成html文件
    1. push_to_gzh\template\author 中按文件夹存放不同元素的模板
    2. push_to_gzh\styles\custom\cp_article_wx.ini 中配置元素使用的模板
  5. push_to_gzh\sync.py 负责与公众号通信
    1. 通过WeRoBot库获取公众号token,APP_ID和APP_SECRET参数在公众号后台获取,注意在公众号后台设置白名单IP
    2. 通过WeRoBot上传文章中的图片素材,通过API将文章对应的html发布到草稿箱

push_to_xiaohongshu

  • 利用selenium实现自动化发小红书
    1. 支持编写文章文字、打标签、发图片
    2. 支持将html页面转换成图片,然后通过图片发布

copyBook

  • 使用文档
  • 丰富了爬虫脚本,支持24hbook.com,beitai.cc,shuqi.com
    1. 24hbook.com格式为epub
    2. beitai.cc下载格式为rar
    3. shuqi.com勉强可用

mytools

  1. 编译后exe过大,上传不便,自行编译
  2. 控制台进入mytools目录,执行pyinstaller.exe main.spec

rss

follow

  1. follow网站拷贝https://api.follow.is/entries 接口返回的json信息
  2. 批量获取json中的rss 地址,替换为可用地址并合成opml文件,方便订阅

gzh_to_rss

  1. 基于公众号转成rss的聚合服务wechat2rss加工
  2. 定时分析聚合服务中更新的文章编写成RSS文件,通过minio服务提供文件访问

xiaohongshu

  1. 支持搜索小红书内容,并导出为excel
  2. 需要自行抓包获取Authorization参数,推荐抓取小红书微信小程序

m3u8

  1. m3u8视频下载工具
  2. 修改m3u8_url,output_file,response = requests.get( 中的地址,下载视频

xs

  1. xbstools.py提供xbs与json互转能力
  2. tts封装 Azure/Ali/Edge tts服务,voice_list.py获取Azure TTS音色列表
  3. data 包含部分源和js解析案例,提高编写源的效率