药九九店铺爬虫
药师帮/内部使用/宇韬数据库/y99店铺爬虫.py
每周一 12:00
📌 业务目的
监控竞品平台「药九九」的店铺变化。每周一自动爬取药九九的商业列表和资质信息,识别新增商业和关店商业,并匹配药师帮系统中的供应商。
📤 输出产物
① 药九九商业.xlsx(含匹配的药师帮供应商)
→ 邮件发送给8位业务同事
→ 附带新增商业数和关店数
🗄️ SQL 筛选条件详解
① 获取已有数据
SELECT storeId FROM ts_y99_shop WHERE closed = 0
含义:只取未关店的店铺,用于对比增量

② 匹配药师帮供应商
匹配条件(满足任一即可):
· 营业执照号 = 药师帮供应商的社会信用代码(去除字母O和数字0的混淆)
· 药九九企业名称 = 药师帮供应商的法人名称
· 资质信息中的企业名称 = 药师帮供应商的法人名称
排除:药九九自有店铺(partyName LIKE '%药九九%')

③ 确认关店
调用药九九搜索接口,若商品总数为0则标记为关店
更新:UPDATE ts_y99_shop SET closed = 1 WHERE storeId = ?
▼ 运行流程
调用药九九API
爬取商业列表(分页)
对比已有数据
识别新增商业 + 可能关店商业
确认关店
调用搜索接口验证商品数=0
爬取新增店铺资质
营业执照、企业名称等
匹配药师帮供应商
营业执照号/企业名称匹配
数据入库
ts_y99_shop + ts_y99_shop_cert
邮件通知
→ 8位业务同事