# 内容接入

# 一、功能介绍

内容接入是面向有优质内容的小程序提供一种接入微信搜索的能力。小程序可以通过该功能推送优质内容的页面路径、参数和结构化数据等信息,让微信搜索可以更及时地收录到小程序内容,推送的内容将会被用于微信搜索结果展示。

# 二、准入要求

同时满足以下条件的小程序能够获得申请内容接入资格。

1.开放类目范围: 面向非个人主体,开放政务服务、商业服务、医疗服务、金融业、文娱、社交 6 个一级类目下的部分子类目;

一级类目 二级类目
政务服务 不限
商业服务 法律服务平台
律所服务
会计师事务所
税务师事务所
医疗服务 公立医疗机构
三级私立医疗机构
其他私立医疗机构
就医服务
互联网医院
金融业 银行
信托
公募基金
私募基金
证券/期货
证券/期货投资咨询
新三板信息服务平台
文娱 出版物
学术期刊
电台
音乐
有声读物
动漫
宗教信息
资讯广场
社交 笔记
问答

注:如小程序含有社区/论坛 、视频广场、其他视频、股票信息服务等服务类目,本次暂不支持接入。

2.活跃用户数: 月均日活跃用户数不低于5000、已发布上架时间超过30天;

3.账号状态: 账号未被限制搜索,账号已完成备案;

4.账号属性: 以提供图文资讯内容为主营业务。

# 三、内容质量规范

内容审核中,关注以下维度:

1.信息价值: 文章内容符合基本事实,内容准确,能给用户带来较高信息增益,低质、明显AIGC等内容会被视作低信息量内容处理;

2.页面浏览体验: 页面结构层次清晰,具有可读性,核心资源可用无死链;

3.广告: 无开屏弹窗广告,无其他严重影响用户体验的恶劣广告;

4.付费内容: 推送内容需要支持免费浏览,付费内容可前置过滤,或针对搜索渠道开通免费试读;

5.时效性: 保持内容定期更新,对于已过期内容,需要及时更新或推送删除信号;

6.合规性: 符合法律法规,不涉及黄赌毒、暴力、恐怖主义、政治敏感、谣言、歧视性言论等违法或违规信息。

# 四、开通流程

满足以上条件的开发者,可申请开通。

具体流程如下:

1. 在“小程序后台-推广与搜索-微信搜一搜-运营中心-内容接入”页面中按要求提交申请,并按照“五、数据推送流程”中的指引,提交测试数据;

2. 推送测试数据(300条),平台将根据“三、内容质量规范”中的标准进行审核评估。测试数据内容需要与正式推送内容在内容类型、质量上保持一致;

3. 测试数据通过后,会进入审核状态,审核通过后 可推送正式数据,正式数据在线上允许被搜索到。

# 五、数据推送流程

# 1.接口调用请求说明

HTTP请求方式:POST

https://api.weixin.qq.com/wxa/search/wxaapi_submitpages?access_token=TOKEN

# 2.请求参数说明

请求参数

参数 类型 说明
access_token string 小程序的access_token,获取方式参见:[获取接口调用凭据 | 微信开放文档](https://developers.weixin.qq.com/miniprogram/dev/OpenApiDoc/mp-access-token/getAccessToken.html)
pages PageObject数组 请求提交的小程序页面信息数组,一次可提交多个页面的信息。放在POST body里

PageObject结构说明

参数 类型 说明
path string 以pages/开头的小程序页面路径。
query string 小程序页面请求参数
data_list PageData数组 小程序页面的数据,一个页面可以同时提交多个结构化信息

注意:path+query标识唯一一个页面,微信侧会使用这个信息构造唯一id。

PageData结构说明

参数 类型 说明
@type string 数据结构类型,用于标识目标业务系统,必填:@type="wxsearch_cpdata" - 正式数据,对应搜一搜正式环境,可被用户检索到;@type="wxsearch_testcpdata" - 审核数据,对应搜一搜数据审核环境,用于数据审核及格式校验,不在搜索结果中展示。
其他 目标业务所需的结构化数据,参见【内容数据字段】

# 3.返回参数说明

参数 类型 说明
errcode int32 错误码
errmsg string 错误信息

常见错误码

errcode errmsg 说明
40066 invalid url 小程序url配置了sitemap disallow
40211 invalid scope_data 数据结构校验失败,附带进一步错误字段,如unexpected instance type: /content_id,表示content_id类型错误。
40212 invalid query 不合法query
40219 pages is empty pages参数为空
45002 content size out of limit http请求包过大,建议拆分或使用压缩
47001 data format error http请求包不是合法Json
47004 submit pages count more than each quota 每次提交的页面数超过1000(备注:每次提交页面数应小于或等于1000, 增量数据推荐单条推送)
47006 submit pages count reach daily limit, please try tomorrow 当天提交页面数达到了配额上限,请明天再试(备注:每日限额页面数为50w)
85091 search status was turned off 小程序的搜索开关被关闭。请访问设置页面打开
85083 search status is banned 小程序的搜索功能被禁用
107001 system error 系统失败,重试即可,请求中的页面可能部分成功
107002 page size out of limit 单个页面大小超过阈值(最大为1M)
107003 permission denied 审核数据前,需提交申请;推送正式数据前,需等待审核通过

其他错误码可从错误码 | 微信开放文档找到说明。

# 4.内容数据字段

字段 名称 数据类型 必填 字段说明及要求
update 更新字段 uint32 1-新增;3-删除;内容更新按照新增处理,如果页面路径(page+query)相同,微信会做覆盖更新。
content_id 数据方自定义id string 数据方自定义id
page_type 页面类型 uint32 固定填2
h5_url H5链接 string 推荐填写,如果该页面有对应的H5链接,则填上
title 标题 string 长度建议在20个字
abstract 摘要 string数组 添加摘要有利于召回
referer HTTP Referer string 如果图片有防盗链逻辑,需要设置referer头,用于图片下载
cover_img_url 封面图URL string 图片url访问如果有有效期,建议设置为15天以上
mainbody 正文 string 正文,不可带有html标签
author 作者 Object 作者信息,推荐医疗类填写医生信息
- author_name 作者名字 string
- author_title 作者职务 string
- author_portrait 作者头像URL string 头像尺寸不低于36px*36px。图片url访问如果有有效期,建议设置为15天以上
video 视频 Object数组
- video_title 视频标题 string 如不填,则视为与页面标题一致
- video_length 视频时长 uint32 单位为秒,优先五分钟内短视频
- video_img 视频封面图URL string URL,尺寸不低于686px*288px。图片url访问如果有有效期,建议设置为15天以上
time_publish 发布时间 uint32 unix时间戳,单位秒
time_modify 更新时间 uint32 unix时间戳,单位秒
extra_info 补充字段 Object 通用字段无法满足要求时,需要额外补充的字段,具体字段内容需要与微信协商