你好,这个错误是说从你给的图片中识别不到条目,我这里看不到你的图片,请自行检查一下。比如另一个帖子说的同样的问题,他想要识别图片中的身份证,但是他的img_url打开是一个人的照片,是识别不出的 https://developers.weixin.qq.com/community/develop/doc/00024ce6488638f0deebf919e5b000?_at=1641987331791
ocr接口调用始终call api service failed,是什么问题?接口调用返回{"errcode":9301002,"errmsg":"call api service failed request id:[MLzPjofQO9OVPfsUeVdtiJHXTVfmLLxWeHNDX5QIEpB2xXFItI2dEZhIz-qYPlwjZDE] rid = 61de8dba-1f979d7d-14fbe01b rid: 61de8dba-1f979d7d-14fbe01b"},是用得base64方式,调用url是https://api.weixin.qq.com/wxa/servicemarket?access_token=ACCESS_TOKEN。 {"client_msg_id":"1641975224134","data":"{"data_type":2,"img_data":"base64"},service":"wx79ac3de8be320b71","api":"OcrAllInOne"}
2022-01-13你好,爬虫侧查了一下,这个月主动推送触发的爬虫抓取有11k的页面,其中有1.5k的白页,看了下这些白页有一些是因为页面本身内容较少,有些是爬虫打开时页面没有完全加载出来(可能是并发较高,有些请求回吐数据较慢),对于这些无效的页面,爬虫还会再次抓取的
页面内容接入主动推送有大量的无效网页?APPID:wx77deaacf778533d2 pages/third/index?id=49e285307b8b4f83b87b14e1dab20698 pages/third/index?id=858a3c82cfda4ec6aa377b94c1d55302 pages/third/index?id=5b1df4e7fe434efe88b338aae7c49a9b [图片]
2021-04-12你好,爬虫侧查了下,这几天没有对wx9aa0cf2f67693802这个小程序进行爬取,请确认下是否是爬虫的请求?(爬虫访问小程序内页面时,会携带特定的 user-agent "mpcrawler" 及场景值:1129)
https://servicewechat.com/x/145/page-frame大量请求问题?https://servicewechat.com/xxxx/145/page-frame.html大量请求后台,导致业务系统无法正常运行。不知道这个是攻击还是微信的爬虫?页面收录已经关掉了,stiemap.json也已经全部disallow了,但是依然有大量请求到后台去。这个是微信的爬虫还是dos攻击呢?
2021-04-09你好,爬虫侧这里查了下,最近几天每天的爬虫页面量是5~10w,十分钟级别没有超过你所设定的6944/10min,你统计的“抓取量”有可能是请求量,我们打开一个小程序页面一般会有多个请求(跟小程序实现有关),可以降低下频率上限试试,按照目前的量,可以设置每10分钟1k试试
小程序后台—页面内容接入—基础设置—频率上线 此处设置的爬虫次数上限不生效[图片] 频率上线已设置,但是抓取量还是半小时数十万,服务器负载比较大,对我们来说风险很高 [图片]
2021-04-08你好,麻烦提供下appid?对于不想被收录的页面,可以通过设置sitemap来禁止爬虫抓取和搜索展示,具体设置规则可参考: https://developers.weixin.qq.com/miniprogram/dev/framework/sitemap.html
小程序开启内容推送, 但是未推送的也被抓取, 造成信息其它页面被收录2020年9月份与微信搜一搜团队合作 官方区, 服务搜索和"页面内容接入", 其中"页面内容接入"是通过 API 提交的, 当时因为审核没通过就没有接着使用. 21年发现之前提交的都可以被搜索到在小程序里面, 但是没有通过 API 提交的也被爬虫收录了, 那些被收录的都是隐私相关的页面, 现在没法用 API 提交, 因为使用 API 提交需要打开"页面收录"功能, 就会把历史被爬走的隐私页面展示出来, 请解决一下 被爬走的敏感隐私页面
2021-02-24你好,爬虫这里查了下,是推送的页面打开时有个请求耗时较高("https://baidumini.liebiao.com/pm&id=wx742c839d40bf87a6&type=request"),导致有的页面打开白页,错误页面会重新抓取,也请看下这个请求可否优化一下~
微信小程序的页面推送的数据被报很多错误页面,但是打开都是正常的,请问是什么原因导致的?微信小程序的页面推送的数据被报很多错误页面,但是我们使用微信小程序模拟器来打开这些页面都是正常的,请问这些页面错误是什么原因导致错误? AppID:wx742c839d40bf87a6[图片]
2021-01-29你好,这里查了下,有一段时间由于策略问题pages/detail.html这个path的参数被干掉了,现策略已修复,历史错误数据会重跑修复
search.siteSearch 返回的页面路径查询参数缺失参见图片 path 字段 [图片]
2021-01-13你好,这里查了下,是12月10号那天推送的URL在一个流程上延迟了10个小时,导致第二天创建爬虫抓取的时候没有读到数据,这里现在补一下数据。
页面内容接入,主动推送页面后,数据还未更新,麻烦管理员查看一下?按照【页面路径推送】操作,并且也开通了页面收录,推送10w+的页面数据,3个星期了,数据还是没有更新。请问可以查看一下问题吗? appid:wx1e9c4b2a5a93ef76 [图片]
2021-01-04你好,这里查看了下爬虫抓取情况,之前推送的URL都是不存在的URL,最近一周推送的才可以打开 同时你的图中推送页面收录数的曲线是一直没有涨的,涨起来的是总页面收录数(包含爬虫主动发现抓取的,不是来自推送的URL)
小程序页面内容接入很久无增涨了?你好,我们的小程序内容每天都会有新的内容接入,而且每天都会推送到接口让收录,之前一段时间是有增涨,但只是总页面收录增加,推送页面都没有增加,可是从10月31日最后一次增加后,总页面到现在再也不增加了,不知道是什么原因? [图片] 另外,我们小程序每天都会推送几十条上百条新的文章资讯,也没有被收录,不知道是什么原因,麻烦官方帮忙查一下是什么原因呢?谢谢! 小程序APPID:wx189c8d56ffe630a0 小程序名:手机游戏攻略大全
2020-12-29你好,这两天的收录数据卡住了,现已恢复,请再看下? 看了下wx742c839d40bf87a6的抓取情况,发现很多都是有问题的页面呢,比如下面这种,差不多有70%左右打开都是这种 [图片]
小程序已经接入页面内容推送,但是收录数看不到数据,这是什么原因?小程序已经接入页面内容推送,但是收录数看不到数据,这是什么原因呢? AppID:wx742c839d40bf87a6 [图片]
2020-12-29