一些具有敏感词汇的关键字可以通过添加一些简单的特殊字符通过检测。
例如,测试文本为“激情少妇”时,检测出不合法内容,这个是ok的
但是,我把测试文本修改为“激情少á妇”,就可以通过检测
我是直接使用postman进行测接口测试。
我在看《内容安全》这部分文档时,并未在宣传中找到提及增强接口比基础接口有更强更智能的检测能力,仅提到了增加并发和总数,提供内容分析。
所以横向对比了还包括但不限于,百度AI和网易易盾等平台的文本审核功能。
我从他们的体验页面上,选取了一些测试用例,使用基础接口进行测试,基本每个都中招了,全能通过测试。
为了让我的帖子能发出来,这些测试用例我暂时不贴了。
总之基础接口的安全系数真的值得商榷,增强接口是否有对这部分进行“增加”?
绕过的方法太多了,估计很难百分百精准检测,官方接口只是能过滤掉大多数,人工审核机制还是少不了,人工抽检、巡检得安排。
对一些时效性要求较高的的应用,例如游戏内的聊天等,人工审核必定无法胜任。
而且,官方过滤掉的绝对不是“大多数”,而是“少部分”明显的。同音,谐音,符号,语义实体,情感倾向都没有做判断。很像是仅对关键字做了判断。
我只是希望官方可以增强接口上的功能。
确实很大问题,好多的词都识别不了。太坑了,其它云平台的试过都能检测到