常见问题
通用搜索
几个搜索接口(标准搜索API - GenericSearch、多阶段流式API-AISearchV3、增强版搜索API(待上线) - GenericAdvancedSearch)的区别
三个接口中的GenericSearch与AISearchV3是等价的,AISearchV3是流式SSE格式;GenericAdvancedSearch是增强版接口,召回结果中增加了权威网页、多样性网页召回,提供更多的返回结果。
搜索结构中的翻页与每页大小是否可调整?需要更多结果如何处理?
目前支持翻页(通过page参数),暂不支持每页数量调整;需要更多结果需要通过调整page多次调用
返回的结果可能多余或者少于10条,不是严格返回10条?
是的,主要原因是存在两种过滤逻辑:1. 召回结果中有极少量需要过滤的站点,2. 通过rerank做排序时,会对相关度很低的站点(<0.3)进行过滤,导致数量小于10条。多于10条是由于召回的有新闻资讯(news_uchq)类卡片,一个卡片包含10条结果,展开后最大可达19条。
使用Python测试样例代码,报错:AttributeError: 'NoneType' object has no attribute 'get_credential'
此错误由于config中的access_key_id/access_key_secret配置为空导致,请确保您的环境变量设置正确。
使用Python测试样例代码,报错:[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate
此错误由于SSL证书过期导致,需要本地将旧证书删除重新安装最新版本的certifi包
下单后,控制台为什么一直是开通中状态?
参考联网搜索【测试/正式】开通说明流程。下单后,默认开通测试账号(15天有效),系统只显示正式账号状态,不显示测试状态(此时可以调用接口测试)。如需要转正式请联系我们。
query长度为什么限制[1,100],query词的最佳实践?
目前的开放域搜索引擎是面向关键字搜索优化的,query超长会降低检索精度。故请求时建议将原始复杂问题通过模型改写为1-4个关键字进行检索(也可以1改N)。建议长度<15,在RT、相关性两个方面都能更优。
索引构建的时效性如何,是否能够爬取今天最新的内容?
不同的网页有不同的更新频率,大部分网页是天级更新的,资讯类的是分钟级更新的,对于热点类是通过垂类API进行获取(SceneItem),也有部分网页是周级或者月级更新。
测试账号转正式账号后,是否需要更换AK或者API-Key,代码是否需要变化?
测试转换为正式,只会涉及到账号状态的变化,如果两个阶段使用的是相同的阿里云账号下单的,则代码(包括AK等)都不需要变化。转正式后会进入正常计量、计费流程;按照后付费每日推送账单。
是否能够在阿里云机房通过私网访问IQS服务?
如果您的客户端在阿里云的VPC中,可以使用vpc-endpoint来访问我们,目前支持8个region的endpoint;参考服务接入点
有一些时效性的问题在结果中召回的不好,如:"今天上海天气如何",“英伟达股价”,“200美元能兑换多少人民币”
这一类query比较难以通过网页索引来得到结果,我们会通过[概览]场景化API召回SceneItem的垂类API来进行召回补充,如果sceneItem中有召回,可以优先选择(可以直接将这部分结果交给模型的context)。目前已支持天气、时间、日期等场景,后续会逐步补充其他场景
返回结果中的publishTime与实际链接中的时间不一致?
由于网页发布时间是通过算法进行预测的,存在极少量时间存在不够准确的问题,后续会持续优化。
召回结果中的mainText与实际连接中的正文存在不一致?
部分网页是动态内容,mainText返回的是缓存结果(会定期更新),在极少量场景存在更新时间不一致的情况。此问题会在4月初进行优化。长期来看,这里面的很大一部分问题会使用SceneItem的垂类API解决。