常见问题

更新时间:

通用搜索

  1. 几个搜索接口(标准搜索API - GenericSearch多阶段流式API-AISearchV3增强版搜索API(待上线) - GenericAdvancedSearch)的区别

    三个接口中的GenericSearchAISearchV3是等价的,AISearchV3是流式SSE格式;GenericAdvancedSearch是增强版接口,召回结果中增加了权威网页、多样性网页召回,提供更多的返回结果。

  1. 搜索结构中的翻页与每页大小是否可调整?需要更多结果如何处理?

    目前支持翻页(通过page参数),暂不支持每页数量调整;需要更多结果需要通过调整page多次调用

  1. 返回的结果可能多余或者少于10条,不是严格返回10条?

    是的,主要原因是存在两种过滤逻辑:1. 召回结果中有极少量需要过滤的站点,2. 通过rerank做排序时,会对相关度很低的站点(<0.3)进行过滤,导致数量小于10条。多于10条是由于召回的有新闻资讯(news_uchq)类卡片,一个卡片包含10条结果,展开后最大可达19条。

  1. 使用Python测试样例代码,报错:AttributeError: 'NoneType' object has no attribute 'get_credential'

    此错误由于config中的access_key_id/access_key_secret配置为空导致,请确保您的环境变量设置正确。

  1. 使用Python测试样例代码,报错:[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate

    此错误由于SSL证书过期导致,需要本地将旧证书删除重新安装最新版本的certifi

  1. 下单后,控制台为什么一直是开通中状态?

    参考联网搜索【测试/正式】开通说明流程。下单后,默认开通测试账号(15天有效),系统只显示正式账号状态,不显示测试状态(此时可以调用接口测试)。如需要转正式请联系我们。

  1. query长度为什么限制[1,100],query词的最佳实践?

    目前的开放域搜索引擎是面向关键字搜索优化的,query超长会降低检索精度。故请求时建议将原始复杂问题通过模型改写为1-4个关键字进行检索(也可以1N)。建议长度<15,在RT、相关性两个方面都能更优。

  1. 索引构建的时效性如何,是否能够爬取今天最新的内容?

    不同的网页有不同的更新频率,大部分网页是天级更新的,资讯类的是分钟级更新的,对于热点类是通过垂类API进行获取(SceneItem),也有部分网页是周级或者月级更新。

  1. 测试账号转正式账号后,是否需要更换AK或者API-Key,代码是否需要变化?

    测试转换为正式,只会涉及到账号状态的变化,如果两个阶段使用的是相同的阿里云账号下单的,则代码(包括AK等)都不需要变化。转正式后会进入正常计量、计费流程;按照后付费每日推送账单。

  1. 是否能够在阿里云机房通过私网访问IQS服务?

    如果您的客户端在阿里云的VPC中,可以使用vpc-endpoint来访问我们,目前支持8regionendpoint;参考服务接入点

  1. 有一些时效性的问题在结果中召回的不好,如:"今天上海天气如何",“英伟达股价”,“200美元能兑换多少人民币”

    这一类query比较难以通过网页索引来得到结果,我们会通过[概览]场景化API召回SceneItem的垂类API来进行召回补充,如果sceneItem中有召回,可以优先选择(可以直接将这部分结果交给模型的context)。目前已支持天气、时间、日期等场景,后续会逐步补充其他场景

  1. 返回结果中的publishTime与实际链接中的时间不一致?

    由于网页发布时间是通过算法进行预测的,存在极少量时间存在不够准确的问题,后续会持续优化。

  1. 召回结果中的mainText与实际连接中的正文存在不一致?

    部分网页是动态内容,mainText返回的是缓存结果(会定期更新),在极少量场景存在更新时间不一致的情况。此问题会在4月初进行优化。长期来看,这里面的很大一部分问题会使用SceneItem的垂类API解决。

周边查询