使用异常

本节将介绍消息队列常见的使用异常问题及相应的解决方案。

无法连接 Broker

可能的原因

  • 您使用的阿里云主机(ECS)与消息队列所属服务器不在同一地域(Region)。

  • 您可能访问在非阿里云主机上的消息队列服务,且您创建的 Topic 不支持非阿里云主机访问。

解决方案:确保阿里云主机与创建的 Topic 在同一个地域。

客户端启动失败,出现“Can not find name server with endpoint”报错

可能的原因:一般是设置的 instanceId、dataCenter(客户端会根据 dataCenter 参数过滤 ACVIP 返回的 sofamqnamesrv 地址)和 endpoint 参数不正确。

解决方案

  1. 检查 instanceId、dataCenter 和 endpoint 参数设置。

  2. 您可以尝试直接请求 acvip,检查返回的数据,如果出现以下两种情况说明数据有问题:

    curl --location --request POST 'http://{替换成用户设置的 acvip endpoint}:9003/antcloud/antvip/instances/get' \ --header 'Content-Type: application/json' \ --data '{"allowPolling" : false,"from": "sofamq-client","clientVersion": "direct_http_json","vipDomainName2ChecksumMap": {"{替换成用户设置的 instanceId}-SOFAMQ": "N"}}'
    • 返回的地址列表为空,说明该用户没有在 portal 里面开通 SOFAMQ,所以地址没有加到对应的 ACVIP 域名。

    • 返回的地址列表不为空,但是没有任何地址的 dataCenter 属性和用户设置的 dataCenter 一致,两者必有一个是错的。具体的 dataCenter 值请登录云游 Local,在 环境设置 > 环境变量 > datacenter 中查看。

启动 Producer、Consumer 失败造成 Group ID 重复

可能的原因:在同一个 JVM 进程里面启动多个 Producer 或 Consumer 实例,且这些实例配置了同一个 Group ID,从而导致客户端启动失败。

解决方案

  1. 确保在一个 JVM 进程中只启动了同一个 Group ID 的一个 Producer 或 Consumer 实例,即可以在一个 JVM 进程中同时启动同一个 Group ID 的一个 Producer 和一个 Consumer 实例,但不能同时启动多个 Producer 或 Consumer 实例。

  2. 重启应用。

主动订阅消息,获取队列列表失败

可能的原因:可能未在控制台上创建该 Topic,导致订阅方启动时获取 Topic 的队列信息失败。

解决方案

  1. 登录消息队列控制台,在左侧导航栏选择 Topic 管理 > 创建 Topic,然后创建 Topic。具体操作步骤请参见 创建 Topic

  2. 在左侧导航栏选择 Group 管理 > 创建 Group ID ,然后创建 Group ID。具体操作步骤请参见 创建 Group ID

  3. 重启应用。

消息显示 Consumed, 但消费端未感知到

可能的原因

  • 业务代码在接收到消息后,不立即打印消息。

    收到消息后,如果直接进入业务逻辑,一旦代码遗漏某个逻辑分支,就会导致消息信息没有被留在业务日志里,造成没有收到消息的假象。建议您收到消息后,立即打印消息信息留存 messageId、timestamp、reconsumeTime 等。

  • 消费端部署了多个消费实例。

    尤其是在调试阶段,消费端不可避免会多次重启,一旦多个消费进程同时存在(进程未退出),那么相当于进入集群的消费模式,多个消费实例会共同分担消费消息。消费端以为没有收到的消息,其实是被另一个消费端接收了。

    您可以到消息队列控制台,进入 Group 管理 > 消费者状态 > 连接状态,查看消费端的实例部署情况(有几个消费实例,各自的连接 IP 等等),然后可以自行排查。

  • 消息消费过程出现未被 Catch 的异常,导致消息被重新投递。

    public class MessageListenerImpl implements MessageListener {
        @Override
        public Action consume(Message message, ConsumeContext context) {
            //消息处理逻辑抛出异常,消息将重试
            doConsumeMessage(message);
            //如果在 doConsumeMessage()方法中出现未被 Catch 的异常,这行日志将不会打印。
            log.info("Receive Message, messageId:", message.getMsgID());
            return Action.CommitMessage;
        }
    }

如果问题还未能解决,请提供本地 SDK 日志,然后 提交工单 获得技术支持。