本文主要教您如何快速上手阿里云云原生数据湖分析DLA Presto CU版本。

操作步骤

  1. 创建虚拟集群
    与Serverless Presto扫描版不同,在CU版本下执行SQL前,必须要创建一个虚拟集群。具体请参见虚拟集群管理
    说明 创建虚拟集群时,选项引擎选择Presto
  2. 配置数据源网络
    说明 如果需要连接您VPC内的数据源(如VPC内的RDS、AnalyticDB等), 您需要配置数据源网络,如不需要连接,忽略此步骤即可。
    1. 在配置数据源网络前,您需要授予DLA账户访问您VPC相关API的权限,详细操作步骤请参见配置数据源网络
    2. 虚拟集群管理页面单击详情,进入集群详情页面。tp
    3. 单击新增数据源网络,选择您想要连接的数据源对应的虚拟网络交换机Id安全组Idtp
      • 交换机ID可以在您VPC内数据源的基本信息页面获取,以RDS为例。tp
      • 安全组ID可以登录VPC控制台获取。tp
        说明 这里安全组可能会有多个,选择一个可以访问您数据源的安全组即可。
  3. 执行SQL
    在CU版本下,当您创建好虚拟集群,首次开始执行SQL时,您会发现系统已经默认自动生成一个公共数据集。tp
    在左边列表中选中public_dataset_xxx这个库,并且执行SQL语句,例如:
    /*+cluster=dladw*/SELECT * FROM `nation` LIMIT 20;
    说明 cluster是您之前创建的虚拟集群实例名称。

    更多关于DLA SQL用法的详细操作,请参见常用SQL