240 发简信
IP属地:湖南
  • 120
    如何限制S3桶只能被特定私有IP访问?

    1. 概述[https://www.jianshu.com/writer] 在对于数据安全有严格要求的场景中,要确保S3桶的数据只能通过在企业内网的特定机器访问,避免数据外...

  • 120
    使用presto-gateway在多个presto集群间调度任务

    1. 概述 Presto是一个Facebook开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。客户在使用Presto的时候发现单个集群不能满足业...

  • 三大开源数据湖产品选型快速指南

    本文节选翻译自:https://lakefs.io/hudi-iceberg-and-delta-lake-data-lake-table-formats-compared/...

  • 120
    Amazon Backup可以指定服务产品来备份了

    2021年11月18日,Amazon Backup在设定备份资源时,可以定义对应的资源类型。

  • 120
    利用AWS DMS迁移AWS RDS到Auroa测试报告

    1. 测试环境: Source:RDS MySQL 5.7.26, db.r4.2xlarge,1TB GP2 Target: Aurora 2.04.6 (5.7), d...

  • 120
    使用 Amazon Elasticsearch分析SES邮件传递情况

    1.概述 用户通过Amazon Simple Email Serivce(SES)发送邮件时,希望能详细查询每封邮件的传递情况。而SES只提供基于Metric的统计数据。本文...

  • 120
    在AWS MSK中启用用户名密码认证及ACL设置

    1. 概述 Amazon Managed Streaming forApache Kafka(Amazon MSK)是亚马逊云推出的一个完全托管、高度可用且安全的Apach...

  • 120
    AWS Glue中使用Spark SQL

    AWS Glue 是一项完全托管的提取、转换和加载 (ETL) 服务,让客户能够轻松准备和加载数据进行分析。您只需在 AWS 管理控制台中单击几次,即可创建并运行 ETL 作...

  • 120
    使用Apache Airflow调度Glue任务

    Apache Airflow是Airbnb开源的一款数据流程工具,目前是Apache孵化项目。以非常灵活的方式来支持数据的ETL过程,同时还支持非常多的插件来完成诸如HDFS...

  • 通过iptable监听所有端口

    有时候为了测试防火墙是否正确的设置端口过滤,需要连接目标服务器所有端口。如果为此在目标服务器上侦听所有端口,就很麻烦。下面就是一个简单的方法: iptables -t nat...

  • 120
    如何使用AWS Lambda的Layer - Python脚本

    2018年11月29日,AWS推出了Lambda的两个新功能:Custom Runtimes和Lambda Layer。我这里只介绍一下Layer的用法,也是正好用到,发现文...