踹不死的小强

发简信

踹不死的小强

18
关注
6
粉丝
4
文章
2805

字数
3

收获喜欢
8

总资产

IP属地：湖南

踹不死的小强

如何高效的向Redis中插入大量数据
┌───────────────────────────────────────────────────┐│2019年12月23日18:55:55更新│ 若redis有密码...

香山上的麻雀
2856 7 17
踹不死的小强

国内稳定的免费API接口，我也来分享下
多多点赞，因为分享是一种美德 http://zhouxunwang.cn/api_a.php?id=25 位置查询 http://zhouxunwang.cn/api_a.p...

在路上_eceb
8537 15 234

踹不死的小强

数仓--Hive-面试之Hive动态分区
面试如果被问道，那么需要说出彩来，特别时参数 Hive动态分区参数配置往hive分区表中插入数据时，如果需要创建的分区很多，比如以表中某个字段进行分区存储，则需要复制粘贴修...

李小李的路
3589 0 7
踹不死的小强

Spark Streaming和Kafka集成深入浅出
写在前面本文主要介绍Spark Streaming基本概念、kafka集成、Offset管理本文主要介绍Spark Streaming基本概念、kafka集成、Offse...

data之道
13223 1 28
踹不死的小强

提交Spark作业，科学设定spark-submit参数
首先摆出我们常用的一种设定。关于spark-submit的执行过程，读Spark Core的源码能够获得一个大致的印象。今天事情比较多，所以之后会另写文章专门叙述关于Spa...

LittleMagic
3151 0 10
踹不死的小强

Hbase--为什么不建议在Hbase中使用过多列族
面试很容易被问到，也容易被问倒！！！Hbase官网建议每张表的列族数建议设在1-3之间，so，Why?从5个方面说明以下问题：列族数对Flush的影响在Hbase中，调用...

李小李的路
3186 1 11
踹不死的小强

Kafka+Spark Streaming如何保证exactly once语义
在Kafka、Storm、Flink、Spark Streaming等分布式流处理系统中（没错，Kafka本质上是流处理系统，不是单纯的“消息队列”），存在三种消息传递语义（...

LittleMagic
6763 6 27

踹不死的小强

Kafka+Spark Streaming管理offset的两种方法
Kafka配合Spark Streaming是大数据领域常见的黄金搭档之一，主要是用于数据实时入库或分析。为了应对可能出现的引起Streaming程序崩溃的异常情况，我们一...

LittleMagic
10464 10 26
踹不死的小强

Spark--SparkCore面试知识点总结
整理于【Spark面试2000题】Spark core面试篇03 ，梅峰谷大数据 1.Spark使用parquet文件存储格式能带来哪些好处？如果说HDFS 是大数据时代分...

李小李的路
1654 0 14
踹不死的小强

es 在数据量很大的情况下（数十亿级别）如何提高查询效率啊？
面试官心理分析这个问题是肯定要问的，说白了，就是看你有没有实际干过 es，因为啥？其实 es 性能并没有你想象中那么好的。很多时候数据量大了，特别是有几亿条数据的时候，可能...

久伴_不离
1016 0 21
踹不死的小强

六大数据采集平台的架构对比分析
随着大数据越来越被重视，数据采集的挑战变的尤为突出。今天为大家介绍几款数据采集平台：Apache Flume、Fluentd、Logstash、Chukwa、Scribe、S...

丨程序之道丨
3121 1 14
踹不死的小强

数仓--Hive-面试之Hive设置配置参数的方法，列举8个常用配置
Hive设置配置参数的方法 Hive提供三种可以改变环境变量的方法，分别是：（1）、修改${HIVE_HOME}/conf/hive-site.xml配置文件；（2）、命令行...

李小李的路
3184 4 8

踹不死的小强

Hbase--优化之表设计
1-预分区默认情况下，在创建HBase表的时候会自动创建一个region分区，当导入数据的时候，所有的HBase客户端都向这一个region写数据，直到这个region足够...

李小李的路
1011 0 9
踹不死的小强

利用Binlog和Kafka实时同步mysql数据到Elasticsearch(四) - 消费Kafka消息同步数据到ES
目录 1、利用Binlog和Kafka实时同步mysql数据到Elasticsearch(一) - 开启Binlog日志2、利用Binlog和Kafka实时同步mysql数据...

Liuzz25
9595 9 89
踹不死的小强

Spark--数据倾斜解决方案
数据倾斜分为两大类：聚合倾斜和join倾斜，针对不同的倾斜类型采用不同解决方案数据倾斜解决方案上分为：缓解数据倾斜和彻底解决数据倾斜 1.数据倾斜表现形势导致数据倾斜的算...

李小李的路
1526 0 20
踹不死的小强

Spark源码解析
海纳百川_spark 编，30 篇文章，236 人关注

深入解析Spark Core、Spark Streaming源码，彻底精通Spark
踹不死的小强

微服务日志分析之ELKK
所谓ELKK 是指 Elasticsearch, Logstash, Kibana, Kafka 这4个开源日志分析，收集, 分析展现和传输工具。由于 Logstash 是...

老瓦在霸都
4760 0 24

踹不死的小强

flume+kafka+SparkStreaming+mysql+ssm+高德地图热力图项目
一、概述本篇文章主要介绍如何使用SparkStreaming + flume + Kafka 实现实时数据的计算，并且使用高德地图API实现热力图的展示。背景知识：在有...

__元昊__
2426 0 17
踹不死的小强

高广超
写了 289605 字，被 1817 人关注，获得了 2533 个喜欢

互联网一线从业者。<br><br>持续稳定输出技术文档，欢迎关注、欢迎转发。<br>