前言 网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。爬虫可以通过模拟浏览器访问网页,从而获取数据,一般网页里会有很多个URL,爬虫可以访问这些URL到达...
前言 网络爬虫,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。爬虫可以通过模拟浏览器访问网页,从而获取数据,一般网页里会有很多个URL,爬虫可以访问这些URL到达...
本文参考自:《ZooKeeper: Distributed process coordination》 Zookeeper 简介 Zookeeper 最初是由 Yahoo 公...
markdown 中有专门为代码设置的语法,这样看起来就不乱了
解读java.lang包下Object类的API(二)一、notify() public final native void notify(); 从对象所有等待中的线程选择一个线程,让他开始执行 一般与wait() sync...
原文:InfoQ 作者 郭俊 简介 Kafka是一种分布式的,基于发布/订阅的消息系统。使用Scala编写,它以可水平扩展和高吞吐率而被广泛使用。 Kafka架构 T...
1. Kafka internal 1.1 Request processing Kafka 的 request 分为: produce request fetch requ...
1. Producer Producers 负责生产消息。消息成功写到 topic 后,broker 会返回 producer 消息的 topic, partition & ...
What's kafka What's kafka Kafka 可以提供 MQ 功能:发布 & 订阅消息 Kafka 可以提供 stream processing 功能 Ka...
每天起床,总有一种深深的空虚感围绕着我,如鲁迅而言,孤单感像大蛇一样缠绕着我。2017年即将过去,回顾这一年,我做了什么? 好吓人,竟然想不起来。日子过的有点浑浑噩噩的,不知...
1. string 类型分两种: (https://www.elastic.co/blog/strings-are-dead-long-live-strings) keywo...
Redis-sentinel是Redis实例的监控管理、通知和实例失效备援服务,是Redis集群的管理工具。在一般的分布式中心节点数据库中,Redis-sentinel的作用...
一、持续集成(Continuous Integration) 要了解GitLab-CI与GitLab Runner,我们得先了解持续集成是什么。 持续集成是一种软件开发实践,...
1. 简介 volume 是将 host 目录树中的某个目录/文件挂载到 docker container 目录树中,可以用来存储和共享持久化数据,独立于具体的 contai...
Analyzer(分析器) https://cwiki.apache.org/confluence/display/solr/Understanding+Analyzers,...
第五章:分解单块系统 事务边界 事务可以保证一些事件要么都发生,要么都不发生。在插入数据库时,这一点非常有用。 服务一定会慢慢变大,直至大到需要拆分。关键是要在拆分这件事变得...
第一章:微服务 1.1 什么是微服务 微服务就是一些协同工作的小而自治的服务。它很小,专注做好一件事。服务越小,微服务架构的优点和缺点也就越明显。 微服务独立部署在 PAAS...
关于微服务,龙军在之前已经做过分享,在开发口袋提供给 dr 后台的服务时,已经引入了 Spring boot 等技术栈,但总觉得自己理解的很肤浅,没有形成一个体系化的认知,更...