三半俊秀 - 简书

发简信

三半俊秀

10
关注
12
粉丝
34
文章
28407

字数
53

收获喜欢
2

总资产

IP属地：河北

三半俊秀

Flink
Google File System Big Table Map Reduce HDFS HBase Hadoop Hadoop 基于硬盘，可以处理海量数据； Spark 基...

218 0 1
三半俊秀

搜索/知网技巧
知网选择 English，论文会多很多，而且下载的事 PDF 版本搜索 site:gov.cn 就只会显示 ZF 网站的结果Github 里的搜索，一定可以学一下，比如 ...

122 0 1

三半俊秀

【读红宝书（一）】背景知识
过去十年引起广泛关注的数据模型是 MapReduce，但 MapReduce 不是一种具有普适性的架构。相反，MapReduce 市场已经转变为 HDFS 市场，并且似乎准备...

163 0 1
三半俊秀

云原生库趋势
Aurora 主要设计理念是降低 I/O，异步写 Page，并且把这个 task offload 到内部存储系统。存储计算解耦，可以做到分层扩容。比如说计算节点增加 500 ...

121 0 1
三半俊秀

【论文通用结构】启发式论文结构模板
摘要摘要注重逻辑和高度概括性，我的基本写作思路是：社会背景 -> 技术背景 -> 动机 -> 主要工作高度概括，并点名解决了什么问题 -> 收束，其中收束我认为可以是实验...

505 0 1
三半俊秀

【翻译工具】CopyTranslator
动机小论文要翻译之后放在大论文，Latex 里面有很多内嵌公式、图引用等等。最后采用了 CopyTranslator，这种方式，大大减少了工作成本。CopyTranslat...

603 0 1
三半俊秀

Latex 备忘录
注释快捷键这个总是忘，在 Overleaf 里只要用 Ctrl + / 即可，但是我们大部分时候都处在大变动时期。这个时候我们一般都用本地的 TexStudio + Te...

366 0 1

三半俊秀

【数据库笔记（一）】数据库系统概论-萨师煊
数据模型数据模型是对现实世界数据特征的抽象，就是字面意思，数据建模。实体：一个人属性：实体的某一特征码：key，也可以说是键数据操作查询更新（插入、删除、修改）...

202 0 1
三半俊秀

数据库 SQL 执行过程
抽象语法树一个 SQL 提交到数据库，首先经过连接器将 SQL 语句交给语法分析器，生成一个抽象语法树（AST）。逻辑计划 AST 经过语义分析与优化器，进行语义优化，使...

192 0 1
三半俊秀

记一次 Latex 编码错误
忽略那些错误日志 CTex 很多错误我们忽略掉，不要强迫症，要想到我们最初只是想要免于排版而已，不用去纠结很多细节。中文乱码恢复 http://www.mytju.com/...

255 0 1
三半俊秀

语雀书写规则（面向自己）
语雀写着写着就会觉得排版很丑，所以总是在换编辑器。后来发现 Markdown 复制进去自动转换之后还挺好看的，然后实验了几次，为了防止自己在写作的时候纠结各种工具，对自己约束...

1612 0 1
三半俊秀

数据库历史
数据库的发展主要经历了OLTP 关系型数据库、OLAP 数据仓库、大数据、“云原生 + 分布式”一体化四个阶段，如图所示： 1）1960 年代关系数据库之父 E.F.Cod...

322 0 1

三半俊秀

基于机器学习的数据库技术
机器学习技术给数据库发展带来新的机遇。但是，由于机器学习算法在训练数据、模型设计方面有昂贵代价，而且数据库技术本身存在诸多问题，二者在结合过程中还面临着很多挑战。 SageD...

595 0 1
三半俊秀

【博】数据库系统性能评测与质量管理-李宇明
评测基准是衡量数据库系统性能的一把尺子，引导着数据库系统的发展方向。针对 AP 数据库，设计了 Touchstone 针对 TP 数据库，设计了 Lauca 大规模事务负载...

217 0 1
三半俊秀

Quad-tree
Quad-tree 是什么？顾名思义，四叉树（Quad-tree）就是不断的四等分空间矩形，如此递归下去，直至树的层次达到一定深度或者满足某种要求后停止分割。四叉树的结构比...

1331 0 1
三半俊秀

【SIGMOD ‘18】The Case for Learned Index Structure
[1] Kraska, Tim, Alex Beutel, Ed H. Chi, Jeffrey Dean, and Neoklis Polyzotis. "The case...

379 0 1
三半俊秀

【软件学报】基于中间层的可扩展学习索引技术
Dabble Kraska 等人提出使用机器学习模型代替传统的 B 树索引，并在真实数据集上取得了不错的效果，但其提出的模型假设工作负载是静态的、只读的，对于索引更新问题没有...

476 0 1

三半俊秀

数据库、数据仓库和数据湖
数据库和数仓的本质区别？数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理，数据仓库 Datawarehouse (Am...

222 0 1
三半俊秀

破题点
Layout 就是数据分区那个，每个分区有一个 id，大概就是 layout，我们的 layout 其实就是为了迎合 RMI 这个接口，适配上去。查询的话基本分成三个步骤：...

161 0 1

个人介绍

我要解耦生命与浪漫的依赖