Google File System Big Table Map Reduce HDFS HBase Hadoop Hadoop 基于硬盘,可以处理海量数据; Spark 基...
Google File System Big Table Map Reduce HDFS HBase Hadoop Hadoop 基于硬盘,可以处理海量数据; Spark 基...
知网 选择 English,论文会多很多,而且下载的事 PDF 版本 搜索 site:gov.cn 就只会显示 ZF 网站的结果Github 里的搜索,一定可以学一下,比如 ...
过去十年引起广泛关注的数据模型是 MapReduce,但 MapReduce 不是一种具有普适性的架构。相反,MapReduce 市场已经转变为 HDFS 市场,并且似乎准备...
Aurora 主要设计理念是降低 I/O,异步写 Page,并且把这个 task offload 到内部存储系统。存储计算解耦,可以做到分层扩容。比如说计算节点增加 500 ...
摘要 摘要注重逻辑和高度概括性,我的基本写作思路是: 社会背景 -> 技术背景 -> 动机 -> 主要工作高度概括,并点名解决了什么问题 -> 收束,其中收束我认为可以是实验...
动机 小论文要翻译之后放在大论文,Latex 里面有很多内嵌公式、图引用等等。最后采用了 CopyTranslator,这种方式,大大减少了工作成本。CopyTranslat...
注释快捷键 这个总是忘,在 Overleaf 里只要用 Ctrl + / 即可,但是我们大部分时候都处在大变动时期。 这个时候我们一般都用本地的 TexStudio + Te...
数据模型 数据模型是对现实世界数据特征的抽象,就是字面意思,数据建模。 实体:一个人 属性:实体的某一特征 码:key,也可以说是键 数据操作 查询 更新(插入、删除、修改)...
抽象语法树 一个 SQL 提交到数据库,首先经过连接器将 SQL 语句交给语法分析器,生成一个抽象语法树(AST)。 逻辑计划 AST 经过语义分析与优化器,进行语义优化,使...
忽略那些错误日志 CTex 很多错误我们忽略掉,不要强迫症,要想到我们最初只是想要免于排版而已,不用去纠结很多细节。 中文乱码恢复 http://www.mytju.com/...
语雀写着写着就会觉得排版很丑,所以总是在换编辑器。后来发现 Markdown 复制进去自动转换之后还挺好看的,然后实验了几次,为了防止自己在写作的时候纠结各种工具,对自己约束...
数据库的发展主要经历了OLTP 关系型数据库、OLAP 数据仓库、大数据、“云原生 + 分布式”一体化四个阶段,如图所示: 1)1960 年代 关系数据库之父 E.F.Cod...
机器学习技术给数据库发展带来新的机遇。但是,由于机器学习算法在训练数据、模型设计方面有昂贵代价,而且数据库技术本身存在诸多问题,二者在结合过程中还面临着很多挑战。 SageD...
评测基准是衡量数据库系统性能的一把尺子,引导着数据库系统的发展方向。 针对 AP 数据库,设计了 Touchstone 针对 TP 数据库,设计了 Lauca 大规模事务负载...
Quad-tree 是什么? 顾名思义,四叉树(Quad-tree)就是不断的四等分空间矩形,如此递归下去,直至树的层次达到一定深度或者满足某种要求后停止分割。四叉树的结构比...
[1] Kraska, Tim, Alex Beutel, Ed H. Chi, Jeffrey Dean, and Neoklis Polyzotis. "The case...
Dabble Kraska 等人提出使用机器学习模型代替传统的 B 树索引,并在真实数据集上取得了不错的效果,但其提出的模型假设工作负载是静态的、只读的,对于索引更新问题没有...
数据库 和 数仓 的本质区别? 数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理,数据仓库 Datawarehouse (Am...
Layout 就是数据分区那个,每个分区有一个 id,大概就是 layout,我们的 layout 其实就是为了迎合 RMI 这个接口,适配上去。 查询的话基本分成三个步骤:...