更通俗的解释是:如果map按照split读取数据时发现最后一行数据没有遇到\n换行符,则会去下一个split中读取数据直到遇到\n为止,第二个map读取数据时会查看上个map的split数据的最后一行是不是\n,若果不是说明本split的第一行数据已经被读取,自己从第二行开始读取;
这段是什么意思啊请问?如果查看上个map数据最后一行不是\n换行符,说明split的第一行数据已经被读取?
MapReduce执行过程(长文)参考资料: Hadoop权威指南第四版第七章 一、MapReduce是个what? 首先说下Hadoop 的四大组件:HDFS:分布式存储系统。MapReduce:分布式计算...