240 发简信
IP属地:澳门
  • 120
    在剽悍一只猫的训练营我到底得到了什么?

    想要进步,想要赚钱,想要跳进更高阶层的我终于没能抵制住诱惑进入了剽悍一只猫的22天行动训练营。 22天过去了,我得到了些什么呢? 第一,阅读速度由普快变高铁。 阅读一直是我所...

  • 120
    如果没有明天

    读后感 作者:林清玄 作者以日记本的故事开头,疑问为什么不记日记了呢,朋友回答说“其实是觉得生活这样单调、空洞、乏味,每天都在重复着,到底有什么好写呢?”作者以这句话切入,...

  • 120
    爱自己,生活才会爱你

    由包贝尔、王千源主演的《大人物》这部电影,有触动我内心的地方、有让我拍手叫好的地方,也有让我万分抵触讨厌的群体,在大人物、大事件面前,小人物的反应刻画的细致入微。 首先介绍一...

  • 2019年度个人总结

    1. 工作总结 收获:MapReduce已熟悉,可独立完成。在简单了解新技术后,要快速上手实践,写着写着就知道问题在哪里了,有些拦路虎是假象的,先动手做起来。 3月份的重点任...

  • 可复制的领导力 之二级反馈

    来源:樊登读书会 反馈是你对别人做的事的表扬或批评,所有的反馈都是基于事实、现象,区别于观点,来判断下面这两句话哪个是观点哪个是事实:1.小张,你最近经常迟到;2.小张,我看...

  • 120
    微梦想清单

    学习了Angie老师时间管理训练营的课程,我的第一个念想是微梦想,这么简单,简单到我随时随地都可以完成一件。我列出了我的微梦想清单。 01 个人提升 1. 本月完成时间管理课...

  • 就因为没时间才什么都能办到-听后感

    这本书的作者是日本吉田穗波,她是一名妇产医师,如今是五个女儿的妈妈,在怀孕三女儿时既要上班,又要照顾大女儿和二女儿,又要在六个月的时间内准备哈佛留学。 我在知道穗波女士的境遇...

  • 120
    Spark on Yarn之Executor内存管理

    本文1、2、3节介绍了Spark 内存相关之识,第4节描述了常见错误类型及产生原因并给出了解决方案。 1 堆内和堆外内存规划 Executor 的内存管理建立在 JVM 的内...

  • 120
    《高效能人士的七个习惯》读书笔记——习惯一、积极主动

    小提示:如果没有时间的话,建议直接拉到文章最后,看“付诸行动”。 人性的本质是主动而非被动的,人类不仅能针对特定环境选择回应方式,更能主动创造有利的环境。最令人鼓舞的事实,莫...

  • 对不起,没有

    DC学院_数据爬取2018-01-23

    使用API爬取网页数据 问题:获取1000部豆瓣电影的评分 爬虫 1. 确定爬取链接 2. 读取链接指向的内容 3. 从中抽取关键元素 基于网站API的爬虫编写 1. 在网站...

  • 120
    金字塔原理

    2018.4.23(证明我读过这本书并影响了我) 第一章为什么要用金字塔。 金字塔原理是唯一合理的架构,用于组织思想、写文章、讨论、沟通,因为金字塔结构符合大脑想问题(记忆知...

  • 120
    python:将一个文件按文件中的字段值分写到以字段值命名的新文件中

    近来有一个需求:计算文件的tfidf值,然后将整个文件拆分,写到以tag_id_act命名的信文件中。我的文件字段为[tag_id, act, word, tf, idf]。...

  • 这里有两个陷阱:1. 某个记录如果A文件有,B文件没有,最后合并时也会输出该记录。
    2. 在我的案例中,因为有的分词是相同的,所以如果按分词作为a的索引,则会导致最后只保留一个结果。

    使用awk按某一属性合并两个文件

    awk内建变量 awk操作A和B两个文件,这两个文件是用来计算TF-IDF的,A文件记录了词频,B文件记录了每个词在文档中出现的次数,现在要对A、B两个文件进行合并。总共有5...

  • 120
    使用awk按某一属性合并两个文件

    awk内建变量 awk操作A和B两个文件,这两个文件是用来计算TF-IDF的,A文件记录了词频,B文件记录了每个词在文档中出现的次数,现在要对A、B两个文件进行合并。总共有5...