240 投稿
收录了13篇文章 · 6人关注
  • Resize,w 360,h 240
    学习《文本分析》之文本索引和检索

    前提概述 前提知识回顾传送门: 学习《文本分析》之概述 学习《文本分析》之分词、词性标注及语法树 信息(这里主要指文本)检索是针对用户提出的信息...

  • Resize,w 360,h 240
    学习《文本分析》之分词、词性标注及语法树

    前提概述 上一章我们讲了一些文本分析中一些基本概念,如果未看过的点击这里,了解一下文本分析涉及到的一些技术和方法。 句子的切分和分词 为了对文本...

  • Resize,w 360,h 240
    学习《文本分析》之概述

    文本分析的意义 在我们日常的系统中,拥有的数据80%是非结构化的数据,而其中,大部分是文本的形式。非结构化的文本数据,包括电子邮件、博客、微博、...

  • Resize,w 360,h 240
    流数据处理

    流数据处理的应用 在我们日常生产环境中有这一样的一类数据密集型应用,数据快速到达,转瞬即逝,需要及时进行处理。如:网络监控、电信数据管理、传感器...

  • Resize,w 360,h 240
    机器学习之决策树

    前提概要 决策树是一个预测模型,它表示对象属性和对象类别之间的一种映射。决策树中的非叶子节点表示对象属性的判断条件,其分支表示符合节点条件的所有...

  • 云计算这么火,那到底什么才叫云计算呢?

    最近笔者断断续续被人要求科谱云计算相关的知识,问到最多的莫过于什么才叫云计算?。本着不想多说,直接给你个地址自己看的原则,在这里开篇写收集如下信...

  • Resize,w 360,h 240
    数据清洗与数据集成

    前提概要 在数据爆炸的时代,我们每时每刻都在产生数据;怎样在海量数据中提炼出有价值的东西,这就需要我们有一双火眼金晴;对于一个数据工作者来说,那...

    2.4 oneape15 1 46 2
  • Resize,w 360,h 240
    分布式唯一ID服务架构

    一、背景介绍 在大型互联网应用中,随着用户数的增加;为了提高应用的性能,我们经常需要对数据库进行分库分表操作。在单表时代我们可以完全依赖于数据库...

    0.6 oneape15 0 17
  • Resize,w 360,h 240
    数据的处理流程及系统架构

    作为一个数据科学家了解数据的处理流程及数据处理系统的架构有哪些有很有必要的(废话真多~~)。如果还不知道什么是数据科学家的,让移步我的另一篇文章...

  • Resize,w 360,h 240
    什么是数据科学家?

    定义 数据科学家是伴随着大数据技术的崛起和数据科学的兴起而出现的新的就业岗位。其被评为21世纪最性感的工作。 数据科学家的技能 数据科学家需要具...