240 发简信
IP属地:山西
  • 7.阿里大数据——大数据建模

    一、为什么需要数据建模 数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。适合业务和基础数据存储环境的模型,大数据能...

  • Resize,w 360,h 240
    6.阿里大数据——数据服务

    数据部门产出的海量数据,如何能方便高效地开放出去,是我们一直要解决的难题。 一、服务架构演进 DWSOA:由数据驱动,一个需求开发一个或几个接口...

  • Resize,w 360,h 240
    5.阿里大数据——实时技术

    数据的实效性一般分三种: 离线:在今天(T)处理N天前(T-N,N>=1)的数据,延迟时间粒度为天。 准实时:在当前小时(H)处理N小时前(H-...

  • 4.阿里大数据——离线数据开发

    阿里巴巴的数据计算层包括两大体系: 数据存储及计算平台离线计算平台MaxCompute实时计算平台StreamCompute 数据整合及管理体系...

  • Resize,w 360,h 240
    3.阿里大数据——数据同步

    数据采集: 日志采集 数据同步 一、数据同步 数据从业务系统同步进入数据仓库 1.源数据类型 关系数据库的结构化数据:mysql、oracle、...

  • 2.阿里大数据——日志采集

    Aplus.JS:是web端日志采集技术方案 UserTrack:APP端日志采集技术方案 一、浏览器的页面日志采集 页面浏览日志采集页面浏览量...

  • 1.理清稀里糊涂的数仓分层

    阿里巴巴大数据体系架构:数据采集层——数据计算层——数据服务层——数据应用层 数仓架构: ODS:操作数据层(Operational Data ...

  • Resize,w 360,h 240
    打卡第七天-线性分类器损失函数与最优化(下)

    Softmax vs. SVM 10是正确的分类所得分数 问题:假设我选择一个数据点,并稍微抖动了一下(稍微改变了它的分数)。在这两种情况下,损...

  • Resize,w 360,h 240
    打卡第六天-线性分类器损失函数与最优化(上)

    SVM损失 计算公式如图:svm-loss 当loss是0时,w的值可能是比例放大的值,w没有的限制范围。 权重正则化 L2是常用的方法 sof...