240 发简信
IP属地:上海
  • 关于证实与证伪

    其实,能否/是否被“证实/证伪”都是一些相对的状态与概念。很多“科学”的结论与认知存在时间上的局限性。 1、无法证实,只能证伪 Causal inference中,我们可以通...

  • Types of Generalization,Can Memorization Generalize?

    问题1:Memorization can't generalize? 由wide&deep文中定义:Memorization can be loosely defined a...

  • 分与合

    大部分的拆分与组合,本质都是在trade off甚至不少明星大佬的离婚与结婚,也是在权衡即时的付出与未来潜在的收益(笑) 模型拆分训练 是否应该拆分,拆分粒度的影响:多场景一...

  • 线性系统在广告产品中的发展

    在各种体系设计与问题建模中,线性系统往往能帮助我们做很多简化,使得很多问题的求解上变得更容易,并且有更好的解析解,更优的bound,更好的收敛理论。例如各种规划,控制理论中对...

  • 关于工业界variance的简单定性数值分析

    Variance估计的难处 再次回顾一下Bengio 对当代DNN的理解:Machine learning is essentially a form of applied ...

  • 建模/指标/系统设计

    由于在广告,推荐,营销,甚至很多更特定的业务场景中,整个链路囿于资源局限性,通常在一定工程与算法的限制下,被拆分成了多个模块。一个typical的链路:召回粗排精排OR层[出...

  • 预估数值校准分析

    1、充分拟合的模型,分某特征取值维度在训练集上积分(例如区分产品类型进行预估值积分),是否等于训练集上的统计值。 A:不是,需要具体分析。 a、理想状态,当模型排序能力100...

  • 模型排序能力与用户相关性

    在推荐场景下,模型auc大于0.5,其排序能力一定高于随机吗?模型离线评估auc大于0.5,上线后发现与随机推荐没差别?排序的商品结果与用户没有相关性? 关于相关性与偏置信息...

  • Entropy,Gini ,Information gain

    Entropy 信息量:值域发生概率越小,信息量越大。不确定性越高,信息量越大。 信息熵:值域,更确切为:,为类别数量:Skewed Probability Distribu...

  • Necessity of causal inference

    必需做Causal Inference的根源在于:The “fundamental problem of causal inference” (Holland, 1986) ...

  • 策略Infrastructure

    何谓好的 Infrastructure 好的infra意味着:“无论在这些点上用多么山寨雷人的方法去做,只要tech driver的解释能力足够强,那么结果就能得到保证,用机...

  • Variance in Contextual Bandit

    Variance问题: 对于Bandit中,一类核心的方法是给出估计的confidence Interval,然后根据其Upper Bound来进行bandit。主要有TS与...

  • Bias in Evaluation(model & policy)

    问题 解决评估本身存在bias的问题。评估policy评估model 0、根源问题虽然我们对于模型本身的训练。policy本身的设计。都考虑到了各种bias的问题。试图在某种...

  • Variance in GLM with penalty

    理解 estimator param的variance到底意味着什么,我们为什么需要研究它?当代工业界复杂模型(namely DNN)的variance如何,为何需要Shri...

  • Variance in OLS/GLM

    对于GLM来说,如何估计其prediction 的Confidence Interval?以及如何估计其Coefficients 的Variance?【这个常常在线性模型用以...

  • Debiasing:Formulation & Summarize

    Formulation: Bias的类型其实有很多,其中有的是非常明确的,而有的问题并非well defined。我们这里讨论如何将各种Bias都准确地形式化出来,构建一个体...

  • Confounding Bias & Selection Bias

    Confounding bias [1]& Selection bias[2]的差异与相似处。 之前的文章从直觉上讨论了系统中的各种bias。其实Selection Bias...

  • Causal Effect Estimation

    Causality & Correlation "相关性(Correlation/Prediction/Association)不意味着因果关系(Causality)”。但经...

  • 目标设计:方法

    目标形态多样性 推荐,搜索,广告这些业务的形态,在目标上有很大的差异。特别是在现在越来越复杂的产品中,不同的产品对这些业务有这不同的诉求与目标。 1、基本形态目标最基本的搜索...

  • 机制设计:形态

    机制设计的核心地位 不同的业务,场景,共同形成了客观意义上的产品。而整个产品的参与者与产品的交互构成了该产品的生命形态。(参与者包含了用户,客户以及员工等等)(譬如小红书,它...

个人介绍
狼厂策略工程师

分享策略算法的原理与经验,以及少数工程框架的知识内容