shudaxu - 简书

发简信

shudaxu

1
关注
57
粉丝
138
文章
131791

字数
43

收获喜欢
1

总资产

IP属地：上海

shudaxu

关于证实与证伪
其实，能否/是否被“证实/证伪”都是一些相对的状态与概念。很多“科学”的结论与认知存在时间上的局限性。 1、无法证实，只能证伪 Causal inference中，我们可以通...

2683 0 0
shudaxu

Types of Generalization，Can Memorization Generalize?
问题1：Memorization can't generalize？由wide&deep文中定义：Memorization can be loosely defined a...

433 0 0

shudaxu

分与合
大部分的拆分与组合，本质都是在trade off甚至不少明星大佬的离婚与结婚，也是在权衡即时的付出与未来潜在的收益（笑）模型拆分训练是否应该拆分，拆分粒度的影响：多场景一...

321 0 1
shudaxu

线性系统在广告产品中的发展
在各种体系设计与问题建模中，线性系统往往能帮助我们做很多简化，使得很多问题的求解上变得更容易，并且有更好的解析解，更优的bound，更好的收敛理论。例如各种规划，控制理论中对...

495 0 0
shudaxu

关于工业界variance的简单定性数值分析
Variance估计的难处再次回顾一下Bengio 对当代DNN的理解：Machine learning is essentially a form of applied ...

530 0 0
shudaxu

建模/指标/系统设计
由于在广告，推荐，营销，甚至很多更特定的业务场景中，整个链路囿于资源局限性，通常在一定工程与算法的限制下，被拆分成了多个模块。一个typical的链路：召回粗排精排OR层[出...

1245 0 0
shudaxu

预估数值校准分析
1、充分拟合的模型，分某特征取值维度在训练集上积分（例如区分产品类型进行预估值积分），是否等于训练集上的统计值。 A：不是，需要具体分析。 a、理想状态，当模型排序能力100...

632 0 1

shudaxu

模型排序能力与用户相关性
在推荐场景下，模型auc大于0.5，其排序能力一定高于随机吗？模型离线评估auc大于0.5，上线后发现与随机推荐没差别？排序的商品结果与用户没有相关性？关于相关性与偏置信息...

862 0 1
shudaxu

Entropy，Gini ，Information gain
Entropy 信息量：值域发生概率越小，信息量越大。不确定性越高，信息量越大。信息熵：值域,更确切为：，为类别数量：Skewed Probability Distribu...

2291 1 1
shudaxu

Necessity of causal inference
必需做Causal Inference的根源在于：The “fundamental problem of causal inference” (Holland, 1986) ...

248 0 0
shudaxu

策略Infrastructure
何谓好的 Infrastructure 好的infra意味着：“无论在这些点上用多么山寨雷人的方法去做，只要tech driver的解释能力足够强，那么结果就能得到保证，用机...

423 0 0
shudaxu

Variance in Contextual Bandit
Variance问题：对于Bandit中，一类核心的方法是给出估计的confidence Interval，然后根据其Upper Bound来进行bandit。主要有TS与...

327 0 0

shudaxu

Bias in Evaluation（model & policy）
问题解决评估本身存在bias的问题。评估policy评估model 0、根源问题虽然我们对于模型本身的训练。policy本身的设计。都考虑到了各种bias的问题。试图在某种...

369 0 0
shudaxu

Variance in GLM with penalty
理解 estimator param的variance到底意味着什么，我们为什么需要研究它？当代工业界复杂模型（namely DNN）的variance如何，为何需要Shri...

154 0 0
shudaxu

Variance in OLS/GLM
对于GLM来说，如何估计其prediction 的Confidence Interval？以及如何估计其Coefficients 的Variance？【这个常常在线性模型用以...

776 0 0
shudaxu

Debiasing：Formulation & Summarize
Formulation： Bias的类型其实有很多，其中有的是非常明确的，而有的问题并非well defined。我们这里讨论如何将各种Bias都准确地形式化出来，构建一个体...

617 0 0
shudaxu

Confounding Bias & Selection Bias
Confounding bias [1]& Selection bias[2]的差异与相似处。之前的文章从直觉上讨论了系统中的各种bias。其实Selection Bias...

863 0 0

shudaxu

Causal Effect Estimation
Causality & Correlation "相关性（Correlation/Prediction/Association）不意味着因果关系（Causality）”。但经...

1372 0 0
shudaxu

目标设计：方法
目标形态多样性推荐，搜索，广告这些业务的形态，在目标上有很大的差异。特别是在现在越来越复杂的产品中，不同的产品对这些业务有这不同的诉求与目标。 1、基本形态目标最基本的搜索...

340 0 0
shudaxu

机制设计：形态
机制设计的核心地位不同的业务，场景，共同形成了客观意义上的产品。而整个产品的参与者与产品的交互构成了该产品的生命形态。（参与者包含了用户，客户以及员工等等）（譬如小红书，它...

490 0 0

个人介绍

狼厂策略工程师

分享策略算法的原理与经验，以及少数工程框架的知识内容