其实,能否/是否被“证实/证伪”都是一些相对的状态与概念。很多“科学”的结论与认知存在时间上的局限性。 1、无法证实,只能证伪 Causal inference中,我们可以通...
其实,能否/是否被“证实/证伪”都是一些相对的状态与概念。很多“科学”的结论与认知存在时间上的局限性。 1、无法证实,只能证伪 Causal inference中,我们可以通...
问题1:Memorization can't generalize? 由wide&deep文中定义:Memorization can be loosely defined a...
大部分的拆分与组合,本质都是在trade off甚至不少明星大佬的离婚与结婚,也是在权衡即时的付出与未来潜在的收益(笑) 模型拆分训练 是否应该拆分,拆分粒度的影响:多场景一...
在各种体系设计与问题建模中,线性系统往往能帮助我们做很多简化,使得很多问题的求解上变得更容易,并且有更好的解析解,更优的bound,更好的收敛理论。例如各种规划,控制理论中对...
Variance估计的难处 再次回顾一下Bengio 对当代DNN的理解:Machine learning is essentially a form of applied ...
由于在广告,推荐,营销,甚至很多更特定的业务场景中,整个链路囿于资源局限性,通常在一定工程与算法的限制下,被拆分成了多个模块。一个typical的链路:召回粗排精排OR层[出...
1、充分拟合的模型,分某特征取值维度在训练集上积分(例如区分产品类型进行预估值积分),是否等于训练集上的统计值。 A:不是,需要具体分析。 a、理想状态,当模型排序能力100...
在推荐场景下,模型auc大于0.5,其排序能力一定高于随机吗?模型离线评估auc大于0.5,上线后发现与随机推荐没差别?排序的商品结果与用户没有相关性? 关于相关性与偏置信息...
Entropy 信息量:值域发生概率越小,信息量越大。不确定性越高,信息量越大。 信息熵:值域,更确切为:,为类别数量:Skewed Probability Distribu...
必需做Causal Inference的根源在于:The “fundamental problem of causal inference” (Holland, 1986) ...
何谓好的 Infrastructure 好的infra意味着:“无论在这些点上用多么山寨雷人的方法去做,只要tech driver的解释能力足够强,那么结果就能得到保证,用机...
Variance问题: 对于Bandit中,一类核心的方法是给出估计的confidence Interval,然后根据其Upper Bound来进行bandit。主要有TS与...
问题 解决评估本身存在bias的问题。评估policy评估model 0、根源问题虽然我们对于模型本身的训练。policy本身的设计。都考虑到了各种bias的问题。试图在某种...
理解 estimator param的variance到底意味着什么,我们为什么需要研究它?当代工业界复杂模型(namely DNN)的variance如何,为何需要Shri...
对于GLM来说,如何估计其prediction 的Confidence Interval?以及如何估计其Coefficients 的Variance?【这个常常在线性模型用以...
Formulation: Bias的类型其实有很多,其中有的是非常明确的,而有的问题并非well defined。我们这里讨论如何将各种Bias都准确地形式化出来,构建一个体...
Confounding bias [1]& Selection bias[2]的差异与相似处。 之前的文章从直觉上讨论了系统中的各种bias。其实Selection Bias...
Causality & Correlation "相关性(Correlation/Prediction/Association)不意味着因果关系(Causality)”。但经...
目标形态多样性 推荐,搜索,广告这些业务的形态,在目标上有很大的差异。特别是在现在越来越复杂的产品中,不同的产品对这些业务有这不同的诉求与目标。 1、基本形态目标最基本的搜索...
机制设计的核心地位 不同的业务,场景,共同形成了客观意义上的产品。而整个产品的参与者与产品的交互构成了该产品的生命形态。(参与者包含了用户,客户以及员工等等)(譬如小红书,它...