背景/目标 本量化系列主要是针对个人或者小型投资团队进行量化+机器学习实操的学习和实践笔记本篇的主要目标是实现mysql数据库的创建和储存历史交易和相关数据的数据表(基于Ma...
背景/目标 本量化系列主要是针对个人或者小型投资团队进行量化+机器学习实操的学习和实践笔记本篇的主要目标是实现mysql数据库的创建和储存历史交易和相关数据的数据表(基于Ma...
背景/目标 本量化系列主要是针对个人或者小型投资团队进行量化+机器学习实操的学习和实践笔记本篇的主要目标是实现对量化策略的框架选择在量化投资学习中,基于以终为始的思想,量化策...
背景:在NLP中,对于两个文本比较和分析的任务,比如文本相似度或者问答模型,因为涉及到两个输入源,如果使用单一的神经网络模型,会使得神经网络需要花费算例和算力去区分两个输入源...
背景:很多情况下,对于异常URL的判别是一项重要的工作,特别是在风控或者是安全防护的环境下。而在很多情况下,是无法获取很多跟URL本身相关的信息源的。比如,数据源受限,你无法...
背景:在使用Github项目的时候,往往会遇到某个Python package对于版本的要求跟当前机器上的版本不符。通常的做法是通过pip install --upgrade...
tmux 是一款终端复用命令行工具,一般用于 Terminal 的窗口管理。在 macOS 下,使用 iTerm2 能应付绝大多数窗口管理的需求。 如上图所示,iTerm2 ...
背景:在softmax函数对vector值进行计算,转换为[0, 1]区间的概率值的时候,往往会先对vector中每个元素减去一个max(vector)值。本文主要记录下对神...
背景:对于Python项目,通常通过pypi将项目封装之后上传开源。好处是对于用户可以更方便的下载安装和使用。目的:本文主要介绍了开源项目包含的文件结构以及如何将开源项目上传...
背景:在Python项目中,涉及到使用虚拟环境来运行项目的需求,主要目的是通过虚拟环境来隔离依赖包的环境,防止依赖冲突的情况。目的:本文主要介绍如何创建虚拟环境运行Pytho...
1. 组合模型对于模型bias以及variance的影响: 定义bias:期望输出与真实标记的差别称为偏差。variance:不同的训练数据集训练出的模型的输出值之间的差异,...
背景:本主题主要介绍在解决Leetcode题中的思想和思维模式。本文通过对求众数的题目类型,对具体思路进行介绍。 如何解题? 目标:找到空间和时间复杂度最优的解法。本题中,时...
背景:在学习深度学习的时候,往往需要做的一个决策是:现在深度学习框架这么多,我应该使用哪种?选取一件趁手的兵器,总是西天取经的第一步。 Who the Super Star?...
背景:目前各种神经网络相关算法,在实验和生产环境中都会大量被应用。那么,如何应用神经网络以及如何优化神经网络,作为一项可以被系统化的工程,流程化实现就显得很有必要且很有价值。...
总结 平台(数据/模型)是众多公司通用的发展前后期必然需求应对业务目标/用户流程的多种建模策略方式,在『线上电商』公司中是共通且模式化的。不同的只是进展程度和技术细节。一些业...
Author: Zongwei Zhou | 周纵苇Weibo: @MrGiovanniEmail: zongweiz@asu.edu References. 官方文档:mu...
问题背景:当数据科学从业者在线下通过TensorFlow/Keras将神经网络模型训练出来之后,因为线上使用Java进行工程实现而与模型无法良好对接,导致形成了工程和策略之间...