MLSQL - 专题

投稿

MLSQL

收录了67篇文章 · 146人关注

mlsql流任务实现distinct
流计算场景里distinct很常用，spark sql对 stream dataset不支持 SELECT COUNT(DISTINCT Com...

0.3 hongshen 0 1
为什么去开发一个MLSQL
算法和工程之殇算法和工程结合，有两个非常大的痛点：第一个，算法的着眼点是，用最快速的方式清洗一些数据出来，然后接着建模训练，评估预测效果，之...

0.3 祝威廉 4 16 1

CrawlerSQL 设计
目标首先CrawlerSQL会包含两个服务：调度服务，比如每个url的抓取周期。抓取服务：调度会给url,抓取服务负责实际的抓取在Stre...

祝威廉 0 3
MLSQL如何支持部署SKLearn,Tensorflow,MLLib模型提供API预测服务
部署成API服务时，除了要把raw数据特征化成向量外，研发还要想着怎么加载模型，产生模型的框架五花八门，比如Tensorflow,SKlearn...

0.3 祝威廉 2 6
算法训练和模型部署如何避免多次重写数据预处理代码
前言前段时间，我们对接算法的工程师哭丧的和我说，模型生成后一般都要部署成API的形态对外提供服务，但是算法工程师并没有提供如何将一条数据转化特...

0.3 祝威廉 0 13
MLSQL解决了什么问题
先看看做算法有哪些痛点（我们假设大部分算法的代码都是基于Python的）：项目难以重现，可阅读性和环境要求导致能把另外一个同事写的python...

祝威廉 0 12
是时候丢掉Spark Streaming 升级到Structured Streaming了
前言又是一个超长的标题（摊手┓( ´∀` )┏）。Spark Streaming 历史比较悠久，也确实非常好用，更重要的是，大家已经用熟了，有...

0.5 祝威廉 9 16

MLSQL是如何集成TensorFlow Cluster的
前言我们知道MLSQL支持SKLearn,TF等流行的算法框架，不过虽然支持了多个实例同时运行，但其实每个模型都需要跑全部数据。有的时候数据太...

祝威廉 0 4
谷歌BigQuery ML VS StreamingPro MLSQL
前言今天看到了一篇 AI前线的文章谷歌BigQuery ML正式上岗，只会用SQL也能玩转机器学习！。正好自己也在力推 StreamingPr...

0.1 祝威廉 1 6
如何按程序员思维写分析师脚本
前言今天无意在在某群里，看到一个很复杂的SQL脚本，join很多,子查询很多，union很多，case when也很多。然后就让我们负责分析师...

祝威廉 1 6