🐌 周日到周四更新 😊 145 蜗牛的历程: [入门问题][机器学习][聊天机器人][好玩儿的人工智能应用实例][TensorFlow][深度学习][强化学习][神经网络][...
🐌 周日到周四更新 😊 145 蜗牛的历程: [入门问题][机器学习][聊天机器人][好玩儿的人工智能应用实例][TensorFlow][深度学习][强化学习][神经网络][...
hive中的变量 结果:2.0,2,2.0,2
顺序模型 Sequential 配置学习过程 compile 优化器 optimizer 损失函数 loss 评估标准 metrics 模型保存和加载
1、注意python2和python3的版本差异2、tensorflow不支持python3.5以上的版本,不要安装3.5以上的;3、spyder启动控制台输入spider4...
熵 又称自信息,描述一个随机变量的不确定性的数量。 联合熵 一对随机变量平均所需要的信息量。 条件熵 给定随机变量X的条件下,随机变量Y的条件熵。 互信息 知道了Y的值以后X...
编码问题 hive中默认都是utf-8编码,但是有的数据格式不是utf-8编码,展示会出现问题,需要转换。例:%e8%bf%99%e4%b8%aa%e8%a3%85%e4%b...
HTML 支持的数学符号 http://www.w3school.com.cn/tags/html_ref_symbols.html HTML 支持的希腊字母 HTML 支持...
在堡垒机权限受限的条件下,线上运行python缺少模块,总结解决方法有以下几种: 1、 从其他已有该模块的python文件下拷贝,保存依赖包,在python中添加路径直接调用...
spark上运行xgboost模型,具有内存运行,速度更快,减少数据传输的优势。 1、交互模式测试 使用spark运行xgboost首先需要下载依赖的jar包,下载地址htt...
资料:https://zh.hortonworks.com/blog/5-ways-make-hive-queries-run-faster/Hive官网:https://c...
为了增加代码健壮性,有时候获取数据表分区不能写死固定的时间,或者sysdate(-1)。 因此需要获取表的最新分区,然后取该分区的数据。 1、show partitions ...
1.1 常用线性模型 1.1.1 线性回归,LinearRegression 1.1.2 脊回归,Ridge Regression 1.1.3 套索回归, Lasso 1.1...
引入 array拼接 转成array
数据标准化 数据分割函数 模型训练、预测、计算准确率 计算精确率、召回率、F1分 Pipelines
常用函数
word2vec 训练结果测试 模型保存和加载 如果模型训练完成(不再更新),可以在wv中转换gensim.models.KeyedVectors实例来避免不必要的内存消耗 ...