240 发简信
IP属地:江苏
  • 120
    机器学习&人工智能博文链接汇总

    🐌 周日到周四更新 😊 145 蜗牛的历程: [入门问题][机器学习][聊天机器人][好玩儿的人工智能应用实例][TensorFlow][深度学习][强化学习][神经网络][...

  • 一些常用tips

    hive中的变量 结果:2.0,2,2.0,2

  • keras-常用函数

    顺序模型 Sequential 配置学习过程 compile 优化器 optimizer 损失函数 loss 评估标准 metrics 模型保存和加载

  • python软件、版本、环境

    1、注意python2和python3的版本差异2、tensorflow不支持python3.5以上的版本,不要安装3.5以上的;3、spyder启动控制台输入spider4...

  • 熵 又称自信息,描述一个随机变量的不确定性的数量。 联合熵 一对随机变量平均所需要的信息量。 条件熵 给定随机变量X的条件下,随机变量Y的条件熵。 互信息 知道了Y的值以后X...

  • 编码问题&html实体转换

    编码问题 hive中默认都是utf-8编码,但是有的数据格式不是utf-8编码,展示会出现问题,需要转换。例:%e8%bf%99%e4%b8%aa%e8%a3%85%e4%b...

  • HTML实体

    HTML 支持的数学符号 http://www.w3school.com.cn/tags/html_ref_symbols.html HTML 支持的希腊字母 HTML 支持...

  • 堡垒机缺少python模块解决方案总结

    在堡垒机权限受限的条件下,线上运行python缺少模块,总结解决方法有以下几种: 1、 从其他已有该模块的python文件下拷贝,保存依赖包,在python中添加路径直接调用...

  • 在Spark中使用xgboost训练模型

    spark上运行xgboost模型,具有内存运行,速度更快,减少数据传输的优势。 1、交互模式测试 使用spark运行xgboost首先需要下载依赖的jar包,下载地址htt...

  • Hive 配置参数汇总

    资料:https://zh.hortonworks.com/blog/5-ways-make-hive-queries-run-faster/Hive官网:https://c...

  • Hive获取最新分区

    为了增加代码健壮性,有时候获取数据表分区不能写死固定的时间,或者sysdate(-1)。 因此需要获取表的最新分区,然后取该分区的数据。 1、show partitions ...

  • sklearn学习1:常用线性模型

    1.1 常用线性模型 1.1.1 线性回归,LinearRegression 1.1.2 脊回归,Ridge Regression 1.1.3 套索回归, Lasso 1.1...

  • numpy

    引入 array拼接 转成array

  • sklearn常用函数

    数据标准化 数据分割函数 模型训练、预测、计算准确率 计算精确率、召回率、F1分 Pipelines

  • jieba

    常用函数

  • word2vec & doc2vec

    word2vec 训练结果测试 模型保存和加载 如果模型训练完成(不再更新),可以在wv中转换gensim.models.KeyedVectors实例来避免不必要的内存消耗 ...