240 发简信
IP属地:广东
  • Shell

    时间命令 循环作业

  • Python

    General 源表解析 文件读写 General findall 返回列表 https://blog.csdn.net/Cashey199...

  • Pyspark-报错与解决

    in show UnicodeEncodeError: 'ascii' codec can't encode characters in pos...

  • HiveSql-常用语句

    get_json_object(page_attr,'$.goods_id') (1) 获取当前时间: from_unixtime(unix_t...

  • Pyspark-常用语句

    dataframe字段操作 打印权重 解析概率 模型调参 初始化spark 常用缺失值填充 StringIndexer 多字段处理 datafr...

  • Sklearn-常用语句

    按user_id分组取click_times最大值对应的行(只有一条记录) 创建空同类型dataframe 训练表 预测结果写csv pyhiv...

  • 类目相关性Apriori-问题记录

    问题1: 支持度与置信度阀值(取前50%)定得太低, 导致规则不是很相关(连衣裙->阿拉伯服饰 lift最高), 会出现在美国站下首推阿拉伯服饰...

  • HiveSql-常用语法

    # 拼接排序 select category_id, regexp_replace( concat_ws(',', -- 对排...