240 发简信
IP属地:北京
  • Clickhouse 读取存储在hdfs的hive表数据

    背景 离线数据经过 hive 处理后,生成的新数据,有时需要对接至研发侧 clikehouse,供前端用户查询使用,所以会涉及到hive数据同步...

  • Resize,w 360,h 240
    Python中一个构建 web 页面的神奇库 streamlit

    背景 在上一篇文章《基于DeepSeek,构建个人本地RAG知识库》中用到了 streamlit 库,于是小编初步深入了解了一下,感觉很好用,是...

  • Resize,w 360,h 240
    基于DeepSeek,构建个人本地知识库RAG

    背景 经过一段使用DeepSeek后,感觉使用体验和ChatGPT基本差不多,问答问题的质量略有提升,因DeepSeek已开源,它的模型、模型权...

  • 从互联网+,到DeepSeek+,新一轮的技术变革

    去年春节过后,ChatGPT成为了科技领域的热议话题,而今年过完年后,DeepSeek同样火爆异常,引发了广泛的讨论。随着大量文章的涌现,Dee...

  • Python 基于Matplotlib制作动态图

    背景 一图胜千言,优秀的可视化图表不仅能以直观、简洁的方式呈现复杂的信息,还能够通过图形、颜色和布局的巧妙设计,引发观众的情感共鸣,增强数据背后...

  • Python 基于协程的端口扫描工具

    背景 端口扫描技术广泛应用于网络运维、网络安全测试、以及黑客攻击服务器等领域。在网络运维中,管理员通过端口扫描来检查服务器或设备的开放端口,确保...

  • 管理的精髓

    本文摘自《深层认知:深层洞悉事物的商业逻辑》,小编感觉讲的挺有道理,分享出来供大家品读。小编读后感到,国内公司在管理水平提升方面仍任重道远,未来...

  • Clickhouse 基础使用教程

    背景 小编最近在做一个数据类产品项目,每天涉及到几十亿数据的汇总计算,从不同维度、不同的关联关系进行汇总统计,刚开始时项目组使用的是hive,写...

  • Clickhouse中创建生成日期序列自定义函数

    背景 Clickhouse 数据库最近几年在大数据领域应用越来越广,因其卓越的性能,外加支持海量数据存储与处理,国内很多大厂都有在使用。其底层使...

个人介绍
分享数据处理、数据分析、数据可视化、数据挖掘、机器学习、深度学习等领域知识,用到的主要工具有Python、Excel、Linux、Hive 、VBA、Mysql 等
欢迎关注微信公众号:DataShare