240 发简信
IP属地:北京
  • DeepSeek创新优化

    一、架构优化   在transformer架构中,DeepSeek引入混合专家模型MixtureofExperts(MoE) ,对传统 Tran...

  • Resize,w 360,h 240
    数学模型和数学算法

      经常在工作和生活中听到模型、算法,甚至常常被叫做模型算法,他们到底能做什么事情?二者是一样的还是有区别?所以需要做一个简单的理解。 一、模型...

  • Resize,w 360,h 240
    雄狮少年2

    国漫《#雄狮少年2 》和第一部保持了一样的高水准。这部#现实主义 作品没有粉丝太平,把人间的苦难就这么真实的再现出来,喜欢里面底层人的不屈和少年...

  • Resize,w 360,h 240
    碳源、碳汇

      我们经常听到双碳,是指什么呢?这是一个很大的领域。下面简单介绍。  双碳是指“碳达峰”和“碳中和”。碳达峰:指在某个时间点,温室气体(主要是...

    0.4 85 0 1
  • Resize,w 360,h 240
    统计理论

      记得刚开始学机器学习时,对于突然冒出来的成本函数、正则项等感到莫名其妙,不知道是怎么出现的,后来才知道源自统计决策。统计学是机器学习中最大的...

    0.2 66 0 2
  • Resize,w 360,h 240
    机器学习沿袭

      现在一提到AI我们想到的一般都是什么大语言模型、深度学习等,但是以算法为核心的这个领域的应用,其发展的过程是怎么样的?有怎样的分类方法?通过...

  • Resize,w 360,h 240
    AI和仿生学共舞

      我们经常听到AI、机器学习、深度学习、大语言模型等。这个概念是什么?有什么关系?好吧。我们先来看看维基百科上对AI对定义:人工智能(英语:a...

    0.2 91 0 1
  • AI 系列写作 开篇辞

      科技已经彻底改变了现在社会,而且这种影响在自推动下有一个让人惊讶的加速度,人类社会的演化范式为此改变。许多新的理念产生,让社会的发展方向出现...

  • Resize,w 360,h 240
    张伊凡、袁洋关于 DoT推理思维图理解

      张伊凡、袁洋在AI的推理方法中,将线性链条的推理CoT(Chain of Thought)拓展为路径为DAG(单一模型内构建有向无环图)的推...

个人介绍
活在当下,面向未来。