240 发简信
IP属地:陕西
  • 《社群领导力:独自成长的时代已经结束》读书笔记

    中心思想:《社群领导力:独自成长的时代已经结束》这本书的中心思想是,随着社交媒体和数字化技术的崛起,传统的独自成长的时代已经结束,取而代之的是社...

  • Resize,w 360,h 240
    NLP最重要的编码方式--BPE

    今天想简单聊聊在自然语言处理领域用得比较多,像BERT,GPT等自然语言模型都会用到的技术,BPE,全称是Byte Pair Encoding。...

  • 【面试题】去除字符串中的空格

    用python作答下题,不可使用strip和re:给定一个字符串S,去除S首尾的空格,并将字符串中间连续的多个空格替换为1个空格,返回处理后的字...

  • Resize,w 360,h 240
    奖励模型Reward Model如何训练?

    如上图所示,ChatGPT 并不是直接让人工去标注每一句话的真实得分是多少(尽管模型最终要预测的就是每句话的得分),而是让人去对 4 句话按照好...

  • 【面试题】拿球游戏的得分期望

    题目 袋子里有10个红球和10个黑球,游戏规则是:拿到红球得1分,拿到黑球减1分,进行无放回拿20次,当你发现继续拿球不利于得分时,可以提前终止...

  • Resize,w 360,h 240
    hugging face预训练模型本地读取指南

    使用Hugging Face的Transformers库来下载预训练模型bert模型时。以下是下载和使用该模型的示例代码: 这将自动下载预训练模...

  • BILSTM+CRF用于命名实体识别任务中的loss

    双向长短时记忆网络 (BiLSTM) 与条件随机场 (CRF) 结合是一种常用于序列标注任务的方法。在这种方法中, BiLSTM用于捕捉输入序列...

  • 《能力陷阱》读书笔记

    《能力陷阱》这本书的主旨是探讨在职场和生活中,人们如何陷入“能力陷阱”中,以及如何避免和克服这种陷阱。 作者讲述了一个人在职场中获得成功的过程中...

    0.2 88 0 0
  • 最大似然估计,最大后验估计,贝叶斯估计联系与区别

    先验概率分布(Prior Probability Distribution)是指在考虑新的证据或数据之前,对某个参数或变量的概率分布进行的假设。...

个人介绍
涉足计算机视觉\自然语言处理\推荐系统领域