躺不平的NLPer - 简书

发简信

躺不平的NLPer

0
关注
1
粉丝
25
文章
13770

字数
1

收获喜欢

IP属地：浙江

躺不平的NLPer

git添加上游仓库
1. 添加 upstream 远程仓库如果你是从一个仓库 fork 下来的，通常需要将原始仓库作为 upstream 远程仓库。假设原始仓库的 URL 是 https://...

15 0 0
躺不平的NLPer

Linux生成 SSH 密钥，以及authorized_keys
1. 生成密钥（如果还没有的话）可以通过ls ~/.ssh 方式查看有没有 2. 选择存储位置(可选) 系统会提示你选择存储密钥的位置：如果你希望将密钥保存在默认位置（...

19 0 0

躺不平的NLPer

五大过程组-十大知识领域-49个过程-工具使用

19 0 0
躺不平的NLPer

绩效域

19 0 0
躺不平的NLPer

DeepSeek-R1论文浅读
DeepSeek-R1-Zero：直接从DeepSeek-V3-Base进行强化学习RL训练，大概进行了数千步，就能展现出强大的性能和惊人的推理能力。（AIME 2024 ...

80 0 0
躺不平的NLPer

ReFT论文浅读
ReFT: Reasoning with Reinforced Fine-Tuning[https://arxiv.org/abs/2401.08967] 核心贡献：使用和...

99 0 0
躺不平的NLPer

DeepSeekMath论文浅读(GRPO)
Group Relative Policy Optimization(GRPO) ，从DeepSeekMath[https://arxiv.org/html/2402.033...

2491 0 0

躺不平的NLPer

PPO（Proximal Policy Optimization）
PPO（Proximal Policy Optimization）是一种广泛使用的强化学习算法，它通过优化策略来训练智能体，旨在提升训练过程的稳定性和效率。 PPO 的核心思...

937 0 0
躺不平的NLPer

spacy安装和使用
spacy是一个python的自然语言处理的包，可以做词性分析、命名实体识别、依赖关系刻画，embedding的计算以及可视化。直接清华源安装spacy 点击下载.whl文...

248 0 0
躺不平的NLPer

rStar论文浅读
来自：Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers[https://arxiv.org/html/...

42 0 0
躺不平的NLPer

位置编码（Positional Encoding）
在大语言模型（LLM）中，位置编码（Positional Encoding）是用于表示输入序列中词汇或标记相对位置的技术。由于Transformer架构本身并没有内建顺序信息...

923 0 0
躺不平的NLPer

Linux cuda-toolkit安装
查看系统信息下载工具包下载地址： https://developer.nvidia.com/cuda-toolkit-archive[https://developer....

260 0 0

躺不平的NLPer

Linux教程命令行运行clash
clash (meta) 下载安装包 linux x64下载 curl https://d2.duckgogo.net/mihomo/mihomo-linux-amd64-v...

3423 0 0
躺不平的NLPer

Python改变字符颜色
打印有颜色的字符串只改变颜色，不打印

70 0 0
躺不平的NLPer

git拉取子模块
如果项目中包含子模块，想将子模块代码一同拉取下来如果未使用 --recursive，已经将主目录拉取到本地，子模块为空文件夹先初始化子模块配置文件，再更新子模块内容

360 0 0
躺不平的NLPer

Clustering and Ranking（CaR）代码框架解读
论文和仓库论文地址[https://arxiv.org/abs/2402.18191]官方代码[https://github.com/IronBeliever/CaR.gi...

60 0 0
躺不平的NLPer

Windows上neo4j的安装
社区版安装安装依赖JDK neo4j安装需要的依赖：https://neo4j.com/docs/operations-manual/current/installatio...

197 0 0

躺不平的NLPer

自动提示工程（Auto Prompt）LMOps代码复现和解读
ProTeGi: Prompt Optimization with Textual Gradients是一篇自动基于LLM的自动提示工程，非常感谢作者的创新和分享，以下是原论...

161 0 0
躺不平的NLPer

git设置提交用户名
取消全局用户名邮箱 git config –global –unset user.namegit config –global –unset user.email 设置全局用...

155 0 0
躺不平的NLPer

mac微信文件存储路径修改
首先说明：mac微信聊天文件保存是按照每个群聊，每个聊天对象，接收，发送分别保存的查看当前文件的保存路径首先查看原本微信文件存储的默认路径，不知道路径的，直接在微信接受的文...

5832 0 0

暂无个人介绍