臻甄 - 简书

发简信

臻甄

20
关注
134
粉丝
87
文章
122029

字数
162

收获喜欢
37

总资产

IP属地：四川

臻甄

HumanEval
HumanEval: Hand-Written Evaluation Set 一个代码评测基准。 From 《Evaluating Large Language Models...

525 0 0
臻甄

Automatic Prompt Engineer (APE)
有一篇文章概述了先进的prompt工程技术：https://luxiangdong.com/2023/08/08/advprompt/[https://luxiangdong...

195 0 0

臻甄

AutoPrompt初步了解
Prompt是什么 NLP发展的四个阶段（1）完全有监督机器学习：word本质是特征，主要在做特征工程（2）完全有监督深度学习：开始搞卷积和Attention（3）预训练：预...

308 0 0
臻甄

使用 OpenAI API 进行快速工程的最佳实践
OpenAI官方提供的Prompt技巧，给OpenAI的模型提供更清晰有效的指令。翻译 From ： https://help.openai.com/en/articles/...

138 0 1
臻甄

OpenChat
· 标题：OpenChat: Advancing Open-source Language Models with Mixed-Quality Data· 链接： https...

135 0 0
臻甄

GitHub搭建自己的持续集成
什么是持续集成代码开发 -> 代码提交 -> 服务器编译、测试、打包 -> 服务器部署（大规模部署用 docker）上面这套流程中除了前两个，其他的都自动执行，就是CI（...

146 0 0
臻甄

分位数回归 Quantile Regression && 期望回归 Expectile Regression
分位数回归 Quantile Regression 先说一下线性回归 & 多项式回归：假定一个函数 f(x) ，让函数尽可能拟合训练数据，确定函数的未知参数。一般通过最小化M...

2776 0 1

臻甄

vLLM
vLLM是什么 vllm是一个很快的且方便使用的库，可以用于LLM的推理和服务。和huggingface无缝集成，可以直接下载加载hugging的模型比huggingfa...

1897 0 0
臻甄

Executable Code
Executable Code Actions Elicit Better LLM Agentshttps://arxiv.org/pdf/2402.01030.pdf[ht...

162 0 1
臻甄

Recursive RM
Scalable agent alignment via reward modeling: a research direction https://arxiv.org/pd...

75 0 0
臻甄

TaskMatrix.AI
这篇文章揭示了ChatGPT Plugins背后的技术路线来自微软的论文：TaskMatrix.AI: Completing Tasks by Connecting Fou...

113 0 0
臻甄

RL4LM笔记
仓库链接：https://github.com/allenai/RL4LMs[https://github.com/allenai/RL4LMs]论文链接：https://a...

1615 0 0

臻甄

ChatGPT笔记
简介 2022年11月，OpenAI推出了一款AI聊天机器人程序，其强大的问答能力瞬间引爆全网关注度。组成部分：GPT3.5 + 大型语言模型(LLM) + 强化学习微调训...

1764 0 0
臻甄

推荐系统精品文章
推荐系统召回四模型之：全能的FM模型[https://zhuanlan.zhihu.com/p/58160982]（1）从多路召回到FM做统一的召回模型，将所有特征划分为（U...

307 0 1
臻甄

推荐系统算法（传统推荐模型）
推荐系统经历两个阶段：传统推荐模型和深度学习模型第一阶段：传统推荐模型(协同过滤，矩阵分解，LR, FM, FFM, GBDT)。协同过滤体现了最朴素的推荐思想，同类相聚...

4022 0 0
臻甄

华为河伯
华为诺亚方舟实验室开源了一个贝叶斯优化+RL的仓库，里面包括几部分：贝叶斯研究（1）HEBO：异方差进化贝叶斯优化 HEBO: Heteroscedastic Evolut...

1625 1 3

暂无个人介绍