240 发简信
IP属地:上海
  • 120
    HumanEval

    HumanEval: Hand-Written Evaluation Set 一个代码评测基准。 From 《Evaluating Large Language Models...

  • 120
    Automatic Prompt Engineer (APE)

    有一篇文章概述了先进的prompt工程技术:https://luxiangdong.com/2023/08/08/advprompt/[https://luxiangdong...

  • AutoPrompt初步了解

    Prompt是什么 NLP发展的四个阶段(1)完全有监督机器学习:word本质是特征,主要在做特征工程(2)完全有监督深度学习:开始搞卷积和Attention(3)预训练:预...

  • 使用 OpenAI API 进行快速工程的最佳实践

    OpenAI官方提供的Prompt技巧,给OpenAI的模型提供更清晰有效的指令。翻译 From : https://help.openai.com/en/articles/...

  • 120
    OpenChat

    · 标题:OpenChat: Advancing Open-source Language Models with Mixed-Quality Data· 链接: https...

  • GitHub搭建自己的持续集成

    什么是持续集成 代码开发 -> 代码提交 -> 服务器编译、测试、打包 -> 服务器部署(大规模部署用 docker) 上面这套流程中除了前两个,其他的都自动执行,就是CI(...

  • 120
    分位数回归 Quantile Regression && 期望回归 Expectile Regression

    分位数回归 Quantile Regression 先说一下线性回归 & 多项式回归:假定一个函数 f(x) ,让函数尽可能拟合训练数据,确定函数的未知参数。一般通过最小化M...

  • vLLM

    vLLM是什么 vllm是一个很快的且方便使用的库,可以用于LLM的推理和服务。 和huggingface无缝集成,可以直接下载加载hugging的模型 比huggingfa...

  • 120
    Executable Code

    Executable Code Actions Elicit Better LLM Agentshttps://arxiv.org/pdf/2402.01030.pdf[ht...

  • 120
    Recursive RM

    Scalable agent alignment via reward modeling: a research direction https://arxiv.org/pd...

  • TaskMatrix.AI

    这篇文章揭示了ChatGPT Plugins背后的技术路线 来自微软的论文:TaskMatrix.AI: Completing Tasks by Connecting Fou...

  • 120
    RL4LM笔记

    仓库链接:https://github.com/allenai/RL4LMs[https://github.com/allenai/RL4LMs]论文链接:https://a...

  • 120
    ChatGPT笔记

    简介 2022年11月,OpenAI推出了一款AI聊天机器人程序,其强大的问答能力瞬间引爆全网关注度。 组成部分:GPT3.5 + 大型语言模型(LLM) + 强化学习微调训...

  • 120
    推荐系统精品文章

    推荐系统召回四模型之:全能的FM模型[https://zhuanlan.zhihu.com/p/58160982](1)从多路召回到FM做统一的召回模型,将所有特征划分为(U...

  • 120
    推荐系统算法(传统推荐模型)

    推荐系统经历两个阶段:传统推荐模型和深度学习模型 第一阶段:传统推荐模型(协同过滤,矩阵分解,LR, FM, FFM, GBDT)。 协同过滤体现了最朴素的推荐思想,同类相聚...

  • 120
    华为河伯

    华为诺亚方舟实验室开源了一个贝叶斯优化+RL的仓库,里面包括几部分: 贝叶斯研究(1)HEBO:异方差进化贝叶斯优化 HEBO: Heteroscedastic Evolut...