mengrennwpu - 简书

发简信

8
关注
6
粉丝
20
文章
45046

字数
27

收获喜欢
7

总资产

IP属地：安徽

mengrennwpu

LLM应用实战: 给个公司简称，输出公司全称
1.背景本qiang~本周在处理手头项目工作的时候，遇到了一个问题，就是友方提供了一个公司名称列表(量不小~，因此无法人工处理)，且该公司名称列表均为简称，需要与库中的全称...

46 0 0
mengrennwpu

LLM论文研读: GraphRAG的替代者LightRAG
1.背景最近有一个很火的开源项目LightRAG，Github6.4K+星※，北邮和港大联合出品，是一款微软GraphRAG的优秀替代者，因此本qiang~得了空闲，读读论...

438 0 1

mengrennwpu

LLM应用实战: OpenAI多代理新作-Swarm
1.背景本qiang~关注到OpenAI两周前发布的轻量级多代理框架Swarm，因此想要深入了解了一下，运行了官方提供的例子，整理并总结一些心得体会~ 源码非常简单，各位看...

165 0 1
mengrennwpu

LLM应用实战: 文档问答系统Kotaemon-1. 简介及部署实践
1.背景本qiang~这两周关注到一个很火的开源文档问答系统Kotaemon，从8月28日至今短短两周时间，github星标迅猛增长10K，因此计划深挖一下其中的原理及奥秘...

960 0 1
mengrennwpu

LLM论文研读: MindSearch
1.背景近日中科大与上海人工智能实验室联合推出的MindSearch思索，引起了不小的关注，github上的星标，短短几周时间，已经飙到了4.2K。看来确实有些内容，因此本...

185 0 2
mengrennwpu

LLM应用实战: 产业治理多标签分类
1. 背景许久未见，甚是想念~ 近期本qiang~换了工作，处于新业务适应期，因此文章有一段时间未更新，理解万岁！现在正在着手的工作是产业治理方面，主要负责其中一个功能模...

121 0 5
mengrennwpu

LLM应用实战：当图谱问答(KBQA)集成大模型(三)
1.背景最近比较忙(也有点茫)，本qiang~想切入多模态大模型领域，所以一直在潜心研读中... 本次的更新内容主要是响应图谱问答集成LLM项目中反馈问题的优化总结，对KB...

89 0 1

mengrennwpu

LLM实战：当网页爬虫集成gpt3.5
1. 背景最近本qiang~关注了一个开源项目Scrapegraph-ai，是关于网页爬虫结合LLM的项目，所以想一探究竟，毕竟当下及未来，LLM终将替代以往的方方面面。 ...

271 0 1
mengrennwpu

LLM实战：LLM微调加速神器-Unsloth+ Qwen1.5
1. 背景上一篇介绍了基于训练加速框架Unsloth，微调训练Llama3的显卡资源占用及训练时间对比。近期Unsloth新增了Qwen1.5的模型适配，因此本qiang...

419 0 0
mengrennwpu

LLM实战：LLM微调加速神器-Unsloth + LLama3
1. 背景五一结束后，本qiang~又投入了LLM的技术海洋中，本期将给大家带来LLM微调神器：Unsloth。正如Unsloth官方的对外宣贯：Easily finet...

707 0 1
mengrennwpu

LLM优化：开源星火13B显卡及内存占用优化
1. 背景本qiang~这两天接了一个任务，部署几个开源的模型，并且将本地经过全量微调的模型与开源模型做一个效果对比。部署的开源模型包括：星火13B，Baichuan2-...

320 0 1
mengrennwpu

LLM应用实战：当KBQA集成LLM(二)
1. 背景又两周过去了，本qiang~依然奋斗在上周提到的项目KBQA集成LLM，感兴趣的可通过传送门查阅先前的文章《LLM应用实战：当KBQA集成LLM[https://...

166 0 1

mengrennwpu

LLM应用实战：当KBQA集成LLM
1. 背景应项目需求，本qiang~这两周全身心投入了进去。项目是关于一个博物馆知识图谱，上层做KBQA应用。实现要求是将传统KBQA中的部分模块，如NLU、指代消解、实...

150 0 3
mengrennwpu

LLM面面观之MoE
1. 背景根据本qiang~最新的趋势观察，基于MoE架构的开源大模型越来越多，比如马斯克的Grok-1(314B), Qwen1.5-MoE-A2.7B等，因此想探究一下...

204 0 2
mengrennwpu

LLM面面观之RLHF平替算法DPO
1. 背景最近本qiang~老看到一些关于大语言模型的DPO、RLHF算法，但都有些云里雾里，因此静下心来收集资料、研读论文，并执行了下开源代码，以便加深印象。此文是本q...

434 0 0
mengrennwpu

LLM面面观之LLM上下文扩展方案
1. 背景本qiang~这段时间调研了LLM上下文扩展的问题，并且实打实的运行了几个开源的项目，所谓实践与理论相结合嘛！此文是本qiang~针对上下文扩展问题的总结，包括...

123 0 0
mengrennwpu

LLM面面观之LLM复读机问题及解决方案
1. 背景关于LLM复读机问题，本qiang~在网上搜刮了好几天，结果是大多数客观整理的都有些支离破碎，不够系统。因此，本qiang~打算做一个相对系统的整理，包括LLM...

757 0 1

mengrennwpu

LLM面面观之Prefix LM vs Causal LM
1. 背景关于Prefix LM和Causal LM的区别，本qiang在网上逛了一翻，发现多数客官只给出了结论，但对于懵懵的本qiang，结果仍是懵懵... 因此，消遣了...

763 0 0
mengrennwpu

Meta AI新发布的超大规模语言模型-OPT-175B
Meta AI在2022年5月3日新发布的OPT-175B模型，该模型是现阶段第一个模型参数超过千亿级别的开放模型，其次该模型与GPT-3相比，更加开放及便于访问。具体开放...

836 0 1
mengrennwpu

谈谈三种海量数据实时去重方案（w/ Flink）
Prologue 数据去重（data deduplication）是我们大数据攻城狮司空见惯的问题了。除了统计UV等传统用法之外，去重的意义更在于消除不可靠数据源产生的脏数据...

LittleMagic
26101 16 28 2

个人介绍

LLM海洋