RAG一般流程 将用于检索的知识库(文档)拆为小(几百个token)的文本块Chunk 对文本块进行 TF-IDF 编码,建立索引 语义嵌入Embedding,存储到向量数据...
RAG一般流程 将用于检索的知识库(文档)拆为小(几百个token)的文本块Chunk 对文本块进行 TF-IDF 编码,建立索引 语义嵌入Embedding,存储到向量数据...
LangChain 是一个用于开发由语言模型驱动的应用程序的框架,它旨在帮助开发者更容易地构建、实验和部署大模型应用程序。LangChain 的架构设计灵活且可扩展,涵盖了从...
AutoGPT[https://github.com/Significant-Gravitas/AutoGPT]是一个相对全面精巧可以构建AI Agent的框架,包含了AI代...
Poetry 是一个用于Python的依赖管理和打包工具,它通过一个pyproject.toml文件来管理项目依赖,简化了依赖管理的过程。Poetry 旨在解决传统工具(如p...
Kubeflow是运行在K8S之上的一套技术栈,通过各种组件实现机器学习模型的训练和推理部署到云原生的模型平台。 Kubeflow组件 Kubeflow提供了一大堆组件,涵盖...
LlamaIndex 是一个RAG检索增强生成框架, 提供了必要的抽象,可以更轻松地摄取、构建和访问私有或特定领域的数据,以便将这些数据安全可靠地注入 LLM 中,以实现更准...
模型是一把尺子,好的策略可以承受一个不太准的尺子。 类似做评分的纯表格数据,特别是连续变量特征适合树模型,深度模型效果一般。 深度模型适合处理离散特征,可以embedding...
对于LLM大模型应用来说,提示工程prompting engineering 是基本的,也是很重要的工具,对于模型智力和推理能力有着至关重要的影响。 从手工开发和维护prom...
从0到1搭建一个智能体,写一个能帮忙买火车票的智能体AI Agent,火车票相关API均为Mock。基于LongChain框架,使用ReAct的Prompt模版。 安装 & ...
智能体 智能体AI Agents指能够感知环境、做出决策并采取行动以实现特定目标的智能系统。自动驾驶汽车就是一种典型的智能体。大模型LLM是智能体的“大脑”,能够处理复杂的任...
这次WAIC2024 世界人工智能大会,参观了蔚来的展台,看了几幅架构图画的有点意思,分享一下。
数据集准备和预处理 通过dataset包加载数据集定义Dataset.map要使用的预处理函数定义DataCollator来用于构造训练batch 加载预训练模型 随机初始化...
直接使用Huggingface的Pipeline这个神器来轻松使用Transformer处理各种NLP问题简直太方便了。 通过AutoModel来直接从checkpoint导...
一般transformer模型有三个部分组成:1.tokennizer,2.Model,3.Post processing [图片上传失败...(image-92e142-1...
Kubernetes指定docker的Entrypoint 下表给出了 Docker 与 Kubernetes 中对应的字段名称。 如果要覆盖默认的 Entrypoint 与...
consul 相信大家已经知道了,在日常的开发以及运维中也会常常听到 consul 这个词,但是不是所有的人都知道它是什么?它在运维中扮演了什么样的角色呢? 首先,我们来看下...
Ceph Ceph是一个可靠、自动重均衡、自动恢复的分布式存储系统。Ceph没有单点故障的问题,数据强一致性,在部分节点出现故障的时候依然能够正常存取文件。 高可用性:Cep...
etcd从功能上来说和zookeeper是一类项目,但是相比而言更现代,使用go语言开发,编译后生成了系统可执行的二进制产物,跨平台性更好,更易维护。 etcd直接提供htt...