本文重点介绍Fastchat是什么,各个组件的作用和关系,如何使用Fastchat框架部署大模型。 Fastchat是什么? FastChat是一个用于训练、部署和评估大模型...
本文重点介绍Fastchat是什么,各个组件的作用和关系,如何使用Fastchat框架部署大模型。 Fastchat是什么? FastChat是一个用于训练、部署和评估大模型...
一、背景 随着人工智能技术的飞速发展,大模型(Large Language Models, LLMs)已成为自然语言处理领域的核心工具。这些模型以其强大的语言理解和生成能力,...
@枉凝眉233 周志华的 机器学习 入门必读
信息论2(自信息、信息熵、联合熵、条件熵、交叉熵、相对熵(KL散度)、互信息、最大互信息系数)1、前言 在研究机器学习一些算法原理时,经常会出现各种有关信息论的概念(自信息、互信息等),此前已分享过一篇文章,但是相对简单了一些,本次将再进一步分析各种相关概念。 2...
1、前言 在研究机器学习一些算法原理时,经常会出现各种有关信息论的概念(自信息、互信息等),此前已分享过一篇文章,但是相对简单了一些,本次将再进一步分析各种相关概念。 2...
1、前言 xgboost是在gbdt基础上进行了升级,所以xgboost也是通过每次拟合上次的残差(上次实际值与目标值之差),从而每次生成一棵树(CART回归树),最...
1、前言 线性回归在整个机器学习算法中相对比较简单,但是在处理实际问题中,使用频率还是比较高。本文将对线性回归做简单介绍,最后利用通俗的讲解来说明逻辑回归于线性回归的关系...
1、前言 对于分类任务,经常会遇到类别不平衡问题(不通类别训练样本数目差距较大),本文将对该问题给出常见的解决方法。 2、常用解决方法 2.1 欠采样(下采样) 欠采...
1、前言 统计相关问题系列第三篇,上一篇点这里 2、常见名词 标准取值:将一组数据中每个数减去均值之后除以标准差,从而转换为z分数。以标准差为单位表示的原始值与均值差...
1、前言 统计相关问题系列第二篇,上一篇点这里 2、常见名词 极差(range):一组数据中最大值与最小值之差。 四分位差(IQR):一组数据中第75百分位数与第25...
1、前言 在机器学习中经常会出现各种各样统计学中的名词,对此,此系列文章将对一些常见统计量及相互关系作简单介绍。本文为第一篇。 2、常见名词 统计量:统计量是指通过对...
git基本操作 初始化 git安装后设置用户与邮箱: 查看用户与邮箱 创建版本库 介绍 版本库:仓库(repository),这里可以简单理解为一个文件夹 创建过程 在需要创...
1、前言 对于相同的数据及问题,可以有不同的算法模型解决,那么如何评价不通算法的优劣,以及最终应该选择哪一种?针对这些问题,本文将做简单介绍。 2、常见术语 过拟合:...
1、前言 决策树是目前机器学习算法中使用较多的一种算法,即使在各大竞赛中(kaggle、天池等),使用较多的集成学习(GBDT、XGBoost、LightGBM、ca...
1、信息熵(Ent(D)) 用来度量一组样本集合的纯度(信息熵越小,纯度越高)。假设在集合D中第k类的占比为,则D的信息熵为: 2、信息增益(Gain(D,a)) ...
1、前言 朴素贝叶斯方法的实现相对简单,但是学习与预测的效率较高,该算法是除了集成学习算法之外较为常用的一种算法。 2、基本概念 想要理解该算法,需知道以下几...
1、前言 由于k近邻算法相对比较简单,故本文不会展开介绍该算法,只是对一些知识点进行整理。 2、相关知识点 2.1 最近邻算法 当k近邻算法中k取1时,则为最...