最近在微调大语言模型的过程中发现训练时会在模型生成的目录出现很多checkpoint开头的文件夹,这些文件夹下面基本都是一套完整可用的模型文件,还比较占用空间。这里详细总结一...
![240](https://upload.jianshu.io/users/upload_avatars/9918284/b6cd8945-b488-4b70-87f3-ccf88374d0ce.png?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
最近在微调大语言模型的过程中发现训练时会在模型生成的目录出现很多checkpoint开头的文件夹,这些文件夹下面基本都是一套完整可用的模型文件,还比较占用空间。这里详细总结一...
我决定把所有日本战国相关参考文献全部放到大年表中,所以本文不列举参考文献。 德川(松平)(葵,二引两纹)(织田→今川→织田→丰臣) 松平清康 松平広忠 德川家康(母於大之方,...
2025年,勇敢地面对,该成长了,该扎根了。 来到US后,天黑的很早,睡的也很早,日子过得很快,很简单,很安静,更加接近自然的质地。短暂跳脱了内卷圈,逃离了社会制定的时间轴,...
(1)Coordinate (COO) 这是最简单的一种格式,每一个元素需要用一个三元组来表示,分别是(行号,列号,数值),对应上图右边的一列。这种方式简单,但是记录单信息多...
茶,作为一种植物和饮品,已经伴随着中国几千年的历史。本篇旨在概述中国茶史的发展脉络,为后续深入探讨不同时代的饮茶方式、茶种类、茶文化在文学作品中的描写和其他茶相关的观史角度打...
之所以想到这个题目其实是因为看了《冰与火之歌》,看到了著名的小指头嚼薄荷: 这一段是小指头对珊莎说的: “令堂曾是我心目中爱与美的皇后。”男子轻声说。他的呼气有薄荷的味道。“...
资源 本文介绍如何使用 geometry 设置 LaTeX 文档页面。这里 是 geometry 在 github 上的项目地址,本文仅对 geometry 常用的排版命令进...
输出 feature map 尺寸计算 经过某一层 Conv2D 后,feature map 的输出大小为其中,N 为原图尺寸,F 为 Filter/Kernel size....
刚刚做完,趁热分享一下。 腾讯校招是投递简历后立马就会收到邮件,然后需要在48h内完成综合素质测评。测评时需要开启电脑摄像头和麦克风,3个项目是分开的,项目中途不能暂停。 测...
矩阵 矩阵初始化 矩阵元素运算 矩阵的乘法 矩阵的转置 矩阵对应列行的最大值,最小值,和 矩阵的其他操作:行列数、切片、复制、非0元素的下标 矩阵的行列式 矩阵的逆和伪逆 矩...
可以使用TEXT,BLOB俩种类型来存储长文本。 1. TEXT TEXT有4有类型: TINYTEXT 256bytes TEXT 64kb MEDIUMTEXT 16Mb...
doccano是documment anotation的缩写,是一个开源的文本标注工具,我们可以用它为NLP任务的语料库进行打标。它支持情感分析,命名实体识别,文本摘要,关系...
numpy 1.增加维度 输出a的形状:(3,4)现在变量a为二维数组,在图形计算中有时需要将图像处理成(length, width, channel)的形式,我们需要将a处...
引用 普通部分 rb主要是为了读取二进制文件而创立的字段,因为二进制字段中很有可能有1A(\x)这个编码,但是这个在普通文件中表示的EOF,即文档结束符,所以如果使用r读取二...
模糊逻辑严格意义上来说与之前讲的机器学习没有什么太大的关系,但是对于人工智能AI来说,我认为是一个非常重要的概念。所以这篇文章就来讲讲什么是模糊逻辑,以及模糊逻辑的应用。 1...