最近在微调大语言模型的过程中发现训练时会在模型生成的目录出现很多checkpoint开头的文件夹,这些文件夹下面基本都是一套完整可用的模型文件,还比较占用空间。这里详细总结一...

最近在微调大语言模型的过程中发现训练时会在模型生成的目录出现很多checkpoint开头的文件夹,这些文件夹下面基本都是一套完整可用的模型文件,还比较占用空间。这里详细总结一...
2025年,勇敢地面对,该成长了,该扎根了。 来到US后,天黑的很早,睡的也很早,日子过得很快,很简单,很安静,更加接近自然的质地。短暂跳脱了内卷圈,逃离了社会制定的时间轴,...
(1)Coordinate (COO) 这是最简单的一种格式,每一个元素需要用一个三元组来表示,分别是(行号,列号,数值),对应上图右边的一列。这种方式简单,但是记录单信息多...
茶,作为一种植物和饮品,已经伴随着中国几千年的历史。本篇旨在概述中国茶史的发展脉络,为后续深入探讨不同时代的饮茶方式、茶种类、茶文化在文学作品中的描写和其他茶相关的观史角度打...
之所以想到这个题目其实是因为看了《冰与火之歌》,看到了著名的小指头嚼薄荷: 这一段是小指头对珊莎说的: “令堂曾是我心目中爱与美的皇后。”男子轻声说。他的呼气有薄荷的味道。“...
资源 本文介绍如何使用 geometry 设置 LaTeX 文档页面。这里 是 geometry 在 github 上的项目地址,本文仅对 geometry 常用的排版命令进...
输出 feature map 尺寸计算 经过某一层 Conv2D 后,feature map 的输出大小为其中,N 为原图尺寸,F 为 Filter/Kernel size....
刚刚做完,趁热分享一下。 腾讯校招是投递简历后立马就会收到邮件,然后需要在48h内完成综合素质测评。测评时需要开启电脑摄像头和麦克风,3个项目是分开的,项目中途不能暂停。 测...
矩阵 矩阵初始化 矩阵元素运算 矩阵的乘法 矩阵的转置 矩阵对应列行的最大值,最小值,和 矩阵的其他操作:行列数、切片、复制、非0元素的下标 矩阵的行列式 矩阵的逆和伪逆 矩...