简介 数据预处理将原始数据转化为适合建模的格式,核心步骤包括:清洗(缺失值、异常值、重复值)、变换(无量纲化、特征编码)…
Transformer 与注意力机制:从零开始彻底理解 > 这是一篇超长文,整理自原视频的完整内容。适合想要深…
<公开笔记/Bilibili/一张图片是怎么喂给大模型的?谈谈 CPU、内存、显存、GPU.md> 简介 本…
这是这篇作者的项目,如何学英语我看到里面的一段故事,于是就放在我的网站上了。笑死我了,尤其是这段: 谨以此献给我曾今的挚…
pikpaktui 是一个专为 PikPak 网盘打造的、纯 Rust 编写的终端用户界面(TUI)和命令行(CLI)客…
简介 课代表: 01:07 推理阶段的显存之权重 04:26 推理阶段的显存之 kv cache 06:43 训练阶段的…
QuarkPan Plus - 夸克网盘增强版 Python 客户端 本项目是基于 QuarkPan 的增强版 ,在原有…
简介 本文是对 B 站视频《Attention is all you need》论文解读及 Transformer 架构…
简介 这篇笔记基于对 LLM 入门视频的学习整理而成,重点聚焦预训练(Pretraining)阶段。 预训练可以理解为:…
简介 简介 本文基于 Meta LLaMA 3.2 3 B 模型架构,以“你知道王汉三是谁吗”为完整示例,从输入到输出逐…
MacState English 轻量级 macOS 菜单栏系统监控工具。所有指标合并显示在单个状态栏项中,资源占用极低…
核心技术总结 一、核心脉络 RAG 的演进历程并非简单的版本升级,而是每一次迭代都在解决前一代无法控制的检索不确定性。路…