大模型 – 第 4 页 – 爱自然爱科技

从编解码和词嵌入开始，一步一步理解Transformer

309

|

2026-6-10 23:18

|

大模型

Transformer 与注意力机制：从零开始彻底理解 > 这是一篇超长文，整理自原视频的完整内容。适合想要深…

一张图片是怎么喂给大模型的？谈谈 CPU、内存、显存、GPU

114

|

2026-5-30 17:29

|

大模型

<公开笔记/Bilibili/一张图片是怎么喂给大模型的？谈谈 CPU、内存、显存、GPU.md> 简介本…

面试中容易露馅的问题：大模型的训练和推理吃多少显存？

175

|

2026-5-27 16:04

|

大模型

简介课代表： 01:07 推理阶段的显存之权重 04:26 推理阶段的显存之 kv cache 06:43 训练阶段的…

《Attention is all you need》论文解读及Transformer架构详细介绍

171

|

2026-5-26 22:33

|

大模型

简介本文是对 B 站视频《Attention is all you need》论文解读及 Transformer 架构…

用费曼学习法，5分钟搞懂LLM的预训练过程

107

|

2026-5-26 22:02

|

大模型

简介这篇笔记基于对 LLM 入门视频的学习整理而成，重点聚焦预训练（Pretraining）阶段。预训练可以理解为：…

大模型架构超详细精讲

156

|

2026-6-03 15:33

|

大模型

简介简介本文基于 Meta LLaMA 3.2 3 B 模型架构，以“你知道王汉三是谁吗”为完整示例，从输入到输出逐…

rag 演近

107

|

2026-5-15 6:49

|

大模型

核心技术总结一、核心脉络 RAG 的演进历程并非简单的版本升级，而是每一次迭代都在解决前一代无法控制的检索不确定性。路…

深度探讨：从 OpenClaw 爆火，看 AI Agent 的真相与程序员的未来

119

|

2026-5-28 14:55

|

大模型

导语：近期，以 OpenClaw 为代表的自主智能体（Autonomous Agent）火爆技术圈。这些宣称能“完全接…

可视化直观地理解LoRA模型

127

|

2026-5-08 18:03

|

大模型

字幕原模型是 6×8 乘八乘的四层结构而 LER 的参数矩阵都是 62 与 28 8×2 与 2×8 8×2 与二成…

本地部署 AI 模型完全指南：用 Ollama 在你的电脑上跑大模型

118

|

2026-5-08 14:59

|

大模型

每次用 ChatGPT 或 Claude，你的对话内容都发送到了别人的服务器上。对大多数人来说这不是问题。但如果你处理…

Obsidian + AI 插件：打造真正的第二大脑

130

|

2026-5-08 14:58

|

大模型

Obsidian + AI 插件：打造真正的第二大脑笔记软件我用过不下十个。Notion、语雀、Roam Resear…

🔥什么是Transformer？

120

|

2026-5-07 16:19

|

大模型

作者: 数据科学家阿宝哥发布/编辑时间: 2026年04月05日 13:24 什么是Transformer？ 2017…

2026 年 6 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

分类： 大模型

分类：大模型