大模型 – 第 2 页 – 爱自然爱科技

RNN 模型框架

61

|

2026-6-15 20:21

|

大模型

为什么需要RNN？想象一下，你给普通的图像识别网络看一张猫咪的照片，它只需要看这一帧，就能立刻告诉你——这是猫。这种网…

RNN 循环神经网络模型

51

|

2026-6-15 20:07

|

大模型

循环神经网络: 是处理文本、股票、语音等序列数据的核心模型。 1. CNN的尴尬：看不懂顺序如果你给CNN一张猫吃鱼的…

5 分钟搞懂 CNN 卷积神经

52

|

2026-6-15 19:38

|

大模型

那计算机又是怎么从这些冷冰冰的数字里，学会辨别猫和狗、识别人脸、甚至读懂医学影像的呢？答案就是今天的主角——卷积神经网络…

5 分钟搞懂神经网络原理

51

|

2026-6-15 19:35

|

大模型

科学家们从生物学中寻找灵感，试图在计算机中模拟人类大脑神经元的工作方式。而要理解庞大的 AI 模型，我们需要从最基础的单…

BPE（Byte Pair Encoding）算法解决了什么问题？

86

|

2026-6-10 20:23

|

大模型

文本子词分词算法是大语言模型的一项关键技术，负责将文本转换为模型可处理的 token 序列。那为什么不能直接以”字符”或…

假设你要设计一个论文辅助阅读智能体

82

|

2026-6-10 16:10

|

大模型

请回答：你会选择哪个模型作为智能体设计时的基座模型？选择时需要考虑哪些因素？如何设计提示词来引导模型更好地理解学术论文？…

如果你要构建一个企业级的客服智能体，你会选择哪种类型的模型？需要考虑哪些因素？

68

|

2026-6-10 15:06

|

大模型

如果让我来架构，我不会盲目选择“最大、最贵”的模型，而是会倾向于采用 “中轻量级开源模型（私有化部署） + 头部闭源大模…

Decoder-Only架构与完整的Encoder-Decoder架构有什么区别？为什么现在主流的大语言模型都采用Decoder-Only架构？

78

|

2026-6-10 15:01

|

大模型

结合你正在阅读的教程中关于 3.1.3 Decoder-Only 架构的内容，这个问题直接触及了现代大语言模型（LLM…

多agent系统：什么时候和如何到使用他们

79

|

2026-6-08 19:12

|

大模型

总结：多智能体系统只有在能解决单智能体无法克服的特定约束时才有价值，否则协调成本会超过收益。 https://claud…

Agent、Skill、OpenClaw、Harness……

140

|

2026-6-08 20:10

|

大模型

简介文档链接：https://oigi8odzc5w.feishu.cn/wiki/WBMfwiNkfi6uNFkRt…

LoRA 算法论文解读 & 开发人员如何微调大模型并暴露可调用接口

92

|

2026-6-08 14:58

|

大模型

LoRA 算法论文解读 & 开发人员如何微调大模型并暴露可调用接口简介一、视频资料与链接 B站视频：BV1R…

Sinusoidal、RoPE、ALiBi等各类位置信息编码

92

|

2026-6-07 19:58

|

大模型

## 简介去年（2024年上半年）录制的一系列内容分享。由于大模型发展很快，有些东西对于时下（2025年上半年）技术发…

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

分类： 大模型

分类：大模型