我的博客
首页 分类 标签 归档 工具 关于

导航

  • 全部文章 18
  • 归档
  • 标签

分类 全部 →

  • 生活1
  • 随笔2
  • 后端4
  • 前端5
  • AI5
  • 运维1

其他

  • 在线工具
  • 关于
  • 后台管理
← 所有标签

#大模型

Transformer 内部结构:从输入到输出拆解 LLM 四大核心组件

22026年5月22日

把 LLM 看成黑盒太简单了 —— 拆解分词器、嵌入层、堆叠的 Transformer 块、语言建模头四个模块,讲清楚一句"我今天很"是怎么变成"开心"的。

AI #AI #大模型 #Transformer #NLP
阅读全文

Transformer 解码策略:贪婪、采样、温度系数与 Top-k / Top-p

12026年5月22日

模型算出 softmax 概率分布之后,到底怎么"挑"下一个词?这一篇讲清楚贪婪解码、随机采样、温度系数这个"放飞旋钮",以及 Top-k / Top-p / Beam Search 的取舍。

AI #AI #大模型 #Transformer #解码策略
阅读全文

什么是 Vibe Coding:Karpathy 这条推文,把"写代码"重新定义了

12026年5月22日

2025 年 2 月,Andrej Karpathy 在 X 上发了条推文,说他写代码已经变成"看一眼、说一句、跑一下、复制粘贴一下"。这个被称作 vibe coding 的工作方式,有人说是编程的未来,有人说是工程的灾难。它到底是什么?谁在用?有没有坑?

AI #AI #vibe coding #Cursor #大模型 #工程实践
阅读全文

我的博客

© 2026 小林. All rights reserved.

归档分类标签 RSS Powered by Nuxt