通过阅读一系列文章,分析摘要、介绍每个section的组织形式,方便写出一些列现代八股文.
attention mechanisms in CV
发表于 更新于
本文字数: 15k 阅读时长 ≈ 14 分钟
本文字数: 15k 阅读时长 ≈ 14 分钟
主要是在视觉领域以及二维的feature map上的注意力机制,不同于1D数据,一般不会用q,k,v来算.总结一下cv中attention的发展.
再回看扩散模型
发表于 更新于
本文字数: 9.9k 阅读时长 ≈ 9 分钟
本文字数: 9.9k 阅读时长 ≈ 9 分钟
最近OpenAI的Sora模型又大火了一把,据说背后的技术是transformer+diffusion.之前我也大致介绍过stable diffusion的过程,这里我再稍微详细介绍一下经典的扩散模型以及改进之后的DDIM.其中我也有很多不太明白的,只有结合代码理解了.
机器学习回顾:集成学习
发表于 更新于
本文字数: 6.8k 阅读时长 ≈ 6 分钟
本文字数: 6.8k 阅读时长 ≈ 6 分钟
传统的机器学习方法,现在用得不多了(自我感觉).但是有必要稍微了解一下原理。
深度学习有用的库以及介绍
发表于 更新于
本文字数: 9.3k 阅读时长 ≈ 8 分钟
本文字数: 9.3k 阅读时长 ≈ 8 分钟
在看其他源代码时以及自己写代码时可能用到的有用的库以及一些常用写法.