Wataの锟斤拷
  • 首页
  • 归档
  • 分类
  • 标签

flow_intro

Flow Models taxonomy ​ 从模型结构来说,主流的生成模一般可以分成以下几种:GAN,VAE,Flow,Diffusion ​ 也有一种分类方法把 Component-by-Component(Auto-regressive model,例如 PixelRNN,VAR,NAR 等)的生成式模型也单独划分成一类,但是个人感觉这种分类方式不一样,上面模型的架构都可以应用于 VA
2025-05-20

PointNet & PointNet++

PointNet & PointNet++ ​ 3d 数据多重表示,例如 point cloud,mesh,volumetric 和 RBGD(投影过后的视角),但是我们常常使用的是 point cloud数据格式,因为点云格式是传感器的原始数据,同时是一种规范的数据形式,因此在实际中我们常常选择对点云数据处理而非其他格式的 3d 数据,PointNet 之前的工作都是通过将点云数据通过
2025-05-18

Hashable & Mutable

Hashable & Mutable 的讨论 基本概念 可变性 (Mutability) 与不可变性 (Immutability) 首先,我们来区分可变对象和不可变对象。 可变对象 (Mutable Objects):指的是那些在创建后,其内部状态可以被修改的对象。这意味着你可以在不改变对象在内存中的地址(ID)的情况下,改变其内容。常见可变类型有 list , dict , se
2025-04-30

on-off-line

对于在线处理和离线处理的讨论 问题描述: ​ 我在使用 MLLM 的 VQA 方式进行单目标跟踪的时候,出现了一个问题是,由于输入的图片分辨率不一样,如果我使用了 normalize bbox 模型并不能正确理解 normalize bbox 的含义,因此我需要正确裁剪 bbox 输入模型相同分辨率的图像,因此需要正确处理数据集,有两种方式,将数据集先全部裁剪完再开始训练,这就是 off-li
2025-04-24

intro

深度学习训练耗时: 训练耗时=训练数据规模×单步计算量⏟模型相关,相对固定/计算速率⏟可变因素\text{训练耗时}=\underbrace{\text{训练数据规模} \times \text{单步计算量}}_{模型相关,相对固定} / \underbrace{\text{计算速率}}_{可变因素} 训练耗时=模型相关,相对固定训练数据规模×单步计算量​​/可变因素计算速率​​ 计算速率: 计算
2025-04-16

intro

Hugging Face Transformers:源码入门指南 ​ Hugging Face transformers 库对于任何使用当前最先进的自然语言处理 (NLP) 模型的人来说,都是一个极其强大的工具。虽然使用库的高级 API,如 pipeline 或 AutoModel.from_pretrained 非常直接,但深入研究源代码可以让你获得更深层次的理解,实现定制化,并更有效地调试问
2025-04-16

policy_gradient

本文将细致推导策略梯度算法: ​ 我们的目的是将策略给参数化,即用神经网络来建模策略,在离散动作空间内,这个建模是比较好进行的,比如 Q-learning(虽然不直接对策略建模,但是值函数的估计就内在给策略建模了)输入当前状态 sss 输出离散动作集内每个动作的 QQQ 值。但是这样对于连续动作空间是不可同样处理的,即我们需要找到一个方法将连续动作空间的策略给参数化。有很多解决方式,比如类似 VA
2025-03-15

planning

Planning:概念、分类与价值 引言 ​ 在强化学习领域,“planning”(规划)是智能体通过内部模拟环境进行决策的能力。与直接通过环境交互的试错学习不同,规划让智能体能够在「想象」中预演未来可能发生的场景。 ​ 即:Planning 指智能体利用环境模型(model)在内部生成虚拟经验,通过模拟状态转移和奖励反馈来优化策略的过程。其本质是通过「思维实验」降低对真实环境交互的依赖 1
2025-02-27

ViT-Adapter复现

ViT-Adapter 复现 ​ 好久没被工程问题折磨了,又被折磨了好惨,不过每次折磨总是能学到新东西 不要轻易尝试重构代码 ​ 我在复现 ViT-Adapter/segmentation at main · czczup/ViT-Adapter 这个仓库的时候,由于官方 repo 给出的 mmcv 环境太老,必须使用 cuda=11.1 的环境,但是服务器的版本是 cuda=12.2,并不能
2025-02-27

value_eval

值函数估计 ​ 在前面我们进行了 MDP 的理论推导,可以发现 value-based 算法的核心在于值函数的估计,状态值函数 Vπ(s)V^\pi(s)Vπ(s) 的定义为: Vπ(s)=Eπ[∑k=0∞γkrt+k+1∣st=s]V^\pi(s) = \mathbb{E}_\pi \left[ \sum_{k=0}^\infty \gamma^k r_{t+k+1} \bigg| s_t =
2025-02-17
123…12

搜索