score_based 基于分数的生成模型(Score-based Generative Model ) Overview 首先简单讲讲分数模型(score-based models) 是怎么回事,以一句话总结来说就是: 它估计 数据分布相关的梯度 并基于 朗之万动力学(Langevin Dynamics) 的思想来生成样本。 Score Matching 如果有一组数据 {x1,x1,…,xn}\{\b 2025-05-31
基于分数的生成模型 (Score-based Generative Models) 基于分数的生成模型(Score-based Generative Model) Overview 首先,我们来探讨一下什么是基于分数的生成模型(Score-based Generative Models,简称SGM)。其核心思想可以概括为:该模型通过估计数据概率密度函数的对数梯度(即“分数”),并借鉴**朗之万动力学(Langevin Dynamics)**的原理来逐步生成新的数据样本 2025-05-31
timm timm 库实用手册 什么是 timm 库? PyTorch Image Models (timm)是一个图像模型(models)、层(layers)、实用程序(utilities)、优化器(optimizers)、调度器(schedulers)、数据加载/增强(data-loaders / augmentations)和参考训练/验证脚本(reference training / val 2025-05-29
flow_intro Flow Models taxonomy 从模型结构来说,主流的生成模一般可以分成以下几种:GAN,VAE,Flow,Diffusion 也有一种分类方法把 Component-by-Component(Auto-regressive model,例如 PixelRNN,VAR,NAR 等)的生成式模型也单独划分成一类,但是个人感觉这种分类方式不一样,上面模型的架构都可以应用于 VA 2025-05-20
Flow Models 详解 Flow Models 详解 生成模型概览 在探索模型结构的多样性时,主流的生成模型大致可分为几类:GAN (生成对抗网络)、VAE (变分自编码器)、Flow (流模型)、Diffusion (扩散模型)以及 AR (自回归模型)等。它们各有特点,致力于从不同角度解决数据生成的问题。 基于流的生成模型 (Flow-based Generative Model) 首先需要回顾一下 2025-05-20 #生成模型 #Flow #深度学习
PointNet & PointNet++ PointNet & PointNet++ 3d 数据多重表示,例如 point cloud,mesh,volumetric 和 RBGD(投影过后的视角),但是我们常常使用的是 point cloud数据格式,因为点云格式是传感器的原始数据,同时是一种规范的数据形式,因此在实际中我们常常选择对点云数据处理而非其他格式的 3d 数据,PointNet 之前的工作都是通过将点云数据通过 2025-05-18
Hashable & Mutable Hashable & Mutable 的讨论 基本概念 可变性 (Mutability) 与不可变性 (Immutability) 首先,我们来区分可变对象和不可变对象。 可变对象 (Mutable Objects):指的是那些在创建后,其内部状态可以被修改的对象。这意味着你可以在不改变对象在内存中的地址(ID)的情况下,改变其内容。常见可变类型有 list , dict , se 2025-04-30
on-off-line 对于在线处理和离线处理的讨论 问题描述: 我在使用 MLLM 的 VQA 方式进行单目标跟踪的时候,出现了一个问题是,由于输入的图片分辨率不一样,如果我使用了 normalize bbox 模型并不能正确理解 normalize bbox 的含义,因此我需要正确裁剪 bbox 输入模型相同分辨率的图像,因此需要正确处理数据集,有两种方式,将数据集先全部裁剪完再开始训练,这就是 off-li 2025-04-24
intro 深度学习训练耗时: 训练耗时=训练数据规模×单步计算量⏟模型相关,相对固定/计算速率⏟可变因素\text{训练耗时}=\underbrace{\text{训练数据规模} \times \text{单步计算量}}_{模型相关,相对固定} / \underbrace{\text{计算速率}}_{可变因素} 训练耗时=模型相关,相对固定训练数据规模×单步计算量/可变因素计算速率 计算速率: 计算 2025-04-16