Hexo

常用Neck网络-1

SPP(Spatial Pyramid Pooling) Motivation： SPP的提出就是为了解决CNN输入图像大小必须固定的问题，从而可以使得输入图像高宽比和大小任意网络结构解析： SPP-Neck网络结构如下：首先是输入层(input image),其大小可以是任意的中间的部分就是SPP-Neck层，SPP会在最后一层卷积层输出的特征图上进行操作，将其划分为多个

2024-04-05

FeatUp(1)

FeatUp 本文章通过借助图像重建的思路提出了一种新型上采样算子，这篇论文的idea可以用以下几点概括：借助3D图像重建网络NeRF的想法：多个视角下的地分辨率信号可以指导采样高分辨率的特征图的“重建“过程，这里的“多个视角”指对原低分辨率特征图进行各种微调（jittered）之后的特征图，通过这些低分辨率的特征图可以有效地帮助重建高分辨率信号以Joint Bilateral Ups

2024-03-27

deep learning > computer vision > sampling operation

#scientific research

Python实用用法

Python实用用法路径操作： Python中常用路径操作库包括os.path 和 pathlib.Path，都是 Python 中用于处理文件和目录路径的模块，但它们的设计哲学和使用方式存在显著区别： os.path：是一个基于字符串的操作库，提供了许多函数来处理路径名，如连接路径、拆分路径、判断是否为绝对路径、获取目录/文件名等以过程式风格编写，所有操作返回的是字符串类型结果

2024-03-19

Wandb教程(2)

Wandb教程(2) Wand的推荐用法 Config： config的配置方法：直接赋值在初始化 wandb 之前或之后，可以创建一个字典或使用 wandb.config 的属性赋值方式来设置配置项。例如： 12345678910111213141516# 方法一：直接创建一个字典并赋值给 wandb.configconfig = { "learnin

2024-03-19

Wandb教程(1)

Wandb教程(1) Wandb（Weights & Biases）是一个用于机器学习实验跟踪、可视化和管理的平台。它提供了一个强大的工具集，帮助研究人员和开发人员跟踪他们的模型训练过程、超参数、指标以及模型的版本。他就是Tensorboard的白富美版本：颜值高，气质好，可视化交互性强，支持所有深度学习框架。它内嵌在计算机中，不需要你写可视化代码（我之前每次可视化都要写一次把张量的

2024-03-17

Pytorch学习

TensorBoardX教程(2)

Tensorboard的示例应用 Tensorboard进行中间特征图可视化：采用了注册钩子函数，再钩子函数中记录特征图，并将其可视化下来的方案，代码如下： 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849import torchimport torch.nn

2024-03-13

Pytorch学习

TensorBoardX教程(1)

TensorBoardX教程(1) TensorBoard 是一组用于数据可视化的工具。它包含在流行的开源机器学习库 Tensorflow 中。TensorBoard 的主要功能包括：可视化模型的网络架构跟踪模型指标，如损失和准确性等检查机器学习工作流程中权重、偏差和其他组件的直方图显示非表格数据，包括图像、文本和音频将高维嵌入投影到低维空间 TensorBoardX的使用：

2024-03-13

Pytorch学习

多臂老虎机

多臂老虎机问题题目描述：有一个拥有 KKK 根拉杆的老虎机(multi-armed bandit)，拉动每一根拉杆都对应一个关于奖励的概率分布 R\mathcal{R}R。我们每次拉动其中一根拉杆，就可以从该拉杆对应的奖励概率分布中获得一个奖励 rrr。我们在各根拉杆的奖励概率分布未知的情况下，从头开始尝试，目标是在操作 TTT 次拉杆后获得尽可能高的累积奖励。由于奖励的概率分布是未知

2024-03-12

intro

什么是强化学习强化学习是机器通过与环境交互来实现目标的一种计算方法。机器和环境的一轮交互是指，机器在环境的一个状态下做一个动作决策，把这个动作作用到环境当中，这个环境发生相应的改变并且将相应的奖励反馈和下一轮状态传回机器（因此强化学习示意图很像RNN网络）。这种交互是迭代进行的，机器的目标是最大化在多轮交互过程中获得的累积奖励的期望。强化学习用智能体（agent）概念来表示做决策的机器。相

2024-03-12

mmcv组件6

MMCV核心组件Hook MM的整个算法过程就像一个黑盒子：给定输入后（配置文件），黑盒子就会吐出算法结果。整个过程封装度非常高，几乎不需要手写什么代码，Hook机制的作用就是在算法执行过程中加入自定义操作呢 Hook就是一种一种触发器，可以在程序预定义的位置执行预定义的函数。MMCV根据算法的生命周期预定义了6个可以插入自定义函数的位点，用户可以在每个位点自由地插入任意数量的函数操作，如下

2024-03-05