标签：Deep Learning | Hiang Xu's Blog

What, How, When and Why about VLA

Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models机器人领域的VLA逐渐火热，但是在快速发展的过程中还有很多没解决的问题，以及经过验证的结论，字节这篇类似empirical

发布于 · 2025-02-08 · #Deep Learning

InstructBLIP 指令微调训练多模态大语言模型

想系统且细致的看一下LLM及MLLM的工作，之前一直跟到了BLIP2，后面的就了解的不全面了。这一系列的文章会有一个章节进行扫盲，比如这个工作里提到的held-in和held-out之类的。开始开始！

发布于 · 2024-04-05 · #Deep Learning

扩散模型理论

从数学本质出发，生成模型本质上是一种概率模型。它的生成过程可以表达成为数学中的两个过程，计算样本的概率分布和从概率分布中采样。以最基本的无条件图像生成模型为例，我们需要构建出一个概率分布函数P(x)，x为图像样本。它在x的像素空间中计算分布。在训练过程中，我们将x分为正负样本，正样本为现实世界中真实

发布于 · 2023-09-04 · #Deep Learning

Large Language Model (LLM) 论文阅读

Large Language Model (LLM) 论文阅读最近LLM的论文几乎每天都会出来一篇新的，一些新出来的论文里面涉及的模块已经理解不了了哈哈，开一个坑也是让自己充充电本篇文章之后会作为一个相关文章的目录，方便回顾。一起主动拥抱新的技术吧～

发布于 · 2023-07-21 · #Deep Learning

模型量化资料整理

模型量化学习资料整理模型的量化是深度学习模型落地不可或缺的一环，如何在边缘端让模型在尽量保证精度的同时，变得更小更快是一个挺有意思的问题。这周打算集中学习一下，本篇文章先记录一下质量较高的学习资料。nvidia int8 TRT量化 PPThttps://on-demand.gputechconf.

发布于 · 2023-07-10 · #Deep Learning #Algorithm

Mutual Information Neural Estimation

Mutual Information Neural Estimation在读完Prof. Tishby的利用 information bottleneck 来解释深度学习的文章，“Opening the black box of Deep Neural Networks via Informatio

发布于 · 2023-02-08 · #Machine Learning #Deep Learning

Task Discrepancy Maximization for Fine-grained Few-Shot Classification CVPR2022

CVPR 2022 FSLCVPR2022列表已经放出来一段时间了，最近也一直在看感兴趣的论文，先放一个few-shot learning的文章1、Task Discrepancy Maximization for Fine-grained Few-Shot Classification先把文章的作

发布于 · 2022-08-27 · #Deep Learning

Generator Adversarial Net and PU Learning

GAN and PU Learning最近在用GAN做一些半监督的工作，本篇文章主要介绍GAN，PU Learning的联系与区别，以及一些工作的介绍。1、PreliminaryGAN是很经典的生成网络，应用也十分广泛，例如图像生成，图像风格迁移等。简单介绍一下GAN的思路，有一个Discrimin

发布于 · 2022-07-17 · #Deep Learning

Survival Analysis

发布于 · 2022-05-26 · #Machine Learning #Deep Learning #Algorithm

Semi-Supervised Few-Short Learning Review

Semi-Supervised Few-Short Learning Review还在跑实验，正好有时间把最近看的一些东西放上来，主要是几篇有关SSFSL的工作

发布于 · 2022-02-09 · #Deep Learning