<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
    <channel>
      <title>Yifan Huang</title>
      <link>https://allenyolk.github.io</link>
      <description>Last 10 notes on Yifan Huang</description>
      <generator>Quartz -- quartz.jzhao.xyz</generator>
      <item>
    <title>Tool Stack</title>
    <link>https://allenyolk.github.io/tool-stack</link>
    <guid>https://allenyolk.github.io/tool-stack</guid>
    <description><![CDATA[ A living document of my tool stack. ]]></description>
    <pubDate>Sun, 19 Apr 2026 15:15:13 GMT</pubDate>
  </item><item>
    <title>Python: Deep Copy and Pickle</title>
    <link>https://allenyolk.github.io/Tech-Notes/python-deepcopy-pickle</link>
    <guid>https://allenyolk.github.io/Tech-Notes/python-deepcopy-pickle</guid>
    <description><![CDATA[ 在 Python 开发时，常会遇到 TypeError: cannot pickle &#039;…&#039; object。这通常是因为我们试图 deep copy 或者序列化一个对象，但该对象的某个属性却是不可序列化的。 Pickle 详解 基本概念 pickle 是 Python 的序列化协议，可将 Python 对象转换成字节流。pickle 包提供的接口可以对象序列化到内存或者硬盘上，也可以将内存或硬盘上的字节流转换成对象。 import pickle class A: def __init__(self, x): self.x = x self.y = [x, x, x] a =... ]]></description>
    <pubDate>Thu, 16 Apr 2026 14:18:24 GMT</pubDate>
  </item><item>
    <title>Yifan Huang</title>
    <link>https://allenyolk.github.io/</link>
    <guid>https://allenyolk.github.io/</guid>
    <description><![CDATA[  Short Bio I’m currently a PhD student at School of Computer Science, Peking University, under the supervision of Prof. Yonghong Tian. ]]></description>
    <pubDate>Tue, 07 Apr 2026 11:45:39 GMT</pubDate>
  </item><item>
    <title>Normalization-free Networks</title>
    <link>https://allenyolk.github.io/Research-Notes/norm-free-networks</link>
    <guid>https://allenyolk.github.io/Research-Notes/norm-free-networks</guid>
    <description><![CDATA[ 在深度网络中，batch normalization (BN) 和 layer normalization (LN) 等归一化层的主要作用有： 减少内部协变量偏移（internal covariate shift），保持激活分布稳定 使 loss landscape 光滑，令大学习率、大 batch size 下的训练更稳定 提供了正则化效果，提升模型泛化能力：例如，BN 训练时统计量基于当前 mini batch 计算；这些统计量随着训练 step 不断变化，与整个数据集上的真实统计量不相等，相当于引入了微小噪声。 但归一化层存在缺点。以 BN 为例： 时空开销大：计算过程较为复杂，且需要保... ]]></description>
    <pubDate>Thu, 26 Mar 2026 11:36:06 GMT</pubDate>
  </item><item>
    <title>Mixed Precision Training</title>
    <link>https://allenyolk.github.io/Tech-Notes/mixed-precision-training</link>
    <guid>https://allenyolk.github.io/Tech-Notes/mixed-precision-training</guid>
    <description><![CDATA[  本笔记参考了 AISystem开源课程。 混合精度训练 (mixed-precision training) 通过在模型训练过程中使用不同的数值精度来达到加速训练和减少内存消耗的目的。其核心思想在于： 低精度计算：前向传播和反向传播时，使用较低的精度 (e.g., float16)。 高精度参数：16 位浮点数的范围和精度有限。为了维持训练稳定性和模型性能，使用高精度来保存和更新模型参数 (e.g. ]]></description>
    <pubDate>Tue, 17 Mar 2026 11:23:53 GMT</pubDate>
  </item><item>
    <title>巴西签证申请</title>
    <link>https://allenyolk.github.io/Misc/brazil-visa</link>
    <guid>https://allenyolk.github.io/Misc/brazil-visa</guid>
    <description><![CDATA[ 我有幸 中稿 ICLR 2026， 即将赴巴西参会。本文结合我自己的实际申请经验，梳理了巴西签证申请的详细流程与所需材料，供有类似需求的同学参考。 申请流程 1. ]]></description>
    <pubDate>Mon, 16 Mar 2026 15:26:52 GMT</pubDate>
  </item><item>
    <title>PyTorch: Tensor Version and Data</title>
    <link>https://allenyolk.github.io/Tech-Notes/pytorch-tensor-version-and-data</link>
    <guid>https://allenyolk.github.io/Tech-Notes/pytorch-tensor-version-and-data</guid>
    <description><![CDATA[ 本笔记将结合代码解析 PyTorch 中 torch.Tensor.data 以及 torch.Tensor._version 的底层机制。 torch.Tensor._version 机制 _version 是 PyTorch tensor 的一个属性，用于追踪原地 (in-place) 修改次数。每当 tensor 发生原地操作 (如 add_、copy_ 等) 时，_version 都会自增。如此一来，autograd 可以检测到数据是否被意外修改，防止梯度计算出错。 以下面的代码为例： import torch x = torch.tensor(2.0) w = torch.tenso... ]]></description>
    <pubDate>Mon, 16 Mar 2026 06:15:40 GMT</pubDate>
  </item>
    </channel>
  </rss>