Projects
[2023.08--2024.02] 基于图像参考的人物一致性ID图像生成研究
- 上海 · 自由量级(上海)智能科技有限公司
- 在无需对生成模型进行训练和微调的情况下,实现任意参考人物的一致性ID图像生成。支持场景构造、风格化、情绪编辑以及动作控制等高级语义控制,可以与任意基于Stable Diffusion的变体模型搭配使用,具有良好的扩展性和广泛的适用性。
- 该工作成果《MagicNaming: Consistent Identity Generation by Finding a "Name Space" in T2I Diffusion Models》已被CCF A类会国际会议 AAAI 2025录用。
-
[2023.03--2023.05] 基于噪声扰动的文本生成图像风格化研究
- 北京 · 京东探索研究院
- 针对传统方法存在的数据集收集不易、计算资源受限等问题,提出了基于噪声扰动的风格生成方法。该方法无需对大模型进行训练,可作为即插即用的组件,在任意基于无分类器引导的扩散模型推理过程中部署使用,具备快捷高效的特点。相比于传统方法长达数周的模型训练过程,该方法可在2秒时间内快速实现生成图像的风格化。
- 该工作成果《Null-text Guidance in Diffusion Models is Secretly a Cartoon-style Creator》已被CCF A类会议ACM MM 2023录用。
-  
[2022.10--2023.02] 基于显著性噪声感知融合的文本生成图像主体控制研究
- 北京 · 京东探索研究院
- 提出了基于显著性感知噪声融合的主体控制方法。该方法首次提出通过结合两个任意现有预训练模型的形式来增强对生成图像的主体可控性,从而避免针对特定生成任务对模型进行重新训练或者微调,具备灵活高效的特点。实验结果表明,显著性感知噪声融合方法能实现两个任意模型生成优势的有效结合,其在多个具有挑战性的生成任务上都显著地提升了文本对生成主体的可控性,具备广泛的应用价值。
- 该工作成果《MagicFusion: Boosting Text-to-Image Generation Performance by Fusing Diffusion Models》已被CCF A类 会议ICCV 2023录用。
-  
[2020.10--2021.10] 面向行人重识别的伪监督学习方法研究
- 长沙 · 量子信息研究所兼高性能计算国家重点实验室(HCPL)
- 调研伪标签策略,探索伪标签数据对深度学习模型学习效果的影响,正式提出了伪监督学习的概念。分析当前伪监督学习方法中引起监督噪音的关键因素,提出一种伪监督学习框架,减少噪音监督信息对模型性能的影响。
- 该工作使三个基线工作的Rank-1性能得到了不同程度的提升,论文《Heterogeneous Pseudo-Supervised Learning for Few-shot Person Re-Identification》已在SCI 1区top期刊Neural Networks 上发表。
-  
[2019.10--2020.10] 面向行人重识别的渐进式半监督学习方法研究
- 长沙 · 量子信息研究所兼高性能计算国家重点实验室(HCPL)
- 对现有基于Few-shot半监督学习的行人重识别方法的渐进式学习过程进行分析,明确了采样准则和采样策略的重要性。提出了基于方差的采用准则和采样算法,优化了伪标签的置信度量,有效减少了标签噪音。
- 该工作在两大数据集上的Rank-1分别达62.17%和71.79%,取得当时的SOTA,论文《One-shot Video-based Person Re-Identification with Variance Subsampling Algorithm》已在 SCI期刊 Comput Anim Virtual Worlds上发表。
-
[2016.08--2017.05] 国家级大学生创业训练项目(SIETP)
- 重庆 · 重庆大学
- 项目简介:项目名为“生活服务类物品代送平台—笑递”。笑递是一个整合物品代送需求的信息平台, 用户通过笑递实现互助物品代送,提高生活工作效率。
- 个人贡献:担任创业团队CEO/项目经理,负责技术、产品、运营等重大决策的协调和安排,参与产品设计和前端开发。
- 项目成效:产品以webapp的形式对接微信服务号上线运营,首月注册用户破千。该项目产品获中国大学生计算机设计大赛全国一等奖,获评SIETP优秀项目奖。
-