赶上最新的AI论文

什么是AI-SCHOLAR？

LongVie：通过多模式控制实现一分钟超高质量视频生成的新时代

LongVie：通过多模式控制实现一分钟超高质量视频生成的新时代

Skywork UniPic：新一代多模态模型，集图像理解、生成和编辑于一体，效率极高

Skywork UniPic：新一代多模态模型，集图像理解、生成和编辑 ...

GPT-4o 级图像生成的民主化：Janus-4o 和 ShareGPT-4o-Image 挑战

GPT-4o 级图像生成的民主化：Janus-4o 和 ShareGP ...

稳定流：图像生成背后 "真正重要的层次 "可视化

稳定流：图像生成背后 "真正重要的层次 "可视化

[连我的狗都会说话的零镜头学习] 验证并解释人工智能语音克隆和唇音同步

[连我的狗都会说话的零镜头学习] 验证并解释人工智能语音克隆和唇音同步

29/01/2025 神经网络

MaskDiT：用于图像生成的低学习成本扩散模型

MaskDiT：用于图像生成的低学习成本扩散模型

27/01/2025 生成图像

根据产品类别和品牌风格生成电子商务背景图片

根据产品类别和品牌风格生成电子商务背景图片

17/01/2025 生成图像

提出一种新的图像编辑方法 "模仿编辑"--MimicBrush

提出一种新的图像编辑方法 "模仿编辑"--MimicBrush

16/01/2025 图像编辑

文本-2-图像利用扩散模型生成物体背景

文本-2-图像利用扩散模型生成物体背景

10/01/2025 生成图像

MicroDiffusion：千元生成图像质量模型，胜过数万美元的模型

MicroDiffusion：千元生成图像质量模型，胜过数万美元的模型

25/12/2024 生成图像

[SKETCHPAD] 利用中间草图增强多模态语言模型的推理能力

[SKETCHPAD] 利用中间草图增强多模态语言模型的推理能力

18/12/2024 大型语言模型

[Plot2Code] 用于测试多模式 LLM 代码生成的基准

[Plot2Code] 用于测试多模式 LLM 代码生成的基准

17/12/2024 大型语言模型

[LDDGAN]用于最快推理的扩散模型

[LDDGAN]用于最快推理的扩散模型

29/09/2024 扩散模型

GenTron：用于生成图像和视频的扩散变换器

GenTron：用于生成图像和视频的扩散变换器

26/08/2024 生成图像

帧插值人工智能技术 RIFE 和 IFNet 的机制和应用

帧插值人工智能技术 RIFE 和 IFNet 的机制和应用

20/08/2024 生成图像

AVI-Talking，它能通过语音生成自然的 3D 说话面孔

AVI-Talking，它能通过语音生成自然的 3D 说话面孔

17/08/2024 人脸识别

分离扩散：从单张图像中提取多个概念的 T2I 模型

分离扩散：从单张图像中提取多个概念的 T2I 模型

26/05/2024 生成图像

U-ViT：用于扩散建模的 ViT 主干网

U-ViT：用于扩散建模的 ViT 主干网

23/05/2024 生成图像