赶上最新的AI论文

什么是AI-SCHOLAR？

LongVie：通过多模式控制实现一分钟超高质量视频生成的新时代

LongVie：通过多模式控制实现一分钟超高质量视频生成的新时代

HiWave：无需额外学习即可生成 4K 图像的小波扩散创新

HiWave：无需额外学习即可生成 4K 图像的小波扩散创新

为了让人工智能不会忘记图像，CoMemo 率先推出了下一代视觉和语言模型

为了让人工智能不会忘记图像，CoMemo 率先推出了下一代视觉和语言模 ...

Insight-V：连接视觉与思维的多模态推理新策略

Insight-V：连接视觉与思维的多模态推理新策略

稳定流：图像生成背后 "真正重要的层次 "可视化

稳定流：图像生成背后 "真正重要的层次 "可视化

让法律硕士在白板上写下他们的推理过程，可以大大提高他们的视觉推理能力！

让法律硕士在白板上写下他们的推理过程，可以大大提高他们的视觉推理能力！

26/12/2024 提示方法

使用 GPT-4V 全面评估泛化情绪识别 (GER)

使用 GPT-4V 全面评估泛化情绪识别 (GER)

06/11/2024 大型语言模型

[MMSEARCH] 整合图像和文本的多模态搜索系统

[MMSEARCH] 整合图像和文本的多模态搜索系统

29/10/2024 大型语言模型

[Qwen2-VL] 可处理不同分辨率图像和视频的最新 VLM

[Qwen2-VL] 可处理不同分辨率图像和视频的最新 VLM

01/10/2024 大型语言模型

使用 CLIP 进行深度伪造检测的新领域

使用 CLIP 进行深度伪造检测的新领域

30/08/2024 假货检测

帧插值人工智能技术 RIFE 和 IFNet 的机制和应用

帧插值人工智能技术 RIFE 和 IFNet 的机制和应用

20/08/2024 生成图像

使用频率掩码的新一代深度防伪检测技术

使用频率掩码的新一代深度防伪检测技术

29/07/2024 假货检测

[FreqNet]通过频率空间学习进行通用深度假货检测

[FreqNet]通过频率空间学习进行通用深度假货检测

29/07/2024 假货检测

利用 CLIP 检测假图像：图像语言建模用于假图像检测

利用 CLIP 检测假图像：图像语言建模用于假图像检测

25/05/2024 假货检测

苹果公司开发了一种大规模自回归图像模型，它可以像 LLM 一样进行扩展。

苹果公司开发了一种大规模自回归图像模型，它可以像 LLM 一样进行扩展 ...

07/05/2024 计算机视觉

生成式人工智能和用户的 "激情行为"。

生成式人工智能和用户的 "激情行为"。

ConvNeXt V2：利用掩码自动编码器改进和扩展 ConvNets

ConvNeXt V2：利用掩码自动编码器改进和扩展 ConvNets

03/04/2024 图片识别

微调 TEXT-TO-IMAGE 扩散模型以生成虚假特征

微调 TEXT-TO-IMAGE 扩散模型以生成虚假特征

13/03/2024 图片识别