赶上最新的AI论文

什么是AI-SCHOLAR？

[InsectMamba]利用状态空间模型对害虫进行分类，以支持智能农业

[InsectMamba]利用状态空间模型对害虫进行分类，以支持智能农 ...

04/09/2024 计算机视觉

[CoMat] 解决文本与图像之间的差异

[CoMat] 解决文本与图像之间的差异

28/08/2024 计算机视觉

[OW-VISCap]注意看不见的物体--理解开放世界视频的新方法

[OW-VISCap]注意看不见的物体--理解开放世界视频的新方法

21/08/2024 计算机视觉

通过 CLIP 评估零镜头图像理解模型的鲁棒性

通过 CLIP 评估零镜头图像理解模型的鲁棒性

24/06/2024 对比学习

[VideoAgent] 使用大规模语言模型作为代理来理解长视频

[VideoAgent] 使用大规模语言模型作为代理来理解长视频

21/06/2024 计算机视觉

[DiffYOLO] 改进低质量数据物体检测的创新框架

[DiffYOLO] 改进低质量数据物体检测的创新框架

18/03/2024 计算机视觉

Mobile-Agent：通过截图分析实现移动应用操作自动化

Mobile-Agent：通过截图分析实现移动应用操作自动化

06/03/2024 模式识别

InstructPix2Pix：用户导向图像编辑模式的出现

InstructPix2Pix：用户导向图像编辑模式的出现

28/02/2024 计算机视觉

[mPLUG-Owl]开发能理解图像和文本的 LLM

[mPLUG-Owl]开发能理解图像和文本的 LLM

06/02/2024 计算与语言

T2I-适配器：文本到图像转换技术的前沿

T2I-适配器：文本到图像转换技术的前沿

25/01/2024 计算机视觉

ImageBind：汇集所有信息，创造新知识

ImageBind：汇集所有信息，创造新知识

24/01/2024 机器学习

先进图像理解与自然语言交互的多模态 GPT-4 和 LLaVA 集成

先进图像理解与自然语言交互的多模态 GPT-4 和 LLaVA 集成

09/01/2024 计算机视觉

掩码 R-CNN：高效检测图像中的物体

掩码 R-CNN：高效检测图像中的物体

04/01/2024 计算机视觉

U-Net：用于生物医学图像分割的卷积网络

U-Net：用于生物医学图像分割的卷积网络

29/12/2023 计算机视觉

用于大规模图像识别的深度卷积网络

用于大规模图像识别的深度卷积网络

28/12/2023 图片识别

利用三维透视几何约束增强扩散模型

利用三维透视几何约束增强扩散模型

27/12/2023 计算机视觉