深度学习
超解析内存网络:改变 Transformer 内存效率的新方法
超解析内存网络:改变 Transformer 内存效率的新方法
Hymba,一种挑战小型 LLM 极限的新架构
Hymba,一种挑战小型 LLM 极限的新架构
Insight-V:连接视觉与思维的多模态推理新策略
Insight-V:连接视觉与思维的多模态推理新策略
稳定流:图像生成背后 "真正重要的层次 "可视化
稳定流:图像生成背后 "真正重要的层次 "可视化
通过 OWL-ViT 实现开放词汇对象检测
通过 OWL-ViT 实现开放词汇对象检测
神经网络
[SOK-Bench] 利用视频中的真实世界知识进行情景视频推理基准测试
[SOK-Bench] 利用视频中的真实世界知识进行情景视频推理基准测 ...
计算机视觉
[Libra] 利用解耦视觉系统对大规模语言模型进行新的多模态设计
[Libra] 利用解耦视觉系统对大规模语言模型进行新的多模态设计
大型语言模型
[DrHouse]利用传感器信息和专业知识的诊断系统
[DrHouse]利用传感器信息和专业知识的诊断系统
医疗
全面调查钢铁行业基于人工智能的预测性维护的现状和挑战
全面调查钢铁行业基于人工智能的预测性维护的现状和挑战
预测模型
利用信息熵和 CRReLU 优化激活函数的方法
利用信息熵和 CRReLU 优化激活函数的方法
损失函数
[让每个人都能享受便利......]使用 WHISPER 对发音障碍者的语音进行适配
[让每个人都能享受便利......]使用 WHISPER 对发音障碍者 ...
肢体瘫痪者的语音识别功能
SpeechT5 是一种革命性的语音处理模式!微软 SpeechT5 语音处理模型的惊人性能
SpeechT5 是一种革命性的语音处理模式!微软 SpeechT5 ...
声音
[你使用的是 Wav2vec2?这是一种更有效的语音特征提取方法
[你使用的是 Wav2vec2?这是一种更有效的语音特征提取方法
肢体瘫痪者的语音识别功能
一项极具挑战性的分类任务!使用 WHFEMD 算法准确、高效地捕捉和分类发音障碍的特征
一项极具挑战性的分类任务!使用 WHFEMD 算法准确、高效地捕捉和分 ...
肢体瘫痪者的语音识别功能
一篇推翻传统观点的论文!听力障碍者是根据噪音而不是根据他们的特征进行分类的!
一篇推翻传统观点的论文!听力障碍者是根据噪音而不是根据他们的特征进行分 ...
肢体瘫痪者的语音识别功能
平等享受便利!EasyCall 语料库",这是一个针对听力障碍者的语音语料库
平等享受便利!EasyCall 语料库",这是一个针对听力障碍者的语音 ...
肢体瘫痪者的语音识别功能
质疑 "规范"!使用超低复杂度 DNN 抑制噪音
质疑 "规范"!使用超低复杂度 DNN 抑制噪音
噪声抑制