文章
让 LLM 代替人类当导师?用自然语言训练的强化学习代理
让 LLM 代替人类当导师?用自然语言训练的强化学习代理
超解析内存网络:改变 Transformer 内存效率的新方法
超解析内存网络:改变 Transformer 内存效率的新方法
Hymba,一种挑战小型 LLM 极限的新架构
Hymba,一种挑战小型 LLM 极限的新架构
Insight-V:连接视觉与思维的多模态推理新策略
Insight-V:连接视觉与思维的多模态推理新策略
稳定流:图像生成背后 "真正重要的层次 "可视化
稳定流:图像生成背后 "真正重要的层次 "可视化
通过 OWL-ViT 实现开放词汇对象检测
通过 OWL-ViT 实现开放词汇对象检测
神经网络
[SOK-Bench] 利用视频中的真实世界知识进行情景视频推理基准测试
[SOK-Bench] 利用视频中的真实世界知识进行情景视频推理基准测 ...
计算机视觉
[Libra] 利用解耦视觉系统对大规模语言模型进行新的多模态设计
[Libra] 利用解耦视觉系统对大规模语言模型进行新的多模态设计
大型语言模型
[DrHouse]利用传感器信息和专业知识的诊断系统
[DrHouse]利用传感器信息和专业知识的诊断系统
医疗
描述性逻辑中异构图神经网络全局描述的新方法
描述性逻辑中异构图神经网络全局描述的新方法
GNN
全面调查钢铁行业基于人工智能的预测性维护的现状和挑战
全面调查钢铁行业基于人工智能的预测性维护的现状和挑战
预测模型
利用信息熵和 CRReLU 优化激活函数的方法
利用信息熵和 CRReLU 优化激活函数的方法
损失函数
[让每个人都能享受便利......]使用 WHISPER 对发音障碍者的语音进行适配
[让每个人都能享受便利......]使用 WHISPER 对发音障碍者 ...
肢体瘫痪者的语音识别功能
SpeechT5 是一种革命性的语音处理模式!微软 SpeechT5 语音处理模型的惊人性能
SpeechT5 是一种革命性的语音处理模式!微软 SpeechT5 ...
声音
[你使用的是 Wav2vec2?这是一种更有效的语音特征提取方法
[你使用的是 Wav2vec2?这是一种更有效的语音特征提取方法
肢体瘫痪者的语音识别功能
一项极具挑战性的分类任务!使用 WHFEMD 算法准确、高效地捕捉和分类发音障碍的特征
一项极具挑战性的分类任务!使用 WHFEMD 算法准确、高效地捕捉和分 ...
肢体瘫痪者的语音识别功能
一篇推翻传统观点的论文!听力障碍者是根据噪音而不是根据他们的特征进行分类的!
一篇推翻传统观点的论文!听力障碍者是根据噪音而不是根据他们的特征进行分 ...
肢体瘫痪者的语音识别功能
小波扩散:最快的扩散模型
小波扩散:最快的扩散模型
生成图像
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技术的新发展
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技 ...
大型语言模型
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的框架现已推出
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的 ...
机器学习
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
聊天室GPT
掩码 R-CNN:高效检测图像中的物体
掩码 R-CNN:高效检测图像中的物体
计算机视觉
图形是如此的神奇!审查与深度学习的整合
图形是如此的神奇!审查与深度学习的整合
GNN
在 35% 的情况下,LLM 代理都能成功引导客户购买!
在 35% 的情况下,LLM 代理都能成功引导客户购买!
聊天室GPT
首个利用 LLM 检测假新闻的框架!
首个利用 LLM 检测假新闻的框架!
Fakenews
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方法
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方 ...
RLHF
简单!准确度高!异常检测模型PatchCore的吸引力
简单!准确度高!异常检测模型PatchCore的吸引力
目标检测
Swin 变形金刚] 基于变形金刚的图像识别模型,你现在要抓紧了
Swin 变形金刚] 基于变形金刚的图像识别模型,你现在要抓紧了
图片识别
什么是 "提示音调整"?
什么是 "提示音调整"?
提示方法
用于评估人工智能代理性能的综合基准--AgentBench 现已推出!
用于评估人工智能代理性能的综合基准--AgentBench 现已推出!
代理模拟
StrongSORT:DeepSORT回来了,更强大了!升级后的追踪模型!
StrongSORT:DeepSORT回来了,更强大了!升级后的追踪模 ...
物体追踪