文章
调试 LLM 多少次有效?用于检测效果衰减的新指标 "DDI "是什么?
调试 LLM 多少次有效?用于检测效果衰减的新指标 "DDI "是什么 ...
速度与准确性的结合:量化感知 LLM 预训练 "QAP"。
速度与准确性的结合:量化感知 LLM 预训练 "QAP"。
HiWave:无需额外学习即可生成 4K 图像的小波扩散创新
HiWave:无需额外学习即可生成 4K 图像的小波扩散创新
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间的提示中遗忘信息
Forget-Me-Not: 建议采用一种简单的提示技术,防止在长时间 ...
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
对话优化标记器的潜力:一种将 LLM 推理效率提高 10% 的方法
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
RoboTwin 2.0:双臂操作机器人的可扩展合成数据生成和基准设计
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
通过基于属性的测试增强 LLM 代码生成!打破自欺欺人的新框架 PGS
OctoThinker 通过改进 Llama 来支持强化学习,展示了中间学习的威力
OctoThinker 通过改进 Llama 来支持强化学习,展示了中 ...
什么是 DualTHOR?用于提高双臂机器人实际适应能力的新一代模拟器
什么是 DualTHOR?用于提高双臂机器人实际适应能力的新一代模拟器
针对大规模语言模型的离群值安全预训练创新,可防止离群值并保护量化准确性
针对大规模语言模型的离群值安全预训练创新,可防止离群值并保护量化准确性
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGPT-4o-Image 挑战
GPT-4o 级图像生成的民主化:Janus-4o 和 ShareGP ...
FedNano:大型多模态模型的轻量级高效分布式学习
FedNano:大型多模态模型的轻量级高效分布式学习
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实场景生成
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实 ...
SwarmAgentic:利用蜂群智能全自动生成代理系统
SwarmAgentic:利用蜂群智能全自动生成代理系统
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模型
为了让人工智能不会忘记图像,CoMemo 率先推出了下一代视觉和语言模 ...
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新方法
PictSure:通过视觉嵌入功能挑战 "Few-Shot "分类的新 ...
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
通过 "截断近端策略优化 "加速强化学习,实现长句生成的效率革命
小波扩散:最快的扩散模型
小波扩散:最快的扩散模型
生成图像
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技术的新发展
利用 ChatGPT 提高面部识别的准确性和透明度,这是软性生物识别技 ...
大型语言模型
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的框架现已推出
[RL-GPT]在 Mincraft 中以比平常快几倍的速度获取钻石的 ...
机器学习
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
现在有了一个框架,可以让法律硕士使用 MBTI 评估人的个性!
聊天室GPT
VCRL:利用奖励差异控制学习难度的 LLM 强化学习新方法
VCRL:利用奖励差异控制学习难度的 LLM 强化学习新方法
从记忆到检索的 LLM:工具内学习的理论优势和证据
从记忆到检索的 LLM:工具内学习的理论优势和证据
简单!准确度高!异常检测模型PatchCore的吸引力
简单!准确度高!异常检测模型PatchCore的吸引力
目标检测
优于ViT!大规模CNN的新基本模型!:InternImage
优于ViT!大规模CNN的新基本模型!:InternImage
深度学习
针对体育博彩中足球比赛预测挑战的机器学习模型
针对体育博彩中足球比赛预测挑战的机器学习模型
体育分析
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方法
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方 ...
RLHF
FakeParts:一个新的基准,揭示了部分深度伪造的威胁和检测极限
FakeParts:一个新的基准,揭示了部分深度伪造的威胁和检测极限
Social-MAE 是一种社交人工智能,它利用自我监督学习来解读情绪、笑声和个性
Social-MAE 是一种社交人工智能,它利用自我监督学习来解读情绪 ...
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实场景生成
ImmerseGen:由代理引导的、轻量级的、高度逼真的下一代虚拟现实 ...
[Qwen2-VL] 可处理不同分辨率图像和视频的最新 VLM
[Qwen2-VL] 可处理不同分辨率图像和视频的最新 VLM
大型语言模型