赶上最新的AI论文
什么是AI-SCHOLAR?
搜索历史
删除所有
登录
新注册
最新文章
从零开始学习人工智能
ゼロから学ぶ
图像识别
自然语言处理
语音识别
机器学习
深度学习
对抗性学习(GAN)
强化学习
采访
查看更多▼
TOP
强化学习
强化学习
从制造业机器人操作演示中学习的路线图
从制造业机器人操作演示中学习的路线图
22/01/2025
机器人
[SCoRe]强化学习,提高 LLM 自我纠错能力!在多步骤过程中发现和纠正错误
[SCoRe]强化学习,提高 LLM 自我纠错能力!在多步骤过程中发现 ...
31/10/2024
大型语言模型
由 NAVER 开发!HyperCLOVA X 是专门针对韩语的大规模语言模型
由 NAVER 开发!HyperCLOVA X 是专门针对韩语的大规模 ...
29/10/2024
大型语言模型
[交叉集合表征学习] 克服深度强化学习中的多样性挑战
[交叉集合表征学习] 克服深度强化学习中的多样性挑战
23/10/2024
神经网络
在大规模采用电动汽车的时代,人工智能将解决电力供需难题
在大规模采用电动汽车的时代,人工智能将解决电力供需难题
11/10/2024
神经网络
[利用人工智能追踪逃犯的新技术
[利用人工智能追踪逃犯的新技术
09/10/2024
多代理系统
[FlagVNE] 用于虚拟网络嵌入的灵活、可通用的强化学习框架
[FlagVNE] 用于虚拟网络嵌入的灵活、可通用的强化学习框架
04/10/2024
网络和互联网架构
在印度开发一个专门处理高中物理选择题的 LLM 聊天机器人
在印度开发一个专门处理高中物理选择题的 LLM 聊天机器人
09/09/2024
大型语言模型
有趣的发现:盲人人工智能学会了绘制环境地图
有趣的发现:盲人人工智能学会了绘制环境地图
31/05/2024
强化学习
Meta 为贝叶斯优化带来意想不到的改进
Meta 为贝叶斯优化带来意想不到的改进
19/02/2024
贝叶斯优化
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方法
[DPO]一种不使用强化学习,直接将大规模语言模型与用户偏好相匹配的方 ...
02/02/2024
RLHF
Open X-Embodiment:实现通用机器人学习
Open X-Embodiment:实现通用机器人学习
10/01/2024
机器人
掩码 R-CNN:高效检测图像中的物体
掩码 R-CNN:高效检测图像中的物体
04/01/2024
计算机视觉
机器优化策略推荐:现在已有系统可推荐符合广告商目标的策略
机器优化策略推荐:现在已有系统可推荐符合广告商目标的策略
26/12/2023
强化学习
机器如何学习理解人类的直觉?
机器如何学习理解人类的直觉?
25/12/2023
机器学习
EUREKA:利用 LLM 自动设计薪酬。
EUREKA:利用 LLM 自动设计薪酬。
04/12/2023
RLHF
扩散政策:机器人扩散模型!当机器人也能做披萨
扩散政策:机器人扩散模型!当机器人也能做披萨
06/11/2023
扩散模型
隐性行为克隆:模仿学习的新表述!机器人的复杂行为
隐性行为克隆:模仿学习的新表述!机器人的复杂行为
30/10/2023
机器人
1
2
3
...
5