Catch up on the latest AI articles

What is AI-SCHOLAR?

CompassVerifier: A New Benchmark And Robust Model To Revolutionize LLM Solution Verification

CompassVerifier: A New Benchmark And Robust Model To Revolutionize LLM Solution Verification

Evolution Of Llama To Support Reinforcement Learning, OctoThinker Shows The Power Of Intermediate Learning

Evolution Of Llama To Support Reinforcement Learning, OctoThinker Shows The Power Of Intermediate Le ...

What Is DualTHOR? Next Generation Simulator For Dual-Arm Robots' Adaptability To Reality

What Is DualTHOR? Next Generation Simulator For Dual-Arm Robots' Adaptability To Reality

Reinforcement Learning Acceleration By "Truncated Proximal Policy Optimization" Revolutionizing Efficiency Of Long Sentence Genera ...

Reinforcement Learning Acceleration By "Truncated Proximal Policy Optimization" Revolutionizing Effi ...

Semantics-Oriented Reward Design With "PrefBERT," A New Evaluation Method To Evolve Long Sentence Generation

Semantics-Oriented Reward Design With "PrefBERT," A New Evaluation Method To Evolve Long Sentence Ge ...

LLMs As Mentors Instead Of Humans? Reinforcement Learning Agents Trained In Natural Language

LLMs As Mentors Instead Of Humans? Reinforcement Learning Agents Trained In Natural Language

Insight-V: A New Strategy For Multimodal Reasoning Connecting Vision And Thought

Insight-V: A New Strategy For Multimodal Reasoning Connecting Vision And Thought

Roadmap For Learning From Demonstrations Of Robot Operations For The Manufacturing Industry

Roadmap For Learning From Demonstrations Of Robot Operations For The Manufacturing Industry

22/01/2025 Robot

[SCoRe] Reinforcement Learning To Enhance LLM's Ability To Self-correct! Identify And Correct Errors In A Multi-step Process

[SCoRe] Reinforcement Learning To Enhance LLM's Ability To Self-correct! Identify And Correct Errors ...

31/10/2024 Large Language Models

Developed By NAVER! HyperCLOVA X, A Large-scale Language Model Specialized For The Korean Language

Developed By NAVER! HyperCLOVA X, A Large-scale Language Model Specialized For The Korean Language

29/10/2024 Large Language Models

Cross-Ensemble Representation Learning] Overcoming Diversity Challenges In Deep Reinforcement Learning

Cross-Ensemble Representation Learning] Overcoming Diversity Challenges In Deep Reinforcement Learni ...

23/10/2024 Neural Network

AI Will Solve The Electricity Supply-demand Conundrum In The Era Of Mass EV Proliferation!

AI Will Solve The Electricity Supply-demand Conundrum In The Era Of Mass EV Proliferation!

11/10/2024 Neural Network

[Grasper] New Technology To Track Fugitives Using AI

[Grasper] New Technology To Track Fugitives Using AI

09/10/2024 Multiagent Systems

[FlagVNE] A Flexible And Generalizable Reinforcement Learning Framework For Virtual Network Embedding

[FlagVNE] A Flexible And Generalizable Reinforcement Learning Framework For Virtual Network Embeddin ...

04/10/2024 Networking And Internet Architecture

Development Of LLM Chatbot Specialized For Multiple Choice Questions In Physics At Indian High School Level

Development Of LLM Chatbot Specialized For Multiple Choice Questions In Physics At Indian High Schoo ...

09/09/2024 Large Language Models

Interesting Discovery: Blind AI Learns To Map Its Environment

Interesting Discovery: Blind AI Learns To Map Its Environment

31/05/2024 Reinforcement Learning

Meta Achieves Unexpected Improvements In Bayesian Optimization

Meta Achieves Unexpected Improvements In Bayesian Optimization

19/02/2024 Bayesian Optimization

[DPO] A Method For Directly Matching Large-scale Language Models To User Preferences Without Using Reinforcement Learning

[DPO] A Method For Directly Matching Large-scale Language Models To User Preferences Without Using R ...

02/02/2024 RLHF