【Unit-DSR】HuBERTによる障害者音声から健常者音声への正規化 【Unit-DSR】HuBERTによる障害者音声から健常者音声への正規 ... 2024年07月26日 self-supervised learning
【Double Descent】なぜ「大きなモデル」と「大きなデータセット」が重要なのか 【Double Descent】なぜ「大きなモデル」と「大きなデータセ ... 2024年07月25日 Neural Network
【Chat-REC】LLMをベースとしたレコメンデーションシステムの提案 【Chat-REC】LLMをベースとしたレコメンデーションシステムの提 ... 2024年07月24日 Recommendation
【HiFi-GAN】単一GPUで22kHzの音声を生成可能なGANベースのボコーダー 【HiFi-GAN】単一GPUで22kHzの音声を生成可能なGANベー ... 2024年07月10日 Speech Synthesis
【Mustango】音楽のドメイン知識を活用した音楽生成モデル 【Mustango】音楽のドメイン知識を活用した音楽生成モデル 2024年07月01日 Audio and Speech Processing
【VoiceCraft】業界最高レベルで自然な音声を合成できる言語モデル 【VoiceCraft】業界最高レベルで自然な音声を合成できる言語モデ ... 2024年07月01日 Speech Synthesis
大規模言語モデルによる法律サービスの変革!速度と正確性で人間を超える? 大規模言語モデルによる法律サービスの変革!速度と正確性で人間を超える? 2024年06月28日 Large language models
日本語特化の大規模言語モデルの最前線を切り拓く「RakutenAI-7B」 日本語特化の大規模言語モデルの最前線を切り拓く「RakutenAI-7 ... 2024年06月27日 Large language models
デコンパイルに特化した大規模言語モデル「LLM4Decompile」の登場 デコンパイルに特化した大規模言語モデル「LLM4Decompile」の ... 2024年06月27日 Large language models
インフォグラフィックスからUIまで画像とテキストを理解する「ScreenAI」 インフォグラフィックスからUIまで画像とテキストを理解する「Scree ... 2024年06月24日 Large language models
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識
AIエージェントの性能を評価する包括的なベンチマーク、AgentBenchが登場! AIエージェントの性能を評価する包括的なベンチマーク、AgentBen ... 2023年09月21日 agent simulation
StrongSORT: DeepSORTが強くなって帰ってきた!アップグレードされた追尾モデル! StrongSORT: DeepSORTが強くなって帰ってきた!アップ ... 2022年12月31日 Object Tracking