言語モデルの"頭の中"を可視化 - 知識グラフで解明するLLMsの内部メカニズム 言語モデルの"頭の中"を可視化 - 知識グラフで解明するLLMsの内部 ... 2024年09月03日 Computation and Language
モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 モバイルUI向けマルチモーダル大規模言語モデル「Ferret-UI」 2024年09月02日 Large language models
【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音障害者音声認識でも輝くのか! 【音声と画像の融合!?】マルチモーダル手法”AV-HuBERT”は構音 ... 2024年08月31日 Speech Recognition for the Dysarthric
【Metaが開発した人工知能!?】従来の自己教師あり学習モデルとは一線を画す"HuBERT"モデルの性能はいかに 【Metaが開発した人工知能!?】従来の自己教師あり学習モデルとは一線 ... 2024年08月29日 AI for Science
【BitNet b1.58】モデルパラメータを3値で表現しLlama以上の精度を達成!? 【BitNet b1.58】モデルパラメータを3値で表現しLlama以 ... 2024年08月27日 Large language models
超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 超長いプロンプト文を圧縮してメモリを抑えるGoogleの高性能LLM 2024年08月27日 Large language models
GenTron: 画像生成、動画生成向けのDiffusion Transformers GenTron: 画像生成、動画生成向けのDiffusion Tran ... 2024年08月26日 Image generation
100kトークン以上の長文のみから構成された書籍要約のためのデータセット、FABLESが登場! 100kトークン以上の長文のみから構成された書籍要約のためのデータセッ ... 2024年08月23日 Large language models
LLMの協調行動と共有資源の管理能力を評価するためのプラットフォームが登場! LLMの協調行動と共有資源の管理能力を評価するためのプラットフォームが ... 2024年08月22日 Simulation Platform
GPT-4、Claude 3 Opus、Gemini 1.0 Ultraが挑む制御工学の新境地 GPT-4、Claude 3 Opus、Gemini 1.0 Ultr ... 2024年08月22日 Optimization and Control
【OW-VISCap】見たことない物体にも注目 - オープンワールドビデオ理解の新アプローチ 【OW-VISCap】見たことない物体にも注目 - オープンワールドビ ... 2024年08月21日 Computer Vision
ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクスの新展開 ChatGPTによる顔認証の精度と透明性の向上、ソフトバイオメトリクス ... 2024年04月08日 Large language models
【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取得するフレームワークが登場 【RL-GPT】 Mincraftで通常の数倍の速さでダイヤモンドを取 ... 2024年04月18日 機械学習
【Swin Transformer】今こそ押さえたいTransformer系画像認識モデル 【Swin Transformer】今こそ押さえたいTransform ... 2024年03月22日 画像認識
「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキャブラリー物体検出 「言葉」で指示して「画像」で探す!OWL-ViTが実現するオープンボキ ... 2025年02月28日 Neural Network