2024-03-19 計画に基づく LLM 推論において並列実行可能な計画編成を行う LLM Compiler の解説 LLM エージェント 論文紹介 こんにちは。Algomatic LLM STUDIO 機械学習エンジニアの宮脇です(@catshun_)。 本記事では LLM を用いたエージェントシステムの基盤となる「計画実行機能」について、ユーザ要求を構成的に分解して立案されたタスク系列(=計画)を並列実行する LLM Compiler (Kim+'23) について紹介します。 Kim+’23 - An LLM Compiler for Parallel Function Calling arxiv.org 続きを読む
2024-03-19 計画立案による思考と行動の切り分けによってトークン効率の良い推論を実現する ReWOO の論文紹介 論文紹介 LLM エージェント こんにちは。Algomatic LLM STUDIO 機械学習エンジニアの宮脇です(@catshun_)。 本記事では LLM を用いたエージェントシステムの基盤となる「計画機能」について、LLM による観察を伴わない推論計画を行う ReWOO (Xu+'23) について紹介します。 Xu+'23 - ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models arxiv.org 続きを読む
2024-03-19 Let's think step by step を超える?計画立案を伴う Plan-and-Solve Prompting の論文紹介 論文紹介 LLM こんにちは。Algomatic LLM STUDIO 機械学習エンジニアの宮脇です(@catshun_)。 本記事では、エージェントシステムで基盤となる「計画」について、その先駆けとなる Plan-and-Solve Prompting (Wang+'23, ACL) について紹介します。 Wang+'23 - Plan-and-Solve Prompting: Improving Zero-Shot Chain-of-Thought Reasoning by Large Language Models (ACL) aclanthology.org 続きを読む
2024-02-29 大規模言語モデル(LLM)における日本語評価の概観 LLM 評価 はじめまして!Algomatic LLM STUDIO でインターンをしている なべ(@_h0jicha)です。普段は大学でマルチモーダル大規模言語モデルの応用に関する研究に取り組んでいます。 Algomatic のインターンでは、LLM の評価に関して網羅的な調査や各種ツールの導入に取り組んできました。 本記事では、この知見を皆さんに共有することで、日本語圏における LLM 評価の現状を俯瞰していただき、各ツールを適切に選択するための糸口を提供することを目的とします。 続きを読む