AI/LLMエージェント
はじめに こんにちは。Algomatic AI Transformation(AX) のsergicalsix(@sergicalsix)です。 本記事では大規模言語モデル(LLM)を用いたアプリケーションないしAIエージェントの構築において切っても切り離せない「コンテキストエンジニアリング」について2…
1. はじめに こんにちは、Algomatic AXの岩城祐作(@yukl_dev)です。 私は5月にAlgomaticに入社し、AIエンジニアとして働いています。 入社エントリに、転職の背景の1つとして以下を書きました。 PoCループの虚しさと危機感 一方で、技術検証やデモ作成にと…
こんにちは!Algomatic ネオセールスカンパニーで営業AIエージェント 「アポドリ」を開発しているGoです。 2023年にリリースされたCursorのような大規模言語モデルをベースにしたコーディングエージェントが登場して以来、フロントエンドのUI実装を自動化す…
OpenAI o3, Claude 3.7 Sonnet , Gemini 2.5 Proの評価と解釈[2025年4月版]
こんにちは!Algomaticネオセールスカンパニーでソフトウェアエンジニアをしている越川と申します。 1月に弊カンパニーでリリースした アポドリ はまだまだたくさんの反響を頂いております。 apodori.ai 本記事では、アポドリを開発している中で向き合ってき…
こんにちは、ネオセールスカンパニーCTOの菊池(@_pochi)です。 1月にリリースした 「アポドリ 」 は、大変ありがたいことに多くの反響をいただいています。本記事では、その開発を通じて得た、「作らない」ことが成功につながる理由 についてお話しします。 …
こんにちは。NEO(x) の宮脇(@catshun_)です。 先日、弊社から 『AIエージェント』 に関するプロダクトが 2つ リリースされたのですが、本記事ではその 「AIエージェント」の一般的な解釈 について簡単に整理するとともに、AIエージェントの開発で心掛けて…
こんにちは。NEO(x) の宮脇(@catshun_)です。 先日 OpenAI から 12 Days of OpenAI がありましたが、同時に Google のリリースも注目されていたのでこちらにまとめます。 Gemini 2.0 1. パフォーマンスの大幅な改善 2. マルチモーダル I/O の対応 3. ネイ…
こんにちは。NEO(x) の宮脇(@catshun_)です。 2024年もあとひと月程となりましたね。 今年は多くの企業から RAG に関するリリースが発表され、同時に AIエージェント の研究開発が盛んに行われた年だったかと思います。 現時点での AIエージェント の市場…
こんにちは、横断CoSの大田(@OTA57)です。 先日以下のnoteを書きました。 note.com このエントリでは、その裏側の仕組みやコードを紹介していきます。 まずは事例①の弊社の勤務場所を選択する機能です。 Slackの設定について① 毎朝の定時実行のコード Acti…
こんにちは。NEO(x) の宮脇(@catshun_)です。 2024/07/18 に行われた『Tokyo AI Talks, 応用機械学習と人工知能セミナー: AIエージェント』で登壇いたしましたので、本記事では簡単にイベント概要を振り返りいたします。
はじめまして!データサイエンティストの山内(@jof_5)です。 本記事では、日々、プロンプト開発されている皆様に向けて、プロンプトを効率的に開発する手法の一つである「自動プロンプト最適化」について記載いたします。 1. プロンプトエンジニアリングの必…
本記事では LLM を用いたブラウザ操作を目的とした WEBエージェントとその周辺記述について紹介します。
Devinの公開から注目を浴びているAIソフトウェアエンジニアについての紹介です。Devika, Open Devin, SWE-agent, AutoDev の他、MetaGPT, ChatDev, Data Interpreter などの関連情報を紹介しています。
はじめに こんにちは。Algomatic LLM STUDIO 機械学習エンジニアの宮脇(@catshun_)です。 Wang+’23 - A Survey on Large Language Model Based Autonomous Agents ChatGPT が発表されてからおよそ 1 年が経ち、AutoGPT, BabyAGI, HuggingGPT, Generative A…
LLM エージェントにおける基本機能の一つである計画立案について、タスクリストを並列に実行する LLM Compiler について解説します。逐次的にタスクを処理する ReAct よりも高いトークン効率とレイテンシを実現しつつ、ReAct よりも一貫して高い正解率を達成…
LLM エージェントにおける基本機能の一つである計画立案について、計画と実行の2段階による推論を行う ReWOO について解説します。ReWOO では Decomposed-first な推論を行うため ReAct よりもトークン消費の効率が良く、同程度の正解率を実現します。