Algomatic Tech Blog

Algomaticの開発チームによる Tech Blog です

AI/LLMプロダクト開発

AI/LLMプロダクトの開発における知見

Claude Code hooksで始めるPromptOps:チームで意図を残す仕組み作り

こんにちは。Algomatic AI Transformation(AX) の柗村@yu_mattznです。 私は7月にAIプロダクトエンジニアとして入社し、今はネオデザインAIの開発責任者をしています。プロダクト出身でAIについての深い知見はないため、日々AIエンジニアの方々の投稿からキ…

オープンウェイトモデルで広がる生成AI活用: LLM API活用の課題と自社運用

はじめに こんにちは。Algomatic AI Transformation(AX) のsergicalsix(@sergicalsix)です。 近年、大規模言語モデル(LLM)の登場により、AIがビジネスの現場で急速に浸透しています。ChatGPTやClaudeなどのAPIを活用し、業務効率化や新サービス開発に取…

Gemini CLI のサンドボックス機能とは

はじめに GoogleからGeminiをコマンドラインで対話的に利用できる「Gemini CLI」が登場しましたね! 基本的な使い方については、すでに多くの方が素晴らしい解説記事を公開されていますので、ぜひそちらもご覧ください。 参考 zenn.dev この記事では、Gemini…

Neovim & Claude Code でCursorっぽく開発したい

はじめに Claude Codeがめちゃくちゃ伸びています。 この背景には、特定のIDEへの依存度を下げたいという需要があるのだと思います。 確かに特定のIDEに依存しないClaude Codeは高い柔軟性を持ちますが、CursorやWindsurfのような気の利いた機能(Diff表示や…

UI設計プロセスにおけるコーディングエージェントの役割と設計情報伝達の最適化

こんにちは!Algomatic ネオセールスカンパニーで営業AIエージェント 「アポドリ」を開発しているGoです。 2023年にリリースされたCursorのような大規模言語モデルをベースにしたコーディングエージェントが登場して以来、フロントエンドのUI実装を自動化す…

【State of Web Dev AI 2025】調査レポート:開発現場のリアルなAI活用とは?

こんにちは!Algomatic ネオセールスカンパニーで営業AIエージェント 「アポドリ」を開発している只野です。 前回の投稿では、Cursorをはじめとしたコーディングエージェントの可能性についてご紹介しました。 tech.algomatic.jp 私たちは、日々のちょっとし…

Dify最大の弱点と、その克服方法について

Dify 最大の弱点は「ワークフローの大量実行が難しい」こと 。私たちはGoogle スプレッドシート + GAS で克服しました 。このスプレッドシートをコピーするだけで、すぐに取り入れられます。

アポドリを「プロダクションレディ」にするためにやったこと

こんにちは、Algomatic ネオセールスカンパニーCTOのきくちです。 AIエージェント、話題ですね。これまではPoCやR&Dレベルと思われていたAIエージェントですが、いよいよ本格的にサービスが提供されてきました。わたしたちが提供する「アポドリ」もその1つで…

Azure Functionsで30分でMCPサーバーを構築する

はじめに こんにちは!Algomaticネオセールスカンパニーでソフトウェアエンジニアをしている越川と申します。 先日、Azure FunctionsがMCPに対応したとのニュースがありました。 techcommunity.microsoft.com 弊カンパニーではインフラ基盤にAzureを利用して…

"「生成AIこんなものか」と諦める前に" 営業AIエージェント開発現場から学ぶLLM品質保証テクニック

こんにちは!Algomaticネオセールスカンパニーでソフトウェアエンジニアをしている越川と申します。 1月に弊カンパニーでリリースした アポドリ はまだまだたくさんの反響を頂いております。 apodori.ai 本記事では、アポドリを開発している中で向き合ってき…

「UIも自動化も後回し」: AIエージェント開発の実践的アプローチ

こんにちは、ネオセールスカンパニーCTOの菊池(@_pochi)です。 1月にリリースした 「アポドリ 」 は、大変ありがたいことに多くの反響をいただいています。本記事では、その開発を通じて得た、「作らない」ことが成功につながる理由 についてお話しします。 …

AIエージェントの解釈について整理してみる

こんにちは。NEO(x) の宮脇(@catshun_)です。 先日、弊社から 『AIエージェント』 に関するプロダクトが 2つ リリースされたのですが、本記事ではその 「AIエージェント」の一般的な解釈 について簡単に整理するとともに、AIエージェントの開発で心掛けて…

開発速度よりも大事なものを見つけた話

こんにちは、シゴラクAIカンパニーCTOの菊池 (@_pochi) です。 この記事は、Algomatic アドベントカレンダー2024の15日目の記事です。 algomatic.jp シゴラクAIカンパニーでは、「シゴラクAI」という法人向け生成AI活用プラットフォームの開発運用に加えて、…

書評『LangChainとLangGraphによるRAG・AIエージェント入門』

こんにちは。NEO(x) の宮脇(@catshun_)です。 2024年もあとひと月程となりましたね。 今年は多くの企業から RAG に関するリリースが発表され、同時に AIエージェント の研究開発が盛んに行われた年だったかと思います。 現時点での AIエージェント の市場…

LLMプロダクト開発のことはじめ #03 ~ プロンプトエンジニアリング

こんにちは。NEO(x) の宮脇(@catshun_)です。 本記事はなつやすみ特集として、これから LLM プロダクトを開発する方に向けて『LLMプロダクト開発のことはじめ』をテーマとした 5分で読める コラムを紹介します ゆるく書くつもりなので、役に立つかどうかは…

Claudeのprompt cachingを活用する

LLM APIの最強の一角であるAnthropic Claudeにprompt cachingが実装されました。簡単に言うとプロンプトの先頭から指定の位置までをキャッシュしてくれて、キャッシュを利用できた場合はAPI使用料金と、APIでかかる処理時間が大幅に改善するというものです。…

LLMプロダクト開発のことはじめ #02 ~ よい応答を得るためのプロンプト制約

こんにちは。NEO(x) の宮脇(@catshun_)です。 本記事はなつやすみ特集として、『LLMプロダクト開発のことはじめ』をテーマとした 5分で読める コラムを紹介します といいつつ今回は文量が多くなってしまいました...。 ゆるく書くつもりなので、役に立つか…

LLMプロダクト開発のことはじめ #01 ~ 問いをデザインする

こんにちは。NEO(x) の宮脇(@catshun_)です。 本記事はなつやすみ特集として、『LLMプロダクト開発のことはじめ』をテーマとした 3分で読める コラムを紹介します🌻 ゆるく書くつもりなので、役に立つかどうかは分かりません 🙏

LLMのシステム導入時に行いたい動作検証について

こんにちは。NEO(x) 機械学習エンジニアの宮脇(@catshun_)です。 LLM から望ましい出力を得るための評価については、評価セットを用いた定量評価などが挙げられますが、本記事では システムへのLLM導入 という側面から動作検証に焦点を当てた話をコラムと…

Claude 3.5 Sonnet の評価に関する備忘録

こんにちは。Algomatic NEO(x) の宮脇(@catshun_)です。 本記事では弊社 podcast の「Algomaticで話題になった生成AIニュースまとめ」という回で用意している会話ネタの一つとして "Claude 3.5 Sonnet Model Card Addendum" を読んだので、その備忘を共有…

自動プロンプト最適化をやってみた

はじめまして!データサイエンティストの山内(@jof_5)です。 本記事では、日々、プロンプト開発されている皆様に向けて、プロンプトを効率的に開発する手法の一つである「自動プロンプト最適化」について記載いたします。 1. プロンプトエンジニアリングの必…

社内文書検索&QAシステムの RAG ではないところ

こんにちは。NEO(x) 機械学習エンジニアの宮脇(@catshun_)です。 RAG システムの開発、いざ業務に統合するとなると結構大変ですよね。 構築してみたがユーザ数が伸びず、、なんてことはよくあると思います。 実際こんな記事も話題になりましたね。 本記事…

Zodスキーマでプロンプト生成を行い構造化データを自由自在に扱えて、LLMプロダクト開発が圧倒的に効率化した話

最近はAIエンジニアを名乗ってるerukitiです。フロントエンドもバックエンドも、LLMを触るあれこれもやってるので、「AIエンジニア」くらいを名乗るとちょうどよさそうだなと思ってます。いずれLLM自体の開発なんかもやってるかもしれません。 LLMプロダクト…

LLM評価ツールpromptfooとアサーションの解説

LLM やプロンプトの性能評価を気軽に行うことができる評価ツール promptfoo を解説します。特にアサーションタイプの種類に着目してまとめます。

LangGraph を用いた LLM エージェント、Plan-and-Execute Agents の実装解説

はじめに こんにちは。Algomatic LLM STUDIO 機械学習エンジニアの宮脇(@catshun_)です。 Wang+’23 - A Survey on Large Language Model Based Autonomous Agents ChatGPT が発表されてからおよそ 1 年が経ち、AutoGPT, BabyAGI, HuggingGPT, Generative A…

Let's think step by step を超える?計画立案を伴う Plan-and-Solve Prompting の論文紹介

LLM エージェントにおける基本機能の一つである計画立案について、その先駆けとなる Plan-and-Solve Prompting について解説します。Zero-shot Prompting (step-by-step に答えて)よりも一貫して正解率の高いプロンプトを提案しています。

大規模言語モデル(LLM)における日本語評価の概観

大規模言語モデル(LLM)の日本語運用性能を評価するための内容をまとめました。評価方法を人手評価・LLM-as-a-judge・自動評価指標に分類し、JGLUEやMT-Benchなどのツールの利点や課題を解説します。