Algomatic Tech Blog

Algomaticの開発チームによる Tech Blog です

イベント運営をNotion x Slack x GASによって効率化する

はじめに こんにちは。Algomatic CTO室 でインターンしている藤巻(@makiart13)です。 普段は、さまざまな業務の改善やPoCを行っています。 弊社Algomaticでは、定期的に技術系ミートアップやカンファレンスを開催しています。イベント運営は開催の1ヶ月前…

LLMプロダクト開発のことはじめ #03 ~ プロンプトエンジニアリング

こんにちは。NEO(x) の宮脇(@catshun_)です。 本記事はなつやすみ特集として、これから LLM プロダクトを開発する方に向けて『LLMプロダクト開発のことはじめ』をテーマとした 5分で読める コラムを紹介します ゆるく書くつもりなので、役に立つかどうかは…

Claudeのprompt cachingを活用する

LLM APIの最強の一角であるAnthropic Claudeにprompt cachingが実装されました。簡単に言うとプロンプトの先頭から指定の位置までをキャッシュしてくれて、キャッシュを利用できた場合はAPI使用料金と、APIでかかる処理時間が大幅に改善するというものです。…

LLMプロダクト開発のことはじめ #02 ~ よい応答を得るためのプロンプト制約

こんにちは。NEO(x) の宮脇(@catshun_)です。 本記事はなつやすみ特集として、『LLMプロダクト開発のことはじめ』をテーマとした 5分で読める コラムを紹介します といいつつ今回は文量が多くなってしまいました...。 ゆるく書くつもりなので、役に立つか…

LLMプロダクト開発のことはじめ #01 ~ 問いをデザインする

こんにちは。NEO(x) の宮脇(@catshun_)です。 本記事はなつやすみ特集として、『LLMプロダクト開発のことはじめ』をテーマとした 3分で読める コラムを紹介します🌻 ゆるく書くつもりなので、役に立つかどうかは分かりません 🙏

2024.07 - Algomaticで話題になった生成AIニュースまとめ

こんにちは。Algomatic NEO(x) の宮脇(@catshun_)です。 本記事では Inside Algomatic という podcast の「Algomaticで話題になった生成AIニュースまとめ」という回で用意している会話ネタの一部として、7月に話題となったニュース一覧を公開します。なお…

LLMのシステム導入時に行いたい動作検証について

こんにちは。NEO(x) 機械学習エンジニアの宮脇(@catshun_)です。 LLM から望ましい出力を得るための評価については、評価セットを用いた定量評価などが挙げられますが、本記事では システムへのLLM導入 という側面から動作検証に焦点を当てた話をコラムと…

AIエージェントのイベントで「コード生成を伴うLLMエージェント」について登壇しました

こんにちは。NEO(x) の宮脇(@catshun_)です。 2024/07/18 に行われた『Tokyo AI Talks, 応用機械学習と人工知能セミナー: AIエージェント』で登壇いたしましたので、本記事では簡単にイベント概要を振り返りいたします。

社内で Dify ハッカソンを開催しました!

はじめに はじめまして、Data Scientist の山内(@jof_5)です。 本記事では、先日、社内で開催した Dify ハッカソンの様子について紹介します。

2024.06 - Algomaticで話題になった生成AIニュースまとめ

こんにちは。Algomatic NEO(x) の宮脇(@catshun_)です。 本記事では Inside Algomatic という podcast の「Algomaticで話題になった生成AIニュースまとめ」という回で用意している会話ネタの一部として、6月に話題となったニュース一覧を公開します。なお…

Claude 3.5 Sonnet の評価に関する備忘録

こんにちは。Algomatic NEO(x) の宮脇(@catshun_)です。 本記事では弊社 podcast の「Algomaticで話題になった生成AIニュースまとめ」という回で用意している会話ネタの一つとして "Claude 3.5 Sonnet Model Card Addendum" を読んだので、その備忘を共有…

自動プロンプト最適化をやってみた

はじめまして!データサイエンティストの山内(@jof_5)です。 本記事では、日々、プロンプト開発されている皆様に向けて、プロンプトを効率的に開発する手法の一つである「自動プロンプト最適化」について記載いたします。 1. プロンプトエンジニアリングの必…

2024.05 - Algomaticで話題になった生成AIニュースまとめ

こんにちは。Algomatic NEO(x) の宮脇(@catshun_)です。 本記事では Inside Algomatic という podcast の「Algomaticで話題になった生成AIニュースまとめ」という回で用意している会話ネタの一部として、5月に話題となったニュース一覧を公開します。なお…

社内文書検索&QAシステムの RAG ではないところ

こんにちは。NEO(x) 機械学習エンジニアの宮脇(@catshun_)です。 RAG システムの開発、いざ業務に統合するとなると結構大変ですよね。 構築してみたがユーザ数が伸びず、、なんてことはよくあると思います。 実際こんな記事も話題になりましたね。 本記事…

LLM でブラウザを操作する WEB エージェントと周辺技術のざっくり紹介

本記事では LLM を用いたブラウザ操作を目的とした WEBエージェントとその周辺記述について紹介します。

JSAI2024(人工知能学会全国大会 第38回) にプラチナスポンサーとして協賛します

こんにちは、Algomatic NEO(x) カンパニーCEOのDory (@dory111111)です。 Algomaticは、JSAI2024(人工知能学会全国大会 第38回) にプラチナスポンサーとして協賛させていただきます! www.ai-gakkai.or.jp 会期中はAlgomaticブースにてノベルティ配布など…

生成AIカンファレンス2024運営レポート

こんにちは、Algomaticのnaotoota(@OTA57)です。現在はChief of Staffとして横断的にさまざまな支援を実施しています。 今日は先日5/8に行われた生成AIカンファレンス2024の運営のレポートになります。 生成AIカンファレンス2024とは? gen-ai-conf.org 生…

Zodスキーマでプロンプト生成を行い構造化データを自由自在に扱えて、LLMプロダクト開発が圧倒的に効率化した話

最近はAIエンジニアを名乗ってるerukitiです。フロントエンドもバックエンドも、LLMを触るあれこれもやってるので、「AIエンジニア」くらいを名乗るとちょうどよさそうだなと思ってます。いずれLLM自体の開発なんかもやってるかもしれません。 LLMプロダクト…

GPT-4oで広がる新しいAI活用シーン(OpenAI Spring Update)

はじめに 2024/5/14 日本時間の午前2:00にOpenAI社が「Spring Update」と評した発表を行いました。 その中ではGPT-4oという新しいモデルや、無料ユーザー向け機能の拡充、デスクトップアプリ等についての発表がありました。 今回、それを受けて、弊社の機械…

複数の関連度から検索可能な BGE M3-Embedding の紹介

本記事では BGE M3 Embedding を用いた検索方法について論文解説するとともに、dense, sparse, multi-vec の 3 つの functionality について紹介します。

LLM評価ツールpromptfooとアサーションの解説

LLM やプロンプトの性能評価を気軽に行うことができる評価ツール promptfoo を解説します。特にアサーションタイプの種類に着目してまとめます。

Devin を含むAIソフトウェアエンジニアと周辺技術のざっくり紹介

Devinの公開から注目を浴びているAIソフトウェアエンジニアについての紹介です。Devika, Open Devin, SWE-agent, AutoDev の他、MetaGPT, ChatDev, Data Interpreter などの関連情報を紹介しています。

Object-Oriented Conference2024 のランチセッションで生成AIの話をしました

tech.algomatic.jp 2024年3月24日 (日) 開催の Object-Oriented Conference2024にて、ランチセッション登壇させていただきました。 登壇資料 登壇資料はこちらです。 speakerdeck.com

生成AIで毎日がちょっと楽しくなる?LLM STUDIOの「今日の一言のお題」自動生成の舞台裏

こんにちは、Algomaticのnaotoota(@OTA57)です。現在はChief of Staffとして横断的にさまざまなカンパニーの支援を実施しています。 LLM STUDIOにおいてはPOの役割を担っているのですが、今日はLLM STUDIOのチーム運営における生成AIを活用したちょっとし…

3月24日 (日) Object Oriented Conference 2024 ランチスポンサーのお知らせ

こんにちは、Algomatic シゴラクAIカンパニーCTOの菊池 (@_pochi)です。 Algomaticは、3月24日 (日) 開催の Object-Oriented Conference 2024 (OOC2024) にて、ランチスポンサーとして参加させていただきます! ooc.dev ランチセッションの登壇に加えまして…

LangGraph を用いた LLM エージェント、Plan-and-Execute Agents の実装解説

はじめに こんにちは。Algomatic LLM STUDIO 機械学習エンジニアの宮脇(@catshun_)です。 Wang+’23 - A Survey on Large Language Model Based Autonomous Agents ChatGPT が発表されてからおよそ 1 年が経ち、AutoGPT, BabyAGI, HuggingGPT, Generative A…

計画に基づく LLM 推論において並列実行可能な計画編成を行う LLM Compiler の解説

LLM エージェントにおける基本機能の一つである計画立案について、タスクリストを並列に実行する LLM Compiler について解説します。逐次的にタスクを処理する ReAct よりも高いトークン効率とレイテンシを実現しつつ、ReAct よりも一貫して高い正解率を達成…

計画立案による思考と行動の切り分けによってトークン効率の良い推論を実現する ReWOO の論文紹介

LLM エージェントにおける基本機能の一つである計画立案について、計画と実行の2段階による推論を行う ReWOO について解説します。ReWOO では Decomposed-first な推論を行うため ReAct よりもトークン消費の効率が良く、同程度の正解率を実現します。

Let's think step by step を超える?計画立案を伴う Plan-and-Solve Prompting の論文紹介

LLM エージェントにおける基本機能の一つである計画立案について、その先駆けとなる Plan-and-Solve Prompting について解説します。Zero-shot Prompting (step-by-step に答えて)よりも一貫して正解率の高いプロンプトを提案しています。

大規模言語モデル(LLM)における日本語評価の概観

大規模言語モデル(LLM)の日本語運用性能を評価するための内容をまとめました。評価方法を人手評価・LLM-as-a-judge・自動評価指標に分類し、JGLUEやMT-Benchなどのツールの利点や課題を解説します。