Zennの「LLM」のフィード
フィード

Clineに全部賭ける前に 〜Clineの動作原理を深掘り〜
2

Zennの「LLM」のフィード
はじめに AIのコーディングアシスタントとして最近、急速に注目を集めているCline。VSCode上でAIと連携し、コード生成からバグ修正、さらにはターミナル操作まで自動化できるこのツールは、多くのエンジニアの生産性を劇的に向上させています。 mizchiさんの『CLINEに全部賭けろ』という記事では、 AIから引き出せる性能は、自分の能力にそのまま比例する AI自体を管理するパイプライン設計を自分のコアスキルにする必要がある ともあるように、エンジニアはClineという強力なツールの最大限を使えるようになっていくべきです。 「AIの上手な使い方」が今のエンジニアにとって必須スキ...
10時間前

ホームページをAI検索に最適化するには(AIO、LLMO、LLMs.txt)
Zennの「LLM」のフィード
AIはあなたのウェブサイトを本当に理解しているか? ChatGPTやGemini、Claudeなどの大規模言語モデル(LLM)が日常的に使われるようになり、さらに検索機能やDeepResearchなどの機能が加わったことにより、AI自身がホームページ・Webサイトを探索・閲覧するのが普通になってきました。 これまで、ホームページはGoogle検索に効率的に引っ掛かるようSEO対策をすることが一般的でしたが、今後はAIに検索されやすくなるような工夫が必要になります。 それをLLMOやAIOと呼びます。 HTMLやCSS、JavaScriptが複雑に絡み合った現代のウェブサイトは、人間が...
12時間前

LLMOpsって何だ?: MLflow Tracing Conceptsを読み込む
Zennの「LLM」のフィード
Tracing Concepts 本記事はほぼほぼ MLflowの公式ドキュメントTracing Conceptsを読み進めているだけの記事ではありますが、ところどころわかりにくい箇所は実際にコードを実行して検証等もしているので、ぜひご覧ください。 What is tracing? あらためてtracingとは以下のように述べられています。 Tracing in the context of machine learning (ML) refers to the detailed tracking and recording of the data flow and proc...
16時間前

LLMOpsって何だ?: MLflow Tracing for LLM Observabilityを読み込む
Zennの「LLM」のフィード
MLflow Tracing for LLM Observability MLflow TracingとはいわゆるLLMOps系の処理であり、GenAIを活用した Applicationにおいて promptとresponseを記録して監視していこうというツールです。 MLflowを中心に、というよりは、GenAI applicationの tracingという概念の理解を中心に取り組みます。 ちなみに実際にtracingを始めてみたい方は脳死のautologが非常に強力だと感じており、下記コードは実際に動作した内容になるので是非これで結果をいくつか取得してみてください。 impo...
18時間前

MCP × LLM:Confluenceに記載の企画書から要件定義・JIRAのPBI作成
Zennの「LLM」のフィード
はじめに 近年、大規模言語モデル(LLM)の進化により、さまざまな業務の自動化が可能になってきました。 特にソフトウェア開発のドキュメント作成や要件管理は、多くの時間とリソースを必要とする作業であり、効率化の余地が大きい領域です。 本記事では、Model Context Protocol(MCP)を活用して、企画書から要件定義書の作成、さらにはJiraのPBI(Product Backlog Item)作成までを自動化した内容を共有します。 本記事でわかること LLMとConfluence/Jiraを連携させる方法 企画書から要件定義書、PBIへの自動変換の実現方法 MC...
18時間前

Cline開発に設計図を!Design Doc生成ステップを挟んでみる
Zennの「LLM」のフィード
TL;DR Clineを使って開発する際にまずDesign Docを生成させることを試してみる。 既存コードのリファクタリングを効率的に実施したい。 llm用のDesign Doc llm_design_doc_template.mdを用意してみた。 LLMはgemini-2.0-pro-exp-02-05 開発プロセス 以下の手順で開発を進めます。 LLM用のDesignDoc Template LLM用のdesign_docテンプレート llm_design_doc_template.md # 開発プロジェクト 設計ドキュメントテンプレート (design_doc)...
20時間前

MicrosoftのSLM「Phi-4-mini-instruct」をM2 Pro Mac miniで動かしてみた
Zennの「LLM」のフィード
Phi-4-mini-instructとは 「Phi-4-mini-instruct」の前に、まず「Phi-4」について簡単に紹介します。 Phi-4は、Microsoftによって開発されたパラメータ数が14Bの小規模言語モデル(SLM)です。2025年1月からMITライセンスとなったため、商用利用も可能なモデルです。Phi-4-mini-instructは、パラメータ数が3.8Bとさらに少なくなったSLMで2025年2月に公開されました。 https://techcommunity.microsoft.com/blog/aiplatformblog/introducing-phi-...
21時間前

【LLM】モデルの重みをWebLLM形式に変換する方法
Zennの「LLM」のフィード
LLMをブラウザで推論させる方法にwebLLMを使う方法がある。webLLMを使うとWASMとWebGPUを使用して量子化モデルをブラウザで動かすことが出来る。 WebLLM は、ハードウェアアクセラレーションを使用して言語モデル推論を Web ブラウザーに直接提供する、高性能なブラウザー内 LLM 推論エンジンです。すべてがサーバーのサポートなしでブラウザー内で実行され、WebGPU で高速化されます。 しかし、web-llmではwebGPU用の変換をする必要があるので、ここではモデルをwebGPU用にMLC-LLMに変換する方法を紹介する。 やったこと 独自でfine-tun...
1日前

macOSのSafariでGrokを使うときの日本語入力問題を解決する方法
Zennの「LLM」のフィード
はじめに macOSのSafariで日本語入力をしながらGrok(grok.com)を使っている方は、こんな問題に悩まされたことはありませんか? 日本語入力中にEnterキーで文字を確定したら、入力途中のメッセージが送信されてしまう 変換候補を選んだ直後に、意図せずメッセージが送信される 思考を整理しながら入力できず、いちいち文章を別のエディタで作成してからコピペしている これはmacOSの日本語IMEと、Webアプリケーションのイベント処理の相性問題です。特にAIチャットサービスでは、Enterキーが「送信」と「日本語確定」の両方に使われることで起こる問題です。この記事では、T...
1日前

初めてのRAGアプリケーション開発
Zennの「LLM」のフィード
これまでLLMについて学んできたものの、ゼロから自分でRAGアプリケーションを作成したことがなかったので、今回初めて開発してみました。 Next.js + ベクトルDB + LlamaでシンプルなRAGアプリを構築したので、メモを残しておきます✍️ RAGが気になるけれどまだつくったことがない、という私と似た状況の方の参考になれば幸いです! 香水RAGシステムの全体像 テーマに選んだのは「香水」。いくつかの条件を入れたら香水を探せるアプリケーションをつくることにしました。 香水に関する情報をベクトルデータベースに格納し、ユーザーの質問に対して関連性の高い情報を検索・提供するRAG(R...
1日前

今更だけど DeepSeek R1 使ってみた(Ollama on Jetson)
Zennの「LLM」のフィード
はじめに この記事は LLM の性能評価ではなく、セットアップの記録です。 動作条件は以前の記事の通りで、Ollama を前提にしています。 https://zenn.dev/19931/articles/c6a2e36bf000d1 DeepSeek R1 は日本語のファインチューニングをしなくても、用途によっては充分な日本語性能が得られるようです。セットアップやパラメータ調整の手間を考えると「オリジナルモデルでいいや」という感想です。 日本語チューニングモデル セットアップ lightblue/DeepSeek-R1-Distill-Qwen-7B-Japanese を使...
1日前

Electronでコード分析ツールを作りました
Zennの「LLM」のフィード
はじめに 開発者として、皆さんもこのような状況に直面したことがあるでしょう:ドキュメントのない古いプロジェクトを引き継ぎ、何万行もの見知らぬコードを前にした時の無力感。あるいは、自分で書いたコードでも、数ヶ月後に見返すと、まるで暗号を読むような感覚... こういった日常的な問題がきっかけとなり、CodeAskを開発しました。ElectronとLLMをベースにしたコード分析ツールで、複雑なコードベースを理解し、メンテナンスする際の困難を解決することを目指しています。 CodeAskの主な機能 インテリジェントなコード分析:LLM APIを活用し、コードベースを分析してレポー...
2日前

結局MCPって何に使えるの?おすすめサーバーの紹介
Zennの「LLM」のフィード
そもそもMCPとは? MCP は、アプリケーションが LLM にコンテキストを提供する方法を標準化するオープンプロトコルです。MCP を AI アプリケーション向けの USB-C ポートのようなものと考えてください。USB-C がデバイスをさまざまな周辺機器やアクセサリーに接続するための標準化された方法を提供するように、MCP は AI モデルを異なるデータソースやツールに接続するための標準化された方法を提供します。 MCPサーバーの紹介 今更感もありますが公式リポジトリで紹介されているMCPサーバーの中からいくつかピックアップしてそのユースケースについて紹介したいと思います...
2日前

MCMCと変分推論(VI)は最先端のLLMでどう使われているのか?
Zennの「LLM」のフィード
1. はじめに 近年、大規模言語モデル(LLM: Large Language Models) の発展により、AIは自然言語処理(NLP)の分野で驚異的な進化を遂げています。GPTシリーズやLLaMA、PaLMなどの最先端LLMでは、確率的推論が重要な役割を果たします。 そこで、本記事では、MCMC(マルコフ連鎖モンテカルロ法)と変分推論(VI: Variational Inference)がLLMのトレーニングや最適化にどのように活用されているか を解説します。 2. LLMの学習と推論における確率的手法の必要性 LLMの学習は基本的に確率モデルを扱います。例えば、次のような...
2日前

1歩1歩理解する、Embedding
Zennの「LLM」のフィード
はじめに 社内勉強会の資料を兼ねてアウトプット。発表までに何度か更新入れます。 検証リポジトリはこちら。 https://github.com/fleagne/embedding Claude 3.7 Sonnetによる、Embeddingまとめ https://claude.ai/share/3704b5b2-e867-4a23-ab08-bbea79222f18 すごいですね。このプロンプトでもここまで作成してくれる。 構成のベースラインとして、Claudeが書いてくれたものを深堀することで効率よくキャッチアップができそうですね。 ここで書いてくれたことを、掘り下げていきまし...
2日前

MLflow Prompt Engineering UIで国産モデルを活用:LLM-jpとの連携ガイド
Zennの「LLM」のフィード
注意書き: 本記事の執筆には誤字脱字などの文章校正以外に 生成AIを利用していません。 MLflowは機械学習のMLOpsのためのOSSライブラリです。最新のバージョンでは、LLMに関する実験管理の機能が随時開発・リリースされています。今回はその中でもPrompt Engineering UIを使って、非サポートのローカルLLMを利用する方法を紹介します。 Prompt Enginnering UIとは? MLflow Prompt Enginnering UIは、ノーコードで様々なモデルのプロンプトチューニングを行い、それらをUI上で簡単に比較することができる機能です。Prompt...
3日前

プロンプトエンジニアリング - ReActに関して
1

Zennの「LLM」のフィード
背景 LLMマルチエージェントを使ったQAシステムのエージェント設計において、しばしば以下の課題が浮上します。 ユーザーとエージェントの会話の履歴を参考にせず、ユーザーの単発の質問に対して回答してしまう 決め打ちのルールやフローに基づいて回答を行わせるため、急に話題が変わった質問や想定外の質問に弱い 計算を間違える ハルシネーション(それっぽい嘘)が発生する ユーザーからの不明瞭、もしくは抽象的な質問に対して、自身で何の情報が足りないか補えない これらをどうにか解消できないか調べた結果、「ReAct」という手法にたどり着きました。 ReActとは 2022年に発表された論文「...
3日前

Colab上でローカルLLMの簡易APIサーバーを構築する【Colab × FastAPI × ngrok】
Zennの「LLM」のフィード
ああ〜、ローカル LLM のデモアプリを手軽に動かせるような環境を用意したいんじゃ〜 0. 想定読者 & 本記事ハイライト 本記事では、Google Colab 上で GPU リソースを活用し、FastAPI と ngrok を用いてローカル LLM デモアプリを外部からアクセス可能な API サーバーとして構築する方法をご紹介します。 対象とする読者は、 LLM を用いた簡易 API サーバーを構築したい方 ローカル LLM のデモアプリを作成したいが、オンプレやクラウドサーバー環境整備に悩んでいる初心者〜中級者 簡易なプロトタイプを短時間で立ち上げたいエンジニア です...
3日前

ClineとAIエージェント時代のプログラミングに関する所感
Zennの「LLM」のフィード
はじめに そろそろAIエージェントを使った開発に慣れる必要性を感じてClineを試した。ClineはVS Code上で動作する対話型のAIエージェントで、コードの生成、修正、テストなどを自律的に行うことができる。GitHub Copilot(以下Copilot)の使用感から大きな期待はなかったものの、コード生成の精度や自律的な動作など、予想を大きく超える体験となった。その所感をまとめる(Xでポストした内容のまとめも兼ねている)。 使用ツール 本家Clineを採用。派生版も存在するがオリジナルで。 https://github.com/cline/cline バージョンは3.4.9...
3日前

【LangGraphの教科書】OpenDeepResearchの実装がとても参考になります
Zennの「LLM」のフィード
ここから見てね https://github.com/langchain-ai/open_deep_research はじめに はじめまして、ふっきーです。 最近話題のDeepResearchの中身が気になったので、LangChainのGitにあるOpenDeepResearchのコードを読んでみました。 こんな感じのやつ DeepResearchの実現方法としては、ふーんという感じでしたが、 LangGraphの実装として見るとさまざまな要素があり、非常に勉強になりました。 AIワークフローを開発するうえで有益だなと思ったので、共有します。 LangGraphを使って、 AIワ...
3日前