にょす

https://note.com/nyosubro

にょすです。LLMを使ったアプリケーション開発に熱中してます。音声メモ日記アプリ「シャべマル」を運営してます。

フィード

記事のアイキャッチ画像
にょすです。生成AIなんでも展示会に出展します!
にょす
4/21(日)本日、こちらのイベントに出展者として参加してきます! 生成AIなんでも展示会|IT勉強会・イベントならTECH PLAY[テックプレイ]2024/04/21(日)開催 生成AIを使った制作が見れて触れる展示イベントtechplay.jp 続きをみる
5ヶ月前
記事のアイキャッチ画像
Gemini 1.5 Proで文字起こしを試してみた
にょす
Gemini 1.5 Proが音声ファイルにも対応したということで、Whisper大好きマンとして、どれほどのものなのかを簡単に調査したいと思います。 Gemini 1.5 Pro on #VertexAI also supports processing audio inputs - including music, speech, and even the audio portion of videos. 🎵 This means it can give high-quality transcriptions or be used to search & analyze multimodal content. → https://t.co/CLMN3wNmeP #GoogleCloudNext pic.twitter.com/kEy2vSVpK0 — Google DeepMind (@GoogleDeepMind) April 9, 2024 続きをみる
5ヶ月前
記事のアイキャッチ画像
音声合成モデルStyle-Bert-VITS2をサーバレスアーキテクチャでWeb API化する
にょす
夢が詰まっているこちらのリポジトリを、Web APIとして立てて動かすための解説記事です。 続きをみる
5ヶ月前
記事のアイキャッチ画像
某掲示板風のスレッド生成アプリ「ねらーAI」の今後の開発計画
にょす
多くの方に遊んでもらっている「ねらーAI」ですが、現状まだまだ改善点があるので、継続的な開発を通じてより面白いアプリにしていきたいと思っています。 やっと公開できた... Claude3を使って、某掲示板のようなスレを生成してくれるアプリ、作りました! 無料で十分使えます!ぜひ意味わかんないスレ作りまくって楽しんでください!https://t.co/2ZwW7Ll51D pic.twitter.com/ePZV9SZFbf — にょす@LLM系アプリを個人開発してます (@nyosubro0706) March 15, 2024 続きをみる
6ヶ月前
記事のアイキャッチ画像
Claude3を使った架空AI掲示板アプリ「ねらーAI」を開発しました!
にょす
みなさん、Claude 3を使ってますか!? 2024年3月4日でたClaude v3シリーズですが、かなり日本語の性能が高いと話題です。僕自身もこれまではGPT-4を使っていましたが、Web版に関しては完全にClaudeに乗り換えてしまったくらい、使い勝手が良いです! 続きをみる
6ヶ月前
記事のアイキャッチ画像
2chスレ生成タスクで、Claude3 Haiku, Sonnet, Opusを比較する
にょす
Haiku APIが出たので、どこまでできるのか検証。 2ch風のスレを生成してもらってるのですが、Haiku APIも形式的には生成できそう。ただ実際の中身はどうなのか!?について検証してみます! 続きをみる
6ヶ月前
記事のアイキャッチ画像
「シャベマル」の英語版をリリース戦略と開発における学び
にょす
音声から文字起こしをしてメモを作成できる「シャベマル」の英語版をリリースしました! ‎MemoMaru: Speak, Memo, Emojify‎MemoMaru, the Voice Memo Diary App, elevates your daily noteapps.apple.com 続きをみる
6ヶ月前
記事のアイキャッチ画像
推しのプロンプト実験管理ツール「promptfoo」を解説
にょす
最近、推したいプロンプト実験管理方法を見つけたので、そちらの紹介記事になります!これを見つけてから、めちゃ楽になりました! LLM evaluation | promptfooLibrary for evaluating LLM prompt quality and testing.www.promptfoo.dev 続きをみる
7ヶ月前
記事のアイキャッチ画像
OpenAI WhisperAPIのwordレベルでの文字起こしを試したみた
にょす
こちらの投稿を見て、少し気になったので試してみました! The Whisper Audio API now supports word-level timestamps! With the new `timestamp_granularities` parameter, you can get word-level precision for transcripts and video edits.https://t.co/aON96JKlkk pic.twitter.com/sinyl77ypS — OpenAI Developers (@OpenAIDevs) February 9, 2024 続きをみる
7ヶ月前
記事のアイキャッチ画像
生成AIによって「既存の仕事は代替されるが、新しい仕事が生まれる」ということに対して
にょす
ここについて色々なレポートや本などを読みながら、思考を整理しています。 情報量が膨大な中で、また様々な意見があり、こういった思考を整理する際には「間違っていたとしても、あえて自分はこうだと思う」というスタンスを取ることが理解を深めるのに大事なステップだと思っているので、 続きをみる
7ヶ月前
記事のアイキャッチ画像
思考メモ:個人開発者が集う会社の形についての構想
にょす
昨日したツイートですが、普段の100倍くらいのインプレッションになったので、結構ニーズはあるんだろうなと思います。 個人開発者が集まる会社とかないんかな。月15万のベースが所属する個人開発者に支払われて、リリースされたアプリの収益の5割が上乗せされ、残りの5割は会社に収められるような仕組み。 年間X個のアプリリリース(あるいはアップデート)みたいな自由度高めのKPIみたいなのが個々人にある — にょす@LLM系アプリを個人開発してます (@nyosubro0706) January 4, 2024 続きをみる
8ヶ月前
記事のアイキャッチ画像
好奇心ドリブンに生き、結構良い感じだった2023年。
にょす
雑記ですが、2023年は自分の人生にとって、印象的な年になったと思うので、簡単に振り返ってみたいと思います。 続きをみる
8ヶ月前
記事のアイキャッチ画像
【MLX】Macbookで、Mistral-7b を LoRA チューニングしてみた
にょす
MacbookでLoRAチューニングが簡単に実行できる時代になりました。自分のPCが熱を上げて、学習を回している体験は感動ものですね…。 この記事は、以下のリポジトリの LoRA に関するサンプルコードを参考にしています。結構簡単ですので、Macbookで LoRA チューニングしてみたい方は、ぜひ最後まで読んでみてください。 続きをみる
9ヶ月前
記事のアイキャッチ画像
【MLX】Macbookで、Mistral-7B をローカル環境で実行してみた
にょす
Appleシリコンに最適化されたML用ライブラリが出たとのことで、色々試していこうと思います!これまでMacbookだと動かしにくかった色々なものが、サクッと動かせるようになっていて感動してます。 今回は Mistral-7B を、MLXを使ってローカルGUIで実行する方法についてまとめていきます。 続きをみる
9ヶ月前
記事のアイキャッチ画像
【MLX】Macbookで、小規模で高性能なモデル Phi-2 をローカル環境で実行してみた
にょす
Appleシリコンに最適化されたML用ライブラリが出たとのことで、色々試していこうと思います!これまでMacbookだと動かしにくかった色々なものが、サクッと動かせるようになっていて感動してます。 今回はマイクロソフト社が出した、2.7bで高性能な小規模言語モデル Phi-2 を、MLXを使ってローカル環境で実行する方法についてまとめていきます。 続きをみる
9ヶ月前
記事のアイキャッチ画像
【MLX】Macbookで、WhisperをローカルGUIで実行してみた
にょす
Appleシリコンに最適化されたML用ライブラリが出たとのことで、色々試していこうと思います!これまでMacbookだと動かしにくかった色々なものが、サクッと動かせるようになっていて感動してます。 今回は音声認識モデルのWhisperを、MLXを使ってローカル実行する方法についてまとめていきます。方法を調べるにあたって、以下の記事を参考にしました。ありがとうございます🙏 続きをみる
9ヶ月前
記事のアイキャッチ画像
Whisperとgpt-3.5-turboで、話した内容を英語に翻訳してくれるChrome拡張機能を作りました!
にょす
LLM Advent Calendar 2023 の9日目の記事を担当する「にょす」です! この記事では、最近開発している「Konnyaku(音声認識の翻訳ツール)」を題材に、LLMを活用したサービス設計と実装について書いていきたいと思います。 続きをみる
9ヶ月前
記事のアイキャッチ画像
OpenAIのストリーミングTTSを試してみた
にょす
ストリーミング形式の場合、Streamlitとかでは多分実装できないなど、ちょっとサクッと試しにくい部分があったので簡単にFastAPIでのバックエンドAPIを実装してみました。 以下のリポジトリから実装コードなどを確認できます。 続きをみる
10ヶ月前
記事のアイキャッチ画像
OpenAI Dev Dayで発表されたOpenAI TTS(Text to Speech)を試してみた!
にょす
OpenAI Dev Day、期待を超えてきましたね。淡々とすごい発表がありましたが、その一つにTTSのAPI公開がありました。これを早速試してみました。 以下にColabを作成しましたので、API Keyさえあればすぐ試せます! 続きをみる
10ヶ月前
記事のアイキャッチ画像
Fine-tuning: gpt-3.5-turboの活用事例。絵文字分類タスク改善のプロセスと、学びの言語化。
にょす
みなさん、Fine-tuning使ってますか!? 一週間ほど前に、OpenAI社からgpt-3.5-turboがFine-tuning可能になったとのアップデートがありましたね。 続きをみる
1年前
記事のアイキャッチ画像
シャべマルまとめページ🚀
にょす
いつもシャべマルのご利用ありがとうございます!開発者のにょすです。 このページでは、音声メモ日記アプリ「シャべマル」に関する記事のリンク集としてまとめていきます。 続きをみる
1年前
記事のアイキャッチ画像
【完全版】シャべマルの効果的な使い方についてまとめました!(随時更新予定)
にょす
みなさん、いつも「シャべマル」をご利用いただきありがとうございます!開発者のにょすです。 シャべマルは「しゃべって、丸投げ」ができる音声メモ日記アプリとなっています。なので、そこまで工夫しなくても良い感じに整理された、気持ちの良いメモ管理ができるのですが、、、 続きをみる
1年前
記事のアイキャッチ画像
Whisper、ChatGPTを活用した、テキスト入力不要な新感覚メモ日記アプリの紹介と、開発における学び
にょす
日常生活の中で生まれた「できごと」や「思ったこと」を、楽しく記録できるメモ日記アプリを開発しました! しゃべったら、あとは丸投げして良い感じにメモを残してくれる「シャべマル」です!(笑) 続きをみる
1年前
記事のアイキャッチ画像
【LLM活用】アイデアが創発される音声認識メモアプリの紹介と、LLMを活用してみての学び
にょす
日常生活に溶け込むような大規模言語モデル(以下、LLM)の活用方法を模索していたのですが、先日結構良さそうなアイデアを思いついたので作ってみました! その名も「音声でサクッとメモを残せて、蓄積されたメモから勝手にアイデアが創発されるアプリ」です! 続きをみる
1年前
記事のアイキャッチ画像
Pydanticを利用した型安全なFunction calling
にょす
Pydanticを活用すれば、型安全かつスキーマ定義も容易に実現ができそうということが分かりましたので共有です。この記事の内容は、以下のツイートに着想を受けました。色々な手法を模索されていて必見です。 Some tips on using function calls in the new @OpenAI release: It's really a naming issue where a function call conflates structured json with tool use. I'm going to got through some examples of just using function calls to extract json w/ @pydantic — jason (@jxnlco) June 14, 2023 続きをみる
1年前