にょす
https://note.com/nyosubro
にょすです。時間無制限で、無料で文字起こし放題なアプリ「無限もじおこし」を運営してます。
フィード
【無限もじおこし】文字起こしの処理の安定化を行いました!(v1.0.5)
にょす
時間無制限で、無料で使える文字起こしアプリ「無限もじおこし」のアップデート情報です! バージョンアップはこちらから↓ 続きをみる
1ヶ月前
【無限もじおこし】文字起こし元の音声が再生できるようになりました!(v1.0.4)
にょす
時間無制限で、無料で使える文字起こしアプリ「無限もじおこし」のアップデート情報です! バージョンアップはこちらから↓ 続きをみる
1ヶ月前
(随時更新)「無限もじおこし」の新機能&バージョンアップ情報まとめ
にょす
いつも「無限もじおこし」をご利用いただきありがとうございます! アップデート内容はこちらから一覧で確認することができます。 続きをみる
1ヶ月前
時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。
にょす
みなさん、こんにちは!9月は久しぶりに個人開発をしてました。 今回はGeminiを使って、ちょっと変わった文字起こしアプリを開発したので、その裏側をお話ししていきたいと思います。その名も「無限もじおこし」です! 続きをみる
2ヶ月前
にょすです。生成AIなんでも展示会に出展します!
にょす
4/21(日)本日、こちらのイベントに出展者として参加してきます! 生成AIなんでも展示会|IT勉強会・イベントならTECH PLAY[テックプレイ]2024/04/21(日)開催 生成AIを使った制作が見れて触れる展示イベントtechplay.jp 続きをみる
7ヶ月前
Gemini 1.5 Proで文字起こしを試してみた
にょす
Gemini 1.5 Proが音声ファイルにも対応したということで、Whisper大好きマンとして、どれほどのものなのかを簡単に調査したいと思います。 Gemini 1.5 Pro on #VertexAI also supports processing audio inputs - including music, speech, and even the audio portion of videos. 🎵 This means it can give high-quality transcriptions or be used to search & analyze multimodal content. → https://t.co/CLMN3wNmeP #GoogleCloudNext pic.twitter.com/kEy2vSVpK0 — Google DeepMind (@GoogleDeepMind) April 9, 2024 続きをみる
7ヶ月前
音声合成モデルStyle-Bert-VITS2をサーバレスアーキテクチャでWeb API化する
にょす
夢が詰まっているこちらのリポジトリを、Web APIとして立てて動かすための解説記事です。 続きをみる
8ヶ月前
某掲示板風のスレッド生成アプリ「ねらーAI」の今後の開発計画
にょす
多くの方に遊んでもらっている「ねらーAI」ですが、現状まだまだ改善点があるので、継続的な開発を通じてより面白いアプリにしていきたいと思っています。 やっと公開できた... Claude3を使って、某掲示板のようなスレを生成してくれるアプリ、作りました! 無料で十分使えます!ぜひ意味わかんないスレ作りまくって楽しんでください!https://t.co/2ZwW7Ll51D pic.twitter.com/ePZV9SZFbf — にょす@LLM系アプリを個人開発してます (@nyosubro0706) March 15, 2024 続きをみる
8ヶ月前
Claude3を使った架空AI掲示板アプリ「ねらーAI」を開発しました!
にょす
みなさん、Claude 3を使ってますか!? 2024年3月4日でたClaude v3シリーズですが、かなり日本語の性能が高いと話題です。僕自身もこれまではGPT-4を使っていましたが、Web版に関しては完全にClaudeに乗り換えてしまったくらい、使い勝手が良いです! 続きをみる
8ヶ月前
2chスレ生成タスクで、Claude3 Haiku, Sonnet, Opusを比較する
にょす
Haiku APIが出たので、どこまでできるのか検証。 2ch風のスレを生成してもらってるのですが、Haiku APIも形式的には生成できそう。ただ実際の中身はどうなのか!?について検証してみます! 続きをみる
8ヶ月前
「シャベマル」の英語版をリリース戦略と開発における学び
にょす
音声から文字起こしをしてメモを作成できる「シャベマル」の英語版をリリースしました! MemoMaru: Speak, Memo, EmojifyMemoMaru, the Voice Memo Diary App, elevates your daily noteapps.apple.com 続きをみる
9ヶ月前
推しのプロンプト実験管理ツール「promptfoo」を解説
にょす
最近、推したいプロンプト実験管理方法を見つけたので、そちらの紹介記事になります!これを見つけてから、めちゃ楽になりました! LLM evaluation | promptfooLibrary for evaluating LLM prompt quality and testing.www.promptfoo.dev 続きをみる
9ヶ月前
OpenAI WhisperAPIのwordレベルでの文字起こしを試したみた
にょす
こちらの投稿を見て、少し気になったので試してみました! The Whisper Audio API now supports word-level timestamps! With the new `timestamp_granularities` parameter, you can get word-level precision for transcripts and video edits.https://t.co/aON96JKlkk pic.twitter.com/sinyl77ypS — OpenAI Developers (@OpenAIDevs) February 9, 2024 続きをみる
9ヶ月前
生成AIによって「既存の仕事は代替されるが、新しい仕事が生まれる」ということに対して
にょす
ここについて色々なレポートや本などを読みながら、思考を整理しています。 情報量が膨大な中で、また様々な意見があり、こういった思考を整理する際には「間違っていたとしても、あえて自分はこうだと思う」というスタンスを取ることが理解を深めるのに大事なステップだと思っているので、 続きをみる
10ヶ月前
思考メモ:個人開発者が集う会社の形についての構想
にょす
昨日したツイートですが、普段の100倍くらいのインプレッションになったので、結構ニーズはあるんだろうなと思います。 個人開発者が集まる会社とかないんかな。月15万のベースが所属する個人開発者に支払われて、リリースされたアプリの収益の5割が上乗せされ、残りの5割は会社に収められるような仕組み。 年間X個のアプリリリース(あるいはアップデート)みたいな自由度高めのKPIみたいなのが個々人にある — にょす@LLM系アプリを個人開発してます (@nyosubro0706) January 4, 2024 続きをみる
1年前
【MLX】Macbookで、Mistral-7b を LoRA チューニングしてみた
にょす
MacbookでLoRAチューニングが簡単に実行できる時代になりました。自分のPCが熱を上げて、学習を回している体験は感動ものですね…。 この記事は、以下のリポジトリの LoRA に関するサンプルコードを参考にしています。結構簡単ですので、Macbookで LoRA チューニングしてみたい方は、ぜひ最後まで読んでみてください。 続きをみる
1年前
【MLX】Macbookで、Mistral-7B をローカル環境で実行してみた
にょす
Appleシリコンに最適化されたML用ライブラリが出たとのことで、色々試していこうと思います!これまでMacbookだと動かしにくかった色々なものが、サクッと動かせるようになっていて感動してます。 今回は Mistral-7B を、MLXを使ってローカルGUIで実行する方法についてまとめていきます。 続きをみる
1年前
【MLX】Macbookで、小規模で高性能なモデル Phi-2 をローカル環境で実行してみた
にょす
Appleシリコンに最適化されたML用ライブラリが出たとのことで、色々試していこうと思います!これまでMacbookだと動かしにくかった色々なものが、サクッと動かせるようになっていて感動してます。 今回はマイクロソフト社が出した、2.7bで高性能な小規模言語モデル Phi-2 を、MLXを使ってローカル環境で実行する方法についてまとめていきます。 続きをみる
1年前
【MLX】Macbookで、WhisperをローカルGUIで実行してみた
にょす
Appleシリコンに最適化されたML用ライブラリが出たとのことで、色々試していこうと思います!これまでMacbookだと動かしにくかった色々なものが、サクッと動かせるようになっていて感動してます。 今回は音声認識モデルのWhisperを、MLXを使ってローカル実行する方法についてまとめていきます。方法を調べるにあたって、以下の記事を参考にしました。ありがとうございます🙏 続きをみる
1年前
Whisperとgpt-3.5-turboで、話した内容を英語に翻訳してくれるChrome拡張機能を作りました!
にょす
LLM Advent Calendar 2023 の9日目の記事を担当する「にょす」です! この記事では、最近開発している「Konnyaku(音声認識の翻訳ツール)」を題材に、LLMを活用したサービス設計と実装について書いていきたいと思います。 続きをみる
1年前
OpenAIのストリーミングTTSを試してみた
にょす
ストリーミング形式の場合、Streamlitとかでは多分実装できないなど、ちょっとサクッと試しにくい部分があったので簡単にFastAPIでのバックエンドAPIを実装してみました。 以下のリポジトリから実装コードなどを確認できます。 続きをみる
1年前
OpenAI Dev Dayで発表されたOpenAI TTS(Text to Speech)を試してみた!
にょす
OpenAI Dev Day、期待を超えてきましたね。淡々とすごい発表がありましたが、その一つにTTSのAPI公開がありました。これを早速試してみました。 以下にColabを作成しましたので、API Keyさえあればすぐ試せます! 続きをみる
1年前