今改めて考えるストリーミングレスポンス

571 Views

May 19, 26

#postman

スライド概要

2026/05/19 「Postman API Night Nagoya 2026 Spring」
https://postman.connpass.com/event/385101/

Koki Miura

@k_miura_io

スライド一覧

Engineer / AWS Community Builder / LINE API Expert / JAWS UG名古屋運営 GIthub: http://github.com/Miura55 Blog: http://supernove.hatenadiary.jp

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

AIエージェントの開発が捗るLLMs.txtって何？

ai coding meetup

Koki Miura 11.4K

転職のしくじりを語りたい

Koki Miura 9.2K

これぞ現代のRPA?! 話題のMCPを触ってみた

rpalt

Koki Miura 3.7K

ローカルLLMでAIエージェントは作れるか？

名古屋llmmeetup

Koki Miura 2.7K

型でつなぐFastAPI × フロントエンド活用術

pycontokai

Koki Miura 2.1K

AppSync Eventsで作るチャットアプリ-Amplifyを使わずに-

jawsug jawsug_nagoya

Koki Miura 2.1K

各ページのテキスト

今改めて考えるストリーミングレスポンス Koki Miura(@k_miura_io)

自己紹介 • 三浦耕生(こうき) • エンジニア • 俺の勉強会運営 • JAWS UG名古屋＆神戸運営 • 鯱.py 運営 @k_miura_io koki.miura05

ストリーミングレスポンスとは？ • サーバーからのレスポンスを一度に返すのではなく、用意できたものから順次レスポンスを返す仕組み • HTTPのレスポンス • LLMエージェントで注目されている技術

挙動の違い通常ストリーミング

Websocketとの違い項目ストリーミングレスポンス（HTTP Streaming / SSE など） WebSocket 接続方向主にサーバー → クライアント双方向（クライアント認証 HTTP認証がそのまま使いやすい（Cookie, Bearer Token, 接続時に認証が必要。JWTやCookieを使うことが多い Sessionなど）再接続通常のHTTPリクエストとして再実行切断時に再接続処理が必要サーバー負荷比較的軽い接続維持コストが高め代表技術 SSE(Server-Sent Events), chunked response WebSocket protocol 向いているユースケース AIチャットの逐次生成、ログ配信、進捗通知チャット、オンラインゲーム、共同編集、リアルタイム操作サーバー）

実装のポイント(LLMと連携したAPIの例) • LLMからの返答で生成されたものからfor文を利用して順次返答するようにする • Pythonであればyieldで実現可能 • FastAPIだとServer-Sent Events(SSE)に対応したレスポンスクラスが用意されているので実装自体がとてもシンプルになる

(参考)実装の比較同期的なレスポンスのエンドポイントストリーミングレスポンス

レスポンスの中身 • レスポンスの中身はJSON に近いが、【text/eventstream】という形式で返答される • EventSource APIを備えたブラウザでサポートされている形式

10.

SSEのデバッグならPostman • PostmanでSSEに対応したAPIをリクエストするとレスポンスが逐次表示されるようになる • 接続の開始・終了を見ることができてストリーミングレスポンスのデバッグが楽

11.

DEMO

12.

まとめ • ストリーミングレスポンスを使うと時間のかかるレスポンスを逐次返すことができる • Websocketと違い常時接続を維持する必要が無いのでLLMのチャットと相性が良い • Postmanならストリーミングレスポンスのテストがやりやすい AIチャットのUX向上の重要な要素の一つ

13.

ソースコード https://github.com/Miura55/claude-stream-sample-api

https://github.com/Miura55/claude-stream-sample-api

14.

END