-- Views
May 05, 26
スライド概要
ようさん EXPO Vol.5 2026.05.06 Independent OSS Author · Unity Engineer ( 本業 ) 日本語でモバイル / IoT で動かせる、 マルチ言語対応のニューラル TTS Edge-ready Japanese TTS · multilingual neural synthesis MIT · 38 MB · 27 ms · 8 01 / 言語 · 6 ランタイム github.com/ayutaz/piper-plus SCAN TO TRY 背景にある課題 BACKGROUND クラウド TTS は データ送信・商用制約・レイテンシ・オフライン不可 が課 ローカル日本語 TTS で MIT × モバイル / IoT を満たす OSS は存在しなかっ 題。 た。 02 / piper-plus とは WHAT IS PIPER+? VITS [1] ベースのニューラル TTS。MIT ライセンスフォークの Piper、独自 G2P で espeak-ng 不要。8 言語 × 6 ランタ イム対応。 v1.12.0 · MIT License · github.com/ayutaz/piper-plus 03 / アーキテクチャ ARCHITECTURE TEXT G2P MB-iSTFT-VITS2 MB-iSTFT-VITS2 [2] Decoder で CPU 2.21× 高速 · ONNX 1 本で 6 ランタイム共通 ja / en / zh / ko / es / fr / pt / sv 独自 G2P で espeak-ng 不要 · 独自実装 (espeak-ng 不要 ) ONNX 統一 Decoder / 2.21× 高速 6 RUNTIMES FP16 38MB Py / Rust / C# / Go / WASM / C++ 27 38 8 6 04 / 数値で見る Latency P50 ms 25 phonemes / CPU 05 / MB Model Size LANGS RUNTIMES G2P Coverage ONNX FP16, 最小クラス KEY RESULTS Cross Platform ja en zh ko es fr pt sv Py / Rust / C# / Go / WASM / C++ 競合比較 COMPARISON SYSTEM RTF ↓ P50 ms SIZE MB LICENSE piper-plus 0.078 27 38 MIT Piper 0.066 35 60 MIT sherpa-onnx 0.075 53 60 Apache-2.0 piper1-gpl 0.060 — 75 GPL-3.0 Kokoro-82M 0.120 — 320 Apache-2.0 本家 FIGURE 1a · MODEL SIZE (MB, smaller is better) ESPEAK-NG ✗ 不要 ✓ 必須 ✓ 必須 ✓ 必須 ✗ 不要 STATUS Active / v1.12 Archived 2025-10 Active Active (OHF) 別アーキ参考 FIGURE 1b · P50 LATENCY (ms, lower is better) piper-plus 38 MB piper-plus 27 ms 本家 60 MB Piper 本家 35 ms sherpa-onnx 60 MB sherpa-onnx 53 ms piper1-gpl 75 MB piper1-gpl no public benchmark — Kokoro-82M 320 MB Kokoro-82M no public benchmark — Piper モバイル / IoT 対応 計測 : Intel Xeon E5-2650 v4 / Linux x86_64 / ONNX Runtime 1.24 / CPU 4 threads / 22 phoneme dummy / warmup 5 × runs 30 → P50 = median. 「 —」 は本ハーネス未計測 (前回 Apple M2 Max)。 06 / READINESS MOBILE UNITY GODOT BROWSER → github.com/ayutaz/piper-plus → github.com/ayutaz/uPiper → github.com/ayutaz/godot-piper-plus → ayutaz.github.io/piper-plus iOS / Android C API (.so / .dylib / .framework) を arm64・ armv7・x86_64 にクロスビルド。Flutter / Swift / Kotlin から FFI 呼び出し可能。 TAKE-HOME uPiper Unity 6 × Unity.InferenceEngine。Win / macOS / Linux / Android 対応、非同期 API とス トリーミング合成、サンプルシーン同梱。 godot-piper-plus Godot 4.3+ 用 GDExtension。 AudioStreamPlayer 派生の PiperTTS ノードを GDScript から直接呼出可能、Win / macOS / Linux 対応。 WebAssembly openjtalk-web (npm) でブラウザ完全オフライ ン推論。サーバー不要、テキスト未送信。音素 タイミング JSON 出力とストリーミング対応。 モバイル / IoT で動かしたい日本語ローカル TTS なら piper-plus 一択 — MIT / 38MB / 27ms / 8 言語対応 @ 生成 AI なんでも展示会 Vol.5 · 2026.05.06 ( 水・祝 ) 12:30–18:00 github.com/ayutaz/piper-plus · MIT License · · すみだ産業会館 8F サンライズホール © 2026 ようさん [1] Kim et al. (2021) Conditional VAE with Adversarial Learning for End-to-End Text-to-Speech, ICML. · [2] Kawamura et al. (2023) Lightweight and High-Fidelity End-to-End TTS with Multi-Band Generation and Inverse Short-Time Fourier Transform, ICASSP. · [3] Desplanques et al. (2020) ECAPA-TDNN, Interspeech.