---
title: 生成AIなんでも展示会-ポスター展示「piper-plus」
tags: 
author: [yousan](https://docswell.com/user/yousan)
site: [Docswell](https://www.docswell.com/)
thumbnail: https://bcdn.docswell.com/page/47QYY28WEP.jpg?width=480
description: 生成AIなんでも展示会-ポスター展示「piper-plus」 by yousan
published: May 05, 26
canonical: https://docswell.com/s/yousan/ZMQLQL-2026-05-05-153643
---
# Page. 1

![Page Image](https://bcdn.docswell.com/page/47QYY28WEP.jpg)

ようさん
EXPO Vol.5 2026.05.06
Independent OSS Author · Unity Engineer ( 本業 )
日本語でモバイル / IoT で動かせる、
マルチ言語対応のニューラル TTS
Edge-ready Japanese TTS · multilingual neural synthesis
MIT · 38 MB · 27 ms · 8
01 /
言語 · 6 ランタイム
github.com/ayutaz/piper-plus
SCAN TO TRY
背景にある課題
BACKGROUND
クラウド TTS は データ送信・商用制約・レイテンシ・オフライン不可 が課 ローカル日本語 TTS で MIT × モバイル / IoT を満たす OSS は存在しなかっ
題。
た。
02 /
piper-plus とは
WHAT IS PIPER+?
VITS [1] ベースのニューラル TTS。MIT ライセンスフォークの Piper、独自 G2P で espeak-ng 不要。8 言語 × 6 ランタ
イム対応。
v1.12.0 · MIT License · github.com/ayutaz/piper-plus
03 /
アーキテクチャ
ARCHITECTURE
TEXT
G2P
MB-iSTFT-VITS2
MB-iSTFT-VITS2 [2] Decoder で CPU 2.21×
高速 · ONNX 1 本で 6 ランタイム共通
ja / en / zh / ko / es / fr / pt /
sv
独自 G2P で espeak-ng 不要
·
独自実装 (espeak-ng 不要 )
ONNX
統一 Decoder / 2.21× 高速
6 RUNTIMES
FP16 38MB
Py / Rust / C# / Go / WASM / C++
27 38 8 6
04 /
数値で見る
Latency P50
ms
25 phonemes / CPU
05 /
MB
Model Size
LANGS
RUNTIMES
G2P Coverage
ONNX FP16, 最小クラス
KEY RESULTS
Cross Platform
ja en zh ko es fr pt sv
Py / Rust / C# / Go / WASM / C++
競合比較
COMPARISON
SYSTEM
RTF ↓
P50 ms
SIZE MB
LICENSE
piper-plus
0.078
27
38
MIT
Piper
0.066
35
60
MIT
sherpa-onnx
0.075
53
60
Apache-2.0
piper1-gpl
0.060
—
75
GPL-3.0
Kokoro-82M
0.120
—
320
Apache-2.0
本家
FIGURE 1a · MODEL SIZE (MB, smaller is better)
ESPEAK-NG
✗ 不要
✓ 必須
✓ 必須
✓ 必須
✗ 不要
STATUS
Active / v1.12
Archived 2025-10
Active
Active (OHF)
別アーキ参考
FIGURE 1b · P50 LATENCY (ms, lower is better)
piper-plus
38 MB
piper-plus
27 ms
本家
60 MB
Piper
本家
35 ms
sherpa-onnx
60 MB
sherpa-onnx
53 ms
piper1-gpl
75 MB
piper1-gpl
no public benchmark
—
Kokoro-82M
320 MB
Kokoro-82M
no public benchmark
—
Piper
モバイル / IoT 対応
計測 : Intel Xeon E5-2650 v4 / Linux x86_64 / ONNX Runtime 1.24 / CPU 4 threads / 22 phoneme dummy / warmup 5 × runs 30 → P50 = median. 「 —」 は本ハーネス未計測 (前回 Apple M2 Max)。
06 /
READINESS
MOBILE
UNITY
GODOT
BROWSER
→ github.com/ayutaz/piper-plus
→ github.com/ayutaz/uPiper
→ github.com/ayutaz/godot-piper-plus
→ ayutaz.github.io/piper-plus
iOS / Android
C API (.so / .dylib / .framework) を arm64・
armv7・x86_64 にクロスビルド。Flutter /
Swift / Kotlin から FFI 呼び出し可能。
TAKE-HOME
uPiper
Unity 6 × Unity.InferenceEngine。Win /
macOS / Linux / Android 対応、非同期 API とス
トリーミング合成、サンプルシーン同梱。
godot-piper-plus
Godot 4.3+ 用 GDExtension。
AudioStreamPlayer 派生の PiperTTS ノードを
GDScript から直接呼出可能、Win / macOS /
Linux 対応。
WebAssembly
openjtalk-web (npm) でブラウザ完全オフライ
ン推論。サーバー不要、テキスト未送信。音素
タイミング JSON 出力とストリーミング対応。
モバイル / IoT で動かしたい日本語ローカル TTS なら piper-plus 一択 — MIT / 38MB / 27ms / 8 言語対応
@ 生成 AI なんでも展示会 Vol.5
·
2026.05.06 ( 水・祝 ) 12:30–18:00
github.com/ayutaz/piper-plus
·
MIT License
·
·
すみだ産業会館
8F サンライズホール
© 2026 ようさん
[1] Kim et al. (2021) Conditional VAE with Adversarial Learning for End-to-End Text-to-Speech, ICML. · [2] Kawamura et al. (2023) Lightweight and High-Fidelity End-to-End TTS with Multi-Band Generation and Inverse Short-Time Fourier Transform,
ICASSP. · [3] Desplanques et al. (2020) ECAPA-TDNN, Interspeech.


