Jak zainstalować Wyoming Piper TTS w Home Assistant i uruchomić polski głos lokalnie
Czym jest Wyoming i Piper TTS w Home Assistant
Wyoming to integracja, która łączy Home Assistanta z zewnętrznymi usługami głosowymi za pomocą lekkiego protokołu. Dzięki niej Assist może korzystać z lokalnych silników rozpoznawania mowy (STT), syntezy mowy (TTS) oraz wykrywania słów kluczowych. Wśród obsługiwanych systemów są między innymi Whisper, Speech-to-Phrase, Piper oraz openWakeWord.
W kontekście polskiego lektora najważniejszy jest Piper TTS. To szybki, lokalny silnik text-to-speech oparty na sieciach neuronowych, zaprojektowany tak, aby działał dobrze nawet na sprzęcie w stylu Raspberry Pi. Obsługuje wiele języków i pozwala generować mowę bez wysyłania danych poza domową instalację.
Poniżej znajdziesz krok po kroku opis instalacji i konfiguracji Pipera w Home Assistant z wykorzystaniem integracji Wyoming, tak aby uzyskać w pełni lokalny polski głos.
Wymagania wstępne
Zanim zaczniesz, upewnij się, że:
-
Korzystasz z Home Assistant OS lub instalacji, która ma dostęp do Sklepu z dodatkami.
-
Masz działający system Assist lub przynajmniej możliwość konfiguracji Assist pipelines w Home Assistant.
-
Home Assistant jest w miarę aktualny, ponieważ Wyoming Protocol jest rozwijany w nowszych wersjach HA.
Opcjonalnie możesz później dołożyć lokalne rozpoznawanie mowy, na przykład Whisper lub Speech-to-Phrase, ale do samego polskiego lektora potrzebny jest przede wszystkim Piper.
Krok 1: Instalacja dodatku Piper TTS
Pierwszy etap to dodanie i zainstalowanie dodatku Piper TTS w Home Assistant.
-
Wejdź w Ustawienia → Dodatki → Sklep z dodatkami.
-
Wyszukaj dodatek Piper lub skorzystaj z linku „My” do Piper, jeśli korzystasz z oficjalnej dokumentacji Home Assistanta.
-
Jeżeli dodatek nie wyświetla się w wynikach od razu, upewnij się, że:
-
korzystasz z oficjalnego repozytorium dodatków
-
odświeżyłeś widok Sklepu
-
masz aktualną wersję HA
-
-
Gdy dodatek będzie widoczny, przejdź do jego strony i kliknij Zainstaluj.
-
Po zakończeniu instalacji kliknij Start, aby uruchomić usługę Piper.
Na tym etapie Home Assistant uruchamia lokalny serwer TTS, do którego później podłączy się integracja Wyoming.
Krok 2: Wybór polskiego modelu głosu w konfiguracji Piper
Po uruchomieniu dodatku Piper warto od razu dobrać model głosu.
-
Wejdź w szczegóły dodatku Piper.
-
Otwórz zakładkę Konfiguracja lub Ustawienia dodatku.
-
Na liście dostępnych modeli znajdź język polski (PL).
-
Wybierz model w jakości medium (na przykład głos w stylu „Gosia” lub inny, który oferuje język polski w Twojej instalacji).
-
Zapisz zmiany i w razie potrzeby zrestartuj dodatek Piper.
Modele medium zwykle oferują dużo lepszą naturalność mowy przy wciąż rozsądnym zużyciu zasobów. Modele o jakości low są lżejsze, ale brzmią bardziej sztucznie.
Krok 3: Integracja Piper z Home Assistant przez Wyoming Protocol
Sama instalacja dodatku nie wystarczy. Home Assistant musi się z nim „dogadać” przez integrację Wyoming.
-
Po starcie dodatku Piper wejdź w Ustawienia → Urządzenia i usługi.
-
W zakładce Integracje Home Assistant spróbuje automatycznie wykryć usługi działające przez protokół Wyoming. Jeśli wszystko jest poprawnie uruchomione, Piper powinien zostać pokazany jako Znaleziony przez integrację Wyoming Protocol.
-
Kliknij Konfiguruj lub Dodaj przy wykrytej usłudze i przejdź przez krótki kreator.
-
Po zakończeniu konfiguracji Piper będzie widoczny jako osobna integracja, zarządzana przez Wyoming.
Jeśli HA nie wykryje Piper automatycznie, możesz dodać Wyoming ręcznie:
-
W Ustawienia → Urządzenia i usługi kliknij przycisk Dodaj integrację.
-
Z listy wybierz Wyoming Protocol.
-
Podaj adres hosta i port serwera Piper, jeśli nie został wykryty automatycznie.
-
Zapisz ustawienia i poczekaj, aż integracja się połączy.
Krok 4: Konfiguracja lokalnego Assist pipeline z Piper TTS
Teraz trzeba powiedzieć Assistowi, że ma używać Pipera jako silnika text-to-speech.
-
Przejdź do Ustawienia → Voice assistants (Asystenci głosowi).
-
Jeśli nie masz jeszcze asystenta, kliknij Dodaj asystenta. Jeżeli już go masz, możesz edytować istniejącą konfigurację.
-
Nadaj asystentowi dowolną nazwę, na przykład „Asystent lokalny”.
-
Ustaw:
-
Język: polski
-
Agent konwersacji: Home Assistant
-
Speech-to-text: wybrany silnik lokalny (na przykład Whisper lub Speech-to-Phrase, jeśli już je zainstalowałeś przez Wyoming)
-
Text-to-speech: Piper
-
-
W sekcji TTS wybierz język polski oraz konkretny głos (na przykład wspomniany model medium, którego używasz w dodatku).
W tym momencie pełen pipeline Assist działa lokalnie. Gdy wydasz komendę głosową, Home Assistant przetworzy ją przez lokalny STT, zinterpretuje i odpowie głosem generowanym przez Pipera.
Jeżeli w zakładce asystentów nie widzisz żadnego pipeline, możesz dodać sekcję assist_pipeline: w pliku configuration.yaml, aby tę funkcjonalność włączyć ręcznie.
Krok 5: Testowanie polskiego głosu
Po konfiguracji warto od razu zrobić kilka testów.
-
Wejdź ponownie do dodatku Piper i skorzystaj z wbudowanego pola testowego, jeśli jest dostępne. Wpisz krótki tekst, na przykład „Cześć, jak mogę pomóc” i odsłuchaj wynik.
-
Następnie uruchom Assist z poziomu interfejsu Home Assistanta, aplikacji mobilnej albo przycisku „Rozmawiaj z Assist”.
-
Zwróć uwagę, czy odpowiedź jest odczytywana po polsku oraz czy brzmienie głosu jest akceptowalne.
-
W razie potrzeby wróć do konfiguracji Pipera i przetestuj inne modele głosów lub jakość nagrania.
Jeżeli chcesz pójść krok dalej, możesz połączyć Pipera z automatyzacjami tak, aby Home Assistant odczytywał komunikaty głosowe na przykład o pogodzie, alarmach, stanie systemu czy przypomnieniach.
Rozszerzenia: satelity głosowe i dodatkowe opcje
Wyoming obsługuje także zdalne satelity głosowe na przykład na Raspberry Pi. Dzięki temu mikrofon i głośnik mogą znajdować się w innym pomieszczeniu, a Home Assistant nadal korzysta z tego samego lokalnego pipeline STT i TTS. Satelity są zwykle wykrywane automatycznie przez Zeroconf, a ich ustawienia audio (tłumienie szumów, auto-gain, głośność mikrofonu) można dopasować do warunków akustycznych konkretnego pokoju.
To jednak krok dodatkowy. Do uruchomienia polskiego Pipera w zupełności wystarczy konfiguracja pokazana powyżej.
Podsumowanie
Instalacja lokalnego polskiego TTS w Home Assistant za pomocą Wyoming i Piper sprowadza się do kilku logicznych etapów. Instalujesz dodatek Piper, wybierasz polski model głosu, integrujesz go przez Wyoming Protocol i przypisujesz do Assist pipeline jako silnik text-to-speech. Dzięki temu Twój asystent głosowy może odpowiadać po polsku całkowicie lokalnie, bez płatnej chmury i bez wysyłania nagrań do zewnętrznych serwerów.
Jeżeli budujesz bardziej rozbudowany system z lokalnym rozpoznawaniem mowy, wake wordami i satelitami głosowymi, ten sam mechanizm Wyoming stanie się kręgosłupem całego rozwiązania.
