Jak zainstalować Wyoming Piper TTS w Home Assistant i uruchomić polski głos lokalnie

Czym jest Wyoming i Piper TTS w Home Assistant

Wyoming to integracja, która łączy Home Assistanta z zewnętrznymi usługami głosowymi za pomocą lekkiego protokołu. Dzięki niej Assist może korzystać z lokalnych silników rozpoznawania mowy (STT), syntezy mowy (TTS) oraz wykrywania słów kluczowych. Wśród obsługiwanych systemów są między innymi Whisper, Speech-to-Phrase, Piper oraz openWakeWord.

W kontekście polskiego lektora najważniejszy jest Piper TTS. To szybki, lokalny silnik text-to-speech oparty na sieciach neuronowych, zaprojektowany tak, aby działał dobrze nawet na sprzęcie w stylu Raspberry Pi. Obsługuje wiele języków i pozwala generować mowę bez wysyłania danych poza domową instalację.

Poniżej znajdziesz krok po kroku opis instalacji i konfiguracji Pipera w Home Assistant z wykorzystaniem integracji Wyoming, tak aby uzyskać w pełni lokalny polski głos.


Wymagania wstępne

Zanim zaczniesz, upewnij się, że:

  1. Korzystasz z Home Assistant OS lub instalacji, która ma dostęp do Sklepu z dodatkami.

  2. Masz działający system Assist lub przynajmniej możliwość konfiguracji Assist pipelines w Home Assistant.

  3. Home Assistant jest w miarę aktualny, ponieważ Wyoming Protocol jest rozwijany w nowszych wersjach HA.

Opcjonalnie możesz później dołożyć lokalne rozpoznawanie mowy, na przykład Whisper lub Speech-to-Phrase, ale do samego polskiego lektora potrzebny jest przede wszystkim Piper.


Krok 1: Instalacja dodatku Piper TTS

Pierwszy etap to dodanie i zainstalowanie dodatku Piper TTS w Home Assistant.

Link dostrony

  1. Wejdź w Ustawienia → Dodatki → Sklep z dodatkami.

  2. Wyszukaj dodatek Piper lub skorzystaj z linku „My” do Piper, jeśli korzystasz z oficjalnej dokumentacji Home Assistanta.

  3. Jeżeli dodatek nie wyświetla się w wynikach od razu, upewnij się, że:

    1. korzystasz z oficjalnego repozytorium dodatków

    2. odświeżyłeś widok Sklepu

    3. masz aktualną wersję HA

  4. Gdy dodatek będzie widoczny, przejdź do jego strony i kliknij Zainstaluj.

  5. Po zakończeniu instalacji kliknij Start, aby uruchomić usługę Piper.

Na tym etapie Home Assistant uruchamia lokalny serwer TTS, do którego później podłączy się integracja Wyoming.


Krok 2: Wybór polskiego modelu głosu w konfiguracji Piper

Po uruchomieniu dodatku Piper warto od razu dobrać model głosu.

  1. Wejdź w szczegóły dodatku Piper.

  2. Otwórz zakładkę Konfiguracja lub Ustawienia dodatku.

  3. Na liście dostępnych modeli znajdź język polski (PL).

  4. Wybierz model w jakości medium (na przykład głos w stylu „Gosia” lub inny, który oferuje język polski w Twojej instalacji).

  5. Zapisz zmiany i w razie potrzeby zrestartuj dodatek Piper.

Modele medium zwykle oferują dużo lepszą naturalność mowy przy wciąż rozsądnym zużyciu zasobów. Modele o jakości low są lżejsze, ale brzmią bardziej sztucznie.


Krok 3: Integracja Piper z Home Assistant przez Wyoming Protocol

Sama instalacja dodatku nie wystarczy. Home Assistant musi się z nim „dogadać” przez integrację Wyoming.

  1. Po starcie dodatku Piper wejdź w Ustawienia → Urządzenia i usługi.

  2. W zakładce Integracje Home Assistant spróbuje automatycznie wykryć usługi działające przez protokół Wyoming. Jeśli wszystko jest poprawnie uruchomione, Piper powinien zostać pokazany jako Znaleziony przez integrację Wyoming Protocol.

  3. Kliknij Konfiguruj lub Dodaj przy wykrytej usłudze i przejdź przez krótki kreator.

  4. Po zakończeniu konfiguracji Piper będzie widoczny jako osobna integracja, zarządzana przez Wyoming.

Jeśli HA nie wykryje Piper automatycznie, możesz dodać Wyoming ręcznie:

  1. W Ustawienia → Urządzenia i usługi kliknij przycisk Dodaj integrację.

  2. Z listy wybierz Wyoming Protocol.

  3. Podaj adres hosta i port serwera Piper, jeśli nie został wykryty automatycznie.

  4. Zapisz ustawienia i poczekaj, aż integracja się połączy.


Krok 4: Konfiguracja lokalnego Assist pipeline z Piper TTS

Teraz trzeba powiedzieć Assistowi, że ma używać Pipera jako silnika text-to-speech.

  1. Przejdź do Ustawienia → Voice assistants (Asystenci głosowi).

  2. Jeśli nie masz jeszcze asystenta, kliknij Dodaj asystenta. Jeżeli już go masz, możesz edytować istniejącą konfigurację.

  3. Nadaj asystentowi dowolną nazwę, na przykład „Asystent lokalny”.

  4. Ustaw:

    1. Język: polski

    2. Agent konwersacji: Home Assistant

    3. Speech-to-text: wybrany silnik lokalny (na przykład Whisper lub Speech-to-Phrase, jeśli już je zainstalowałeś przez Wyoming)

    4. Text-to-speech: Piper

  5. W sekcji TTS wybierz język polski oraz konkretny głos (na przykład wspomniany model medium, którego używasz w dodatku).

W tym momencie pełen pipeline Assist działa lokalnie. Gdy wydasz komendę głosową, Home Assistant przetworzy ją przez lokalny STT, zinterpretuje i odpowie głosem generowanym przez Pipera.

Jeżeli w zakładce asystentów nie widzisz żadnego pipeline, możesz dodać sekcję assist_pipeline: w pliku configuration.yaml, aby tę funkcjonalność włączyć ręcznie.


Krok 5: Testowanie polskiego głosu

Po konfiguracji warto od razu zrobić kilka testów.

  1. Wejdź ponownie do dodatku Piper i skorzystaj z wbudowanego pola testowego, jeśli jest dostępne. Wpisz krótki tekst, na przykład „Cześć, jak mogę pomóc” i odsłuchaj wynik.

  2. Następnie uruchom Assist z poziomu interfejsu Home Assistanta, aplikacji mobilnej albo przycisku „Rozmawiaj z Assist”.

  3. Zwróć uwagę, czy odpowiedź jest odczytywana po polsku oraz czy brzmienie głosu jest akceptowalne.

  4. W razie potrzeby wróć do konfiguracji Pipera i przetestuj inne modele głosów lub jakość nagrania.

Jeżeli chcesz pójść krok dalej, możesz połączyć Pipera z automatyzacjami tak, aby Home Assistant odczytywał komunikaty głosowe na przykład o pogodzie, alarmach, stanie systemu czy przypomnieniach.


Rozszerzenia: satelity głosowe i dodatkowe opcje

Wyoming obsługuje także zdalne satelity głosowe na przykład na Raspberry Pi. Dzięki temu mikrofon i głośnik mogą znajdować się w innym pomieszczeniu, a Home Assistant nadal korzysta z tego samego lokalnego pipeline STT i TTS. Satelity są zwykle wykrywane automatycznie przez Zeroconf, a ich ustawienia audio (tłumienie szumów, auto-gain, głośność mikrofonu) można dopasować do warunków akustycznych konkretnego pokoju.

To jednak krok dodatkowy. Do uruchomienia polskiego Pipera w zupełności wystarczy konfiguracja pokazana powyżej.


Podsumowanie

Instalacja lokalnego polskiego TTS w Home Assistant za pomocą Wyoming i Piper sprowadza się do kilku logicznych etapów. Instalujesz dodatek Piper, wybierasz polski model głosu, integrujesz go przez Wyoming Protocol i przypisujesz do Assist pipeline jako silnik text-to-speech. Dzięki temu Twój asystent głosowy może odpowiadać po polsku całkowicie lokalnie, bez płatnej chmury i bez wysyłania nagrań do zewnętrznych serwerów.

Jeżeli budujesz bardziej rozbudowany system z lokalnym rozpoznawaniem mowy, wake wordami i satelitami głosowymi, ten sam mechanizm Wyoming stanie się kręgosłupem całego rozwiązania.