System sztucznej inteligencji Voicebox

Źródło graficzne:Freepik.com

Meta umożliwi użytkownikom tłumaczenie tekstu na dźwięk

System Voicebox to innowacyjne narzędzie, które umożliwia przekształcenie danych tekstowych na dźwięk. Co istotne, system charakteryzuje się mniejszymi wymaganiami dotyczącymi procesu uczenia się i przetwarzania w porównaniu do innych podobnych rozwiązań.

Według firmy Meta, system Voicebox ma możliwość generowania wysokiej jakości dźwięku i edycji wcześniej nagranego dźwięku przy jednoczesnym zachowaniu jego treści i stylu. Obsługuje wiele języków i może być wykorzystywany do różnych celów, takich jak dostarczanie naturalnie brzmiących głosów dla wirtualnych asystentów i postaci w metaverse, pomaganie osobom niedowidzącym w słyszeniu pisemnych wiadomości własnym głosem, pomaganie twórcom w łatwym tworzeniu i edytowaniu ścieżek dźwiękowych do filmów i nie tylko.

Meta jest ostrożna i nie udostępnia publicznie kodu źródłowego ani aplikacji ze względu na obawy dotyczące potencjalnego niewłaściwego użycia technologii – ogłoszenie służy bardziej jako aktualizacja informacyjna niż pełne wprowadzenie produktu na rynek.

Źródło: https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/?utm_source=twitter&utm_medium=organic_social&utm_campaign=blog&utm_content=video