Meta umożliwi użytkownikom tłumaczenie tekstu na dźwięk
System Voicebox to innowacyjne narzędzie, które umożliwia przekształcenie danych tekstowych na dźwięk. Co istotne, system charakteryzuje się mniejszymi wymaganiami dotyczącymi procesu uczenia się i przetwarzania w porównaniu do innych podobnych rozwiązań.
Według firmy Meta, system Voicebox ma możliwość generowania wysokiej jakości dźwięku i edycji wcześniej nagranego dźwięku przy jednoczesnym zachowaniu jego treści i stylu. Obsługuje wiele języków i może być wykorzystywany do różnych celów, takich jak dostarczanie naturalnie brzmiących głosów dla wirtualnych asystentów i postaci w metaverse, pomaganie osobom niedowidzącym w słyszeniu pisemnych wiadomości własnym głosem, pomaganie twórcom w łatwym tworzeniu i edytowaniu ścieżek dźwiękowych do filmów i nie tylko.
Meta jest ostrożna i nie udostępnia publicznie kodu źródłowego ani aplikacji ze względu na obawy dotyczące potencjalnego niewłaściwego użycia technologii – ogłoszenie służy bardziej jako aktualizacja informacyjna niż pełne wprowadzenie produktu na rynek.
Źródło: https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/?utm_source=twitter&utm_medium=organic_social&utm_campaign=blog&utm_content=video