🎙 VibeVoice от Microsoft — open-source стек для голосового AI, который делает слишком много
Если тебе нужно распознать часовой митинг с разделением по спикерам, озвучить статью четырьмя голосами или собрать пайплайн «речь на входе → речь на выходе» — обычно это три разных инструмента. Microsoft собрал всё в один open-source фреймворк и отдал бесплатно.











