Programlar:Festival

Wiki.Pardus-Linux.Org sitesinden

Git ve: kullan, ara

Festival Konuşma Meydana Getirme Sistemidir

Festival çeşitli modüllerin örneklerini içeren konuşma meydana getirme sistemlerinin yapımının genel çatısını sunar. birkaç API ile bir bütün olarak tüm metinden konuşma sunar: kabuk seviyesinden, tasarı komut yorumlayıcısına, C++ kütüphanesi gibi, javadan, Emac arayüzüne kadar. Festival çok dillidir (şuanda ingiliz (Britanya ve Amerikan), ve İspanyolca) İngilizce en gelişmiş olanıdır. Diğer guruplar sistem için yeni diller yayınlamaktadır. ve Yeni sesler yapmak için bütün araçlar ve belgeler Carnegie Mellon'nun FestVox projesinde bulunmaktadır (http://festvox.org).

Sistem C++ ile yazılmıştır ve Edinburgh konuşma araçları kütüphanesini alt yapı mimarisi için kullanmaktadır ve kontrol için tasarı(Scheme) (SIOD) temelli komut yorumlayıcı kullanmaktadır. Belgeler FSF texinfo biçimindedir, yazılı kullanım kılavuzu, bilgi dosyaları ve HTML oluştura bilir. Festival özgür bir yazılımdır. Festival ve konuşma araçları X11-tip lisansı ile kısıtlanmamış ticari ve ticari olmayan şekilde kullanılabilir.

Şuanki Personeller

  • Alan W Black (CMU)
  • Rob Clark (CSTR)
  • Korin Richmond (CSTR)
  • Volker Strom (CSTR)
  • Simon King (CSTR)
  • Heiga Zen (Nagoya Institute of Technology)

Eski Personeller

  • Paul Taylor
  • Richard Caley

Şuanki Sürüm

sürüm 2.0'ın betası (1.95-beta olarak etiketlendirilmiştir) şuan indirilebilir. Bu ücretsiz ve kısıtsız kullanım için en güncel sürümdür. Bu sürümün işlevselliği 2.0 ile denktir, ancal yeni sürüm deleyiciler ile uyumu sağlayana kadar 2.0 a çıkmaktan geri duruyoruz. Şuanlar bu sürümde yeni:

HTS Nagoya teknoloji ensitüsünden gizli Markov model temelli sentez motoru

Multisyn CSTR'den sentez motoru genel amaçlı seçim birimi

gcc 3.2 ve 3.3, ve intel 8.0 desteği

clunits birim seçin iyileştirmeleri

Apple OS X desteği

hata düzeltmeleri.

Diğer özellikler şunları içerir:

Festival 1.4.3 ile geri uyum

İngilizce (Britanya ve amerikan), İspanyolca and Galce metinden konuşma

Dışardan yapılandırılabilir dilden bağımsız modüller:

ses takımları(phonesets)

veri sözlüğü

harften sese kuralları

tokenizing

konuşma etiketleme kısmı

tonlama ve devam süresi

Dalga Biçiminda Meydana getiriciler:

diphone temelli: residual excited LPC (ve PSOLA dağıtım için değil)

MBROLA veri tabanı desteği.

özgür X11-tip lisansı altında dağitılmıştır.

istatistik modülleirnin genellemeleri, ngram, CART, wfst ile viterbi böylece daha kolay paylaşılabilirler

Initial JSAPI desteği

ilişkiler için XML yükleme

Portatif (Unix) dağıtımı

çevrimiçi belgelendirme

SABLE markup, Emacs, client/server (Java dahil), betikleme arayüzleri.

İlgili Bağlantılar