Programlar:Festival
Wiki.Pardus-Linux.Org sitesinden
Festival Konuşma Meydana Getirme Sistemidir
Festival çeşitli modüllerin örneklerini içeren konuşma meydana getirme sistemlerinin yapımının genel çatısını sunar. birkaç API ile bir bütün olarak tüm metinden konuşma sunar: kabuk seviyesinden, tasarı komut yorumlayıcısına, C++ kütüphanesi gibi, javadan, Emac arayüzüne kadar. Festival çok dillidir (şuanda ingiliz (Britanya ve Amerikan), ve İspanyolca) İngilizce en gelişmiş olanıdır. Diğer guruplar sistem için yeni diller yayınlamaktadır. ve Yeni sesler yapmak için bütün araçlar ve belgeler Carnegie Mellon'nun FestVox projesinde bulunmaktadır (http://festvox.org).
Sistem C++ ile yazılmıştır ve Edinburgh konuşma araçları kütüphanesini alt yapı mimarisi için kullanmaktadır ve kontrol için tasarı(Scheme) (SIOD) temelli komut yorumlayıcı kullanmaktadır. Belgeler FSF texinfo biçimindedir, yazılı kullanım kılavuzu, bilgi dosyaları ve HTML oluştura bilir. Festival özgür bir yazılımdır. Festival ve konuşma araçları X11-tip lisansı ile kısıtlanmamış ticari ve ticari olmayan şekilde kullanılabilir.
Şuanki Personeller
- Alan W Black (CMU)
- Rob Clark (CSTR)
- Korin Richmond (CSTR)
- Volker Strom (CSTR)
- Simon King (CSTR)
- Heiga Zen (Nagoya Institute of Technology)
Eski Personeller
- Paul Taylor
- Richard Caley
Şuanki Sürüm
sürüm 2.0'ın betası (1.95-beta olarak etiketlendirilmiştir) şuan indirilebilir. Bu ücretsiz ve kısıtsız kullanım için en güncel sürümdür. Bu sürümün işlevselliği 2.0 ile denktir, ancal yeni sürüm deleyiciler ile uyumu sağlayana kadar 2.0 a çıkmaktan geri duruyoruz. Şuanlar bu sürümde yeni:
HTS Nagoya teknoloji ensitüsünden gizli Markov model temelli sentez motoru
Multisyn CSTR'den sentez motoru genel amaçlı seçim birimi
gcc 3.2 ve 3.3, ve intel 8.0 desteği
clunits birim seçin iyileştirmeleri
Apple OS X desteği
hata düzeltmeleri.
Diğer özellikler şunları içerir:
Festival 1.4.3 ile geri uyum
İngilizce (Britanya ve amerikan), İspanyolca and Galce metinden konuşma
Dışardan yapılandırılabilir dilden bağımsız modüller:
ses takımları(phonesets)
veri sözlüğü
harften sese kuralları
tokenizing
konuşma etiketleme kısmı
tonlama ve devam süresi
Dalga Biçiminda Meydana getiriciler:
diphone temelli: residual excited LPC (ve PSOLA dağıtım için değil)
MBROLA veri tabanı desteği.
özgür X11-tip lisansı altında dağitılmıştır.
istatistik modülleirnin genellemeleri, ngram, CART, wfst ile viterbi böylece daha kolay paylaşılabilirler
Initial JSAPI desteği
ilişkiler için XML yükleme
Portatif (Unix) dağıtımı
çevrimiçi belgelendirme
SABLE markup, Emacs, client/server (Java dahil), betikleme arayüzleri.
