Speechz Text to speech 1.0

Lisensi: Gratis ‎Ukuran file: N/A
‎Peringkat Pengguna: 0.0/5 - ‎0 ‎Suara

Tentang Speechz Text to speech

Teks Speechz ke ucapan

Sintesis bicara adalah produksi buatan dari pidato manusia. Sistem komputer yang digunakan untuk tujuan ini disebut synthesizer ucapan, dan dapat diimplementasikan dalam produk perangkat lunak atau perangkat keras. Sistem text-to-speech (TTS) mengonversi teks bahasa normal menjadi ucapan; sistem lain membuat representasi linguistik simbolis seperti transkripsi genggam ke dalam ucapan. [1] Ucapan yang disintesis dapat dibuat dengan menggabungkan potongan-potongan ucapan yang direkam yang disimpan dalam database. Sistem berbeda dalam ukuran unit ucapan yang disimpan; sistem yang menyimpan ponsel atau diphone menyediakan kisaran output terbesar, tetapi mungkin kurang jelas. Untuk domain penggunaan tertentu, penyimpanan seluruh kata atau kalimat memungkinkan output berkualitas tinggi. Atau, synthesizer dapat menggabungkan model saluran vokal dan karakteristik suara manusia lainnya untuk menciptakan output suara yang sepenuhnya "sintetis". [2] Kualitas synthesizer pidato dinilai dari kemiripannya dengan suara manusia dan kemampuannya untuk dipahami. Program teks ke ucapan yang cerdas memungkinkan penyandang gangguan penglihatan atau ketidakmampuan membaca untuk mendengarkan karya tertulis di komputer rumah. Banyak sistem operasi komputer telah memasukkan synthesizer ucapan sejak awal 1990-an.

Gambaran umum sistem TTS yang khas

Pengumuman otomatis MENU0:00 Suara sintetis mengumumkan kereta yang tiba di Swedia. Masalah dalam memainkan berkas ini? Lihat bantuan media.

Contoh Microsoft Sam MENU0:00 Suara synthesizer ucapan default Microsoft Windows XP mengatakan "Rubah coklat cepat melompati anjing malas 1.234.567.890 kali. Soi" Masalah dalam memainkan berkas ini? Lihat bantuan media. Sistem teks ke ucapan (atau "mesin") terdiri dari dua bagian:[3] front-end dan back-end. Front-end memiliki dua tugas besar. Pertama, ia mengonversi teks mentah yang berisi simbol seperti angka dan singkatan menjadi kata-kata yang setara dengan tulisan. Proses ini sering disebut normalisasi teks, pra-pemrosesan, atau tokenisasi. Front-end kemudian menetapkan transkripsi genggam ke setiap kata, dan membagi dan menandai teks menjadi unit prosodik, seperti frasa, klausa, dan kalimat. Proses penetapan transkripsi ototik ke kata-kata disebut teks ke otoma atau konversi grapheme-to-phoneme. Transkripsi koptik dan informasi prosody bersama-sama membentuk representasi linguistik simbolis yang dihasilkan oleh front-end. Back-end—sering disebut sebagai synthesizer—kemudian mengubah representasi linguistik simbolis menjadi suara. Dalam sistem tertentu, bagian ini mencakup perhitungan prosody target (kontur nada, durasi kopak),[4] yang kemudian dikenakan pada pidato output.