Tuesday, November 8, 2016

Browsing audio data, Speech recognation dan Speech synthesis

Browsing Audio Data
Browsing Audio Data merupakan metode browsing jaringan yang digunakan untuk browsing video / audio data yang ditangkap oleh sebuah IP kamera. Sebuah komputer lokal digabungkan ke LAN (local area network) untuk mendeteksi IP kamera. Jaringan video / audio metode browsing mencakupi langkah-langkah sebagai berikut :
  • Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi yang disimpan dalam kamera IP.
  • Transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server) oleh program aplikasi.
  • Mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi compile ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video / audio data yang ditangkap oleh kamera IP, dimana server layanan menangkap video / audio data melalui Internet.
Browsing audio data tidak semudah browsing dokumen cetak, karena adanya sifat temporal suara. Ketika melakukan browsing terhadap dokumen, kita dapat dengan cepat mengalihkan fokus perhatian dengan membaca sepintas isi dari dokumen tersebut. Kita dapat mengetahui ukuran dan struktur dokumen, dan menggunakan memori spasial visual untuk mengingat dan mencari spesifik topik.  Namun, ketika browsing suatu rekaman audio, kita harus berulang kali memainkan dan melompati bagian tertentu, tanpa memainkannya, kita tidak bisa menyadari suara atau isinya. Kita harus mendengarkan semua stream audio untuk dapat menangkap semua isinya.

Speech Recognition dan Speech Synthesis
Speech Recognition adalah proses identifikasi suara berdasarkan kata yang diucapkan dengan melakukan konversi sebuah sinyal akustik, yang ditangkap oleh audio device (perangkat input suara).

Contoh:
Dalam perawatan kesehatan domain, bahkan di bangun meningkatkan teknologi pengenalan suara, transcriptionists medis (MTs) belum menjadi usang. Layanan yang diberikan dapat didistribusikan daripada diganti. Pengenalan pembicaraan dapat diimplementasikan di front-end atau back-end dari proses dokumentasi medis. Front-End SR adalah salah satu alat untuk mengidentifikasi kata-kata yang ucapkan dan ditampilkan tepat setelah mereka berbicara Back-End SR atau SR tangguhan adalah di mana penyedia menentukan menjadi sebuah sistem dikte digital, dan suara yang diarahkan melalui pidato-mesin pengakuan dan draft dokumen diakui dirutekan bersama dengan file suara yang asli ke MT / editor, yang mengedit draft dan memfinalisasi laporan. Ditangguhkan SR sedang banyak digunakan dalam industri saat ini.

Speech Synthesis adalah transformasi dari teks ke arah suara (speech). Transformasi ini mengkonversi teks ke pemadu suara (speech synthesis) yang sebisa mungkin dibuat menyerupai suara nyata, disesuaikan dengan aturan – aturan pengucapan bahasa.TTS (text to speech) dimaksudkan untuk membaca teks elektronik dalam bentuk buku, dan juga untuk menyuarakan teks dengan menggunakan pemaduan suara.

Contoh:
Pidato sintesis telah lama menjadi alat bantu teknologi vital dan penerapannya di daerah ini sangat signifikan dan luas. Hal ini memungkinkan hambatan lingkungan harus dikeluarkan untuk orang dengan berbagai cacat. Aplikasi terpanjang telah menggunakan pembaca layar untuk orang dengan gangguan penglihatan, tetapi teks-to-speech sistem yang sekarang umum digunakan oleh orang-orang dengan disleksia dan kesulitan membaca lainnya serta anak-anak pra-melek. Mereka juga sering digunakan untuk membantu mereka dengan gangguan berbicara parah biasanya melalui bantuan output komunikasi suara khusus. Situs seperti Ananova dan YAKiToMe! telah sintesis suara yang digunakan untuk mengkonversi berita yang ditulis untuk konten audio, yang dapat digunakan untuk aplikasi mobile. Teknik sintesis Pidato digunakan juga dalam produksi hiburan seperti game, anime dan serupa. Pada tahun 2007, Animo Limited mengumumkan pengembangan paket aplikasi perangkat lunak berdasarkan sintesis pidato FineSpeech software-nya, secara eksplisit diarahkan terhadap pelanggan dalam industri hiburan, mampu menghasilkan narasi dan baris dialog sesuai dengan spesifikasi pengguna.

Sumber : https://panjinji.wordpress.com/2014/11/26/pengertian-head-up-display-system-tangible-user-interface-computer-vision-browsing-audio-data-speech-recognition-dan-speech-synthesis/

0 Comments:

Post a Comment

    Followers