Jawatan Popular

Pilihan Editor - 2019

Mendapatkan TV anda untuk memahami anda lebih baik

Anonim

Penyelidikan baru dari University of Waterloo telah menemui satu cara untuk meningkatkan keupayaan pemahaman permintaan suara platform hiburan rumah.

iklan


Penyelidikan ini, dengan kerjasama University of Maryland dan Comcast Applied AI Research Lab, menggunakan teknologi kecerdasan buatan (AI) untuk mencapai interaksi berasaskan ucapan yang paling asli dengan TV setakat ini.

"Hari ini, kami telah biasa berbual dengan ejen-ejen pintar yang melakukan tawaran kami - dari Siri pada telefon bimbit ke Alexa di rumah. Mengapa kita tidak boleh melakukan perkara yang sama dengan TV?" tanya Jimmy Lin, seorang profesor di University of Waterloo dan David R. Cheriton di Sekolah David R. Cheriton Sains Komputer.

"Comcast's Xfinity X1 bertujuan untuk melakukannya dengan tepat - platform ini dilengkapi dengan 'suara jauh' yang menerima pertanyaan yang diucapkan. Keinginan anda adalah arahannya - beritahu TV anda untuk menukar saluran, tanyakan tentang filem kanak-kanak percuma, dan juga mengenai ramalan kaji cuaca."

Dalam menangani masalah yang rumit untuk memahami permintaan suara, para penyelidik mempunyai idea untuk memanfaatkan teknologi AI terbaru - teknik yang dikenali sebagai rangkaian saraf berulang hierarki - untuk memperbaiki konteks model dan meningkatkan ketepatan sistem.

Pada bulan Januari 2018, model rangkaian neural baru penyelidik telah digunakan dalam pengeluaran untuk menjawab pertanyaan daripada pengguna langsung sebenar. Berbeza dengan sistem terdahulu, yang dikelirukan oleh kira-kira lapan peratus daripada pertanyaan, model baru mengendalikan kebanyakan pertanyaan yang sangat rumit dengan sewajarnya, sangat meningkatkan pengalaman pengguna.

"Jika penonton meminta 'Chicago Fire, ' yang merujuk kepada kedua-dua siri drama dan pasukan bola sepak, sistem ini dapat menguraikan apa yang anda mahukan, " kata Lin. "Apa yang istimewa tentang pendekatan ini ialah kita mengambil kesempatan daripada konteks - seperti rancangan dan saluran kegemaran yang ditonton sebelum ini - untuk memperibadikan keputusan, dengan itu meningkatkan ketepatan."

Para penyelidik telah mula bekerja untuk membangunkan model yang lebih kaya. Intuisi adalah dengan menganalisis pertanyaan dari pelbagai perspektif, sistem ini dapat memahami dengan lebih baik apa yang dilihat oleh penonton.

Kertas, Pembelajaran Multi-Tugas dengan Rangkaian Neural untuk Memahami Query Voice Query Platform, disampaikan pada Persidangan Antarabangsa ACM SIGKDD ke-24 mengenai Pengetahuan Pengetahuan & Data Mining yang baru-baru ini diadakan di United Kingdom. Penyelidikan itu dijalankan oleh Jinfeng Rao, seorang graduan PhD dari University of Maryland, penasihat Lin, dan mentor Ferhan Ture, seorang penyelidik di Comcast Applied AI Research Lab.

iklan



Sumber Cerita:

Bahan yang disediakan oleh University of Waterloo . Nota: Kandungan mungkin diedit untuk gaya dan panjang.