Согласно недавнему отчёту IBM, разработчикам компании удалось добиться значительного снижения коэффициента ошибок в процессе компьютерного распознавания речи. Показатель составил 5,5%, тогда как предыдущий результат равнялся 6,9%. Стоит отметить, что IBM смогла побить не только собственный рекорд, но и обойти Microsoft: в октябре прошлого года последняя сообщила об уменьшении доли ошибок до 5,9%. Ожидается, что в обозримом будущем достижение IBM позволит в несколько раз улучшить работу виртуальных помощников Siri и Alexa.
Объявив о своих успехах в октябре 2016 года, Microsoft полагала, что её показатель ошибок в 5,9% технологии машинного распознавании речи не так уж и далёк от человеческого. Однако IBM считает иначе.
"На данном этапе исследования мы выяснили, что процентное соотношение распознавания речи человеком в сравнении с компьютером на самом деле ниже, и к этому результату - 5,1% - ещё никто не приблизился" - сообщил главный научный сотрудник IBM Джордж Саон в своём блоге.
Этим заявлением IBM установила новую планку, к которой будет стремиться сама, и подстёгивать достигнутыми результатами конкурентов. Тем не менее для того, чтобы сравнять в этом плане компьютер и человека, придётся серьёзно потрудиться и учесть множество нюансов.
"Способность распознавать речь так, как делает это человек - серьёзный вызов, поскольку определение беглой речь, особенно во время спонтанного разговора, является чрезвычайно сложной задачей, - сказала Джулия Хиршберг, профессор и заведующий кафедрой компьютерных наук Колумбийского университета. - Сложность заключается ещё и в том, что способность людей распознавать и понимать речь других зависит от индивидуальности".
|