Bienvenido a Shenzhen Acetech Technology Co., Ltd.
Casa >> Noticias >> Noticias de la ...

Noticias

Noticias

Contáctenos

Tel: 0755-27729997
Fax: 0755-23357300

Jimmy Zhang
Teléfono móvil / Wechat / Skype / WhatsApp: + 86-18565696154
Correo electrónico: jimmy@szacetech.com

Añadir: 6F, edificio Baoxin, Baolishi Industrial Park, No.5, Xingye East Road, zona de Dawangshan, ciudad de Shajing, distrito de Bao‘an, Shenzhen

Noticias de la compañía

Con la precisión del reconocimiento de voz para mejorar el nuevo paradigma de la interacción humano-computadora

Hora:2017-09-22 Puntos de vista:36
Según la asociación de la industria del habla de China, la industria mundial de la voz inteligente alcanzó los $ 6,12 mil millones en 2015, un 34,2 por ciento más anualmente, y se espera que el tamaño total del mercado supere los $ 10 mil millones en 2017. Entre ellos, la voz inteligente de China el mercado alcanzó los 4.030 millones de yuanes en 2015, un 41% más anualmente y más que la tasa de crecimiento global. En los próximos dos años, se espera que el mercado chino mantenga un crecimiento de alrededor del 60%, y la participación en el mercado mundial se mejorará aún más, lo que indica el reconocimiento del mercado de voz nacional por parte de las instituciones estadísticas.
 
En los últimos 20 años, la tecnología de reconocimiento de voz ha progresado significativamente, pero la precisión del reconocimiento ha impedido un mayor desarrollo del habla inteligente. Con la mejora de la precisión, el alcance de la aplicación del reconocimiento de voz se ampliará y la interacción de voz será gradualmente posible.
 
El reconocimiento de voz es una disciplina cruzada, también conocida como reconocimiento automático de voz. El objetivo es convertir los contenidos léxicos del habla humana en entradas legibles por computadora, como pulsaciones de teclas, códigos binarios o secuencias de caracteres. A diferencia del hablante y el hablante, este último trata de identificar o identificar al hablante en lugar de las palabras que contiene.
 
A finales del siglo XX, los sistemas de reconocimiento de voz se han utilizado ampliamente en juegos de computadora y juguetes, control de diferentes instrumentos, recopilación de datos y dictado. En las últimas dos décadas, gracias al rápido desarrollo de la inteligencia artificial y el aprendizaje automático, la tecnología de reconocimiento de voz ha mejorado significativamente, y el control por voz se ha vuelto más práctico y comenzó a moverse del laboratorio al mercado.
 
En el informe de tendencias de Internet, el discurso será el nuevo paradigma de la interacción humano-computadora. La tecnología del habla liberará las manos y los ojos humanos, y los usuarios visitarán en cualquier momento a un costo menor. Se espera que en los próximos 10 años, la tecnología de reconocimiento de voz ingrese a diversos campos, como la industria, los electrodomésticos, la comunicación, la electrónica del automóvil, la atención médica, el servicio a domicilio, la electrónica de consumo, etc. El futuro será el modo interactivo con hogar inteligente, dispositivo portátil y robot, y la voz será el mejor modo interactivo.
 
La tecnología de voz inteligente involucra múltiples disciplinas, tiene altas barreras técnicas, el ciclo de desarrollo es largo, con grandes propiedades, tales como la fuerza integral que distinguen a los fabricantes sobresalientes, por lo que hacen una estructura de mercado oligopólica. Desde que Apple desarrolló su primer asistente de voz inteligente, Siri, en 2011, GuGe, Microsoft, Amazon y Facebook se unieron al campamento, cada uno de los cuales está injertado en un terminal de dispositivo móvil inteligente.
 
Pero la precisión del reconocimiento ha estado obstaculizando el desarrollo de la voz inteligente. Actualmente, en la práctica, vemos reconocimiento de voz en áreas de hogares inteligentes, como electrodomésticos inteligentes o parlantes inteligentes. En este punto, debemos considerar la cuestión de quién es la orden ejecutiva para electrodomésticos inteligentes o parlantes inteligentes cuando varios miembros de la familia hablan al mismo tiempo. ¿Cómo pueden encontrar las órdenes de su maestro en tantas voces? Estos son los problemas que el reconocimiento de voz actual necesita resolver. Después de todo, lo que generalmente llamamos reconocimiento de voz es más que solo el reconocimiento del contenido del habla.
 
En este sentido, Microsoft ha progresado recientemente. Microsoft discurso equipo xue-dong huang introducción, "en octubre del año pasado, después de nuestra tasa de error del sistema de transcripción hasta 5,9%, otros investigadores han llevado a cabo su investigación, adoptan mucho más involucrados en el proceso de transcripción, la tasa de error reducido al 5,1%. es un nuevo hito de la industria que supera ampliamente la precisión lograda el año pasado ".
 
Según xue-dong huang, desde una perspectiva de investigación, la importancia es muy significativa, incluso el 0,1% de la brecha, tanto en el tiempo de cálculo y el costo son enormes: "¿sabes la brecha de 0.1, 0.2, 0.3, cuánto llegará el tiempo, el cálculo de la tasa de error debe estar de acuerdo con el error relativo, la tasa de error relativa debería ser de 5.9 a 5.9 13%, la tasa de error relativa sobre 13%, ha sido estadísticamente significativa ". En pocas palabras, el equipo de voz de Microsoft reduce significativamente la tasa de errores al mejorar la acústica de la red neuronal y el modelo de lenguaje del sistema de reconocimiento de voz de Microsoft.
 
Con la mejora de la precisión, el alcance de la aplicación del reconocimiento de voz se ampliará y la interacción de voz será gradualmente posible. Pero en el proceso de reconocimiento de voz para actualizar la iteración, se puede evitar el viejo y nuevo fenómeno de coexistencia, el caos inicial del mercado en el océano azul, solo para ver la tendencia de desarrollo, puede aprovechar la oportunidad, para un nuevo desarrollo .