Interfaces de conversação
Assistentes virtuais operados por voz, como o Google Now, oferecem uma maneira simples de procurar informações e realizar algumas tarefas na maioria dos smartphones. Apesar do rápido desenvolvimento destas tecnologias nos últimos anos, estes sistemas estão longe de serem considerados "perfeitos", já que muitas vezes escutam e interpretam mal os comandos ditados pelos usuários.
Fundada no ano 2000, na China, como resposta ao Google, a Baidu vem fazendo progressos no segmento particularmente impressionantes, especialmente no que diz respeito à precisão do reconhecimento da voz. Em novembro de 2015, a companhia atingiu um marco importante com o desenvolvimento - em seu laboratório no Silicon Valley -, de um novo e poderoso motor de reconhecimento de voz chamado Deep Speech 2. Trata-se de uma enorme rede neural capaz de aprender a associar sons a palavras e frases à medida em que é alimentada por milhões de exemplos de relatos transcritos. O Deep Speech 2 pode reconhecer palavras faladas com uma precisão impressionante; os pesquisadores descobriram que ele consegue transcrever trechos de discurso em mandarim com mais precisão que uma pessoa. Além disso, a grande vantagem do engine da Baidu é que ele funciona como um "sistema universal de linguagem", tendo a capacidade de aprender a interagir com qualquer idioma.