A voz antes da Siri: 1ª assistente virtual brasileira foi criada há 25 anos

Muito antes da Siri, do Google Assistente ou da Alexa, uma outra assistente virtual já falava com os brasileiros por comando de voz. Lançada em novembro de 2001, a Mediz foi um serviço criado pela Gradiente, que apostava na recém-criada tecnologia de reconhecimento de fala. O serviço durou três anos e contou com a voz de Regina Bittar, que depois também foi usada para os serviços da Siri e do Google Tradutor.
Como funcionava
Via ligação telefônica, o usuário podia pedir notícias, previsão do tempo, resultados da loteria ou informações sobre o trânsito — e recebia as respostas por voz. Com investimento de US$ 26 milhões, ela tinha parceria com operadoras como Claro Digital e ATL, e até um avatar digital, como hoje é a Lu, do Magalu. Na prática, era um embrião da "internet móvel" e uma das primeiras experiências de navegação por voz no país. A novidade foi lançada com campanha de marketing nas revistas, na TV e no rádio.
A voz é de Regina Bittar, que anos depois também viria a ser a primeira voz da Siri e do Google Tradutor em português. Foi preciso gravar uma infinidade de frases. A gravação levou cerca de um ano antes do lançamento do produto.
Quando eu fui chamada para participar do casting de escolha da voz da Mediz, eu já trabalhava como locutora há bastante tempo. Tinha trabalhado num estúdio há oito anos, como produtora, atendimento, e estava começando a carreira solo como profissional liberal. Foi uma grande surpresa porque era um projeto inovador
Regina Bittar, a voz da Mediz e primeira voz da Siri
Interação à internet por ligação de telefone. Baseada na tecnologia da norte-americana Nuance, a Mediz usava reconhecimento de voz para identificar a demanda do usuário e respondê-lo conforme o pedido. A interação era feita exclusivamente por chamada telefônica, o que transformava qualquer aparelho — mesmo os mais simples — em um ponto de o vocal à internet, explica Marcelo Ribeiro, atual CEO da Gradiente Solar.
A Gradiente foi responsável pela criação de toda a tecnologia que deu origem à Mediz. A área teve um número de colaboradores entre 25 e 30 pessoas e investimento para trazer hardware e software do exterior. No caso, eram placas que faziam o reconhecimento de voz e software que permitia criar algoritmos de navegação em torno dos serviços e conteúdos que queríamos mostrar. Na época do lançamento da Mediz, ela contava com uma unidade de negócios chamada In Motion, que oferecia serviços de valor agregado ao mercado de alta tecnologia.
A ideia era simples e revolucionária ao mesmo tempo: oferecer o à internet sem tela. Você falava e a Mediz respondia. Investimos pesado porque acreditávamos que o futuro da internet aria pela voz.
Marcelo Ribeiro, atual CEO da Gradiente Solar
A ideia de criar uma persona completa realmente foi o que nos diferenciou de algumas iniciativas que estavam acontecendo fora do Brasil. A ideia era realmente colocar na cabeça das pessoas que elas estavam conversando com alguém. Queríamos uma voz agradável, simpática, que inspirasse confiança e que fosse também amiga, divertida. Era muito difícil escutar as vozes e enxergar nelas todas essas características. Com a Regina, acertamos em cheio.
Como acabou
A Mediz durou cerca de três anos. Durante esse tempo, usuários usaram o serviço por mais de um milhão de minutos por mês, de acordo com Ribeiro. Também gerou bastante receita tanto para as operadoras quanto para a Gradiente.
Com o ar do tempo, as operadoras de telefonia começaram a focar muito mais na banda de dados e menos nos serviços de voz. Os planos de voz acabaram ficando cada vez mais baratos, o custo do minuto acabou diminuindo e isso começou a fazer com que o modelo de negócios não fechasse mais em termos econômicos. Quando a Gradiente percebeu isso, ela acabou vendendo os equipamentos e a tecnologia para as operadoras, que eventualmente optaram por descontinuar o serviço.
Eu acho que a Mediz foi uma iniciativa muito à frente do seu tempo. A ideia de que o ser humano ia precisar de outras formas de interagir com as máquinas e poder navegar através de conteúdos, através da internet, de outras maneiras, era uma ideia absolutamente atual, uma coisa que realmente aconteceu e acontece a cada dia. A Gradiente foi muito visionária nesse momento, olhando para a frente. E eu acho que a tecnologia de hoje, quando vemos as assistentes virtuais hoje, como Alexa, Siri e outras que eventualmente existam, elas são exatamente o que queríamos que a Mediz se transformasse.
Marcelo Ribeiro
Voz se tornou icônica
A voz de Regina ficou gravada na memória afetiva de uma geração — e também na memória de muitos dispositivos. Anos depois da Mediz, ela viria a descobrir que sua voz estava sendo usada por sistemas como o Google Tradutor e, posteriormente, a Siri da Apple.
Depois de ter gravado a Mediz, aconteceu um novo casting em São Paulo, buscando uma voz. "Mas, nesse caso, eles nos falaram que era para a gravação de um TTS (Text to Speech). Tinha até fonoaudióloga, o teste demorava uma hora, com vários textos grandes e com trava-língua, com texto sem nexo? Você tinha que manter a dicção, a entonação, a emissão de voz por muito tempo. Não podia errar", disse Regina.
Com esse novo teste, a voz foi pro Google Tradutor e para Apple. Na época, ela achou que se tratava de um projeto voltado à ibilidade, como os que já tinha feito antes, e gravou para uma empresa de tecnologia, sediada em Zurique. A sua gravação foi licenciada para essa empresa. Mais tarde, a empresa cedeu o uso da voz para gigantes da tecnologia, primeiro o Google Tradutor, que ainda não tinha uma voz em português, e depois, para a Apple, que ainda não tinha uma voz em português para desenvolver o sistema.
Regina assinou contrato com a empresa suíça de tecnologia por dez anos — contrato que foi renovado e ainda está em vigor. Hoje, sua voz é usada no CarPlay, no GPS de carros e em sistemas embarcados da Cerence, empresa especializada em inteligência artificial veicular.
Eu continuo gravando para eles. Cada vez menos é necessário a gravação, porque a inteligência artificial agora realmente aprende. Nós só começamos com as emoções.
Regina Bittar, a voz da Mediz e primeira voz da Siri
Comecei a ser reconhecida ao dar agem por uma pessoa na rua, por exemplo, e ela falar, 'obrigada Siri, obrigada Google Tradutor. Um dia eu parei para pedir informação, porque eu sou super perdida (é uma ironia eu ter uma voz em GPS) e o GPS estava me mandando por um lugar? A pessoa me respondeu: 'mas como você está perdida se você é a voz do GPS?'