利益相关:Cortana Diagnostics Team @ Microsoft

排名最高的两个答案中分别提到了从技术积累上和从技术细节上分别“怎么做到”的。我在这里给 @麦络Milo 的答案做一点小补充:从用户的角度来看,“根据情感分析结果,对中文发声序列进行调整,从而更加符合语调和情感”这一点是Cortana做到和真人发音相似的关键。
Cortana会根据当前的对话情景进行情感分析,控制自己的语音语调。比如在说类似于“Sorry, I can’t do that”(没用过英文版Cortana,大概在这种场景下吧)的时候会用很抱歉的语气,而如果是“I find three StarBucks nearby for you”之类的句子就会是非常确定的语气。这样听起来自然比简单地把单词拼接起来更加像人类的声音,当然我也不知道Siri之流有没有使用类似的技术,更无从评价Cortana和Siri究竟哪个好。当然从利益相关的角度我自然会认为Cortana更好:)
至于情感分析背后的技术手段,其实我也不知道。就算知道了也不可能在这儿说出来的……Cortana发布前不小心发了条相关的微博都被勒令删除了有木有啊。
就是这样。

— 完 —

本文作者:sqybi

【知乎日报】
你都看到这啦,快来点我嘛 Σ(▼□▼メ)

此问题还有 16 个回答,查看全部。
延伸阅读:
Siri 通过语音识别提供智能助手服务,这样一个产品的技术挑战在哪里?
百度语音助手(安卓版)的使用体验如何?

分享到