嗨的来电 来电秀导读:语音入门篇系列,已经接近尾声,第三篇主要围绕语音场景分析后半一部分(车辆控制、电话的语音话术)和对话设计重点,也是最精彩的一部分,让我们一起来看看吧。
基本功能包括车内空调温度调节、控制车窗开关、后视镜角度的调节,还可以切换驾驶模式、变换档位等等。
空调控制ON/OFF ?? 打开空调、关闭空调
空调Auto ?? 打开自动空调、自动空调开启
空调打开+模式 ?? 太冷了、好热啊(检索到关键词,制冷/热进行切换模式)
空调风量增减 ?? 风量大/小一点、风大/小一点
设置风量级别 ?? 风量设设为2级、风量调成2级、风量最大/小
空调温度增减 ?? 温度高/低一点、温度调高/低一档
设置温度级别 ?? 温度调到xx度、温度设置xx度、温度调到最高/最低温度(空调温度调整到对应指)
空调吹风模式 ?? 吹脸/脚、吹脸吹脚、吹脚前除霜、前除霜(前除霜:处理前挡风玻璃的)
后窗除霜 ?? 打开后除霜/雾、打开后窗加热、后挡风玻璃除霜/雾
开启/关闭车窗 ?? 开/开启/打开/关/关闭 车窗(未指定某一个窗户,打开/关闭所有车窗户)
指定开启/关闭车窗 ?? 开/开启/打开/关/关闭 – 左前/右前/左后右后窗 、 打开/关闭主驾旁边车窗、打开/关闭前排窗、打开/关闭后排窗、打开/关闭全部窗户
车窗开启/关闭到具体数值 ?? 车窗开/关一半(1/2)(车窗调节范围0-100%,根据不同车厂设定值为准)
前文中有提到TTS反馈,那我就在车辆控制中情景模式详细举例子给大家讲解一哈。
清凉模式 ?? 打开/开启/关闭 清凉模式 TTS反馈 清凉模式已打开/关闭、清凉模式已处于打开状态
温暖模式 ?? 打开/开启/关闭 温暖模式 TTS反馈 温暖模式已打开/关闭
雨雪模式 ?? 打开/开启/关闭 雨雪模式 TTS反馈 雨雪模式已打开/关闭、即将关闭车窗,请注意安全
抽烟模式 ?? 打开/开启/关闭 抽烟模式、我想抽烟 TTS反馈 抽烟模式已打开/关闭
导航是我们最常用的功能之一,对于用户而言输入地址是一件头疼的事情,所以在导航去目的地的时候,直接语音输入后,匹配所需要导航的目的地,让语音助手帮你直接导航,还可以询问语言助手到达目的地时间和距离播报,有的车机导航系统还可以支持语音缩放地图大小,省得两只手指在触控屏幕进行放大缩小操作手势,在导航中的使用语音主要的目的就是便捷与高效。
导航中的执行逻辑我这边就不做过多叙述,因为相对要更专业点,后续有机会我在深挖讲解。
公司 ?? 我要去公司、导航到公司、去公司、上班了
回家 ?? 我要回家、导航回家、回家了
注:如果没有设置公司/家的地址 需要进入设置公司/家的具体地址流程,设置完毕之后,方可语言导航去公司/家
附近加油站 ?? 导航到附近/周围/周边加油站、帮我找个最近的加油站
当前位置 ?? 导航到模糊的POI(会产生多个结果) ?? 导航到火车站(拿上海举例子:上海有虹桥火车站、上海火车站、上海南站、松江站、上海西站,因此产生了多个结果后,语音助手还会继续问到你需要导航到具体那个火车站,如果时间超过定义时间将默认为第一个)
当前位置 ?? 导航到POI简称 ?? 导航到人广(人名广场,要不要和我一起去吃炸鸡、带我去交大(交通大学)
附近其他 ?? 导航附近三甲医院
搜索指定位置+指定类型POI ?? 帮我找一下南京西路的日式餐厅
搜索指定距离+指定类型POI ?? 两公里以内的停车场、一公里中式快餐店
搜索指定位置+指定品牌POI ?? 南京西路的古驰店
查询途径点的距离播报 ?? 距离南京西路还有多远、距离下一个途径点距离还有多少
查询途径点到达耗时播报 ?? 到南京西路还需要多久、距离下一个途径点还要多长时间
在驾驶过程成如果需要拨打电话,是一件不太容易的事情,而且是极其危险的,所以需要结合语音进行来辅助,接听/挂断 不管是屏幕触控还是方向盘的硬按键都可以直接操作,体验还不错,对于不习惯语音的的人来说该功能点可以替代,但总体来说,语音接通/挂断会优于屏幕触控,硬按键对于长期使用来说可能会有优过语音,对于用户来说,在安全驾驶前提下,那种使用方式习惯就用那种。
联系人姓名 ?? 打电话给老妈、呼叫老爸、联系哥哥、给姐姐打电话
拨打电话号码 ?? 打电话给12315、打电话给18015888888
拨打常用黄页名 ?? 打电话给中国电信、给上海银行打电话
接听 ?? 接听/接电话/接通电话/接听电话
挂断 ?? 挂断/挂电话/挂断电话/挂掉电话
重拨 ?? 重拨电话
回拨 ?? 回拨电话
对话设计是基于人们的对话的设计语言,它集合多个设计的内容,其中包括语音用户界面设计、交互设计、视觉设计、动画设计、语音对话脚本设计、乃至还有音频设计增加语音助手的灵动性。
对话设计的是否成功与否最重要的就是个性,现在市场上的许多车载语音系统对话听起来还是基本很相似,是因为很多公司都没有专业的对话设计师,要么是程序员、产品经理、好一点的公司组建一个语音组,都是从其他行业转化过来,然后将各个大厂的语音对话研究一下,就上岗了,国内优秀的VUI设计真的很稀缺,也是很缺少的人才,我可不想再用语音交互的时候 语音助手和我说“对不起,我没懂你的意思”。
对话设计师在规划用户在具体每个功能模块区域内做什么,同时还要考虑用户的需求和技术限制,对话的策略,是代表着该语音系统完整的用户体验,也包含这详细的规范定义流程和底层逻辑。
这边需要着重的讲一个小知识点:
我们会有一个误区,认为“对话”仅只是#说 or #听到的内容,其实对话本质上是多模态的,对话的核心内容是对话的流程和底层逻辑,图形界面的逻辑一般都不太会用在对话内容的设计方面,基本上他们两是一个独立的个体。
车载语音的对话做的是否OK?是基于对话内容时间的长短,因为用户没办法像查看UI界面内容那样,去查看语音的内容。
根据人的平均记忆力,如果车载语音虚拟形象说了,关于这个话题很多内容,用户可能无法记全所有的内容,这对于对话将大打折扣,因此在对话过程中需要严格遵循 ?? 简短明了,让每一个文字都有意义,避免重复的短语,可以让用户可以快速的做决定。
当用户在用导航功能的时候,语音对话说“导航去火车站”,如果在上海的话,就有好几个火车站,需要用户再次去选择,#1虹桥火车站、#2上海火车站、#3上海南站、#4上海西站,我们在做项目的时候,体验设计师给他的定义是如果用户超过8秒还没有进行选择的话,默认是选择第一个,如果第一个目的地不是我想要的,那么我需要重新通过语音再次输入信息。
我觉得默认选择这个选项可能会有些不妥,如果这期间来一个电话或者是微信的语言电话,那么我是不好通过语音去选择的,如果汽车不是在驾驶的状态,可以手动触控屏幕进行选择OK没问题,如果是驾驶状态下,就需要优化前面默认选择项了。
超过8秒钟后,默认选择第一个没有问题,但是在用户结束自己之前任务状态后,可以说重新选择目的地,将之前的搜索出来的火车站结果都再次调出来,提供用户重新去选择。
这块就更智能化一些了(这个有一点前瞻性的意思,研发要是看到这个需求估计要揍死我,当语音助手检测用户正在忙的状态时候,在8秒钟都没有做出选择,那么语音助手可以从第一个目的地开始播报,用户可以通过方向盘OK硬按键去选择自己所需要导航的目的地,在驾驶过程中,方向盘的硬按键安全性远高于中控屏幕的点击。
给用户提供选择的选项列表的时,最好不要超过三个选项,给用户较少的选择,能够让用户更明确去抉择,减少过多选项对于用户的干扰,刚刚上面导航那个案例排除,上海火车站真的太多了没办法,其他城市应该还好都是1-3个左右。
上面实际案例就是强行逼迫用户去选择一个,这种体验很差,有一种场景,如果这三个选项都不是我想要的,你就得重新在说,帮我推荐一下附近的餐厅,想想这种体验就不是我想要的,我觉得可以增加一些情感化的设计在里面,如果这三个选项都不是我想要的。
我可能会说“这些我都不想去、能不能帮我再推荐其他的”。
语音助手说“你可真挑食、好的,那我就在帮你找找其他美食”(我的意思就是要让机器多去自我学习,更加智能化、情感化贴近于用户的交流,这样用户才会更愿意使用语音交互)。
上诉的场景是对于这块区域不熟悉的用户来搜寻美食,如果用户有直接目的需要吃什么类型的餐饮的时候,语言助手只需要推荐相关美食就好。
用户说“帮我找一下附近的海底捞”
语音助手说“附近有三家海底捞,您是要去哪一家…(播报三家信息)”
(播报三家海底捞的 位置和距离 甚至我想是不是可以增加排队人数的播报,如果排队人很多就可以换一家,接下来就可以和语音助手直接说帮我预约好位置,省的用户到店面还要进行排队等候)
在做对话设计的时候千万别考虑用户的思考逻辑,每个人的思考逻辑都不一样的,所以不用去猜想用户的想法,只需要提供有用的信息让用户自己选择好了,前面有提到对话设计是讲究有逻辑性的,你在设计对话剧本的时候不可能就只考虑一条线。
举个简短的例子,你在设计一个订购飞机票语音对话流程,你想法是,首先先确定目的地,哪里起飞去哪里,然后再选择时间点起飞。假设用户直接说:“帮我预定早上八点的飞机,飞往深圳”那问题来了一开始是用户是说的时间,最后只说了目的地,没有有说出发地,因此在语音设计剧本的时候,你需要将所有能出现的状况都考虑进去。
在图形设计之前UE也需要将动词、名词之间的搭配提前定义好,需要全局保持一致性,这块内容有在我第二篇文章提到过,因此在对话设计过程中也要格外注意。
现实中我们正常 处理事物的时候,也是将事物划分成几块,然后按照计划步骤进行,而不是一股脑子乱做,车载语音设计也是如此,作为一个正常的用户来说,我们一次性说出的需求并不会很多,不会像专业的车机测试人员一样,去叙述一大堆信息去检测机器的运转效率,和一个处理信息的准确性,每次出差去南京走查,都会听到测试人员巴拉巴拉 一直说,我脑袋都大了,所以我们正常用户都是逐步的去说消息的,举个列子:
举一个场景的例子,当你在道路上开车,需要停在路边接朋友,朋友还没有到达指定位置,或者该位置是不可以停留的,语音助手正确说法“这边不可以停车,不然交警叔叔会罚款的,赶紧溜,我帮你找一个附近可以停车的地方吧” 错误的说法:“你触犯了了我国《交通法》第XXX条,……此处省略法律条文 这边是禁止停车的”。
首先当你听到触犯法律,你的第一想法what?这是什么鬼,给用户的感觉是很糟糕的,因为法律消息通常会包含阅读的长并且还不自然的语言,给用户带了不好的体验,并且还未给解决的方案。一个好的语言设计方案会让人喜欢上使用它。
后续我会对于前瞻性的语音进行探索,再写一篇。前瞻性的就再举一个例子吧:通过面部扫描,检测到用户不开心的时候,车载系统可以推荐一些治愈系的电台,或者可以让用户放松、舒缓心理的的歌曲,或者你进行人机交谈(这个就比较高级,需要让语音系统进行大数据自我学习,达到能够和人能正常交流),让我们一起展望未来吧。
文章中如有不足之处,欢迎补充交流,我们下期见。
本文由@设计界的影帝 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
嗨来电的背景音乐动漫