人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?

2023-08-21 181

在前不久的MIDC大会上,小爱同学5.0正式发布,从3.0跨代升级到5.0小爱同学,从语音助手正式升级为——智能生活助手

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图

让全球每个人都能享受科技带来的美好生活,是小米的使命。在手机×AIoT的战略下,小米智能设备已经影响到了全球上亿用户生活,而作为小米智能生活的核心,小爱同学是行业内唯一一个拥有大规模落地场景的语音助手

当前,它已覆盖了8大场景,囊括影音娱乐、生活服务、信息查询、出行路况等1400+技能。它能听会说,⽆处不在,已成为我们生活中离不开的智能助手,也是给我们带来美好生活的亲密伙伴。

截至2020年6月,小爱同学⽉活跃⽤户已达7840万,激活小爱设备数达2.28亿,已取得了斐然成绩。

这一次,小爱同学5.0共有五大升级:全场景智能协同、对话式主动智能、定制化情感声音、多模态融合交互、智慧学习好助手

全新的小爱同学拥有更强大的全场景服务能力,更像真实的人,更具专属感,交互更自然。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图1

全场景智能协同

一个指令,化繁为简

我们都知道,当我们只有一个智能设备时,下达指令非常简单且直接的。但随着用户家里的智能设备越来越多,在使用和操作方面也变得更加复杂,我们一直在思考如何让智能生活变得足够简单轻松、没有负担和门槛。

小爱同学5.0,就是那个能帮你决策最佳执行设备的“智能生活助手”。

我们希望通过全场景智能协同为用户提供多设备跨场景的灵活应答和执行能力,能够智能地选出最符合预期的设备唤醒应答、调起能力最匹配的设备执行指令、通过最适合的设备触达提醒。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图2

在协同唤醒和协调响应方面,小米面对行业最丰富的AIoT生态,是最具挑战的全场景协同场景。

首先,我们拥有米家提供的最强大的设备和环境感知能力,以及与之配套的执行反馈能力。

其次,小爱同学已进驻到家居、车载、穿戴等全场景各类终端形态,长期积累的对用户行为习惯的理解以及各类设备长项的建模能力,让我们的全场景智能协同站上了引领行业的大舞台。

在协同提醒方面,传统的设备控制,都是被动响应、一问一答式的控制体验,控制命令呆板不口语化,与理想中的“智能”仍有距离。

我们根据用户的IoT控制习惯,让小爱同学在家庭中,能够感知、理解、预测用户的IoT控制或提醒需求,并适时的主动提供信息和服务,从简单的家居控制中枢进阶到智能生活的助手角色。从这方面看,小爱同学是国内首次实现此种体验的产品。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图3

通过感知、理解、预测用户的IoT习惯,实现智能的控制和提醒绝非易事。目前我们已经根据挖掘的用户习惯构建了数个合适的场景,后续我们将继续去探索更符合习惯的IoT联动,重点结合小米手机的优势,与IOT设备联动,实现更丰富的全场景智能协同。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图4

对话式主动智能

有记忆的人工智能

随着人工智能和用户生活不断交融互通,人工智能的存在的意义,不仅是满足用户生活化需求,更将会承载用户的情感化需求。

作为小米人工智能应用前沿探索的先锋,小爱同学经历了几代的技术积累与成长,也正朝着人文化、智能化的方向迈进。

在这个过程中,“学会主动”将是不可或缺的一步。主动对话本身就是高级智能的体现,它意味着人工智能不仅仅存在和用户互动的短暂过程中,而是在更长的时间内在不断思考和计算;不仅仅会帮用户解决遇到的问题,也可以像人一样主动产生对这个世界的好奇,不断地了解更多。

小爱同学5.0的对话式主动智能,改变过去语音助手有问才有答的产品形态,小爱同学将会像人一样和你沟通,像人一样发起问题来增进对你的了解,拥有了关于你的记忆,背后强大的全场景主动服务能力也得以更好的施展。

为了让小爱同学能像人一样,拥有“记忆”,我们克服了很多难点。

首先,有赖于小米NLP技术支持的30多个业务场景、日调用次数达80亿的深厚积累,用户对小爱同学说过的话会经过NLP分析处理,并主动学习其中关于用户的知识。

另外,小爱同学还能计算哪些问题可以主动向用户提问,并在合适的时机加入到对话式主动智能的沟通队列中。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图5

然后是记忆的存储,用户专属的小爱同学云端大脑会为用户建立多维度的个人画像,实现了全设备个人信息互联互通,每次交互都可以结合个人画像进行计算,产生出面向用户的个性化结果。

就像婴儿咿呀学语一样,看似简单的一轮“对话”,是小爱同学思考、计算的复杂过程,也是人工智能实现自身进化的引擎,作为每位用户身边的“智能生活助手”、用户的朋友,小爱同学在多模态交互中,默默吸收着来自外界的丰富知识及信息。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图6

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图7

定制化情感声音

以声传情,留住温暖

在如今繁忙都市生活中,有一些人,他们总是没有那么多机会“被陪伴”,例如很长时间才能见到的恋人、忙碌上班族的孩子、独自在家的老人。他们身边的人或许无法永远陪伴,但对方熟悉的声音,却可以填补很多重要时刻所需要的陪伴感。

从这些用户群体的视角出发,如果能用父母的声音,给孩子讲故事,能让子女的声音陪伴着爸妈,读新闻,让声音可以跨越地理、时间的阻碍,随时随地传递温度,这将是一件意义非凡的事情。

由此,小爱同学定制声音项目应运而生。

面对多种技术实现难题及压力,作为目前行业内唯一一家大规模落地语音助手场景,定制声音功能在今年2月的小米10发布会上首次亮相,功能一经发布广受用户好评。

为了能让更多用户体验到该功能,把不能随时看得见、摸得着的亲密关系做成“声音”带给更多用户,小爱同学产品团队计划将“定制声音”功能陆续上线至更多机型,让米粉们都能享受到科技带来的美好生活。

定制声音功已支持机型:Redmi K30S 至尊纪念版、Redmi K30 至尊纪念版、Redmi 10X 5G、Redmi 10X Pro 5G、小米10至尊纪念版、小米10、小米10 Pro、小米10 青春版 5G。更多机型,陆续开放中,敬请期待。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图8

从少量录音到声音合成的过程,早已不是依靠常规声音处理技术就能实现落地,为了让这黑科技覆盖更多设备,让更多的用户能体验到定制声音的妙用,定制声音项目落地背后,也曾面临各种挑战

小爱同学的工程师们花了大量时间精力,攻克了如何基于少量低音质数据、如何实现海量声音模型云端智能调度、如何降低服务成本这三个难题,以提供给用户更极致的体验。

除定制声音功能以外,我们也很关注特定的人群需求。通过大量的用户调研、反馈分析,我们发现部分用户对粤语方言有着强烈需求。

因此,小爱同学团队专门招聘了懂粤语的产品经理,用心打磨粤语语音识别功能,对两万句符合粤语回复的语言做了深度的优化,只为让粤语功能更地道、更好用。

作为行业首家全终端落地的粤语功能,我们已与11月中旬正式启动在手机及音箱上小爱同学粤语功能的内测,敬请期待后续进展。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图9

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图10

智慧学习好助手

更多资源,更强工具

无论何时,“教育”总是非常热门的话题。一直以来,学生人群都是小米手机、小爱同学最重要的用户群体之一,每天都有不同学龄段的学生问小爱大量的学习相关的问题,通过小爱同学获取新知识。

小爱同学5.0这次升级的重点之一,就是聚焦学生党需求,打造了更丰富的学习功能,希望成为同学们的“智慧学习好助手”

讲到教育学习,很多人第一印象想到的是“学习相关的内容”,这次,小爱同学5.0整合了海量的优质的K12网课资源,精选1000+网课视频资源,累积接入或新增问答3000万+,打造了一个强大的知识库,为需要随时获取新知识的用户提供便利。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图11

除了需要丰富的资源内容,小爱同学5.0还有好用的工具。

课程表是学生学习中最基本的一个工具类需求,我们把课程表与小爱同学结合在一起,打造了一个纯粹无广告、简单易用,功能强大,有国内首发AI拍照导入课程功能等先进人工智能技术加持的AI课程表。

另外一大工具是翻译,小爱同学5.0围绕用户翻译痛点,打造了更全面的AI翻译功能—— 一句话翻译、翻译模式、面对面同传三大功能,足以覆盖用户日常、外语学习、旅行等各个翻译场景。

学习时偶尔忘记一个单词,或突然想用外语表个白,这时直接对小爱同学说“工作的英文”或者“小爱同学,爱的日语怎么说”,小爱同学能直接回复翻译结果。

面对学习一门外语等更复杂的翻译场景,可以对小爱说“打开翻译”,进入翻译模式,可以进行快捷的文本翻译、拍照翻译或语音翻译,甚至能看到英语单词的音标、例句等等详细释义。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图12

如果在出国旅行、或者跟外国人长时间地交谈,就可以对小爱同学说“打开同传”来使用面对面同传功能了,对方说话过程中就能看到译文,无需尴尬等待。

小爱同学自带“同学”属性,一直有着愿意和千万学生米粉一同成长的心。这一次的小爱同学5.0,从K12教辅、知识问答、AI翻译、AI课程表等多个方面为他们打造一个智慧学习助手

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图13

多模态融合交互

更自然,更懂你

初听“多模态融合交互”,或许会有些不理解,但简单来说就是:拥有各种传感器的智能设备,除了能听(耳)会说(嘴)外,同时还能利用摄像头(眼)观察、利用底盘云台(脚)移动等,从而全面的理解用户意图,和用户进行沟通,满足用户的需求。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图14

这个交互过程模拟了人与人之间的交互方式,使交互无门槛、更自然、更切合用户意图,更懂人。这一交互方式打破了传统的键盘输入和智能手机的点触式交互方式,符合“机器人”类产品的形态特点和用户期待,定义了下一代智能产品和人的专属交互模式。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图15

作为多模态融合的应用场景之一,这一次,我们在视觉模块上投入了较多精力,全面扩充了小爱同学的视觉能力,包括集成键盘输入、语言输入、图像输入的多模态输入能力、自动截屏进行翻译、识物的语音与屏幕融合能力。

还有新版扫一扫集成的六大核心功能:扫文档、翻译、扫码、识物、扫题、名片,全新5.0实现了多场景视觉能力提升,小爱同学的“眼睛”更好用了。

小爱同学五大升级深度揭秘,小爱同学5.0的新功能你最喜欢哪个?插图16

从语音输入走向视觉输入,未来的人工智能的不仅仅是生活的工具,更会朝着人机交互、情感交互的的趋势发展。

如你我所见,小米的人工智能,一直在追求更自然地交互、更懂用户的需求;并在这个方向上努力,从未停下脚步。

原文链接:https://new.qq.com/rain/a/20201201A02RWN00

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部