BOB电子竞技:vivo周围:大模型技术体验两不误手机是最好场景 MEET 2024

发布时间:2024-05-19 03:38:12 来源:bob体官网 作者:bob网站下载

  原标题:vivo周围:大模型技术体验两不误,手机是最好场景 MEET 2024

  vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围,在MEET智能未来大会上表示:

  大模型目前最能完成体验闭环和商业闭环的场景,就是落地在手机上,打造智能体。

  大模型目前最能完成体验闭环和商业闭环的场景,就是落地在手机上,打造智能体。

  言下之意,不仅智能手机需要大模型来做智能升级,大模型也需要庞大的手机市场来帮助大模型进行应用落地。

  由此也就不难理解,为何从今年下半年开始,全地球手机厂商纷纷加速大模型进入手机的步伐,快速而坚定。

  以vivo为例,今年vivo正式发布自研AI大模型矩阵蓝心大模型,以及全新手机操作系统OriginOS 4。

  其中蓝心大模型包含十亿/百亿/千亿三个参数量级,共5款大模型,其中70亿参数版本对外开源。同时还宣布在端侧跑通130亿参数大模型。

  而在带来这些实际进展背后,身处激烈竞争中的厂商们,如何理解技术本身?如何看待趋势发展?

  周围认为,核心原因在于大模型将人类数千年的文明知识进行了高纬度的抽象,并压缩成每个人都可以获取的知识和信息,再应用这些知识和信息去解决问题。

  这让大模型变成了可以人手一本的“全新字典”。它载入了人类历史、文化、文明等知识,可以随身携带,我们问什么、它就专业回答什么。

  关于其能力的讨论,“情商”部分占比很高。比如对于手机智能体而言,周围认为它应该具备以下几方面能力:

  对应到实际场景,手机智能体可以在用户的充分授权下,完整模拟用户对OS系统、应用的操控,“就像手机里的一个虚拟管家,帮你完成各种事情。”

  比如制订旅行攻略、预订更合适的机票酒店;在购物时刻全程双向沟通,辅助用户挑选到心仪商品。

  在这一基础上,周围强调说,手机智能体应该具备人格和记忆,理解人类的喜怒哀乐,也拥有自己的情感。

  并且在可预见的未来中,智能体将出现在各种终端载体上,拥有各种各样的形象,可能是机器人、宠物狗,也可能是智能汽车。

  透过周围的一系列分享,可以明显感受到,手机生产厂商更加关注大模型应用给人带来的实际体验如何。

  比如将大模型比作是人手一本的“新字典”,是对便携性的关注;强调智能体的意图理解、情感陪伴能力,是对用户友好的关注。

  纵观人机交互发展史,从命令行界面到触摸界面,从多媒体交互到AR/VR,始终都在遵循着更丰富体验、更个性化、更用户友好的方向发展。

  周围自2005年加入vivo,从事智能机软件开发,熟悉各类Linux智能机开源项目,曾担任vivo软件研发总经理。

  2018年,vivo AI全球研究院正式成立,周围担任首任院长。成立之初,研究院设有12个研究方向,包含语言识别、NLP、机器视觉等。

  当时周围对外表示,vivo AI全球研究院的理念为基于AI技术构建一个平台,为消费者服务。

  OriginOS目前已迭代至第四代,在最新版本中已整合大模型能力,上线蓝心小V私人助理。

  一边投身AI基础技术探索,一边领衔手机系统研发,同时还是手机行业近20年老兵。

  而结合他的个人履历,还能发现一层事实,vivo在AI和操作系统方面的布局,已经双线并行多年。

  vivo AI全球研究院从成立以来,始终保持千人规模AI专家团队。另外还成立了人工智能图谱研究院,目前已积累13000TB数据。

  二者都是以用户体验为起点,开始进行技术探索和落地实践。此前OriginOS中已有不少功能,正是二者碰撞出的火花。

  如今随着大模型趋势爆发,这两条线正式发生大交汇,直接能看到的成果,就是vivo今年一口气发布5个大模型,并直接带来落地应用,普通消费者已能实际体验。

  这一系列动作,也给手机行业如何落地大模型、大模型如何走进更多场景,提供了有价值参考。

  其中70亿版本对外开源,由此vivo成为首家开源大模型的手机生产厂商。同时实现130亿版本在端侧跑通,同样是业内首家。

  规模最小的10亿参数大模型,完全跑在端侧,内存占用仅为1GB,出词速度达到64字/秒。

  百亿级别大模型能提供更加丰富的能力。700亿参数版本是端云主力模型,支持角色扮演、知识问答、自然对话等能力,在多个评测榜单中位列第一(数据截止11月中)。

  千亿级别包括1300亿和1750亿版本,它们可以进行更加复杂的逻辑推理和任务编排。

  vivo走了软硬一体路线。硬件方面,和芯片厂商深度合作,加速大模型上手机;软件方面,推出多种应用形式、并和底层系统深度融合,让消费者能更快上手体验。

  紧接着,采用全大核架构的天玑9300发布,这块芯片由vivo和联发科共同定义、联合研发、联合。

  架构的革新使其可快速完成任务、快速休眠,大幅降低功耗,天生更适合生成式AI场景。

  今年vivo X100系列拿下天玑9300首发,成为名副其实的“大模型手机”。

  蓝心小V和系统深度融合,内嵌于OriginOS 4中,实现了全局智能辅助,具备自然对话、意图理解、智慧搜索、图像智慧处理、图文生成等能力。

  在vivo X100上已经可以实际体验,蓝心小V不仅可以和用户自然对话、弄清楚复杂脑筋急转弯,还能把照片中的路人一键消除,AI魔法叠满。

  基于端侧大模型能力,它还可以不联网使用(下载模型),离线总结文档、图生图。

  蓝心千询则是以单独APP形式推出,这意味着即便是非vivo手机也能通过应用商店下载使用。

  它额外增加了代码能力,能够编写量化框架、Python语言界面,30秒响应。

  它将率先带来两个本地化功能,智能总结录音以及输入法智能回复。这些都能离线运行,因此速度和原生感应该都不错。

  同时谷歌还推出了AI Core系统服务,支持开发者将Gemini驱动的功能加入到他们开发的应用中。

  据了解谷歌还在计划将Gemini Nano纳入整个安卓体系中,高通、三星、联发科的芯片将都能兼容。

  在大模型爆发元年,如果说有什么行业已经因此发生变革,手机终端必定是其中之一。

  如谷歌微软这样的科技巨头,都抢先布局端侧小模型。而手机场景之所以受到关注,原因也很明了:

  市场方面,在人手一部智能机的时代,大模型成功撬动智能手机行业,则意味着撬动了千亿美元市场。

  用户接受方面,以Siri为代表的第一代智能语音助手提前完成了用户教育,大模型无需寻找新的应用形式,可以在此基础直接进行升级革新,提高使用者真实的体验同时又能高效落地。

  另一方面,手机行业在过去半年内也快速行动、积极拥抱大模型,甚至还带动了大模型上终端的新趋势。

  下半年开始,几乎每个月都有国产手机生产厂商官宣大模型相关进展。这种竞争追逐加速行业创新,几个月时间内,端侧可跑通的大模型规模就从几十亿参数飙升至几百亿参数。

  不仅是手机生产厂商发力,高通、联发科也相继推出面向生成式AI时代的旗舰芯片,且性能功效全面大幅度的提高,给大模型上层应用开发创新创造更多空间。

  最近有行业观点提出,大模型的真正价值如何,取决于它所撬动的行业价值如何。

  结合现在的状况来看,手机行业正在让大模型的价值进一步凸显外化,加速大模型浪潮演进。

  未来,我们大家都希望利用AI的能力,进一步重构系统,并通过智能手机的普及,携手迈向智能体时代。

  未来,我们大家都希望利用AI的能力,进一步重构系统,并通过智能手机的普及,携手迈向智能体时代。

上一篇:四大交互界面为用户所带来智能人机交互体验让人车沟通变得格外自然_车家号_发现车生活_汽车之家 下一篇:黑科技 这才真的是面向未来的人机交互界面!