苹果刚发布的Vision Pro,可能是下一个时代的「iPhone 时刻」
3月21日晚,老黄穿着他标志性的皮夹克,在 GTC 2023 上说,ChatGPT 是 AI 行业的「iPhone 时刻」。时隔2个多月,Vision Pro 在 WWDC 上的发布,则呈现了未来数字产品形态的全新可能,而这同样是一个「iPhone 时刻」。
XR头显的设计,终于有作业抄了
早在 2016 年的时候,微软就已经推出了 HoloLens,准备 All in 元宇宙的 Meta 也有自家的头显产品 Quest,甚至分高低两个产品线。而游戏领域御三家之一的 Sony ,虽然手握大把游戏IP,但是游戏内容并没有撑起自家的 PS VR2 ,而这个产品在中国大陆的预订销售,则由于 Sony 在不同平台定价内讧之下,整个 PS VR2 定价干干脆脆地来了几连跪。不要问我为什么知道。我反正退货了。
HTC 的 Vive 就不说了。
XR 头显出来了这么多年,整个市场一直都没做起来。之前一直被视作为头部的 Meta 也没做出啥成绩。Meta 在 Quest 上上线的游戏《地平线世界》还因为人物角色没有脚,而遭遇群嘲。可是就是这样一个顶级科技公司,做了这么些年的 VR 头显产品,这样的画面素质真的是没眼看,你就说这是 AndROId 1.6 时代的游戏,都有人信。
我相信前几天 Meta 的 Quest 整个部门是一边上班一边看 WWDC 大会的, Vision Pro 发布的时候,只有悲喜交集四个字才能描述自己的心情。
悲自不必解释。
喜的是终于有作业抄了。
而作为回应,苹果也没有在 WWDC 中提及哪怕一句 Meta 和元宇宙。一次都没有。
典型的苹果设计
从最直观的外观设计上,Vision Pro 就很苹果。
酷似滑雪镜外观的 Vision Pro 所使用的硬件设计语言,显而易见地延续了苹果最近几年来的工业设计语言,内嵌一整块曲面玻璃的铝合金外框有着细腻的阳极氧化处理,平滑的 G3 曲率表面和几乎所有的苹果系产品都保持一致,并且显而易见,带有乔纳森艾维主导 ID 时代的印记。
内侧的 Micro OLED 屏幕单块超过 2300 万像素,分配到双眼上的效果超越4K显示屏的效果,而和面部接触的模块所采用的细腻的织物表面极富亲和力,这个可以根据脸型和眼部进行定制模块,则结合固定后脑勺的弹性绑带,为整体的佩戴舒适性做出了贡献。
这种材质的选取和构建,显而易见源自于苹果在 Apple Watch、HomePod、AirPods Max 上的一系列探索的沉淀。
我们曾在 AirPods 系列产品上体会过的空间音频,同样是 Vision Pro 的声学基础,为了让耳朵在真实虚拟空间之间灵活切换,赋予沉浸感的 Spatial Audio 技术则可以扫描环境,赋予虚拟物品和环境相匹配的声场特征。
(别忘了 TWS 这个赛道可是 AirPods 系列一手开拓出来的。)
前面板的屏幕可以显示用户的双眼,很大程度上降低了 Vision Pro 对佩戴者之外的其他人产生的恐怖谷效应。
Vision Pro 顶部的表冠则和 Apple Watch 神似,交互上想必也有着明确的「继承关系」,这种相似性无疑是降低用户认知负荷的绝佳策略。
内置的传感器和堪称性能怪兽的 M2 芯片是 Vision Pro 极致体验的算力基础,而专门定制的 R1 芯片则是 Vision Pro 的视觉呈现和反馈速度的保证。
但是 Vision Pro 又是显而易见不完美的,是一个妥协的产物。
虽然目前官网上还没有 Vision Pro 的具体重量参数,但是前往 WWDC 现场的 Up 主的反馈中,有人觉得佩戴起来偏重,有的则感觉还能接受,贴合度则因为可以定制+调节,倒是没有太多人吐槽。
同样出于重量的考量,Vision Pro 通常供电是依靠有线连接,而独立的电池组件也只能维持 2 小时续航。
空间计算下的自然交互
Vision Pro 力图打通现实和数字世界,在沉浸和互通之间灵活切换,彼此融合,这也是为什么它是一台真正意义上的 XR 头显,完全沉浸的 VR,叠加内容的 AR,彼此交融的 MR,都只是它服务用户的手段,概念之间的区分似乎已经不再重要。
基础交互上,内置的传感器识别虹膜,精准确定目光的指向,目光确定方向,双指捏合确定以激活选定的目标,这种几乎没有成本的交互可能比学会鼠标双击还要快。
前置摄像头和传感器对双手的精准识别,彻底不需要额外的手柄。干掉手柄这件事情,无疑让 XR 头显类产品交互往前走了一大步。
目光锁定,Siri 的音频识别,带有音频反馈的虚拟键盘,都确保了输入交互上的自然灵活多样,而 visionOS 的系统,自然而然地接入了 iOS、iPadOS、macOS 的苹果软件生态,则无疑是整个平台软件和内容输出的保证。
同时,Vision Pro 同样可以调用既有的苹果硬件,不限于Macbook 系列笔记本,iPhone、iPad 以及妙控键盘、触控板和鼠标。
尤其值得一提的是,前两年在 iPadOS 和 macOS 上更新的「前台调度」功能,无疑是 visionOS 的苹果全平台生态下软件交互上的前置应用。这些系统的软件和服务以更贴合 Vision Pro 的空间计算的拓展性,自然地在空间中延展。
而弥合生态、交互和体验细节的,则是发布会少有提及的 AI。
AI 几乎无处不在
在今年的 WWDC 发布会上,几乎没有好好说今年大热的 AI,但是稍加细看,AI 又无处不在,尤其是在 Vision Pro 的系统和软件当中。
被称为 Optic ID 的虹膜识别技术 Vision Pro 让用户能够借用眼球虹膜来解锁设备,这是一种基于 AI 的生物识别技术。而在虚拟空间中「看哪打哪」的交互基础,同样是 Optic ID。
而帮助用户识别周围环境的 Eyesight 技术,同样是在传感器和摄像头的基础上,借由 AI 来帮助用户识别周围的环境,是否有人出现在周遭,是否要让进入识别范围的其他人「被抠图进入」虚拟环境。
而 Persona 这一功能对于设计师应该很熟悉,「用户画像」。借助初始的扫描和传感器生成的真实人物3D形象,同样是 AI 加持的,相比于描述化和参数化的「用户画像」,Persona 更加直观具体,并且借助 AI ,更加自然。
之前提到的扫描环境材质构建声场,让虚拟场景和真实环境融合的 Spatial Audio 同样是 AI 技术的加持。
看来算力炸裂的 M2 芯片在 Vision Pro 里确实没闲着,要识别手势、优化声场、识别语音、建模渲染、人物时事抠图、输入辅助、还要把语音转为文本。
而苹果的这一策略也展现了 AI 真正在应用层面的范式——并非无处不再的输入框和 prompt,而是合理有机地将 AI 功能融入到点点滴滴的产品功能和细节,结合到输入输出交互当中。这样既能提高用户的便利性和满意度,又能保持用户的主动性和自由度。
等待重置的数字基建
今年 AIGC 快速崛起过程中,一直有交互从「GUI 向 CUI(对话式界面)」转变的说法,我觉得这种转变在一段时间内、在生产端是存在的,但是真正的范式改变可能会着落在 Vision Pro 所引领的下一个十年上。
「图形」是为了呈现,指向的是视觉化结果和一图胜千言的结果。「对话」终究是沟通 AI 和人类的自然语言指令,而所指向的结果理应是不言自明的呈现,或是心领神会甚至超越构想的效果。
所以,ChatGPT 是 AI 行业的「iPhone 时刻」,而 Vision Pro 则应该是面向下一个时代的「iPhone 时刻」。前者是获得结果的底层技术,后者负责呈现、重塑体验、空间、行业和生活的那个结果的可能性。
就像 5G 是高速网络,而借助 5G 网络在高清屏幕上丝滑看直播,才是我们想要的结果。
从生产端来说,设计、模拟、呈现将会截然不同。在专业的设计领域,鼠标、手绘板和键盘快捷键驱动下的软件交互可能会被更加直觉的「手搓」替代,学习成本和认知负荷将会进一步降低。
现实中的全息影像有没有机会实现我不知道,但是托尼史塔克在三维空间中手搓 MK2钢铁侠战甲的体验,肯定会有开发者会在 Vision Pro 中替我们搞出来的。
从二维的屏幕进入3D的空间,一切都要重新计算。已经被「高清重置」的数字内容亟待「空间重置」。当现实当中的行业、领域和产品增加了一个新的维度,意味着一场席卷一切的数字空间基建,其中所蕴藏的机会,一时之间恐怕难以道尽。
告别电视,用XR头显看有着空间纵深的影视剧集。
隔着千万里,在自家沙发上第一人称沉浸式赶海。
抢不到演唱会的内场票,同样可以享受前排观看的感动。
在跑步机上一边刷朋友圈的步数排名,一边在死亡搁浅的世界里跑图。
身处世界各地的团队成员,在 XR 版的 Blender 中用手比划出角色、建筑、场景乃至一整个世界。
……
这是一场从「在线」到「在现场」的转变,而这种转变可能会席卷所有行业。
当然,这一切都建立在 Vision Pro 能够引领如今的整个数字产品和设计领域真正进入 XR 这一赛道基础上。
结语
触发 「iPhone 时刻」的初代 iPhone 并没有大卖,这并不影响移动端设计和过去 10 年的这一轮繁荣发展。3499美元的 Vision Pro 现在距离每一个普通用户还有相当的距离,但是它对未来体验的重塑,让我在 AI 焦虑下的生活和工作,有了新的期待。
各位,应该是有活儿干了。
作者:陈子木
想了解更多网站技术的内容,请访问:网站技术