视觉中国。
文本 |AR Star Man,作者 |李沛霖.当库克在 2023 年 Apple Vision Pro 发布会上大喊空间计算时,很少有人知道,早在 2021 年,Xreal 创始人徐驰就提出了“空间互联网”。
根据极客公园在2021年对徐驰的采访,Meta当时提出了元宇宙的概念,而徐迟在火灾后相当不感兴趣,他更喜欢用空间互联网来表达类似的概念:移动互联网使用2D屏幕框架浏览数字世界,空间互联网使用AR设备突破框架的限制进入数字世界。 你叫它方宇宙也没关系。 」
昨日,Xreal官宣了6000万美元融资的消息,我深深地感受到了这种看不到未来(钱)的硬件创业者是多么的艰难。 如果未来5年消费市场有一定数量的出货量,徐驰就是AR圈的麝香,传奇一边盯着深渊一边嚼碎玻璃,终于挺过了转机。 如果这笔钱花完后没有改善,可能是AR圈里的贾月婷,结局可能就像盈创倒闭,甚至创始人被关进监狱。
早在2021年,徐驰就表示:“五金行业的创业就是在桎梏上舞,一方面要关注五金产业链的过程,另一方面要能够想象赛道的未来,节奏感很重要。 ”
或许这句话的言下之意是,一旦没有把握好节奏,极有可能成为“殉道者”。
Xreal 为行业带来了 Birdbath 的消费级 AR 眼镜,该眼镜具有折叠光路。 Birdbath 的原意是“鸟的罐子”,这款 AR 眼镜的名字来源于弯曲的镜子,它设计了光路穿过,类似于“鸟壶”。
XREAL的Birdbath眼镜,凭借其出色的工业设计和近乎时尚的外观,在日常使用中看起来并不怪异和突兀,并且重量轻,可以折叠在口袋里,显示效果会给初次采用者留下深刻印象。 XREAL的Birdbath眼镜,相比同样具有空间显示功能的OST AR眼镜,比如离轴光学的Dream Glass和联想推出的Mirage,相对笨重的“头盔”一体机,Birdbath显然更容易打开消费市场。
但现阶段严格来说,Birdbath眼镜只是一款单功能眼镜屏幕投影仪,需要连接外接手机、PSP游戏机、PC等计算终端,显示原理属于部分透光的OST,勉强算是AR,但交互功能极弱。 在想象中,birdbath用它来虚拟化一个“大屏幕”,用于工作或娱乐的空间,发烧友们用高频场景生成一个“大屏幕”,躺着私下看电影或玩游戏,这是一种懒惰的神器。
在2016年底回国创业之前,Xreal创始人徐驰受雇于Magic Leap,负责头部跟踪定位算法的实现和嵌入式优化,还曾为NVIDIA参与最新一代GPU计算平台的开发。 2016年,将是VR AR的非理性繁荣泡沫期,而徐驰就职的Magic Leap,是当时硅谷业内资金最高、最神秘的创业公司,而立志回国创业做AR眼镜的徐驰,踩到了2017年到2020年这个行业低谷期的时间点。
在2020年美国CES展会上,Nreal(Xreal更名前叫Nreal)的展台热闹非凡,这让徐驰意识到消费级AR眼镜的需求是真实的"在AR的赛道上,中国企业可以成为玩家而不是旁观者,因为他们贴近产业链和用户,中国企业的迭代速度远快于美国同行,这让我们有机会在AR的某些方向上引领美国,成为规则制定者。 手机将继续存在,但到 2030 年,消费者的头上将有 10 亿只 AR 眼镜。 "
这句话现在显然有点嚣张。
如何制作消费级真正的AR眼镜,其实没人知道。
苹果培训其销售人员不要提及VR这个词,而是使用空间计算,它应该与AR相匹配,而不是强调沉浸式VR头显。 Vision Pro 也不像其他 VR 制造商那样,会在产品发布时公布 FOV、光学镜头模块和其他配置。 苹果的举动很“苹果”,它不想让消费者先入为主地认为Vision Pro和Meta的Quest和Byte的PICO属于“同一种”,它用语言和营销的艺术,以及产品的神奇体验,来削弱消费者脑海中已经形成的观点和偏见。
Vision Pro精准、复杂、超高配置,拥有独创的Eyesight和人机交互,软硬件大幅升级,苹果对VR的研究难度大,积累多大,整个程序的原创性在现阶段无法与其他厂商相提并论。 但归根结底,它本质上是一个带有 VST 的 VR 耳机。
VST采用摄像头透视,从摄像头传感器捕捉画面,对数据流进行处理,然后呈现到屏幕上,相比于人体视网膜接收光子通过视神经到大脑进行处理和“成像”,自然的OST过程,VST图像延迟压缩到极限是人眼直视无法比拟的。 例如,当您使用手机打开相机拍摄界面时,只需快速轻弹,即可清楚地看到图片延迟、拖拽和可见延迟。
无法解决的 VST 图像延迟意味着晕动病,用户根本无法在设想的日常场景中长时间佩戴它。 当用户佩戴VR并盯着屏幕时,只要头部转动,或者整个人处于运动状态(例如在超速行驶的汽车、高铁、飞机上),内耳就会检测到“旋转”,这会刺激前庭神经来指导眼球的协调运动, 这是人脑的运动视觉机制。依靠相机VST难免会造成图像延迟、抖动,眼睛看到的画面运动和内耳检测到的运动不同步,会出现头晕不适,而且这种症状因人而异,有的人可以逐渐适应,有的人很难克服。
VST 引起的晕动病只是一个方面。 摄像头视频的画面失真校正、色彩、明暗对比度无法100%还原,真实世界的反射眩光和过度曝光问题在摄像头上极为突出,一旦耳机断电或系统崩溃,就无法看到外界,正在进行的工作或娱乐都会立即遇到安全问题。
VST 尽管存在所有这些问题,Apple 还是选择了 VST 来实现 AR 所代表的“空间计算”。 因为AR正统的光学透视OST难度太大,现有技术根本就不成熟。
以 Xreal 为例,它所代表的 Birdbath 模块的很多技术细节都没有展开,只有一个光效,蓝线代表来自 OLED 微型显示器的光,通过 1-8 个各种光学器件,绿线代表现实世界的光,通过 ABCDEGF 的“层”,它们最终的光效是多少?
示意图来自 Karl 的个人博客 KGON Tech 2021 文章
只有14%的来自鸟浴模块屏幕的光线进入人眼,只有23%的来自外部现实世界的光线可以通过。
以Xreal为代表的消费级AR眼镜,近年来只努力在蜗牛壳里做一个道场,只是为了提高几个百分点的光效,并改进光学设计,让画面更“干净”,而Birdbath模块则努力增加眼镜的FOV(视场), 这将不可避免地导致臃肿,这与对更薄的 Birdbath 模块的需求从根本上是矛盾的。另一条技术路线光波导显示,眼镜越来越薄,现实世界的透光率也更高,但无论是阵列光波导还是衍射光波导,整体光效只有1%-10%左右,存在色彩还原、FOV太小等严重问题。
再往后一点,离轴光学器件,如下图所示,在眼镜对角线上方配备了一个屏幕,屏幕图像通过自由曲面镜头反射到人眼中。 由于光学特性,离轴光学元件的体积难以小型化,头盔式设计是不可避免的。 离轴光学显示效果与鸟浴相比没有明显的优势,但体积如此之大,优势只是与鸟浴相比,FOV(视场)从50°增加到90°,如图所示
左边是离轴光学AR头显的光学原理,右边是Birdbath眼镜的光学原理
图为带有离轴光学元件的 Dream Glass AR 头戴式设备。
对于几款AR眼镜的画面显示质量,国外知名光学专家Karl表示,AR眼镜应该提升虚实画面融合的自然显示效果,并严重依赖索尼、三星、LG等国外面板巨头,以及石涯、京东方等国内微显示技术进步。 硅基OLED微屏需要提高良率,降低成本,从1080p、2K、4K甚至8K提升分辨率,屏幕亮度将持续提升。 从理论上讲,最理想的micro LED微显示器,亮度已经可以达到百万尼特,但仍然无法实现最基本的RGB三色源像素集成的显示器,实际商业成本和量产问题仍然排在后面。
说了这么多,这仍然是AR眼镜最基本的显示问题,如何将AR中更重要的感知、计算、人机交互硬件单元集成到一副正常体积的眼镜中? 如何解决算力、续航和发热的问题? Microsoft Hololens和Magic Leap已经给出了自己的答案,现阶段只能以头盔形式制作。
消费市场怎么可能接受高频AR眼镜供日常使用,每天头上戴着一斤重的头盔,只用在特定的工业级场景。 这就是 Xreal 选择 Birdbath 的原因,这是一款分体式 AR 眼镜:AR只能以普通眼镜的形式使用,没有计算和存储单元,用于消费市场。
与国外科技巨头相比,中国厂商不具备底层芯片、各类传感器、软件和算法层面的SLAM、眼动追踪、裸手手势识别等底层技术创新能力。
小点判断:苹果先是做了一款带有摄像头视角VST的VR头显,并没有做一款带有光学视角OST的纯AR头显,因为基本的虚实画面叠加,OST现有方案的效果还处于原始阶段,需要等待技术的进一步发展。 至少,VR头显已经打开了消费级游戏市场。
从2020年开始,不算那些已经倒闭或采用非主流解决方案的厂商,新锐创业公司Xreal、Rokid、Thunderbird Innovation、Shadow,消费电子品牌华为、荣耀、魅族、OPPO相继进入游戏。
期待已久的VISION Pro出道大卖,苹果将司空见惯的VST优化到了极致,却不敢进入光学OST AR的大坑。 前段时间,朋友圈看到,据说华为也跟进了Vision Pro,调动资源搞大项目,似乎不敢不跟消费电子的新赛道、新趋势。 而频频裁员的字节PICO、谷歌、Meta,似乎被打了一剂强心针,必须继续投资。 巨头们选择的赛道是一致的和理性的。
创业是勇敢者的游戏。 从长远来看,做艰难但正确的事,还是活在当下,做正确的事? 市场的灵魂被折磨,谁能笑到最后。
暂时,我愿向勇敢者致以最诚挚的祝福!