今年新款 iPhone XS、iPhone XS Max 与 iPhone XR 为用户带来的不仅仅是手机硬件的更新,而且将像素级图像分割、精准的人体关键点检测集于一身,像人工智能普及化迈出了一大步。
景深摄像
单单使用大光圈,高像素、双摄的手机是很难达到单反级别的景深摄影的效果。神似出自单反相机的人像模式实际使通过算法处理出来的,一张由 12MP,f/1.8 手机单摄像头所拍摄的图像,如果我们仔细观察这张图片的细节,会感叹新一代 iPhone 的处理能力:人物边缘选择非常精准,效果鲜艳。这得益于深度感应引擎结合来自神经网络引擎图像分割图像,准确区分主体与背景。
像素级语义分割
语义分割目前广泛引用基于摄像头传感的自动驾驶系统,使汽车分辨前方车辆、行人、路牌。而像素级语义分割,就是将场景分割效果细致到像素点。在移动设备上几秒之内的图像分割就可以达到非常不错的用户体验,后期处理的三个步骤:「面部检测、面部标界、分割」大量摄影师才能实现的高质量图像效果,只需要 iPhone XS 在短暂数秒内即可完成。
人体骨骼关键点检测(Pose Estimation)
人体骨骼关键点检测的目的主要是为了让机器可以感知到人的行为,在视频监控领域,这项技术主要被用于检测视频画面中人的特殊行为,配备了这项能力的机器人可以对用户「察言观色」,是人机交互的一大进步。我们可以看到这项技术的优势体现:准确的检测目标的行为和姿态。实际生活中实现行为检测需要兼顾场景中复杂的光线、动态人物、突变姿态等,至少需要绘制 13 个关键点,需要承担高负荷的图形计算压力。苹果搭载的 A12 处理器为新一代人机交互提供了平台。
A12 才是 iPhone 的最大卖点
当下手机图像处理功能已经非常依赖于深度神经网络后期处理,单一的 CPU 搭配 GPU 已经不能满足图像处理要求,使用于运算神经网络数据必须具备的特殊运算核心;而且苹果这次升级 ARKit 2 平台加入了好友 AR 合作对战,渲染大型 3D 游戏画面,画质堪比游戏家用主机,为了实现绝大部分功能的实时化处理,新款 iPhone 搭载的 A12 处理器才是产品发布的核心。
我们借此可以看到苹果秉承的三条战略:
● 超前于其他手机厂商的技术视野;
● 带给用户融合最前沿技术的原生应用,「体验」既是一切;
● 硬件不必花哨,新一代应用开发平台才是关键。
如果盯着苹果硬件配置价格表,可能并不会让人有任何购买的冲动,但苹果的战略始终是使人亲身体会到产品带给人的感受。仅仅通过增加内存,提高处理器运算速度已经远不能满足当今的智能手机市场。手机真正带给用户的是体验,而速度仅仅是体验的一部分。从图像处理到内嵌人工智能模型的应用程序,苹果最新 iPhone 系列都在尝试容纳最前沿的算法技术,iPhone XS 系列原生功能都需要借助于 A12 强大的神经网络计算功能,苹果目的是通过 A12 打造新的开发者生态圈,原先只能通过云计算实现的运算现在放在了 iPhone 上,实现很多原先不可能的功能。
最新评论