三井物产来自奥飞基量子比特的报告|公众号
这是一个新手机发布、必须讨论AI的时代。
这也是一个需要测试才知道AI是否有效的时代。
不久前,华为发布了新一代旗舰手机Mate 20系列。搭载AI芯片麒麟980和双NPU,号称六项行业第一。
而且,余承东还在发布会上“秀”了不少AI驱动的功能。例如:
实际情况如何?
近日,量子比特拿到了一台华为Mate 20 Pro,对其AI能力进行了评估。希望能给大家带来一些参考。
评测设备基本配置为:8G+128G,EMUI 9系统。
整个评测围绕AI展开,分为AI性能测试和日常任务测试两部分。
日常测试的内容基本对应华为在宣传、发布会中提到的功能进行对比。
在评测过程中,量子位发现,华为在发布会上吹嘘的基本上都可以实现。当然,从实际效果来看,买家秀和卖家秀还是有区别的。
下面是我们的上手测试~
我们先来跑个分
在智能手机领域,一直流传着这样一句话:不服就考。
评估手机的AI能力,自然要使用具有AI特性的基准程序。
前段时间,位于苏黎世的瑞士联邦理工学院开发了一款名为AI的应用程序,专门用于测试设备和芯片的AI性能。
通过各种途径,我们从Play下载了这个APP。
整个基准测试过程持续约8分钟,与通常的基准测试软件的时间大致相同。
△评分过程一览
结果出来后,我们有点惊讶:14,442分。随后又进行了几次跑分,分数基本都在14000分以上,最高达到了14475分。
官网也有Mate 20 Pro的跑分,仅为12047分。
原因是具体配置不同。我评测的设备运行8G内存,而官方评测设备只有6G。
看来运行内存会对手机的AI性能产生影响。
据官方介绍,AI测试的是手机运行一些深度神经网络算法的能力。
测试中执行的任务主要包括图像分类、人脸识别、图像去模糊、图像超分辨率、图像语义分割、图像增强、内存限制测试等。
其中大部分是与图像识别和处理相关的任务,目前广泛应用于手机中。在后面的评测中也会提到。
需要注意的是,跑分只能反映手机硬件对AI任务的支持程度,它反映的是手机硬件AI性能的表现。在完成日常生活中的一些任务时其效果如何还需要进一步测试。
日常任务测试
Mate 20系列产品发布时,有一个功能让很多人感到惊讶:
这是发布会上播放的手机视频。在黑白的背景下,舞女和她的红色裙子非常引人注目。
保留所有人物颜色,去除所有背景颜色,这种细致又费时的后期处理工作全部搬到了手机上实时完成。
这部分就从这个函数开始。
AI相机&拍照
其实我们也想找个女孩一起跳舞来测试一下,但是没找到。只能抓一个强者走两步来测试一下。
我们就姑且看一下这篇“土味”的评测吧。
打开相机,切换到视频模式,点击左下角的“魔棒”按钮,选择“AI色彩”,就可以开始拍摄了。
具体入口位置如图:
前方高能! “铁锈味”警告!
总体来说,效果还是不错的。但如果速度足够快,颜色就追不上。
要实现这个功能,首先要把人物和背景分开。基准任务中的“图像语义分割”就是用来完成这项工作的。如果发现分割的主体是人,则将“人”字保留在黑白背景中即可。该区域的颜色。
猫、狗、小金鱼等不会保留它们的颜色,但在测试过程中我们发现,只要它们是勉强的人形,它们就会保留它们的颜色。例如葫芦宝宝。
背景模糊的实现逻辑大致相同,只是分割后的背景处理方法略有不同。
在视频中,识别动态人物的方法相对较多。例如,您还可以通过比较前后帧来确认字符。但同时也会对设备的性能提出更高的要求。
拍摄静态照片时肯定会出现类似的效果。
咔嚓一声,整个人就被扔进了教堂里,阳光透过彩色的窗户倾泻进来。
不过,剪裁的痕迹还是有点明显。毕竟算法的使用会受到各种环境因素的影响。但它比我用过的大多数类似软件都要好。
这是Mate 20相机“人像”模式下的一个小功能,开关就在中间。
实现这个功能有很多限制:需要实时拍摄,需要靠近人并瞄准脸部。
除了为视频和照片打造各种戏剧效果之外,这款手机还围绕相机执行了许多实用的AI功能。
智能物体识别
余承东在发布会上展示的检测食物热量的功能,属于智能食物识别的一部分。
检查卡路里
要使用该功能,需要先打开相机拍照界面,点击左上角的“小眼睛”图标。
进入后,选择“识别对象”。隐藏得相当深。
一切准备就绪后,恰巧有同事在吃包子,就“借”了她的包子来测试。
结果相当准确,还可以“目测”估算出这些包子的重量。
橙苹果测试结果:
炒面:
结果错了,搞得一团糟。这是可以理解的,因为它看起来很像混合蔬菜。人类用肉眼很难识别,如果交给AI来识别就更让人摸不着头脑了。
如果真的准确的话,这款手机的AI能力将会非常成熟。
不过,用手机测量卡路里只是一个参考。如果你想用这个来减肥……算了。我们先不谈估计的准确性。就连一个馒头也能拍得又白又嫩。谁能挡得住?
测量卡路里只是这种“物体识别”功能的一方面。当你把相机对准其他物体时,你会发现它还有很多其他的功能。
真正的智能知识
断网时无法使用智能物体识别功能。具体的实现方式应该是通过摄像头采集图像,然后在云端进行识别、处理、反馈结果。
而且,该功能还会受到图像背景复杂程度和识别对象类型的影响。
比如识别衣服就变成了狗,人就变成了商场。
有时甚至不被认可,然后就送给汽车之家。应该是识别对象是汽车。
在处理复杂图像的能力方面,算法确实很难处理好。仍需改进。
不过,也有很厉害的时候,比如下面对绿萝和花叶万年青的鉴定就非常准确。
从上述评测结果可以看出,Mate 20 Pro使用不同的“引擎”来识别不同类型的物体。
对于大多数项目,它使用百度ID。对于某些细分品类,会选择专门的引擎,比如植物的“花伴侣”、汽车的“车之家”、专门用于识别食物和计算卡路里的算法等。
产品搜索和购物
产品搜索和购物与在猫宝等电商应用上搜索图片和使用图片搜索产品几乎是一样的。这对于手机厂商和用户来说都是一个非常实用的功能。
Mate 20 Pro默认的搜索引擎是淘宝,也可以选择全球购,里面有当当网、考拉网、寺库等电商平台的商品推荐。识别数码产品时,会默认出现华为商城推荐华为产品。
功能入口位于物体识别旁边。如果手机上已有该图片,也可以双手按住该图片进入搜索和购物界面。只要敢拍、敢按,结果就出来了,只是准确度……还是有待提高。
例如,墨水被认为是眼影和指甲油,但通常它们看起来很相似。
说到通过图片搜索商品最常用的品类:衣服,这款手机在淘宝上搜索同款效果非常好。我很快就在淘宝上找到了同款毛衣。
但作为一个在AI圈子里只有半只脚的人,怎么可能只搜衣服呢。有人给了我们一个测试手机的想法。
猜猜这是什么手机?评论区见,大家猜猜看。
实时翻译和文档提取
说起翻译,也是华为手机非常重视的一个部分。在该产品发布的预告片中,曾传言它可以“秒懂多种语言”。发布会上,余承东还展示了自己强大的实时语音翻译能力。
不过,实时语音翻译仅保时捷版本支持。
我们评测的Mate 20 Pro只能使用“AR翻译”,即利用摄像头实时识别目标物体,提取文本并给出翻译结果。
发布会上还提到了“AR翻译”功能,当时这是一个外语菜单。从效果来看,还可以。
但实际效果还是有待提高,偶尔……会出现一些乱七八糟的情况。
放在平坦的表面上识别文档,效果还不错。
文档识别功能与“物体识别”集成。如果检测到文档,会自动进入提取文档的界面,然后对识别出的文档进行分词处理。
嗯,看来我们对AI的要求有点苛刻了。我们上来的时候让它读报纸。要求确实非常高。对于翻译一些日常指令,效果还可以。
图像测试到此结束。让我们开始测试它的语音识别能力。
AI语音助手
华为语音助手的默认唤醒词是“小艺小艺”,是由原来的小E演变而来。
在国内发布会上,余承东花了一些时间介绍这项服务,同时还发布了一款智能音箱。看来华为这次是认真的。
由于起步较晚,没有受到太多关注,华为在数据积累方面明显落后。
在评测过程中,可以明显感觉到,在Mate 20 Pro上,虽然具体的唤醒和语音命令的识别都比较流畅,但感觉有些停滞。
不过使用语音助手完成一些日常任务是没有问题的,比如设置闹钟、发送微信、发送QQ消息等。发布会上提到的驾驶模式由于条件有限没有进行测试。如果您有条件测试一下,请分享一下。
然而,它也有和它的朋友一样的缺点。
默认为“小艺小艺”时,如果我喊“小鹰小鹰”,它也会有反应。
如果你叫小爱同学“小白”、Siri“四黑”,他们也会回应你。
有兴趣的话可以尝试一下~
概括
总体而言,华为Mate 20 Pro是当前AI技术的集大成者。
芯片上,有麒麟980加持,跑分表现确实不错。就具体应用而言,针对不同的场景,选择更好的引擎并在系统层面进行集成确实是一个很好的解决方案。
虽然在实际评测过程中,也存在不少“弱智”行为。但从目前AI发展阶段来看,这是比较正常的。毕竟,历史进程必须得到尊重。
需要注意的是,手机的AI能力不仅仅局限于表面的应用,还会体现在系统的设计以及手机的实际使用体验中,而这些只有大家才能感受得到。 。
又一个遗憾
除此之外,本次评价还有一个遗憾。能够复活人物的3D建模没有经过测试,很多同事的大胆想法没有实现。
经过查询,发现11月份之后才可以在App Store下载相应的应用。具体日期尚不清楚。截至发稿,尚未上架。
至此,我们的评测就结束了。
你觉得这款手机的AI怎么样?
- 超过-
活动策划招聘
量子位正在招募活动策划人员,将负责不同领域线上线下相关活动的策划和执行。欢迎聪明可靠的朋友加入,希望您有一定的活动策划或运营经验。相关详情请在量子比特公众号()对话界面回复“招聘”二字。
量子比特·今日头条签约作者
̾'ᴗ' ̫ 追踪AI技术和产品新进展