现如今,无论是刷短视频时的个性化推荐,还是外卖配送时的耗时预估,或是移动支付时的人脸识别,以算法为代表的AI技术在消费互联网行业被应用得“得心应手”。然而提到传统行业,人们却很难快速想起非常成熟的应用人工智能的典型案例。为何AI技术在传统行业的应用速度和范围远不如消费互联网等行业?
1 消费互联网行业应用AI更具优势 AI技术的应用主要取决于数据、算力和算法。首先数据要达到一定的体量,这是应用基础,此外算力也要能支持大规模的模型训练,而后算法方面需达到一定的精度,端侧算力也要具备一定的推理能力。
之所以目前只有消费互联网公司在大规模应用AI技术,主要是在这三方面消费互联网公司都更具优势。
前些年短视频并没有现在这么火爆,例如发展初期的淘宝,也并没有很强的用户黏性。而随着推送越来越精准,用户的体验感也得到了极大的提升,最终呈现井喷式的用户增长。
精准推送主要依赖于算法精度的提升,而算法精度的提升又离不开海量的数据作为基础。在这个单一的场景中,算法模型需要不断进化,终身学习。由于不是封闭数据环境,总有新的数据加入,算法模型需要不断通过学习进行调整、迭代升级,使其精度越来越高,形成一个良性循环。
与此同时,虽然目前消费互联网行业在算法精度上已上升到一定高度,但相比一些传统行业的应用场景,消费互联网行业对于AI算法精度接受的阈值都较低。比如短视频、淘宝偏好推荐、百度热搜关键词,只需达到用户产生黏性的目的,只要有一定准确性,用户都可接受。相比之下,在很多传统行业,对于技术精度的要求就高得多。比如基于视觉的AI技术在人脸识别方面的应用,在高铁站、飞机场核实身份,1∶1的比对准确度要高达99.99%甚至更高才可以进行应用。
在算力方面,目前云端算力已可以支持大规模模型训练和推理,比如短视频、淘宝推荐等。但在大量传统行业应用场景中,智能终端上的端侧算力还无法满足推理的实时性和准确性要求。
相比于社交网络和电商系统,传统行业应用场景的封闭生态系统使云端算力无法得到有效应用。如以智能无人系统巡检为例,电力巡检、管道巡检、交通巡检等要求搭载在无人机和机器人上的算力满足实时巡检要求,由于视频分析的模型复杂度较高,端侧往往无法实现精准高效的实时推理,轻量级网络在满足实时性的同时,损失了识别精度。由于算法精度达不到使用要求,在很多场景中无法实现AI技术应用。
2 传统行业应用AI面临三大挑战 在AI应用方面,消费互联网行业之外的其他行业都面临着三大挑战:数据集很小;定制化成本很高;从验证想法到部署生产的过程很长。以传统制造业为例,传统制造企业在制造向智造转型过程中,数据是个很突出的问题。首先在数据获取方面存在一定难度。传统制造企业的数据是封闭的,因为很多传统企业并不是新型信息化设备,没有传感器收集实时数据,也没有数据中心,因此数据零散,缺失严重,很难获取像消费互联网企业里那种海量、高质量的数据。其次,行业内部各个工厂的数据很多具有商业价值,因此工厂都严格保密,导致数据不流通,没法进行共享,形成数据孤岛效应,影响AI算法模型的优化。
在开发一个AI算法模型时,因为数据的保密性,往往得到的数据都是经过“脱敏”的,这也严重地影响了判断。而传统行业的企业中,又缺乏具有AI算法模型开发能力的技术人员,因此双方在合作研发过程中也存在着很高的壁垒。
此外,传统行业中的数据大多来源并于复杂的业务场景,必须进行“清洗”,去掉大量无效信息,AI算法模型才能高效学习以提高精度。如学习时,知识点中夹杂大量无用信息,就需标明知识点以提高效率。传统制造业要想获得高质量数据,就必须对生产设备进行信息化、智能化改造。这种改造需要企业投入大量的时间和精力,还会增加生产成本,这也成为AI在传统制造业中应用的壁垒。
3 高质量数据是应用前提 过去这10年,大部分AI的研发和应用是“以软件为中心”驱动的。在传统行业无法提高数据质量和数量的情况下,应采用“以数据为中心”的模式,把重点放在获得质量更好、匹配度更高的数据上。
在这种思路下,传统行业也涌现一些不错的应用案例。如医学领域的影像识别AI系统,可帮医生“看”CT影像片子。很多数据都由专业的放射科医生在影像片子上进行了标注,因此数据较准确,AI算法模型在学习过程中进步很快。目前很多影像识别系统的准确率都能达到90%以上。
尽管传统行业有一些应用AI技术的成功案例,但要想更好地和AI结合,还得在提高数据质量方面下功夫。首先对已经积累了海量数据的传统行业,在保证数据安全的前提下,主动开放数据。挖掘数据中蕴藏的价值,和需求关联起来,会有很大发展空间。其次,对于新兴行业,如新能源汽车等,在构建智能工厂规划的时候,就把获取数据、智能化的因素考虑进去。
不过,在传统行业用好AI技术的同时,也不要滥用AI技术,在应用前做好评估,盲目强行使用AI技术,就是对资源的浪费。比如一些应用场景需要AI算法达到99%以上的精度才可使用,通过评估,现有模型算法只能达到90%的精度,那么这个场景就没必要强行上马AI技术了。
总而言之,对于AI技术的应用要数据先行,有高质量的数据再谈应用,没有好的数据很难有好的应用。
(陈曦)