计算机视觉,落地的技术与艺术

自从1956年达特茅斯会议以来,人工智能已经深深地印在了IT技术发展的历史上。60多年的发展和沉淀已经& ldquo人工智能技术已经得到了广泛的传播,到目前为止并不新鲜。。从概念到实践,从技术到产品,AI技术已经在智能客服、智能家居、医疗、工业机器人、无人驾驶等诸多领域开花结果。

计算机视觉技术堪称AI皇冠上的一颗宝石,无论是技术深度还是商业应用都走在了行业的前列。9月5日,腾讯云TVP AI技术闭门会议邀请计算机视觉领域的技术专家、学者和资深从业者在线讨论,层层解构计算机视觉技术,从个性化商业实践中探索共性的发展方向,勾勒出行业进一步发展的潜在蓝图。

大规模着陆的可视化AI技术

& ldquo视觉AI技术严谨的名字是电脑CV。以前AI是AI,CV是CV。近年来,随着深度学习的普及,出现了统一整合的趋势,于是就有了现在的视觉AI。在To B领域,视觉AI技术已经渗透到很多行业,开始了一轮大规模的落地之旅。& rdquo

优图实验室——昊天研究中心主任&;专家研究员郭小炜老师向与会者介绍了视觉人工智能技术的历史渊源。他说,视觉AI的基本任务是阅读图像,目前大众熟知的商业应用案例包括面核、内容理解与广告推荐、泛娱乐、内容评论等方向。目前已经深度融合,尤其是在教育、工业、支付、广播等行业。

郭小炜说,影响人工智能规模和商业化的因素只有三个:成本、安全性和数据。

成本:数据、设备、人才、市场培育和开发,这些都需要大量的资金投入,成本高昂。

安全性:准确性和可靠性。在某些领域,比如医疗行业,AI只能给出参考,对于解决医生的痛点帮助不够。

数据:AI需要的数据,尤其是细分场景数据,很难获取和标注,数据隐私问题也是一大约束。

在细分之下,有五个大规模的着陆挑战需要解决。

挑战1:贴标成本太高,如何降低成本提高效率

业内有一句自嘲的话,智力和工人一样多。这句话说明了标签成本高的痛点。如何通过技术手段降低成本,提高效率?郭小炜说,主动学习是一个有效的解决方案。主动学习的好处是不需要标注全量,只需要不到体验中标注总量的一半。这个过程可以边筛选边学习,直到收敛。为此,他给出了优图实验室在智能医疗场景下的糖网分类识别案例。在这种情况下,腾讯Youtu是基于信息熵的主动学习和特征之间的密度空。同样的效果下,贴标成本可以节省一半以上,当贴标订单达到几十万的时候,成本可以节省几百万。

【/s2/】挑战2:数据量太小,训练效果差。我该怎么办

第二个挑战是数据量太小,影响训练效果。在To C场景中,获取数据的方式相对容易,数据量相对较大,但是在To B场景中,情况正好相反。在这种情况下,样本增强、小样本学习、gan等技术值得推荐。尤其是小样本学习,支持极少量样本的训练,最大限度地利用现有样本,达到最大可能的泛化效果。在货架产品识别和小样本学习技术方面,腾讯优途相对于行业主流方案提出了样本构成、损失函数和后处理三项创新,取得了比优化前提高10-30个百分点的显著效果,与全样本的差距小于10%。

【/s2/】挑战3:数据太少,能伪造吗?

其实第三个问题是问第二个问题,是否可以通过数据生成或者伪造数据的方式来弥补数据的不足。GAN是近年来流行的对抗生成技术,其本质是通过生成器学习符合目标分布的数据,称为& ldquo无中生有。。郭小炜说,如果GAN的结果符合目标的真实分布,它仍然可以发挥一些作用。但是这个效果可能还是要分场景的,并不是每个场景都会有好的效果,所以需要精心设计。

郭小炜提到了一个车辆识别的案例:对于人工智能来说,白天场景下的车辆识别相对容易,但在夜间场景下就更难了。一是这类数据量相对较小,二是光线昏暗不利于人工标注。Uto Lab的解决方案是利用CycleGAN技术,利用大量的白天数据自动生成并模拟夜间数据,然后将模拟的夜间数据与真实的夜间数据混合进行训练,最终成功提高夜间识别效果。

挑战4:业务场景多变,AI泛化能力差,调优太慢

技术上来说,在特定场景下训练出来的表演效果可以很好,但是换了场景之后效果会直线下降。在解决方案上,技术手段应该是场景迁移,常用手段是迁移学习,最简单的方法是在训练前标记目标数据。但是这种情况下需要大量的标注数据,从标注采集到训练通常需要很长一段时间。郭小炜推荐了域自适应技术,它能快速适应新的场景,具有成本低、效果好和普遍适用的优点。

根据域自适应技术,优图实验室提出了一种创新的ReID技术,具体原理和效果如下图所示:

【/s2/】挑战5: AI需要海量数据,如何保护客户/用户隐私?

AI的成长需要海量的训练数据,来自场景的数据可以最大化效果。但通常情况下,场景中的数据也涉及到隐私问题。在许多情况下,用户数据不能离开本地。有什么方法可以满足AI的训练,保护用户隐私?郭小炜共享了一个名为AceCV的系统,可以支持本地数据训练、模型独立演化和集成,实现方案基于域适配、模型集成等技术完成端+云升级。

与联邦学习相比,AceCV系统不需要传输数据和梯度,只需要低频传输模型。同时有自主进化模块和模型集成模块,保证场景模型持续低成本迭代,结合多场景优势升级云模型。去年优图实验室创新性的提出了滤镜嫁接技术,可以支持多种模式取长补短,互相帮助升级。

分享后,郭小炜老师还对留言区提出的问题给出了精彩的回答。由于篇幅有限,这里不再赘述。

腾讯云视AI的商业产品实践

& ldquo站得高还是站得高,改变世界还是努力赚钱?这是我这次分享的小标题,也是我们想和业界探讨的问题。& rdquo

腾讯云AI视觉产品中心总经理王乐妍向与会人员充分分享了腾讯云AI目前的地位和成就。他介绍说,腾讯云AI是腾讯AI的商业出口。在底层算法和云资源层面,有腾讯优途、微信AI、AI Lab、音视频实验室、海量服务器等一系列顶级实验室。、GPU/CPU等资源;在平台和产品层面,包括泛娱乐平台、工业AI平台、广电媒体AI中间站、内容评论平台四大平台,提供文本识别、人脸识别、图像识别、知识地图、AR/VR等一系列丰富的产品;在生态层面,围绕开发者社区、培训、竞赛、AI加速器、中创空房、专项合作计划等加速行业。

在商业化的探索中,腾讯云AI不断步入坑中,一路成长,积累了宝贵的经验供业界参考。王乐妍将其总结为四个阶段:确定方向、培育产品、建立基准和推广复制。

确定方向

确立方向是第一步,简单来说就是选择做什么。成千上万条路通向胜利。选错方向,团队两行泪。腾讯云AI的做法是先分析行业内的关键流程或关键问题,推导出应用方法和商业模式。比如教育行业,可以从教学、考试、管理、教育等核心教学过程中寻找AI的应用场景。最后,我们发现使用人脸识别可以非常方便地帮助学生登录在线课程,而不必设置密码,并且自然有身份认证,避免了打卡和考试。

除了洞察行业外,还可以参考行业内各大玩家的情况,尤其是现有的主力玩家。腾讯云在开发设计AI产品的时候会考察市场的主要玩家,这将直接影响未来的激烈竞争。

孵化产品

这里主要考虑两个问题,一是技术是否可行;第二,产品的价值是什么,尤其是产品与竞争产品相比有什么区别或优势。王乐妍以腾讯护目镜为例,拆除了孵化产品的核心问题。可见,Goggles的面芯四层设计形成了这样一套立体丰富、安全的刷脸系统,具有很高的商业价值和广泛的应用场景。目前在国内市场,Goggles是头号面核体产品。

建立基准

标杆管理也是一个测试产品的过程。一个产品是不是好产品,取决于它是否真的为客户创造价值。只有好的价值才能被客户认可,然后才会有后续的、持续的、健康的使用和支付。

腾讯云AI基准客户众多,王乐妍说卫忠银行就是典型的客户案例。伟众银行是中国第一家互联网银行。伟众的远程核流程已经应用了腾讯云眼脸核技术。总理在参观卫忠银行时,现场见证了面核体的演示。经过媒体报道,颜回吸引了更多的客户。

王乐妍指出,标杆管理不是一蹴而就的,所谓的隔行如隔山,在一些重要行业,仍然需要龙头企业的背书才能给产品带来更高的认可度。中国联通是腾讯云AI在电信运营商领域的首个头基准客户,腾讯云AI也为其提供了显著的成本降低效果。

此外,王乐妍还在直播现场提到了深圳政务现场和斗鱼公司,从效率提升和合规性方面揭示了腾讯云AI提供的客户价值。

促进复制

推广复制背后的问题很复杂,但核心其实就是一个字:成长。它与市场供求、产品价值和产品特性密切相关。王乐妍说,如果你想长得好,你首先需要考虑清楚三个问题:

目标客户:谁是目标客户?目标客户在哪些行业?是什么类型的客户?谁在用?谁在付钱?

定价策略:策略是利润最大化还是收益最大化,是抢占市场份额还是刺激活跃用户?

复制效率:如何快速向新客户销售产品并完成交付。

只有把这些问题想清楚,进行有针对性的设计,才能在商业产品的实践探索中找到可持续发展的方向。

王乐妍总结说,在确定方向、培育产品、建立基准和促进复制的背后有一个隐含的逻辑。企业应该在不同的阶段和不同的场景下采取不同的做法,这些做法应该随着变化而变化。AI技术的商业产品实践是一个循环演化的过程,需要不断了解行业,提供价值,优化价值,寻找新方向,孵化新产品,不断向前探索。

& ldquo在AI生态建设上,腾讯云AI致力于连接行业和开发者,打造开放生态、共赢局面。我们希望更多的合作伙伴加入腾讯云AI的生态系统,加快人工智能产业的应用。& rdquo

分享后,王乐妍还进一步回答了评论区提出的问题,如腾讯内部AI平台的分歧和落地等。

计算机视觉技术在服装业的实践

& ldquo从创业公司的角度看AI在行业的落地,可能会有不同的视角。在人工智能登陆的所有行业中,服装或时尚等一些行业大家都比较陌生。为什么我们选择在服装行业登陆人工智能?希望今天能和大家分享。& rdquo

智艺科技联合创始人兼CEO郑泽宇作为AI领域的创业者,带来了一些与腾讯云AI不同的思路和视角。郑泽宇之前在谷歌工作过,也是国内知名的TensorFlow专家。他提到,从2015年开始,人工智能的概念开始流行,大家都希望用技术之锤找到现场的钉子。AI领域的初创企业也很多,不同的AI企业会孵化出不同的技术方向。这个阶段被他称为AI技术落地的第一阶段,技术求现场。

第一阶段发展一段时间后,AI领域的初创公司碰壁& ldquo南墙& rdquo:巨人公司走到最后,竞争激烈;创业公司资金不足,AI烧钱太快。此时,如何让AI技术更多的应用于其他行业和场景,产生商业价值,成为AI商业化的新主题,已经进入AI落地的第二阶段,场景与技术相结合。

以服装行业为例,其实这个行业要用到的技术很多。除了CV,自然语言处理、关联推荐、地图搜索、数据分析、趋势预测都是关联技术。郑泽宇说,每个行业都有很多数据,不同的数据需要不同的排序方法和算法。基于这些技术和应用场景的深度集成和绑定,人们发现技术对一个行业的影响是深远的。

郑泽宇提到,很多AI创业者最初的意图和愿景是颠覆自己选择的行业,却忽略了对行业的了解。他认为,只有真正了解行业,才能在最关键的地方做出改变,才有颠覆行业的可能,这也是智艺科技创业的实现路径和价值。

很多人对服装行业的感知都是时尚和艺术,很难被AI理解。但郑泽宇在对服装行业深入了解后发现,这是一个99%商品,1%艺术的场景,在这个行业做AI创业不是为了取代设计师,而是利用AI技术做好服装的选择,这是一个可以同时被AI理解的理性方向。传统的基金选择方法通常会遇到各种各样的问题,而AI技术恰恰是为了解决这些无法用数据量化的主观问题。

在互联网场景下,海量数据的获取使得基于数据的分析不再困难,但正是因为数据量大,无法形成有效的解释。特别是图像等非结构化数据,计算机很难直接识别和理解,需要通过人工智能图像进行分析,得到结构化数据标签,可以有效利用。如何让机器理解时尚成为智艺科技需要解决的核心痛点。

郑泽宇说,计算机视觉最经典的三个问题,就是理解图片,把图片分类好,解决搜索问题。但理解时尚不属于以上三类。为了让计算器有效理解产品地图,智艺科技将产品地图分为12个维度,有500多个标签。在穷尽了所有可以手动总结排序的标签之后,我们让深度学习模型来试试。

经过长时间的不断调整模型、增加容错性、优化标签、打磨人工智能算法,最终达到了相对较好的精度:

基于这些数据和特征,扩展了地图搜索、趋势预测和智能拟合等功能。郑泽宇表示,目前服装行业知名线上线下品牌基本成为智艺科技的客户,公司实现了自负盈亏,属于现金流相对健康的AI创业公司。

分享结束时,郑泽宇先生还精彩地回答了计算机如何理解服装场景中美的定义、3D建模等问题。

圆桌会议:新基础设施背景下人工智能面临的挑战和机遇

在本次闭门技术会议的圆桌讨论会上,优图实验室-昊天研究中心负责人&专家研究员郭小炜、腾讯云ai视觉产品中心总经理王乐妍、智艺科技联合创始人兼首席执行官郑泽宇、海神科技首席执行官戴见彬、香港科技大学助理教授陈奇峰、活动主办方腾讯优图实验室高级AI研究员彭派,就新基础设施时代主题下给人工智能带来的挑战和机遇,分享了各自的观点和思考。

王乐妍:从2017年底到2018年初,当时没有新基础设施的参考,腾讯云AI要做大量的探索和决策往哪个方向走。其实一路走来反思过去探索过程的核心,是你对行业是否有足够的了解,对技术是否有合理的判断,对自己的差异和优势是否有正确的认识。从这些维度分析自己,基本上可以得到一个清晰的答案,这个答案不一定能被自己接受,但是对行业有深刻的了解。从目前的时间点来看,腾讯云AI做的不错,一路上的探索和实践积累了很多经验和方法论,在新的基础设施时代也很有用。

郑泽宇:服装行业本身更注重线下场景,从设计到制作到营销。现在很多技术都在试图通过线上线下,让数据能够充分流通,厂商提供的智能设备也在广泛使用。在这种背景下,实际上,后端生产、品牌运营和前端营销都是新基础设施的组成部分。智艺科技希望在这个过程中沉淀的核心能力就是打通和收集数据的能力。通过人工智能、5G、边缘计算等新兴技术带来的新的基础设施成果,数据采集能力越来越强,通过有效的处理最终形成更多科学的数据决策。这是新的基础设施为行业提供的可能性,我们也在积极布局以适应这种变化。

戴见彬:智能安检是海神科技2019年至今的重点发展方向,也符合新基础设施时代的背景。目前我们在智能安检方面投入了大量的资金,还有很多后续的衍生领域,比如安防方向。新基础设施的大前提对我们还是很有好处的。三四年前很难找到和企业的合作,现在To B和To G两种场景都可以很好的到达客户,新技术的开放性和接受度都不一样。海神科技未来发展的重点是专注于这一领域的深化和突破。

陈奇峰:新的基础设施背景可能会促进离线人工智能能力的落地,我的许多研究项目将与实际应用相结合。比如有一个研究方向就是如何设计新一代的深度相机。然后我们在学校做了一些东西来证明它的可行性。我们在学校里设置了这样的模板,但是如果要离线落地,可能需要行业的配合才能使用相关的深度相机。这项技术主要用于汽车,尤其是无人驾驶汽车。除了室外场景,我们还有室内研究项目。在学术界,我们的重点可能是证明一些新技术的可行性。如果有同学感兴趣,会自己做产品,然后我们提供支持。

郭小炜:我们可以看到“新基础设施”这个术语是今年提出的。它包括5G、人工智能、交通、能源、工业等领域,必然会催生大量的线下AI需求。目前Uto Lab已经在工业互联网、政务、民生等这些方向投入研究。但是,其实我们也可以看到,在这个过程中,也对AI提出了更高的挑战。优图实验室还是希望解决一些行业常见的落地问题,解锁更多限制。另外,需要政府推动数据共享,打破数据孤岛,从政策层面降低AI的准入门槛。以上是我对新基础设施的看法。

最后,大圆桌咖啡人针对限制出口技术目录、外国技术封锁等问题进行了深刻的思想碰撞。本次闭门会议的主持人腾讯优图实验室高级ai研究员彭派也向面临挑战和挑战的AI从业者发出了信息和自我鼓励。

AI的价值要从实践中去找。但是TVP也很清楚,技术的价值必须让所有人受益。这次计算机视觉技术闭门会议的成功结束,不仅为AI行业提供了借鉴,也带来了更深入的思考,无论是新的创新思路还是新的商业模式,最终都会对整个行业有所帮助。

从概念到实践,从云到落地,从现在到未来。AI还有很长的路要走,新的基础设施还有很多事情要做,但是在这条路上,我们看起来都像是同路人。

关于TVP技术的闭门会议[/s2/]

TVP,腾讯云价值专业,是腾讯云给云计算领域技术专家的奖项。东方神起计划与行业技术专家搭建沟通平台,打造云计算技术生态系统,实现& ldquo利用技术影响世界。我们美丽的愿景。

TVP技术闭门会议是为TVP打造的专属技术闭门研讨会,旨在为TVP人提供一个开放、平等、全知的交流环境,就热门技术、前沿技术、技术管理等话题进行深入探讨。

为您推荐

发表评论

电子邮件地址不会被公开。