商汤科技赵峰:企业内容是数字化重要组成部分


来源:新浪财经   时间:2020-09-11 16:38:21


9月11日,由商学院主办的“信仰的力量”——2020《商学院》商业领袖高峰论坛”暨“第四届寻找中国最具价值企业颁奖典礼”在北京举办。商汤科技企业业务事业部总经理赵峰出席并发表演讲。

赵峰表示,企业的内容是很重要的数字化组成部分。大量的信息化已经把很多的信息完成了结构化录入。但还有一些内容,包括语音、文字、文本,这些其实是非结构化数据。那么在OCR的一个发展当中,其实卡阵类的、表单类的、票据类的、文本类的,需求纷繁复杂。在这个过程当中,普通的OCR技术的卡证其实已经和票据其实做的相对来说比较精准。

以下为演讲实录摘编:

在发展期当中,其实走向了几个应用的一个案例,我给大家做一个分享。

第一点是企业的内容是很重要的数字化组成部分。大量的信息化已经把很多的信息完成了结构化录入。但还有一些内容,包括语音、文字、文本,这些其实是非结构化数据。那么在OCR的一个发展当中,其实卡阵类的、表单类的、票据类的、文本类的,需求纷繁复杂。在这个过程当中,普通的OCR技术的卡证其实已经和票据其实做的相对来说比较精准。

但在接下来一个发展当中,当你能够更深层次的被不同的企业要应用到,其实你需要用深度学习技术去替代人工模板的编写,需要用自定义的模板的技术去适应更多的文档结构化。

第二类的应用,诚如刚才第二张图片显示的检测类算法,在一张图片当中需要定义的物件如此之多,人脸、车辆、行人,道路……那么这些检测类和场景分割类的算法非常多,它不像人脸在单一场景下,在单一的算法下可以应用的场景,它的回报率非常之高,但是你切到每个独立的检测算法,整个的成本和回报,其实是比较难以去算清的。在此基础上,其实更多的模型生产部署平台,就为企业去拥有符合自己的培育场景的技术得到了支撑。

这里面有两个典型的一个应用,一个是0-1的这样一个孵化的训练体系。比如说在单一场景之下,在没有任何基础模型的支持情况下,针对于垂于场景,获取数据进行私有化部署的一个训练。这在深圳的智慧城市当中,大家看到有这些场景都得到了应用。

第二类,其实在有些检测场景下,比如车辆、垃圾、道路,其实已经有了一些基础算法。但是在每个细分的领域当中它都有特点,比如说你在小区的道路、高速的道路、在城市公共空间的道路,其实都会有差异。那么我们其实应用叫做模型、预训练模型去配合垂直场景的进一步的增强训练,来适应一个垂直场景的这样一个应用。

在算法生产效率提升之后,非常多行业的长尾算法其实就得到了一个前面提到的人脸、人体、车辆这些,它的应用场景会偏多,有大量的长尾算法,算法多、应用场景相对来说比较窄,这一系列其实我们把它叫做长尾,这些长尾需求基于模型生产部署平台,其实可以得到进一步的一个应用。

第三个垂直深化期,其实是人机交互。那么在计算机视觉和深度学习里面,其实 AR其实是非常重要的一个部分,就是增强现实技术。这里面其实有三个场景,第一块是AR数字人,相信大家在自己的导航的软件里面,其实经常已经可以用到一些明星的声音,来给你提供导航的一个服务。那么现在通过视觉,通过文字也完全可以驱动一个模拟的3D数字人,也可以驱动一个类似于真人的一个逼真的人物形象去给你提供服务。 在一些客服行业,不管是线下的还是线上,其实都可以完成后台的呼叫中心去驱动前方数字人服务客户。

扫二维码点击查看直播

  版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“融道中国”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场。

延伸阅读

最新文章

马斯克V.S薛其坤:立足当下 对人类未来展开无限想象 马斯克V.S薛其坤:立足当下 对人类未来展开无限想象

精彩推荐

图文观赏

众安在线扭亏为盈:2020年净利5.5亿 数字生活生态驱动增长 众安在线扭亏为盈:2020年净利5.5亿 数字生活生态驱动增长

热门推荐