图麟科技有限公司怎么样?怎么在视频中图像识别?

新闻资讯 (58) 10个月前

“还比较Low,现在正改版呢。”魏京京苦笑道,“项目已启动一年多,一直忙着做产品,都没顾得上打理门面。”

去年6月,魏京京扔掉同创伟业投资总监的身份,成立图麟科技,踏入图像、视频处理领域创业。他对此行业并不陌生,十多年前,曾就读于中科大时,便有所接触。当时同一实验室,有不少同学一直从事相关研究。

他花了半年时间,组建了一个以中科大老同学为核心的6人团队,正式开干,并把以图搜视频作为核心技术。

经过一年筹备,团队攻克核心难题。从2000小时的视频中搜索一张图片,用时在1s以下,视频预处理时间从24小时缩短至5~6小时。

“我们是分布式可增量的系统,对视频总量没有限制,均可在1s内搜索到含有该图片的所有视频。”

至今,图麟有超过30人的硕士博士技术团队,已研发出三款产品。

以图搜视频解决方案(涵盖以图搜图、以图搜视频、以视频搜视频功能)已有6家试用客户;图麟科技机器视觉解决方案已在一家工厂内用于触摸屏质检;图像处理云服务的客户有三家,如泰康保险等。

注: 魏京京已确认文中数据真实无误

二次触电图像技术

十多年来,魏京京只玩一款游戏——《星际争霸》。平时晚上不忙时,他便和以前实验室的博士同学战上一局,疯狂时会玩到凌晨以后。

两人打了几千盘,平时聊天也是围绕游戏话题。一天,魏京京向博士同学请教图像识别和图像分析的技术门槛。这令对方大吃一惊,“你怎么关心起我的专业了?”

本科时,他们同在中国科技大学(简称中科大)学习计算机专业。早在2002年,魏京京便接触过图像处理技术。“当时实验室在给军方做类似导弹导航系统,会涉及到图像分析和识别。”

此后,魏京京并不“安分”,在IBM做了几年“攻城狮”,从北京辗转到硅谷,又从硅谷回到国内跳到咨询行业,然后涉足财务工作、投资分析,搭建金融分析模型,之后就职于同创伟业,转做风险投资。

看项目时,他留意到一些做图像识别、分析的创业公司。这让他想起在实验室时,有不少同学主攻此方向,而且这些年来一直在继续搞研究。

《星际争霸》的老对手博士同学便是其中的佼佼者。他曾在微软亚洲研究院、理光亚洲研究院负责相关领域研究,还在海外研究所、高校担任该领域的高级研究职位。

近水楼台。在跟老同学不断咨询后,魏京京了解到,那些创业公司的技术并不怎么好。

他心里打起了“小算盘”,为什么我们不能自己做呢?然而,这个方向是否靠谱,他没有十足把握。此后,魏京京花了两年时间边做投资边验证方向。

2014年,他发现一个现象,由于深度学习技术的应用,依据图像、视频本身的智能化功能不断涌现出来,原本多年难有突破的技术正逐步实现商业化,如以Face++为代表的人脸识别技术。

魏京京感觉时机成熟。期间,他在同创投过一些项目,担任被投企业的董事会成员并深度参与到企业管理方面的工作,“感觉创业也没那么复杂”。

前后花了半年时间,他组建了一个以中科大老同学为核心的班底,博士同学为首席科学家。“6个人,我们都工作十年以上,最长的和我认识了18年。”

14年6月,图麟科技正式成立。然而,一年后项目才正式启动,同期获得1000万Pre-A轮融资,投资方为同创伟业。

核心技术视频搜索

魏京京花了一年时间来确定最终产品方向。他找了7~8个方向,最终确定以图搜视频为核心技术。

例如,在优酷或百度搜索电影,目前只能用文字来搜索。“你有一张电影截图,有时并不知道片名,这时可用图片搜索出电影。”

彼时,淘宝的拍立淘已将以图搜图商业化。魏京京认为,国内以图搜视频技术还停留在高校实验室开发算法阶段。“视频搜视频技术更为早期,均无成熟通用的解决方案。”

◆以图搜图用于电商

相比之下,他们的技术团队已具备算法雏形,魏京京打算率先将此技术商业化。

第一阶段,团队把以图搜视频的算法转化为产品Demo。“要根据不同的使用场景构建产品,过程很复杂。”

更复杂的是将Demo产品化。期间,最大的挑战为搜索算法与数据处理性能的博弈。

2000多小时的视频,数据量约为2T,搜索一张图片的时间在1s以下。然而,最初预处理这些视频要花24小时。“视频是由海量连续的画面组成,不可能把它拆成一帧一帧的图片,然后利用以图搜图的方式来做,这样处理速度很慢。”

如何在算法和性能之间权衡?团队用了半年多时间来寻找答案。“负责算法的人员不了解产品,负责产品的又不擅长算法,双方不断地沟通协商。最终解决方法主要是优化预处理方案,加入运动跟踪等技术。此外,还要优化视频搜索算法。”

◆以图搜视频

15年年底,团队预处理2000小时视频的时间缩短至5~6个小时。“今年计划将处理速度再提升10~20倍。”

最终的产品形态为以图搜视频的综合解决方式,基于公有云或私有云。“服务功能包括以图搜图、以图搜视频、以视频搜视频。”

半年后,经朋友介绍,一家上市公司找过魏京京,想要体验产品。对方拿着大量图像、视频数据在图麟的系统里做测试。

结果以图搜图和以图搜视频的准确率都是100%,即使把图像打了马赛克、做了滤镜等附加噪声,依然不影响准确率。“对他们来说,是很惊讶的。”魏京京说。

随后,陆续有6家企业在试用该解决方案。比如媒体资产类公司,他们会把图片授权给客户试用,但无法判断客户使用的所有图片是否全部经过授权。“如果利用文字搜索的话,需要花费大量的人工。”

◆以图搜视频在公安行业的应用

此外,有三家公安机关正在试用产品。此前,刑侦人员通过监控视频要查找某一辆特定的车,需要用人眼去识别车牌等信息。在图麟的解决方案中,会截取车身颜色、环保标签、划痕等细微细节信息搜索。

用于工业机器视觉

除了以图搜视频外,魏京京将图像处理技术用于工业机器视觉。比如工厂要聘请大量的质检工人,检查生产手机的尺寸,屏幕、元器件的大小等,判断是良品还是次品,确保最终出厂产品的良品率。

由此,质检质量尤为重要。暴走漫画曾打造出虚拟的质检工形象——富士康质检员张全蛋,火爆一时。而魏京京要用机器取代“张全蛋”们。

◆质检机器实体

“质检的核心是图像处理、识别,人眼并不能保证始终在同一标准下质检,且质检员的工作状态也会影响质检结果。”

工业机器视觉方向,魏京京前面摆着两个标杆,日本的基恩士(KEYENCE)和美国的康耐视(COGNEX)。

◆质检机器示意图

“之前国内的大部分机器视觉公司,都是采购基恩士或康耐视的成熟视觉解决方案搭建产品,而图麟没有用任何国外现成的技术,从最底层开始构建自己的视觉解决方案。”

去年项目启动时,魏京京找到一家合作方进行项目研究。可几个月过去,进展缓慢。

“主要是我们对机器视觉的硬件不熟悉,而硬件和软件之间存在很强的关联性。获取图像的质量会严重影响质检结果,之前是他们给什么图像我们就用什么,只在后端优化算法效果甚微。”

他感叹,“此前没有接触过制造行业,完全没概念。后期为主动了解一线工厂的实际情况,我下工厂超过10次。”

他决定让团队参与硬件获取图像环节。“必须软硬结合。”

影响图像获取的因素诸多,如镜头、光源、工业相机等。“光源就是几千种,要考虑如何组合。”

又花费约半年时间,团队把硬件部分一一梳理,最终获取质量合格的图像。“来回地组装、搭配各种硬件。”

前端摸顺之后,搭配后端图像处理算法,机器质检质量达到稳定。已有一家工厂与其合作质检手机触摸屏。“一台质检机器可替代4~5名工人。”

此外,魏京京还设下了第三个方向,为企业客户提供图像处理云服务,包括识别、搜索、运动跟踪等。“比如一些App要处理或搜索海量图片或视频,又没有专门的技术人员。我们可以提供SaaS系统或API接口。”

年初,图麟的云服务已搭建完成,如今已有三家企业客户在使用,如泰康保险等。

筹备一年多,接下来,魏京京将拿出精力用于产品推广。

此外,魏京京已在布局面向C端的产品,如智能机器人、辅助驾驶设备等。关于产品细节,他表示暂时保密。

“我们已经联系了海外高校资源,聘请了全球领域多名在计算机视觉、运动控制、自动驾驶领域的专家作为图麟科技的技术顾问,研讨产品方向。”

文章版权声明 1 本网站名称:理财笔记
2 本站永久网址:www.safeak.cn
3 本文内容由互联网用户自发贡献,该文观点及内容相关仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系: QQ853250197进行删除处理。

发表回复