您的位置:皇家国际官网 > 通讯 > 短时间内可甄别海量数据真伪,助力视频产业加

短时间内可甄别海量数据真伪,助力视频产业加

2019-11-02 20:25

皇家国际官网 1

记者21日从中科创星获悉,多模态AI生成信息智能检测应用小程序“星眼鉴”已发布,这款反AI智能工具可以高效鉴别出用户上传的视频或图像是否为AI生成的伪造数据。

原文链接:点击打开链接

10月16日晚,专注于军事领域智能化的智慧防务服务商——南京摄星智能科技有限公司,发布了全国首款分别面向B端和C端的多模态AI生成信息智能检测应用小程序——星眼鉴。不仅能够几秒就高效鉴别出用户上传的视频/图像是否为AI生成的伪造数据,还能自动生成量化的检测报告,精准的分析出数据的难辨等级和合成率。

AI技术正在被大量应用于场景中,而人脸识别技术为人们的生活带来便利和乐趣的同时,其风险性也日益突出。比如,利用AI进行“逃逸攻击”“对抗样本攻击”和“数据污染攻击”的案例逐渐增多。

摘要: 结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。

随着深度学习技术的发展,AI技术被应用在大量场景中。其中,应用最为广泛的技术之一,人脸识别为我们的生活带来了许多实实在在的便利和乐趣。但同时,技术滥用和信息管理的不规范下,利用AI进行“逃逸攻击”、“对抗样本攻击”和“数据污染攻击”的案例逐渐增多。各种风险难以估量,甚至一旦被不法分子利用,更是会引发恶性事件。

提升反AI安全防务迫在眉睫。南京摄星智能创始人兼CEO杨理想介绍,基于自主研发的人工智能技术,他们开发出反AI检测程序。“星眼鉴”分别面向B端和C端,其中,B端版本提供更全面和更高级的服务,用户可将其用于各种侦测、安防场景;C端加入用户猜测、评价机器判断结果对比、报告图片分享至朋友圈等互动性娱乐设计。

写在前面

近期,阿里视频云推出了智能视频解决方案,依托阿里云强大的计算能力和多媒体人工智能技术,可以提高视频审核、处理的效率,助力视频产业加速。

近一两年来,无论是技术咖开发带有“一键脱衣”功能应用,将色情主角换成女明星的脸;还是Twitter上“奥巴马吐槽特朗普是笨蛋”的假视频所引起的一系列跟风;甚至最近发生的诈骗团伙利用AI合成语音技术从英国一家公司骗走22万欧元的案例,以及不久之前一夜爆火的换脸APP“ZAO”,其“以假乱真”的程度也引发了网友的集体担忧……这些频出的恶性事件和潜在隐患都让反AI安全防务迫在眉睫。

杨理想介绍,用户在上传视频或图像后,后台会基于深度学习的智能检测算法,对视频中的每一帧图像进行人脸检测和特征学习,包括人的生理特征、面部分辨率以及脸部运动等,将学习到的特征深度融合,形成真伪视频的判断结论。“经检测,该模型在反AI检测准确率已经达到95%以上。”他说。

行业背景

根据行业报告显示,2017上半年中国在线视频行业用户规模已经接近6亿,而2017年在线视频市场规模已经达到了503.3亿元,视频行业进入了用户规模稳中有升、市场规模快速扩大的阶段。其中直播、短视频等视频形态的崛起和大范围的行业交叉分布也带动了PGC、UGC的内容发展,海量的视频等多媒体数据随之产生。

市场的繁荣也促进了技术进步,视频云市场风起云涌,大量厂商加入角逐大军,提供从一站式音视频云服务到垂直细分技术服务等各类解决方案。平台方也希望通过推陈出新的技术来重塑视频的观看体验,从而沉淀更多用户。这其中VR、AR、AI技术也走进视频,开始为整个行业带来创新。尤其是行业关注度非常高的人工智能技术,它是可以基于云计算和人工智能模块来对海量视频数据进行分析、研究和处理。那么人工智能技术可以在视频领域应用于哪些场景呢?

星眼鉴是南京摄星智能基于其后台强大的军智内核平台,以自主研发的人工智能技术,快速开发出的反AI检测程序。尽管整个项目历时不到一周,但产品不仅做到了准确率可达到企业级要求的鉴别侦测,比如B端版本提供更全面和更高级的服务,用户可将其用于各种侦测、安防场景;更因为对C端开放,简约版本还加入了如用户猜测、评价机器判断结果的对比、将报告图片分享到朋友圈等的互动性娱乐设计,旨在成为最有趣、最好用的反AI智能工具。

据介绍,南京摄星智能的研发团队来自北京大学、中国科学院、西安交通大学等高校或机构,掌握的核心技术包括自然语言处理、机器视觉、语音识别等方向。此前,团队结合其对多模态数据理解、样本对抗等方法,自主研发出反AI检测算法框架,形成了反AI检测体系,军智内核平台已落地多个合作伙伴。

需求场景

摄星CEO杨理想博士

“这套内核是在军工领域深耕的成果,比如智能反AI检测体系,支持多模态虚假AI数据的检测。”杨理想说,经过技术脱敏处理,衍生出“星眼鉴”。他们计划陆续推出语音、文本等类型信息的反AI生成鉴别工具。

视频智能审核需求

网络发展也带来了内容的肆意泛滥,淫秽色情、暴恐、恐怖等不良视频影响了和谐的网络氛围,也给平台方带来了很多隐患。从2014年快播被关停至今,多家在线视频、直播、短视频平台都受到了处罚、整改、关停等监管措施。稍有不慎,平台方就会置身于违规违法的边缘。随着UGC短视频的爆发,传统的人工审核方式效率低下,很难满足快速、准确的审核海量的视频内容的需求,利用AI技术来提升视频数据的审核效率与精准度是一个新的方向。

据南京摄星智能CEO杨理想介绍,星眼鉴以小程序的形式推出,使用简单方便。和之前的“换脸APP”一样,用户在上传视频/图像后,后台会以其基于深度学习的智能检测算法,对视频中的每一帧图像进行人脸检测和特征学习,包括人的生理特征、面部分辨率以及脸部运动等,将学习到的特征深度融合,形成真伪视频的判断结论,实现端到端的自动鉴别,具有较好的泛化能力。经检测,该模型在反AI检测准确率已经达到95%以上。

视频内容理解需求

海量的视频源源不断的产生,如何将视频推给最合适的人群是一个巨大的挑战。在大多数情况下,为了方便用户的选择和观看,在线视频网站的视频是需要分类管理的,有的短视频APP还可以按照用户的喜好标签来推送指定的小视频,以提高视频点击率,优化用户体验,这一切都需要对视频数据进行最初的理解和判断。除此之外,在视频监控场景中,安防管控、人流监控等动作都是以视频理解技术为支撑的。

作为一家致力于防务AI技术研究的公司,南京摄星智能构建了多模态知识图谱和多源目标研判等在垂直领域的算法体系,此前已完成多个B端大型项目。核心技术包括自然语言处理、机器视觉、语音识别等方向,团队结合其对多模态数据理解、样本对抗等方法,自主研发了反AI检测算法框架,形成了业界先进的反AI检测体系,在内部多模态测试数据集上的实际准确率,超过99%。目前,其技术和产品都经过了市场的验证,军智内核平台已落地多个大型合作伙伴,在军事领域具有极高的影响力和口碑。

视频智能编辑需求

在我们浏览直播APP的时候,经常会被漂亮的封面图所吸引,从而进入直播间。有研究称最受用户喜欢的视频长度在2.1分钟左右,那么如何从2分钟的视频内选取最精华的缩影作为首图,是非常重要的提升用户点击率的手段。通常,平台方会通过编辑操作或提示用户选择一张效果最好的截图作为封面,但是这个办法效果并不理想。而且在广电新闻行业,也经常会出现需要将大段新闻拆成单条短新闻的业务场景,人工操作效率和准确率并不理想。利用AI技术,对视频进行编辑,就可以解决这个问题。

上传AI生成照片后星眼鉴给出的检测报告

视频版权保护需求

网络盗版一直都是在线视频行业的一颗毒瘤,不仅影响了版权方的利益,也不利于行业健康的发展。在线教育、金融财经分析、版权剧等平台方都知道,如何对视频排重、相似度判断、盗版鉴定和防止侵权是非常重要的。目前PGC短视频盛行,那平台方对这些视频进行内容保护,可以鼓励原创性,推动视频内容的蓬勃发展。视频AI技术可以抓取视频数据进行鉴别,防止自有版权内容被侵权。

关于此次小程序的推出,杨理想表示,南京摄星智能有一套完整的军智内核,技术脱敏处理后,To C产品可顺手而快速的衍生出来。这套内核是其在军工领域深耕的成果,比如智能反AI检测体系,支持多模态虚假AI数据的检测,在国防防务领域的反AI检测体系可深入应用。本次产品开发是基于其在军事领域的高度认可和完整体系的技术架构,为C端用户提供价值。

视频AI大图

皇家国际官网 2

根据用户的需求场景,阿里云推出了视频AI解决方案。上图是通过基础层、技术层、应用层、业务层四个层面来解读了视频AI解决方案的能力。在最底层,也就是基础层,主要是做算法的准备,保障算法的效率和效果,包括数据、离线训练、在线服务、移动端、高性能计算等等;第二层是技术层,这一层是算法的技术实现,分为四类:第一是视频检索,可以实现视频指纹、时序表征、视频索引。第二是视频理解,可以对视频进行识别、分类、语义分割和目标跟踪。第三是视频编辑,实现结构化分析、内容编解码和内容生成。第四是多模态分析,实现OCR/ASR/Face/Motion和跨媒体理解;第三层是应用层,是在搜索、识别、交互、编辑、监控这五类典型场景中,进行功能的封装;最上层是业务层,在这一层中,我们结合客户的实际业务,进行功能的提供,比如视频内容审核和视频版权保护的功能可以帮助安全业务更准确、高效的开展。

结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。

皇家国际官网 3

据了解,南京摄星智能此前曾获得数千万级的天使轮融资,投资方包括中科创星和联想之星,目前正在进行亿级规模的Pre-A轮融资。创始人兼CEO杨理想,南京大学计算机系本硕博毕业,目前是南理工副教授,研究方向为机器学习与自然语言处理,有多个国家级重点大型项目经验。其他核心团队成员,均来自北大、中科院、南大、华科、西交大等知名高校,并拥有华为、BAT、微软、网易等国内外一线企业和大型军工集团的工作经验,有深厚的技术实力和广泛的业务背景渠道。目前,南京摄星智能正处于高速发展和快速扩张中,欢迎广大AI算法方向和工程项目等的人才加入,共同为防务领域提供智能产品和解决方案。

功能与应用

最后,杨理想表示,近年来,AI技术在各行各业都掀起了智能化革命,智慧防务,尤其在国防安全方面,是AI最有价值和最需要落地应用的领域。在军事和民用领域里,随着AI技术的稳步提升,短时间内产生大量的伪造数据,形成巨大的情报、研判失误或者带动舆论导向,都将给各方带来巨大的威胁。如何利用反AI技术,在短时间内快速甄别出海量数据的真伪,同时能够反侦测,形成新的策略对应对AI技术的造假,是南京摄星智能一直在做的事情。除了目前发布的视频/图像鉴别小程序外,此后还将陆续推出语音、文本等类型信息的反AI生成鉴别工具。

视频智能审核

视频智能审核依托阿里集团海量场景数据,具备高效数据流转体系,历经双11保障考验,可以对色情、暴恐、涉政、广告内容、二维码、无意义的视频进行识别,同时能够识别性暗示等未明显露点的色情行为和gif鉴黄,保证审核的高准确度。

功能实现了从产品接入、测试、策略管理、运营监控、到审核打标及模型/规则动态优化的闭环能力支撑。在通用能力满足常用场景的基础上,支持对高级能力的定制,可根据用户管控尺度进行灵活调整和快速迭代。为不同场景(视频/直播/社交/电商)提供视频内容安全审核的整套完整解决方案。

相对于传统的10万张/人/天的人工效率,智能审核可以达到10亿张/天的超高处理效率,同时大大节省了人力,成本得以压缩。

视频内容理解

在视频内容理解这个阶段,阿里云提供视觉、语音、文本、运动多模态信息分析技术,全方位理解视频,可以把非结构化的内容进行结构化处理。主要功能体现在以下五个方面。

1. 视频分类

通过视频多模态特征分析,自动对视频进行类目分类,提高视频分发、管理的效率。

皇家国际官网 4

2. 语音识别

将语音转成文字的服务,能支持中文、普通话、英文的语音识别。可应用于实时会议记录、视频直播实时字幕等场景。

其中一个典型的应用场景是会议内容的实时转写,法庭庭审识别。智能语音识别技术将参会人所说的每一句话实时转写成文字并进行存储,依靠人工智能技术替代了人工记录会议内容,法庭庭审中取代书记员。另一个典型应用场景是视频直播实时字幕,现场演讲、直播场景下,将视频中的音频实时转写成字幕展示。相应速度极快,几乎与直播同步,提升了视听体验。

3. 视频标签

分析视频中图像、文字、语音、人脸、物体、行为等多模态信息,自动为视频打多维度标签。
皇家国际官网 5

这个功能的应用场景包括:视频的个性化推荐和视频检索,基于视频内容,可以实现快速给视频打多维度标签,并在新增热门标签时快速补充,解决新视频标签缺失和新热门标签缺失的问题。

4. 人脸识别

人脸识别(Facial Recognition)是提供视频帧和图像中人脸分析的服务,包括人脸检测、人脸特征提取、人脸关键点定位、人脸检索等服务。可应用于人脸美化、人脸识别和认证、大规模人脸检索、照片管理等场景。
皇家国际官网 6

人脸识别的功能应用场景非常广泛,包括会场、大厦等安防管控中的大规模人脸检索,零售行业通过人流监控分析货品摆放合理性,出勤率统计,照片管理与智能分类,娱乐美颜等等方面。

皇家国际官网,5. 目标检测

目标检测(Object Detection)是基于深度学习的目标检测技术,准确找出给定视频的视频帧中多目标及位置,并给出每个目标的具体类别。应用场景包括:第一,可以检测并识别特定类目的目标,对特定目标做有趣的交互;第二,可以识别视频中的目标位置及目标分类,为视频提供丰富的分类标签,可用于个性化推荐和视频搜索;第三,在目标检测后,可以对目标进行实时跟踪定位,精确地分割出目标的时域片段,用于智能监控系统、流量控制系统等。举个最实际的例子,在淘宝商家上传视频过程中,可以自动检测商品并跟踪,在前端展示的时候,感兴趣的用户点击锚点可以直接进入商品页。

皇家国际官网 7

视频智能编辑

视频编辑是为了更好的输出内容,提升用户点击率,优化用户体验。在这个环节,人工智能可以让视频千人千面,结合用户行为和封面图属性,同一个视频向不同用户展示不同的画面。并且支持类目定制,结合行业运营经验,定制不同的封面图生成模型。同时,视频编辑功能具有高精准度,利用多项AI技术,对视频进行全方位理解后,甄别出最优、最高精准度的画面或片段。

1. 视频首图

通过对视频内容的理解结合画面美学,选出最优的关键帧或关键片段作为视频封面图。

皇家国际官网 8

这个功能非常适用于UGC视频封面,用户上传的视频,使用智能生成封面图服务,为海量视频自动生成具有代表性的高质量封面图,提升用户视觉体验,展示在 feed 流、视频搜索结果页等场景。同时,在长视频场景中,通过智能生成封面图服务,截取精彩片段作为视频看点,利用动态展示方式吸引用户并快速展示精彩内容。

2. 视频摘要

视频摘要服务(Video Summary Service)根据视频内容智能提取最能代表视频的截图组成GIF,作为视频的摘要概括。应用场景同视频首图。

3. 视频Highlight

视频摘要服务(Video Summary Service)根据视频内容智能提取最能代表视频的5s视频,作为视频的highlight。应用场景同视频首图。

4. 新闻拆条

将新闻节目以单条新闻为单元自动化分割的服务,有助于后期对单条新闻的播放推送和加工处理,为新闻推送生产素材,并且可以灵活对某个或某类新闻做后期加工处理。

皇家国际官网 9

视频版权保护

阿里云人工智能通过长时间调研选型验证,如今已能够识别多种视频抄袭手段,保证视频查重结果的精准性。同时支持多分辨率多视频格式,亿级视频查重及相似度实时结果返回、视频入库、删除等操作。可用于如广告分成等多种业务场景。

1. 视频指纹

视频指纹是一种软件识别、提取、压缩视频技术,可以产生唯一“指纹”代表视频文件进行视频查找。在视频查重场景中,视频通过视频指纹在样本库中比对,召回相同/相似视频,进行入库、排序控制。

同时,视频指纹可对自有版权的视频资源,从公网抓取视频数据鉴别,防止自有版权内容被侵权,保护版权视频安全,并对原创视频、剪辑视频、自媒体再造视频进行识别,检索成分库召回认领视频,支撑广告分成业务生态。

2. 相似性计算

相似性技术可以生成给定视频的定长特征,计算视频之间相似度。可应用于基于视频内容推荐相关视频,个性化视频等场景,提高视频点击转化,也可以用于视频去重业务场景。

3. 跨媒体检索

支持对文本、语音、图像、视频等不同多媒体种类进行内容统一特征检索。

效果展示及使用

我们在线上的视频AI产品专题页和【视网膜】页面中,可以看到阿里云视频AI的能力体现。

以线上已经有的示例视频为例,用户可以对人物识别、视频分类、标签识别、语音识别、文字识别(OCR)、视频审核、智能封面等功能进行体验。

下图是智能封面功能,人工智能为视频选择了最能代表视频内容的一帧图片。
皇家国际官网 10

下图是语音识别功能将功守道电影中的精彩片段里的音频别出来。
皇家国际官网 11

在视网膜系统中,我们看到一段热播剧猎场的视频片段,示例视频中的明星人物被完整无误的识别出来,同时,该人物在视频中出现的位置也被标记出来,点击标记点,即可直接跳转到人物的片段,这就是人物识别功能。
皇家国际官网 12

整个视频被分解出无数标签,点击某个标签,直接跳转到对应的画面,这是视频标签。
皇家国际官网 13

云栖大会的视频中,除了嘉宾演讲的语音被实时识别和显示,视频中的字幕、现场PPT等文字信息都也被识别出来,也就是OCR。
皇家国际官网 14

目前,阿里云视频AI已经开放,点击了解产品详情及申请:

点击登录视网膜:

加入阿里云视频云AI-业务咨询群,申请试用

皇家国际官网 15

本文由皇家国际官网发布于通讯,转载请注明出处:短时间内可甄别海量数据真伪,助力视频产业加

关键词: 皇家国际官网