腾讯云海外购

AI 人工智能

计算机视觉是将图像和视频转换成机器可理解的信号的主题。利用这些信号,程序员可以基于这种高级理解来进一步控制机器的行为。在许多计算机视觉任务中,图像分类是最基本的任务之一。它不仅可以用于许多实际产品中,例如Google Photo的标签和AI内容审核,而且还为许多更高级的视觉任务(例如物体检测和视频理解)打开了一扇门。自从深度学习的突破以来,由于该领域的快速变化,初学者经常发现它太笨拙,无法学习。与...本教程是教程是介绍如何使用Tensorflow实现的MTCNN和MobileFaceNet实现的人脸识别,并不介绍如何训练模型。关于如何训练MTCNN和MobileFaceNet,请阅读这两篇教程 MTCNN-Tensorflow 和 MobileFaceNet_TF ,这两个模型都是比较轻量的模型,所以就算这两个模型在CPU环境下也有比较好的预测速度,众所周知,笔者比较喜欢轻量级的模型,如何让我...

AI 人工智能

计算机视觉是将图像和视频转换成机器可理解的信号的主题。利用这些信号,程序员可以基于这种高级理解来进一步控制机器的行为。在许多计算机视觉任务中,图像分类是最基本的任务之一。它不仅可以用于许多实际产品中,例如Google Photo的标签和AI内容审核,而且还为许多更高级的视觉任务(例如物体检测和视频理解)打开了一扇门。自从深度学习的突破以来,由于该领域的快速变化,初学者经常发现它太笨拙,无法学习。与...本教程是教程是介绍如何使用Tensorflow实现的MTCNN和MobileFaceNet实现的人脸识别,并不介绍如何训练模型。关于如何训练MTCNN和MobileFaceNet,请阅读这两篇教程 MTCNN-Tensorflow 和 MobileFaceNet_TF ,这两个模型都是比较轻量的模型,所以就算这两个模型在CPU环境下也有比较好的预测速度,众所周知,笔者比较喜欢轻量级的模型,如何让我...

mtcnn算法网络结构简介

mtcnn算法网络结构简介

由于各种姿势,照明和遮挡,在不受限制的环境中进行人脸检测和对齐具有挑战性。 最近的研究表明,深度学习方法可以在这两项任务上取得令人印象深刻的性能。 在本文中,我们提出了一个深层级联的多任务框架,该框架利用它们之间的固有关联性来提高其性能。 特别是,我们的框架采用了三级精心设计的深层卷积网络的级联结构,这些网络以粗糙到精细的方式预测面部和界标的位置。 此外,在学习过程中,我们提出了一种新的在线硬样本......

基于MTCNN和MobileFaceNet实现的人脸识别

基于MTCNN和MobileFaceNet实现的人脸识别

本教程是教程是介绍如何使用Tensorflow实现的MTCNN和MobileFaceNet实现的人脸识别,并不介绍如何训练模型。关于如何训练MTCNN和MobileFaceNet,请阅读这两篇教程 MTCNN-Tensorflow 和 MobileFaceNet_TF ,这两个模型都是比较轻量的模型,所以就算这两个模型在CPU环境下也有比较好的预测速度,众所周知,笔者比较喜欢轻量级的模型,如何让我......

AlexNet做文档布局分析 (版面分析)&数据集

AlexNet做文档布局分析 (版面分析)&数据集

文档布局分析 (Document Layout Analysis) 是识别和分类文本文档的扫描图像中的感兴趣区域(RoI, Regions of Interest) 的过程。阅读系统需要从非文本区域分割文本区域,并按正确的阅读顺序排列。将文本正文,插图,数学符号和嵌入文档中的表格等不同区域(或块)的检测和标记称为几何布局分析。但文本区域在文档中扮演不同的逻辑角色(标题,标题,脚注等),这种语义标记......

收藏!深度学习10篇必看经典算法文章总结!

收藏!深度学习10篇必看经典算法文章总结!

计算机视觉是将图像和视频转换成机器可理解的信号的主题。利用这些信号,程序员可以基于这种高级理解来进一步控制机器的行为。在许多计算机视觉任务中,图像分类是最基本的任务之一。它不仅可以用于许多实际产品中,例如Google Photo的标签和AI内容审核,而且还为许多更高级的视觉任务(例如物体检测和视频理解)打开了一扇门。自从深度学习的突破以来,由于该领域的快速变化,初学者经常发现它太笨拙,无法学习。与......

SFFAI分享 | 马聪:NLP中的生成式预训练模型【附PPT与视频资料】

SFFAI分享 | 马聪:NLP中的生成式预训练模型【附PPT与视频资料】

本次分享将主要关注OpenAI在自然语言处理领域的两个预训练的工作GPT和GPT-2.0. 通过分析GPT的两个模型,重点探讨基于单向语言模型的NLP预训练过程对序列生成任务的作用以及利用预训练模型进行NLP多种任务无监督测试的方式和效果。GPT-2.0在机器翻译、问答系统、文本摘要等复杂任务上的性能展示出NLP预训练模型的强大功能以及其在自然语言序列生成中性能。 ...

CVPR:深度无监督跟踪

CVPR:深度无监督跟踪

本文提出了一种无监督的视觉跟踪方法。与使用大量带注释数据进行监督学习的现有方法不同,本文的CNN模型是在无监督的大规模无标签视频上进行训练的。动机是,强大的跟踪器在向前和向后预测中均应有效(即,跟踪器可以在连续帧中向前定位目标对象,并在第一个帧中回溯到其初始位置)。在Siameses相关过滤器网络上构建框架,该网络使用未标记的原始视频进行训练。同时提出了一种多帧验证方法和一种对成本敏感的损失,以促......

逆境逢生,可视化入局文旅产业,真能扭转局面打造文旅4.0?

逆境逢生,可视化入局文旅产业,真能扭转局面打造文旅4.0?

旅行是人们美好生活的调剂品,文旅产业也一直稳步向前发展。但由于今年疫情,旅游业在这一段时间内按下了“暂停键”,这对文旅产业产生多大的影响呢?有一组数据可供参考,据文化和旅游部数据中心统计,2019年春节景区接待的总人数是4.1亿人次,实现旅游收入5139亿元。而今年春节景区基本没有开门,处于零收入的状态。其次2020年清明小长假,本应该属于开启旅游热潮的季节,在清明假期全国国内接待4325万人次,......

精选论文 | 图神经网络时间节点【附打包下载】

精选论文 | 图神经网络时间节点【附打包下载】

最近,图神经网络广泛受到了各界的关注,基于图神经网络的模型和应用在异质图表示学习和零样本学习任务中取得了不错的效果。今天,两位主讲嘉宾为大家精选了图神经网络方法中的几个代表性模型以及零样本学习模型,和大家一起学习分享最新的研究进展。...

网络验证码的进化:从简单图文到无感验证

网络验证码的进化:从简单图文到无感验证

2018年全国硕士研究生招生考试预报名的第一天,成都大学的一名大四女生,在网上报名时,竟出现了“别考”字样的验证码,同时在验证码上边显示一行红字:您输入的用户名或密码有误。专门负责全国研究生报名的“中国研究生招生信息网”相关负责人回应说,验证码出现“别考”字样纯属巧合。...

学术资讯 | 关于“深度合成”技术的十个误解 (内含完整报告)

学术资讯 | 关于“深度合成”技术的十个误解 (内含完整报告)

随着人工智能时代的到来,下一代媒体将由人工智能驱动,人工智能可能给数字内容领域带来重塑。其中,可以实现换脸、人脸合成、语音合成、视频生成甚至数字虚拟人等诸多应用形式的“深度合成”技术,作为人工智能发展到一定阶段的产物,逐步从deepfake、deepnude等色情性的换脸视频的阴影中走了出来,迎来了商业化时代。AI虚拟主播、电商平台上的“数字试穿”、电影后期制作、社交产品中的人脸融合、合成人脸和合......

精选论文 | 人脸图像合成【附打包下载】

精选论文 | 人脸图像合成【附打包下载】

最近,人脸图像合成技术越来越受到社会各界的关注。人脸图像合成技术不仅可以实现“换脸”、“人脸编辑”等娱乐效果,而且能够有效提高人脸识别等技术的性能。今天,两位主讲嘉宾为大家精选了人脸图像合成中的几篇代表性的工作,和大家一起学习分享最新的研究进展。...