NDIDIA
英伟达
英伟达开发者社区:GPU应用开发启蒙园地
侯宇涛
GPU市场应用总监
深度学习
- Nvidia SDK& Tool
- 开发者社区
- DIGITS
应用:
- 各种游戏方面的
- Deep Learning
- VR
- Design & Visualization
社区
nvidia中国
nvidia developer china
DIGITS:
- 数据集处理
- 深度神经网络配置
- 过程监控
- 可视化结果
NVIDIA 开发者社区经理
何琨
Development + Deployment
- Training:训练
- Desktop
- Cloud
- Data Center
- Inference:推理
- Data Center
- Self-Driving Cars
- Intelligent Machines
Computer Networks
- Libraries
- cuBLAS
- cuSPASE
- cuRAND
- NPP
- cuSOLVER
- NCCL
- cuFFT
- nvGRAPH
- Directives
- PGI
- OpenACC
- Deep Learning
- cuDNN
- TensorRT
- NVIDIA Digits
- DeepStream SDK
- Language Integrations
- C
- C++
- Python
- Fortran
Nvidia GPU:
- GeForce
- Tesla
- Tegra?
- 。。。
一般配置Configuration:
- 硬件:
- CPU:Xeon
- Memory:32-64GB
- Disk: > 1TB
- GPU:Compute Capability > 3.5
- GPU:
- Tesla K40/K60/K80
- Tesla M40/M60
- Tesla P4/P40
- Tesla V100
- Geforce 1060/1070/1080/1080TI
- TITAN/TitanV
- Tegra K1/X1/X2/Xavier
- 可以跑完整的Ubuntu等系统
- 软件:
- System: Ubuntu, Redhat, Fedora, OpenSUSE, RHEL, CentOS
- GPU Driver
- CUDA 9.0
- 几乎所有的Nvidia的其他工具都是基于CUDA的
- 很多其他工具,比如OpenCV也是要求CUDA(去利用GPU的?)
- CUDNN, CUBLAS, Tensorflow, cuSparse, cuFFT, DeepStream, Nvidia, DIGITS
- Caffe Caffe2 TensorFlow, PyTorch MXNet, Matlab, Chainer,…
根据你的需求决定:具体需要什么级别的CPU,内存,GPU等
很多都是矩阵操作,比如相乘
GPU应用领域:
- Telas:Data Center
- GeForce:Desktop
内核个数:
- CPU:常见比如4,8,12等
- GPU:常见比如512个
A Complete DL Platform
- Manage
- 给定样本
- Train
- 用Digits -》 Caffe,Torch等框架去训练
- Deploy
- GPU Inference Engine
- 开发环境:资源一般很丰富
- 部署环境:资源往往很有限
- 受限于 尺寸,功耗等等,计算能力有限,其他资源有限
- Nvidia Deep Learning SDK and CUDA
- Caffe
- Caffe2
- Chainer
- Cognitive Toolkit
- Matlab
- PaddlePaddle
- 。。。
- 各种
- cuDNN
- TensorRT
- 推理,小阶段产品
- DeepStream SDK (2.0)
- (音视频流)编解码期间,即可识别出你要的对象
- cuBLAS
- cuSPARSE
- NCCL
都是基于CUDA
最新CUDA 9.2
Nvidia DIGITS
- Interactive Deep Learning GPU Training System
直接用:
浏览器,去操作,远程深度学习的服务器的服务
包括各种管理和监控
还支持自定义
TensorRT:Work Flow
一般是处理4维的数据
比如:ncwh
- n=number:多少张图片
- c=channel:信道?
- w=width:宽
- h=height:高
支持:直接做推理
- 可以不用TensorFlow,Caffe等
比如:
识别图片,至少需要做
- praser:解析器
- builder:引擎=可执行程序
- 输入:训练好的模型
- 输出:engine,可执行程序
演示:
(阿里云服务器,安装好了DIGITS)
tensorrt.cn:5000
问:此系统用于训练非图片,比如信号存到excel,是否支持?
答:要自己normalize后,变成图片这种才能支持。
问:生成对抗网络GAN是否支持?
答:支持。
问:PC机上的程序,如何移植到TS库上?
答:训练模型和网络参数,如果都设置好了,就可以了?
NVIDIA Tesla专业计算卡优势
陈晓翰? 吉浦迅 CEO?
- 之前:4个月
- TensorRT:1个月
- DeepStream:半天
Tesla专业计算卡:
- 简称:TS卡
- TS1,TS2
- 特点
- 一般人:贵
- 专业:
- 专业元器件
- 性能更好
- 单精度
- 双精度
- ECC:准确度,持久度
下面介绍贵在什么地方:
- GPU显卡本身性能:通常以 单精度 为基准
- 高性能计算:双精度
- 深度学习:半精度
- 显存数量+带宽+传输模式:
- 单GPU计算:CPU《-》GPU
- 多GPU计算(包括集群):GPU《-》GPU
- DMA引擎数量、支持GPU Direct技术、Hyper-Q
- 计算模型限制
- GeForce系列:
- ECC校验:不支持
- Tesla系列:(含TitanV)
- ECC校验:支持
- 确保数据正确与执行稳定
CUDA C Programming Guide
吉浦迅科技: GPU推广,Nvidia的合作伙伴
问题:
(1)NLP中如何实现深度学习实现从现有的普通的英文对话中学习,具有一定智能,实现自由对话?
吉浦迅科技
微信公众号:gpusolution
功能介绍:在这里,你可以及时了解NVIDIA GPU的行业资讯、最新进展、应用场景和各项功能。参与GPU世界举办的精彩活动,体验人工智能的未来生活。
【讲座通知】如何构建高效的深度学习开发环境
深度学习已确认为进入AI殿堂的入口,对于要创建深度学习系统的企业和科研单位来说,如何快速入门、如何从GPU中获得最大计算收益等成为了他们考虑的因素。
NVIDIA作为人工智能领域技术领导厂商,诚挚邀请您参与6月26日于苏州工业园区西交利物浦大学的技术交流会,由NVIDIA中国区开发者社区经理等人,详细讲解企业或科研单位如何构建AI开发系统、如何搭建NVIDIA深度学习开发环境(TensorRT、cuDNN、DIGITS、CUDA等),以最大限度地提高数据科研人员的工作效率,除此之外,还将面对面交流实际应用时的经验分享。
日期:2018年6月26日
时间:下午13:30~16:30
地点:西交利物浦大学(江苏省苏州市工业园区仁爱路111号)北校区中心楼1106室
议程:
13:30 ~ 13:50报到
14:00 ~ 14:15 NVIDIA GPU应用市场总监侯宇涛
14:15 ~ 15:20 NVIDIA 开发者社区经理何 琨
15:20 ~ 15:30 休息时间
15:30 ~ 15:50 经验分享-NVIDIA Tesla专业计算卡优势
15:50 ~ 16:30QA时间
转载请注明:在路上 » 【讲座通知】如何构建高效的深度学习开发环境