标准尺寸
半高半长单槽位(165.67mm x 68.9mm )
高算力、低功耗
整板峰值功耗仅为44W,算力可达 64TOPS@INT8、32TFLOPS@FP16
硬件编解码及加速引擎
支持 32路 1920*1080 30fps 的H.264/H.265 解码(1080P);支持16路1920*1080 30fps 的H.264/H.265 编码;内置硬件图像处理加速引擎:Resize、Mirror、Flip、Rotate、Crop、Padding、C2C
应用场景脑仿真和脑科学领域
支持类脑计算模型和大规模仿真,为脑科学邻域提供有利工具;助力构建更大、更快、更准的功能级脑仿真平台,推动脑科学与类脑算法的研究和类脑生态构建。
交通智能数据分析
为车牌识别、面部识别,违章状态识别,提供大数据分析,动向分析工具,应用于交通违章违规研判与目标车辆跟踪
金融智能数据分析
对财务报表、单据、卡证等材料提供高速自动识别工具,降低人员工作量,实现智能化处理。
城市智能化
提供对行人、车辆、可疑辨识物的实时分析算力工具,通过数据的实时分析与算法应用,为交通、安防、巡检等提供优化与效率升级方案。
零售智能化改造
通过本地算力部署配合功能设备,即可实现无人超市、无人货柜、机器人服务等零售业对于物体识别、计量、计费、安防等智能化改造工作。
工业智能改造升级
对工业现场工作环境采用中式或分布式管理,合理布局算力分布,可最大化对人员,机器设备、物料、工艺流程、环境等进行合理控制,智能监管,提升产线生产效率。
AI服务器市场
为AI服务器厂商提供高性能,灵活配置的AI扩展卡工具,对计算密集型应用提供足够的处理能力与更低的功耗,助力推动服务器产品算力加速,提供更加均衡高效的AI处理性能。
项目名称详细参数
计算单元数量 |
60 组计算单元 |
神经元数量 |
50 万个 |
神经突触 |
5000 万个 |
AI 算力 |
64TOPS@INT8;32TFLOPS@FP16 |
Resnet50 推理性能 |
2500 fps@FP16 |
能耗比 ( 突触操作数 /W) |
≥ 1TSops/W(单芯片) |
内存容量 |
16 GB |
内存峰值带宽 |
25.6 GB/s(单芯片) |
内存位宽 |
64 bit(单芯片) |
内存运行频率 |
1600 MHz |
图像预处能力 |
独特内置硬件图像处理加速引擎 |
编解码能力 |
支持 H.264、H.265、VP9、MPEG4 视频格式硬件解码, 最高视频解码性能 1000fps@1920*1080 支持 H.264、H.265 视频格式硬件编码,最高视频编码性 能 500fps@1920*1080 支持JPEG 图 像 硬 件 解 码, 最 高 图 像 解 码 性 能 600fps@1920*1080 支持JPEG 图 像 硬 件 编 码, 最 高 图 像 编 码 性 能 600fps@1920*1080
|
峰值功耗 |
44W |
外形尺寸 |
半高半长单槽位(165.67mm x 68.9mm ) |
接口 |
PCIe4.0 ×16 |
散热方式 |
被动散热 |
工作环境温度 |
0℃~ 55℃ |
操作系统 |
Ubuntu 18.04 |
支持框架 |
DNN:TensorFlow、Pytorch、PaddlePaddle、Caffe、MxNet、Keras、ONNX等
SNN:Nengo、Neuron等 |
支持模型 |
DNN:Resnet、Inception、VGG、Mobilenet、Yolo、SSD、Squeezenet、Senet、DenseNet、FullyConvolutionNet、Transformer、Bert等 SNN:Microcircuit等 |
编译工具 |
LyngorⓇ Compiler |