2024年3月31日
Nvidia DOCA-芯片上的数据中心软硬件架构简介 术语 DOCA: Data Center-on-a-Chip Architecture, 芯片上的数据中心架构 简介 DOCA 代表片上数据中心架构,基本上,它是 NVIDIA 的 DPU 软件开发平台。 DOCA 包括支持 DPU 加速的库、驱动程序和运行时。 DOCA 代码是用 C 编写的,一种思考方式是 DOCA 之于 DPU,就像 CUDA 之于 GPU 一样 NVIDIA DOCA™ SDK 使开发人员能够利用行业标准 API……
阅读全文
2024年1月9日
Linux内核-驱动技术杂谈 简介 Linux进程状态机 内存管理 网络架构 arm引导 参考 Linux设备驱动开发详解(基于4.0内核-宋宝华): https://e.dangdang.com/pc/reader/index.html?id=1900471094 晓兵 AI吐槽工具(小喇叭): https://chattoyou.cn 博客: https://logread.cn | https://blog.csdn.net/ssbandjl | https://cloud.tencent.com/developer/user/5060293/articles weixin: ssbandjl 公众号: 云原生云……
阅读全文
2024年1月7日
Beegfs 简介 BeeGFS 包含两个内置基准测试工具,可以分别帮助表征或评估网络或存储NetBench 和 StorageBench。当启用NetBench模式时,服务器将丢弃收到的写请求而不是写入数据。类似地,在读取请求的情况下,不会从底层文件系统读取,而是仅将内存缓冲区发送到客户端。NetBench……
阅读全文
2024年1月6日
Nvidia网络技术-端到端网络解决方案 术语 performance per watt 每瓦性能 适用于现代工作负载的加速网络-强大、安全的基础设施的蓝图 简介 每年出货的 3000 万台数据中心服务器中,有三分之一用于运行软件定义的数据中心堆栈。企业需要发展其网络基础设施,以支持现代数据中心工作负载导致的呈指数级增长的数据处理量。……
阅读全文
2024年1月6日
Nvidia 迈络思 OFED GPU直接RDMA 简介 GPU-GPU 间通信的最新进展是 GPUDirect RDMA。该技术在 GPU 内存与 NVIDIA 网络适配器设备之间提供直接的 P2P(点对点)数据路径。这显着减少了 GPU-GPU 通信延迟,并完全卸载了 CPU,将其从网络上的所有 GPU-GPU 通信中移除。GPU Direct 利用 NVIDIA 网络适配器的 PeerDirect RDMA 和 PeerDirect ASYNC™ 功能(异步远端直接通信……
阅读全文
2023年12月19日
优化 RDMA 代码的建议和技巧-rdma性能优化技巧-避坑指南-RDMA资源 RDMA 被用在很多地方,主要是因为它可以实现高性能。在这篇文章中,我将提供有关如何从多个方面优化 RDMA 代码的建议和技巧 简单的科普下RDMA 什么是RDMA? DMA 代表直接内存访问。这意味着应用程序可以在 CPU 干预的情况下直接访问(读……
阅读全文
2023年12月15日
VirtIO简介 简介 技术, Linux内核开发 2022 年 5 月 24 日 | 阅读时间 33 分钟 (https://blogs.oracle.com/authors/jonah-palmer) 概述: 在本文档中,我们将从技术角度了解 VirtIO 的基础知识,并深入探讨其一些关键领域。这篇 VirtIO 简介是在假设读者几乎没有 VirtIO 工作知识的情况下编写的,但对于那些已经熟悉 VirtIO 的人来说,这也应该是一个有用的复习。 我们将首先了解 VirtIO……
阅读全文
2023年10月6日
统一通信 X(UCX) 实现高性能便携式网络加速-UCX入门教程HOTI2022 UCX - 有史以来最好的通信库 UCX参考链接 官网: https://openucx.org/ 官方文档: https://openucx.readthedocs.io/en/master/ 设计文档及设计思想(以传输层为例): https://github.com/openucx/ucx/wiki/UCT-Design 项目主页: https://github.com/openucx/ucx 观看 SC'19 会议上的 UCX 演示,了解有关 UCX 及其最新发展状况的更多信息: https://www.youtube.com/watch?v=H2d1CkGXJ64 演讲: https://ucfconsortium.org/presentations/ 视频链接: https://www.youtube.com/watch?v=Yv9nW0Qyjys&t=2713s 术语 UCF Unified Communication Framework 统一通信框架……
阅读全文
2023年10月5日
DAOS Mercury(HG) Libfabric(OFI) RDMA 分层verbs接口调用详解 简介 参考之前的分享中, DAOS与RDMA分层关系如下图, DAOS引擎 -> CART(RPC/大块数据/集合RPC请求) -> Mercury(HG: RPC注册/回调/RPC操作/预期/非预期消息/大块消息/轮训/阻塞/网络抽象等) -> Libfabric(网络抽象层,对rxm,r……
阅读全文
2023年9月24日
Intel Open Fabrics Interfaces Libfabric Tutorial 英特尔开放结构接口 Libfabric 教程 rdma verbs network gpu panda hpc ai 简介 本文介绍了libfabric的基本教程, 以及常见代码示例, 包含tcp_socket, libfabric, gpu, dma等代码和示例, 内容基于intel专家的的视频和个人理解, 欢迎一起交流高性能存储, 分布式存储, 网络, rdma等技术 HOTI 热门互联网络技术 视……
阅读全文