perf性能分析(1) -- Intel VTune 配置与使用(1)
1. Intel VTune 配置 1.1 使能 ptrace 使能进程跟踪 (ptrace) 功能 (attach ID),以便 VTune 可以监控到进程的运行情况。 sudo vim /etc/sysctl.d/10-ptrace.conf # set kernel.yama.ptrace_scope = 0 # 使配置生效 sudo sysctl --system -a -p...
1. Intel VTune 配置 1.1 使能 ptrace 使能进程跟踪 (ptrace) 功能 (attach ID),以便 VTune 可以监控到进程的运行情况。 sudo vim /etc/sysctl.d/10-ptrace.conf # set kernel.yama.ptrace_scope = 0 # 使配置生效 sudo sysctl --system -a -p...
使用 BOOST_DLL_ALIAS 定义插件接口。 使用 import_alias 导入插件接口。 使用 creator / Factory 模式,提供创建插件实例的接口。 Demo Code: test_plugin_dll 1. 实现插件接口 1.1 DSO/DLL原型定义 class DIInterface { public: DIInterface()...
原作者 Linux Performance 原作者 github perf-tools pdf – Linux Performance Tools 中文翻译 pdf – Linux Performance Tools github – Performance Ninja Class ARMVirtualization: Performance and Archite...
STL 包含五种主要组件: 算法(algorithm):定义计算过程。 容器(container):管理一组内存位置。 迭代器(iterator):提供算法遍历容器的方法。 函数对象(function object):将函数封装在对象中,供其他组件使用。 适配器(adaptor):调整组件以提供不同的接口。 从实现来看还需要包含: 分配器(allocato...
C++11 新特性
1. clCreateBuffer 分配内存 创建 OpenCL 内存对象函数原型为: clCreateBuffer(cl_context, // 上下文 cl_mem_flags, // 内存对象的性质,见下表 size_t, // 内存对象数据块大小 void *, ...
pdf 文档 AMD_OpenCL_Programming_Optimization_Guide Arm Guide to OpenCL Programming NVIDIA_OpenCL_Best-Practices-Guide opencl-sdk_developer-guide-processor-graphics_2019.4 NVIDIA OpenCL SD...
1. Barrier 1.1 clEnqueueBarrierWithWaitList // Provided by CL_VERSION_1_2 cl_int clEnqueueBarrierWithWaitList( cl_command_queue command_queue, cl_uint num_events_in_wait_list, const c...
1. 平台模型 关键词: OpenCL Device CU – Compute Unit PE – Processing Element 2. 内存模型 github – OpenCL Guide –Memory Model 3. 执行模型 3.1 ...
# 远程分支与本地分支有不相关的提交,合并远程分支 git pull origin main --allow-unrelated-histories # 删除远程分之 git push origin --delete <branch_name> # 更新远程分支列表 git remote update origin --prune # 删除submodule # R...