【Tengine】推理流程脑图【1】

推荐订阅源

Blog

Vulnerabilities – Threatpost

Apple Machine Learning Research

Google Online Security Blog

Security Archives - TechRepublic

Threatpost

Y Combinator Blog

Tailwind CSS Blog

CTFtime.org: upcoming CTF events

Arctic Wolf

Cyber Attacks, Cyber Crime and Cyber Security

小众软件

Recent Commits to openclaw:main

量子位

About on SuperTechFans

The Last Watchdog

雷峰网

CERT Recently Published Vulnerability Notes

Palo Alto Networks Blog

The Blog of Author Tim Ferriss

The Exploit Database - CXSecurity.com

Engineering at Meta

OpenAI News

Hacker News - Newest: "LLM"

Scott Helme

IT之家

Secure Thoughts

MongoDB | Blog

Lohrmann on Cybersecurity

博

博客园 - 司徒正美

Google DeepMind News

Пусть этот камень будет более крепким, чем человек

【琐记】烟火与尘埃【Triton】Triton实现矩阵乘【LLM推理加速】FlashAttention 【LLM推理加速】PagedAttention 【LLM推理加速】Online Softmax LLM基础知识【1】 Transformer模型【AI编译】LayerGroup Tiling Tile的疑惑和思考【AI编译】深度优先的Tile调度，万事大吉？【AI编译】多级流水线Tile调度策略【CUDA C++】GPU内存使用【3】【AI编译】Cache缓存地址映射【CUDA C++】GPU存储【2】【CUDA C++】GPU基本介绍【1】【00】0序章-不受欢迎的来客【转载】我来了——持续低熵【Halide】调度优化【2】【感想】写作进度报告5 【Halide】调度优化【1】【转载】北大中文男足战报2 【BYOC】TVM切分子图【转载】北大中文男足战报1 【AI编译】张量生命周期管理 SystemC 用寄存器同步建模方法【脉动阵列】脉动阵列类型【im2col】AScend conv accelerate 【感想】写作进度报告4 【BYOC】TVM添加自定义编译器 ccompiler 【感想】写作进度报告3 【Tengine】推理流程脑图【2】【NCNN】学习ncnn模型转换【编译器】使用llvm编译自定义语言【3】编译 object 【编译器】使用llvm编译自定义语言【2】转llvm IR 【编译器】使用llvm编译自定义语言【1】构建AST 【AI编译】如何进行内存分配【感想】写作进度报告2 【AI编译】layer-group之后如何tiling 【AI编译】如何进行layer-group 【量化】连续卷积层首尾量化的可行性【Gemm】内存对齐【gemm】Gemm计算加速【TVM】通过代码学习编译流程【5】FuseOps 【TVM】通过代码学习编译流程【6】CodeGen 【TVM】通过代码学习类【3.5】Pass 【TVM】通过代码学习编译流程【4】BuildRelay 【AI编译】Tiling操作能优化什么时间【TVM】通过代码学习编译流程【3】模型编译【TVM】通过代码学习编译流程【2】模型转换【TVM】通过代码学习编译流程【1】必要知识【感想】写作进度报告1 【Winograd】卷积加速算法原理及实现 SystemC 等待异步事件解决方案【TVM】Python脚本实现模型编译和保存【推理引擎】常见AI推理框架【3D建模】T110E3卡迪夫蓝调皮肤模型【TVM】C++部署运行TVM 【推理引擎】NCNN和Tengine量化推理逻辑对比【3D建模】IS-7攻城锤流纹岩皮肤展示【TVM】根据例子走通代码库博客汇总目录【Im2Col】卷积加速算法【2】NHWC 【Im2Col】卷积加速算法【1】 NCHW openBlas库的安装与简单使用 C语言工程调用Cpp库解决方案 foo Hello World

【Tengine】推理流程脑图【1】

Post author: XianMu@Пусть этот камень будет более крепким, чем ч · 2025-04-24 · via Пусть этот камень будет более крепким, чем человек

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

	int register_all_op_prototype(){
	...
	ret = register_argmax_op();
	ret = register_const_op();
	ret = register_convolution_op();
	ret = register_crop_op();
	ret = register_deconvolution_op();
	...
	}

	int register_convolution_op()
	{
	ir_method_t m;

	m.version = 1;
	m.init = init_op;
	m.release = release_op;

	return register_op(OP_CONV, OP_CONV_NAME, &m);
	}

	static struct tm2_serializer tm2_serializer = {
	.base = {
	.get_name = get_name,
	.load_model = load_model,
	.load_mem = load_mem,
	.unload_graph = unload_graph,
	.register_op_loader = register_op_loader,
	.unregister_op_loader = unregister_op_loader,
	.init = init_tm2_serializer,
	.release = release_tm2_serializer,
	},
	.loader_list = NULL,
	};

	int register_all_tm2_ops(){
	...
	ret = register_tm2_concat_op();
	ret = register_tm2_conv_op();
	ret = register_tm2_crop_op();
	...
	}

	static struct cpu_device cpu_dev = {
	.base = {
	.name = CPU_DEVICE_NAME,
	.interface = &cpu_interface,
	.allocator = &cpu_allocator,
	.optimizer = &cpu_optimizer,
	.scheduler = NULL,
	.privacy = NULL,
	},
	.master_cpu = 0,
	.cpu_model = 0,
	};

推荐订阅源

Пусть этот камень будет более крепким, чем человек

# 前言

# 介绍

# 推理流程

# init_tengine()

# 1. 注册算子原型：register_all_op_prototype ()

# 2. 注册序列化工具：register_all_serializer ()

# 3. 注册设备：register_all_devices ()

# Create_graph()

# 1. 创建上下文：create_context ()

# 2. 创建图：create_ir_graph ()

# 3. 加载图结构：load_mem ()

# 后记

	static struct interface cpu_interface = {
	.init = init_cpu,
	.pre_run = prerun,
	.run = run,
	.post_run = postrun,
	.async_run = NULL,
	.async_wait = NULL,
	.release_graph = cpu_dev_release_exec_graph,
	.release_device = release_cpu,
	};

	int register_all_cpu_ops(){
	...
	ret = register_concat_ref_op();
	ret = register_conv_ref_op();
	ret = register_conv_dw_hcl_x86_op();
	ret = register_conv_hcl_x86_op();
	ret = register_crop_ref_op();
	...
	}

	typedef struct context
	{
	char* name;
	struct scheduler* scheduler;
	struct device* device;
	void* default_options;
	void* device_options;
	} ir_context_t;