文档
博客
论坛
学院
解决方案
合作伙伴
地平线征程6工具链入门:J6P/H 计算平台部署指南
算法工具链
本文详解 J6P/H 计算平台部署指南,分硬件、软件模块介绍,梳理官方推荐流程与实用工具特性,帮你快速理解并落地部署。
2025年09月22日
算法工具链
【地平线 J6工具链入门】QAT新版qconfig量化模板使用教程
2025年09月28日
算法工具链
【地平线J6工具链进阶】算子优化方案集锦
2025年09月29日
发表博客
筛选
技术方向
感知
规控
算法工具链
底层软件
硬件技术
文章类别
技术深度解析
社区征文
前沿技术
杂谈
官方教程
芯片类型
征程6
征程5
征程3
最新
热门
【手撕大模型】MQA和GQA原理解析
.前言.大模型(参数规模通常数十亿至万亿级)在处理复杂任务时面临三大核心问题:...显式关联的局限性:传统 Multi-head Attention 依赖输入数据的显式特征(如文本中的词向量、图像中的像素特征)计算注意力,难以捕捉深层语义(如 “同义词替换”“上下文隐喻”)或抽象结构(如 “逻辑推理链”)。...数据效率与泛化瓶颈:大模型训练需海量数据,但在低资源语言、专业领域(如医学、法律)中,
momo(社区版)
算法工具链
社区征文
技术深度解析
前沿技术
134
0
0
2025-07-29
2025-07-29
134
0
0
J6工具链如何支持Matmul/Conv双int16输入量化?
.前言.在J6工具链的量化精度调优实践中,当 Matmul/Conv 算子的两个输入皆为量化敏感算子时,PTQ 与 QAT 各自面临着难以克服的棘手困境。.在 PTQ 流程里,为了实现双 int16 输入的支持,工作人员不得不借助脚本将原本结构单一的 Matmul/Conv 算子拆解为 2 个 conv + add 算子,随后还要围绕这两个新算子进行一系列复杂且细致的量化配置。这一过程不仅涉及到
momo(社区版)
算法工具链
社区征文
杂谈
技术深度解析
192
0
0
2025-07-28
2025-07-28
192
0
0
【手撕大模型】flashttention原理及代码解析
.在当今大模型蓬勃发展的时代,训练效率成为了制约模型发展与应用的关键因素。Transformer 架构中的自注意力机制虽强大,但面临着高计算成本与内存消耗的挑战。FlashAttention 应运而生,作为一种高效的注意力计算方法,它在加速模型训练与减少内存占用方面展现出了卓越的性能,为大模型的发展注入了新的活力。本文将深入探讨 FlashAttention 的原理,并结合代码实例进行详细解析。F
momo(社区版)
算法工具链
社区征文
技术深度解析
前沿技术
157
0
0
2025-07-28
2025-07-28
157
0
0
【手撕大模型】KVCache原理及代码解析
.在大型语言模型(LLM)的推理过程中,KV Cache 是一项关键技术,它通过缓存中间计算结果显著提升了模型的运行效率。本文将深入解析 KV Cache 的工作原理、实现方式,并通过代码示例展示其在实际应用中的效果。.一、为什么需要 KV Cache?.在 Transformer 进行自回归推理(如文本生成,每次生成一个 token 的时候需要结合前面所有的 token 做 attention
momo(社区版)
算法工具链
社区征文
技术深度解析
前沿技术
156
0
0
2025-07-28
2025-07-28
156
0
0
【大模型】VLA初识及在自动驾驶场景中的应用
# 1. VLA简介..## 1.1 VLA定义..VLA (Vision Language Action)是一种多模态机器学习模型,结合了视觉、语言和动作三种能力,旨在实现从感知输入直接映射到控制动作的完整闭环能力。VLA强调一体化多模态端到端架构,非感知规控的模块化方案。..下图是常见端到端的框架,是RT-2、OpenVLA、CLIP-RT等 VLA 系统的典型代表,这些系统均采用基于 Tra
Jade-self
算法工具链
技术深度解析
社区征文
杂谈
106
0
0
2025-07-25
2025-07-25
106
0
0
谈谈OTA乱象及解决方案
.........前言...........在汽车智能化浪潮中,OTA(Over-The-Air Technology,空中下载技术)被视为为汽车赋予“生命”、实现持续进化的一项新兴技术。车企大力宣传OTA,描绘着车辆可以像智能手机一样,随时在线升级,不断获得新功能、优化性能的美好愿景,消费者们也对其满怀期待。然而,理想很丰满,现实却很骨感。近年来,OTA相关的负面事件频频爆出,让我们不得不在今天
巴山夜雨
算法工具链
技术深度解析
前沿技术
38
0
0
2025-07-24
2025-07-24
38
0
0
芯片功能安全架构设计 —— 硬件层面
.荐 言:. ..今天推荐王伟峰老师的新书《一本书讲透汽车功能安全》,这是一本系统、深度解读ISO 26262/GB/T34590功能安全标准并解决标准落地难题的实战性著作,为读者打通标准与工程实践的桥梁,能有效弥合二者的差距。本书是作者从事汽车电子与功能安全10余年经验的总结,得到了众多行业专家的高度评价。特别推荐给大家!.. .本文节选自书籍第九章关于芯片功能安全架构的描述。更多内容可以点击下
巴山夜雨
算法工具链
前沿技术
62
0
0
2025-07-22
2025-07-22
62
0
0
新版perf文件解读与性能分析
.前言.在模型开发与应用领域,精准的性能分析和优化是提升效率的核心。地平线通过 J6 算法工具链 OE3.2.0 版本,对 hbm_perf 接口进行了重大升级,新增了 内存占用信息 和 硬件占用 Timeline 两大功能 。这些强化功能使开发者能够清晰掌握模型运行时的资源消耗和硬件效率,为后续优化提供关键依据。本文将深入解读新版 perf 文件的核心内容,并结合实例分析性能优化策略。.新功能介
momo(社区版)
算法工具链
社区征文
杂谈
技术深度解析
257
0
1
2025-07-22
2025-07-22
257
0
1
【大模型】VLM初识及在自动驾驶场景中的应用
在了解VLM之前,先复习下LLM。..# 1. LLM(Large Language Model)..大语言模型(LLM,Large Language Model)名字虽然带有语言二字,但其实并不局限于语言类场景。LLM 更多是一种统计建模的通用技术,它们主要通过自回归 Transformer 来模拟 token 流,这些 token 可以代表文本、图片、音频、动作选择、甚至是任何东西(多模态信号
Jade-self
算法工具链
技术深度解析
社区征文
杂谈
90
0
0
2025-07-21
2025-07-21
90
0
0
【J6】BPU trace简介与实操
# 1. BPU trace理论基础.在学习BPU trace前,希望大家对UCP trace已经有简单的了解,详情可见工具链用户手册《统一计算平台(UCP)-UCP性能分析工具-UCP Trace使用说明》章节。..## 1.1 BPU Trace配置文件模板..在system模式下抓取BPU trace,需在perfetto配置文件中加入BPU trace的数据源,ucp_bpu_trace.
Jade-self
算法工具链
技术深度解析
社区征文
征程6
杂谈
155
0
0
2025-07-18
2025-07-18
155
0
0
自动驾驶中常提的数据闭环是个啥?
.近年来,自动驾驶技术成为全球科技领域的热门话题,被视为交通领域革命性变革的重要推动力。在这一领域中,数据被称为推动技术进步的"燃料",其采集、分析和反馈的效率与质量直接决定了自动驾驶系统的性能和安全性。而随着自动驾驶技术复杂性的不断增加,传统的数据处理方式已经难以满足高效优化的需求,数据闭环的概念应运而生,成为各大自动驾驶企业关注的核心。..所谓数据闭环,是指通过一个系统化的流程,将车辆运行过程
巴山夜雨
算法工具链
技术深度解析
前沿技术
89
0
0
2025-07-15
2025-07-15
89
0
0
无人物流车:自动驾驶规模化落地的先锋场景深度解析
.在智能网联汽车技术加速迭代与物流行业降本需求双重驱动下,无人物流车正从技术试验场迈向商业化应用的关键阶段。作为自动驾驶领域场景容错率高、技术门槛适中的细分赛道,其在快递末端配送等场景的规模化落地,不仅重塑物流行业成本结构,更成为衡量自动驾驶技术商业化成熟度的重要标杆。本文基于物流场景特性,从行业关注的八大核心问题出发,系统梳理无人物流车的发展脉络、现实图景与未来趋势,为投资者与行业参与者提供全景
巴山夜雨
算法工具链
前沿技术
27
0
0
2025-07-14
2025-07-14
27
0
0
【性能优化】mul与reduce_sum的优化实例
# 1. 基础介绍.什么是mul与reduce_sum?...mul 通常指元素级乘法(Element-wise Multiplication),它将两个形状相同的张量中对应位置的元素相乘,返回一个与原张量形状相同的新张量。..reduce_sum 是一种规约操作(Reduction Operation),它沿指定维度对张量的元素求和,从而 “压缩” 或 “减少” 张量的维度。如果不指定维度,则对
Jade-self
算法工具链
社区征文
征程6
杂谈
技术深度解析
330
0
1
2025-07-10
2025-07-10
330
0
1
【J6】灰度图部署链路介绍
# 1. 为什么是灰度图 . .相较于 RGB 三通道图像,灰度图仅保留亮度信息(Y 分量),数据量减少 2/3,相比于常用的NV12图像,数据量减少1/3,内存占用与计算负载显著降低。对于下游网络结构而言,单通道网络计算量/参数量也会更少,这对边缘设备的实时处理至关重要。 . .灰度图部署有一个问题:如何将视频流中的 NV12 数据高效转换为模型所需的灰度输入,并在工具链中实现标准化前处理流程。
Jade-self
算法工具链
社区征文
征程6
技术深度解析
杂谈
81
0
0
2025-07-09
2025-07-09
81
0
0
全球首个自动驾驶VLA综述重磅发布:VLA自驾模型全面拆解(麦吉尔&清华等)
.“自动驾驶未来已来?”.当视觉(Vision)、语言(Language)和行动(Action)三大能力在一个模型中融合,自动驾驶的未来将走向何方?.近日,来自麦吉尔大学、清华大学、小米公司和威斯康辛麦迪逊的研究团队联合发布了全球首篇针对自动驾驶领域的视觉-语言-行动(Vision-Language-Action, VLA)模型的全面综述。这篇题为《A Survey on Vision-Langu
巴山夜雨
算法工具链
技术深度解析
前沿技术
98
0
1
2025-07-09
2025-07-09
98
0
1
端到端双SOTA,超越Hydra-MDP
.写在前面 && 笔者理解.端到端在当下可谓是炙手可热,它将感知和规划集成到一个统一的、完全可微的网络中。不过,因为物理世界的复杂性和规划意图的不确定性,基于对物理场景的整体理解,也就是空间、语义和时间信息的理解,能够进行多模态运动规划,也是一个比较有挑战性的工作。.为了增强对场景的理解,现有的端到端方法探索了多种场景表示,包括以BEV为中心的表示、基于向量的表示等等。一些工作利用多模态大型语言模
巴山夜雨
算法工具链
前沿技术
61
0
0
2025-07-08
2025-07-08
61
0
0
J6 cim roi使能引起报错分析
..场景.A进程:2V 4K@40fps-CIM0-ddr-ISP0-PYM0-ddr.B进程:2V 1280P@30fps-CIM0-ddr-ISP0-PYM0-ddr.AB进程同时启动场景;.现象.重复启动多次,使能ROI时,概率出现4K通路输出帧率比实际帧率少的情况,通过dmesg日志查看,日志中显示size error/overflow交替出现;..初步分析.Cim size error,
新手村
感知
社区征文
征程6
技术深度解析
底层软件
46
0
0
2025-06-29
2025-06-29
46
0
0
J6 多摄像头AE同步
..1.Single Camera AE update.单camera场景,N-1帧统计数据在N帧时序内完成计算,并把AE结果设置到camera sensor寄存器上;camera sensor拥有global hold机制,可确保跨帧设置寄存器能在同一帧timing生效;一般情况下,该场景下,AE更新机制被称为N+2有效机制;..2.multi-Cameras AE sync.沿用N+2的机制.
新手村
感知
征程6
社区征文
技术深度解析
118
0
0
2025-06-29
2025-06-29
118
0
0
J6E/M A核诊断示例
..1. 功能概述¶.本文档为地平线功能安全(FuSa)的诊断服务的Sample Code使用手册,文档说明了Diagnose Sample实现架构、平台支持、运行指南、运行结果说明、命令行等内容, 使得用户能够正确使用该Sample,从而了解如何编写一个用户APP来接入地平线诊断框架,快速实现诊断信息上报功能。..1.1. 软件架构说明¶.本文档提及的Sample主要为一个Diagnose Pr
新手村
算法工具链
社区征文
征程6
底层软件
官方教程
106
0
0
2025-06-29
2025-06-29
106
0
0
J6E/M 多camera场景示例
.1. 功能概述¶..本sample提供全链路场景1V,4V,7V使用演示,实现单路及多路VIO接入,逐级经过ISP、PYM、BPU、CODEC模块处理。..1.1. 软件架构说明¶.本sample调用VIO API来实现整个数据通路,实现单路、多路camera接入,并能够dump每一路数据的图像。调用BPU API使用BPU模块,并依赖 libhbucp.so 等库中的算法API实现对视频图像的
新手村
算法工具链
征程6
社区征文
技术深度解析
官方教程
334
0
1
2025-06-29
2025-06-29
334
0
1
共807条
<
1
...
10
11
12
...
41
>
前往
页
上一页
下一页
前往
页