博客
关于我
基于光流的3D速度检测
阅读量:324 次
发布时间:2019-03-04

本文共 886 字,大约阅读时间需要 2 分钟。

光流的概念在1950年由Gibson首次提出。它是在观察成像平面上空间移动物体的像素移动的瞬时速度。利用图像序列中时域中像素的变化以及相邻帧之间的相关性,找到前一帧与当前帧之间的对应关系,从而计算出相邻帧之间物体的运动信息。一般而言,光流是由前景物体本身的移动,相机的移动或场景中两者的联合移动引起的。

假设我们有两个图像I和J,它们之间有一个小的转换,可以表示如下。

其中,I(x)和J(x)可以看作是一个映射函数,其中像素位置x为自变量,像素灰度为因变量。这两个图像。我们从优化的角度考虑这个问题,如下

通过连续地调整该二维平移d,J和I之间的差异被最小化。

为了解决这个问题,我们首先求解目标函数相对于自变量的导数,可以得到以下公式。

接下来,我们采用J(x + d)的一阶泰勒展开式,然后将其简化为误差函数的导数,如下所示:

最后,必须添加这些错误以获得总错误。

经过迭代计算,我们可以收敛到最终结果。

两个帧之间相应点的光流关系可用于估计3D速度。

其中,点p是使用校准相机的投影方程式从3D点P在图像平面上的投影。

或矢量记法

区分wrt时间收益:

光流场矢量可以分为平移部分和旋转部分,如下所示:

如果存在3个非共线的光流向量和深度,则可以求解3D速度。

通过将翻译部分跨越的线相交,我们可以获得扩展焦点(FOE),也称为Epipole:

我们可以如下设置碰撞时间

与FOE处于相同径向距离的点的流动矢量长度与反深度成比例。

我们可以获得以下共面条件

这表示像点,流量和线速度都在同一平面上。

我们可以从两点获得V:

从n个点得到一个齐次系统

V是A的零空间,可以从SVD获得。

对于平移和旋转情况,我们可以重写:

可以线性写成反深度和Ω。

对于n点,我们可以写出一个方程组。

对于Φ,矩阵是2N x(N + 3)矩阵,并且是V的函数。

如果我们求解反深度和Ω的未知矢量,则会得到。

我们可以将其插入目标函数中。

在球上搜索得到V:

参考文献

Robotics: Perception Coursera ,Université de Pennsylvanie

 

转载地址:http://vmxq.baihongyu.com/

你可能感兴趣的文章
NLog 自定义字段 写入 oracle
查看>>
NLog类库使用探索——详解配置
查看>>
NLP 基于kashgari和BERT实现中文命名实体识别(NER)
查看>>
NLP 时事和见解【2023】
查看>>
NLP 模型中的偏差和公平性检测
查看>>
Vue3.0 性能提升主要是通过哪几方面体现的?
查看>>
NLP 项目:维基百科文章爬虫和分类【01】 - 语料库阅读器
查看>>
NLP_什么是统计语言模型_条件概率的链式法则_n元统计语言模型_马尔科夫链_数据稀疏(出现了词库中没有的词)_统计语言模型的平滑策略---人工智能工作笔记0035
查看>>
NLP、CV 很难入门?IBM 数据科学家带你梳理
查看>>
NLP三大特征抽取器:CNN、RNN与Transformer全面解析
查看>>
NLP入门(六)pyltp的介绍与使用
查看>>
NLP学习笔记:使用 Python 进行NLTK
查看>>
NLP度量指标BELU真的完美么?
查看>>
NLP的不同研究领域和最新发展的概述
查看>>
NLP的神经网络训练的新模式
查看>>
NLP采用Bert进行简单文本情感分类
查看>>
NLP问答系统:使用 Deepset SQUAD 和 SQuAD v2 度量评估
查看>>
NLP项目:维基百科文章爬虫和分类【02】 - 语料库转换管道
查看>>
NLP:从头开始的文本矢量化方法
查看>>
NLP:使用 SciKit Learn 的文本矢量化方法
查看>>