OpenCV加速方法-像素遍历-内存释放-运行时间计算-基本技巧

文章目录

1.查表法
2.像素遍历
3.GPU加速
4.内存释放release
5.计算运行时间

1.查表法

LUT代表查找表（Lookup Table），它是一种用于像素值映射的技术。查找表是一个数组，其中每个元素对应于输入像素值的一个映射值。使用LUT可以有效地对图像进行像素值的转换，常用于颜色空间转换或者对特定像素值进行操作。
查表法：LUT，使用lut的方法法，远快于每个像素都计算的方法。
查表法可以很大程度的节约计算时间，优于每个像素点的重复计算，如果像素点的计算，不与周围像素相关，应采用这种方法进行计算。

2.像素遍历

openCV像素遍历常用的是三种方法：ptr指针，迭代器（iterator）以及动态地址at。

一般图像行与行之间往往存储是不连续的，但是有些图像可以是连续的，Mat提供了一个检测图像是否连续的函数isContinuous()。当图像连通时，我们就可以把图像完全展开，看成是一行进行处理。动态地址at不适合用于像素遍历，速度太慢了，比较适合随机访问的方式

#include <iostream>
#include <opencv2/core.hpp>
#include <opencv2/highgui.hpp>using namespace std;
using namespace cv;void colorReduceAt(Mat& srcImage, Mat& dstImageAt, int div);
void colorReduceIterator(Mat& srcImage, Mat& dstImageIterator, int div);
void colorReducePtr(Mat& srcImage, Mat& dstImagePtr, int div);int main()
{//加载lena图像Mat srcImage = imread("lena.jpg");//判断图像是否加载成功if(srcImage.empty()){cout << "图像加载失败!" << endl << endl;return -1;}elsecout << "图像加载成功!" << endl << endl;imshow("srcImage",srcImage);//声明处理后图像变量Mat dstImageAt, dstImageIterator, dstImagePtr;dstImageAt = srcImage.clone();dstImageIterator = srcImage.clone();dstImagePtr = srcImage.clone();int div = 4;//声明时间变量double timeAt, timeIterator, timePtr;timeAt = static_cast<double>(getTickCount());colorReduceAt(srcImage, dstImageAt, div);timeAt = ((double)getTickCount() - timeAt) / getTickFrequency();imshow("dstImageAt",dstImageAt);cout << "使用at()动态地址计算耗时：" << timeAt << endl << endl;timeIterator = static_cast<double>(getTickCount());colorReduceIterator(srcImage, dstImageIterator, div);timeIterator = ((double)getTickCount() - timeIterator) / getTickFrequency();imshow("dstImageIterator",dstImageIterator);cout << "使用iterator迭代器耗时：" << timeIterator << endl << endl;timePtr = static_cast<double>(getTickCount());colorReducePtr(srcImage, dstImagePtr, div);timePtr = ((double)getTickCount() - timePtr) / getTickFrequency();imshow("dstImagePtr",dstImagePtr);cout << "使用ptr指针耗时：" << timePtr << endl;waitKey(0);return 0;
}//使用at动态地址计算方式
void colorReduceAt(Mat& srcImage, Mat& dstImageAt, int div)
{int rowNumber = dstImageAt.rows;      //获取图像行数int colNumber = dstImageAt.cols;      //获取图像列数//对每个像素进行处理for(int i = 0; i < rowNumber; i++){for(int j = 0; j < colNumber; j++){dstImageAt.at<Vec3b>(i,j)[0] = dstImageAt.at<Vec3b>(i,j)[0]/div*div;    //BluedstImageAt.at<Vec3b>(i,j)[1] = dstImageAt.at<Vec3b>(i,j)[1]/div*div;    //GreendstImageAt.at<Vec3b>(i,j)[2] = dstImageAt.at<Vec3b>(i,j)[2]/div*div;    //Red}}}//使用iterator迭代器方式
void colorReduceIterator(Mat& srcImage, Mat& dstImageIterator, int div)
{MatIterator_<Vec3b> imageIt = dstImageIterator.begin<Vec3b>();      //获取迭代器初始位置MatIterator_<Vec3b> imageEnd = dstImageIterator.end<Vec3b>();       //获取迭代器结束位置//对每个像素进行处理for(;imageIt != imageEnd; imageIt++){(*imageIt)[0] = (*imageIt)[0]/div*div;      //Blue(*imageIt)[1] = (*imageIt)[1]/div*div;      //Green(*imageIt)[2] = (*imageIt)[2]/div*div;      //Red}
}//使用ptr指针
void colorReducePtr(Mat& srcImage, Mat& dstImagePtr, int div)
{int rowNumber = dstImagePtr.rows;                           //获取图像矩阵行数int colNumber = dstImagePtr.cols*dstImagePtr.channels();    //三通道图像每行元素个数为列数x通道数for(int i = 0; i < rowNumber; i++){uchar* pixelPtr = dstImagePtr.ptr<uchar>(i);            //获取矩阵每行首地址指针for(int j = 0; j < colNumber; j++)pixelPtr[j] = pixelPtr[j] / div * div;}
}

在这里插入图片描述
使用指针方式是最快的处理方式，而迭代器的方式相对最慢。但是使用迭代器是较为安全的访问方式。

尽可能使用opencv中提供的参数，已经优化，速度有保障
最快的方式是LUT()函数，因为opencv库通过Intel Threaded Building Blocks实现其多线程。
如果写一个简单图像的遍历程序推荐使用指针方式。
迭代器是相对来讲比较安全的访问方式，但其速度也相对较慢。
在Debug模式下，动态地址计算方法是最慢的访问方式，但是在Release模式下它有可能比iterator访问方式快

3.GPU加速

需要GPU硬件设备支持。

openCL加速：使用UMat结构代替Mat。
高性能：OpenCL的相关用法：UMat
在OpenCV3中，OCL module已经被舍弃。而是使用更易上手的Transparent API来替代 OCL module。因此只需要使用 UMat来替换Mat，而其余的代码保持不变，即可实现加速。
Mat转换成UMat可以使用Mat::copyTo(OutputArray dst)，也可以使用Mat::getUMat(int access_flags)。

#include <chrono>
#include <opencv2/opencv.hpp>
#define  millisecond 1000000
#define DEBUG_PRINT(...)  printf( __VA_ARGS__); printf("\n")
#define DEBUG_TIME(time_) auto time_ =std::chrono::high_resolution_clock::now()
#define RUN_TIME(time_)  (double)(time_).count()/millisecond
using namespace std;void main() {string image_path = "1.jpg";cv::Mat image1 = cv::imread(image_path);cv::Mat dest1;DEBUG_PRINT("image size:[%d,%d]", image1.cols, image1.rows);//Mat convert to UMat//cv::UMat image2= image1.getUMat(cv::ACCESS_FAST);//ACCESS_READ, ACCESS_WRITE, ACCESS_RW和ACCESS_FASTcv::UMat image2;image1.copyTo(image2);cv::UMat dest2;DEBUG_TIME(T0);cv::blur(image1, dest1, cv::Size(15, 15));DEBUG_TIME(T1);cv::blur(image2, dest2, cv::Size(15, 15));DEBUG_TIME(T2);//UMat convert to Matcv::Mat dest3;dest2.copyTo(dest3);DEBUG_PRINT("CPU:%3.3fms", RUN_TIME(T1 - T0));DEBUG_PRINT("GPU:%3.3fms", RUN_TIME(T2 - T1));
}//image size:[2000,3008]
//CPU:18.039ms
//GPU:9.623ms

4.内存释放release

内存占用过高时，应主动释放内存。

	Mat image  = imread("D:\\OpencvTest\\1.jpg");image.release();

5.计算运行时间

using namespace cv;//设置宏定义
#define TB__(A) int64 A; A = cv::getTickCount()
#define TE__(A) cout << #A << " : " << 1.E3 * double(cv::getTickCount() - A)/double(cv::getTickFrequency()) << "ms" << endl// 使用方法：
TB__(cpu_cvt);
#pragma omp parallel for num_threads(4)for (int k = 0; k < REPEATES; k++)cv::cvtColor(cpu_src, cpu_dst, CV_BGR2Lab);
TE__(cpu_cvt);

OpenCV加速方法-像素遍历-内存释放-运行时间计算-基本技巧

文章目录

1.查表法

2.像素遍历

3.GPU加速

4.内存释放release

5.计算运行时间

相关资讯

热文排行

最新新闻

推荐新闻

热搜词