在 python 中执 DTW 算法,但是太慢,想到了用c++写该算法,再用python执行
先贴一张效果图,可以看出,同样一份 dtw 代码,python 和 C++ 有10倍多的差距。
有很多种方法可以在python里执行c++代码,这里选一个我觉得最简单的。推荐使用vs,编译如下代码,注意选择生成dll,而不是exe。
我的函数原型是 :
double dtw(double* x, int x_size, double* y, int y_size)
头文件里需要声明:
//头文件 main.h
#pragma once
#includeextern "C"
{__declspec(dllexport) double __cdecl dtw(double* x, int x_size, double* y, int y_size);
};
源文件里实现:
//源文件 main.cpp
#include "main.h"
#includedouble dtw(double* x, int x_size, double* y, int y_size)
{double** D0 = (double**)malloc(sizeof(double*) * (x_size + 1));
for (int i = 0; i< x_size + 1; i++)
D0[i] = (double*)malloc(sizeof(double) * (y_size + 1));
//填充边框
D0[0][0] = 0;
for (int i = 1; i< x_size + 1; i++) D0[i][0] = INT_MAX;
for (int i = 1; i< y_size + 1; i++) D0[0][i] = INT_MAX;
//填充数据
for (int i = 1; i< x_size + 1; i++)
{for (int j = 1; j< y_size + 1; j++)
{D0[i][j] = abs(x[i - 1] - y[j - 1]);
}
}
for (int i = 1; i< x_size + 1; i++)
{for (int j = 1; j< y_size + 1; j++)
{ //使用min()函数时候总会莫名其妙报错
double temp = D0[i - 1][j]< D0[i][j - 1] ? D0[i - 1][j] : D0[i][j - 1];
double t = temp< D0[i - 1][j - 1] ? temp : D0[i - 1][j - 1];
D0[i][j] += t;
}
}
double d = D0[x_size][y_size];
for (int ii = 0; ii< x_size + 1; ii++)
{free(D0[ii]); //一定要释放!
}
free(D0);
return d;
}
在vs中编译生成dll库后,拿去python里用。
注意:
对于malloc申请的内存,一定要释放掉。内存泄漏以前我都不管,因为函数执行次数不多,程序结束也就自动释放了。但这次由于 dtw 函数在 python 里执行了几十万次,瞬间内存就爆了。
首先导入ctypes 库:
from ctypes import *
然后导入dll库:
dll = CDLL("./DTW_DLL.dll")
dtwc = dll.dtw #dtw名称需要与c++中函数名称一致
Python写法中需要注意的,就是传入和传出参数的类型,我的C++函数原型是
double dtw(double* x, int x_size, double* y, int y_size)
因此传入参数是[double* , int , double* ,int],传出参数是[double]
设定传入传出参数类型:
dtwc.argtypes = [np.ctypeslib.ndpointer(dtype=np.float64,ndim=1),c_int,
np.ctypeslib.ndpointer(dtype=np.float64,ndim=1),c_int]
dtwc.restype = c_double
最后执行函数:
d = dtwc(x,20,y,20)
你是否还在寻找稳定的海外服务器提供商?创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源,准确流量调度确保服务器高可用性,企业级服务器适合批量采购,新人活动首月15元起,快前往官网查看详情吧