1. 概述
插值是根据已知的数据序列(可以理解为你坐标中一系列离散的点),找到其中的规律,然后根据找到的这个规律,来对其中尚未有数据记录的点进行数值估计的方法。最简单直观的一种插值方式是线性插值,它是数学、计算机图形学等领域广泛使用的一种简单插值方法,根据已知数据点来估某一点的函数值。线性插值法的特点是简单、方便,适用于函数在某一段区间内是线性的情况,即函数在该区间内可以用一条直线来近似表示。线性插值法的优点是计算量小,缺点是对于。多个点而言在连接点出出在明显的间断点。
2. 一点数学知识
线性插值是简单直观的,假设已知坐标与,要得到区间内某一位置在直线上的值,根据点斜式直线方程,我们只需要求出斜率即可,显然有:
则:
如果写成斜截式:
当然如果时,就违背了函数单一性原则(不讨论广义上的曲线)。
对于多个点,可以在每个区间段内采用分段线性插值。
3. 算法实现
3.1 单段线性插值
单段线性插值就是确定一个线性函数,然后通过函数估算其他点处的函数值。
以下定义个函数,返回一个多维数组,表示多项式的系数,并通过该返回值创建多项式,随后计算处的值,并在图形中表示:
import numpy as np from numpy.polynomial import Polynomial import matplotlib.pyplot as plt def linear_2p(x:np.ndarray,y:np.ndarray): k=(y[1]-y[0])/(x[1]-x[0]) b=y[0]-k*x[0] return np.array([b,k]) x=np.array([2,5]) y=np.array([3,7]) coef= linear_2p(x,y) # 线性插值函数的系数 p=Polynomial(coef) # 构造多项式 print(p) # 0.33333333 + 1.33333333 x print(p(2.5)) # 3.6666666666666665 # 绘制图形 X=np.linspace(x[0],x[1],100) Y=p(X) plt.plot(X,Y,'r') #plt.plot(x,y,’r’) #注:这两种在线性时绘图效果相同, # 但是实际含义不同,前者是用多个点绘制拟合曲线, # 后者仅用线段连接起止点 plt.plot(2.5,p(2.5),'b*') plt.grid() plt.show()
绘制图形如下:
如果需要计算单个点或者多个点的插值,其实不需要去计算该段的直线,也可以使用定比分点的概念:
因此,插值可以使用如下函数:
def linear_2p_intp(x:np.ndarray,y:np.ndarray,w): t=(w-x[0])/(x[1]-x[0]) return (1-t)*y[0]+t*y[1]
例如,实现5个点的插值并显示:
x=np.array([2,5]) y=np.array([3,7]) w=np.linspace(3,4,10) plt.plot(x,y,'r') # 简化绘图 yw=linear_2p_intp(x,y,w) plt.plot(w,yw,'b*') plt.grid() plt.show()
运行效果如下:
动态演示效果如下:
3.2 多段线性插值
多段线性插值在每一段上都是两点线性插值,假设点序列(X,Y)中X为单调递增,即具有如下特点:
估算x=w点处的值时,首先需要定位w属于哪个区间段,
为此,在构造该算法时,除了需要各段的函数外,还要有各段的区间信息,定义类如下:
from scipy.interpolate import PPoly import numpy as np from numpy.polynomial import Polynomial as P import matplotlib.pyplot as plt class multiSegLinearIntp: __coef:np.ndarray # coefficient __bps:np.ndarray # breakpoints __seg=0 # segments count def __init__(self,x:np.ndarray,y:np.ndarray): n,=x.shape k=np.diff(y)/np.diff(x) self.__coef=np.zeros((2,n-1)) self.__coef[0,:]=y[0:-1]-k*x[0:-1] self.__coef[1,:]=k self.__bps=x.copy() self.__seg=n-1 def __call__(self,x:np.ndarray): n,=x.shape y=np.zeros(n) for i in range(n): w=x[i] if w<self.__bps[0]: y[i]=self.__coef[0,0]+self.__coef[1,0]*w continue if w>=self.__bps[-1]: y[i]=self.__coef[0,-1]+self.__coef[1,-1]*w continue j=0 while w>=self.__bps[j]: j+=1 y[i]=self.__coef[0,j-1]+self.__coef[1,j-1]*w return y @property def c(self): return self.__coef @property def seg(self): return self.__seg
该类multiSegLinearIntp的构造函数将numpy.ndarray的实例x和y作为参数,内部保存各分段区间的系数,实例对象在收到传入值x后,查找x其所在的分段,并在该段返回函数的值,测试如下:
x=np.array([0,1,2,3,4,5,6,7,8,9]) y=np.array([2,4,3,3,1,5,6,3,1,0]) z=multiSegLinearIntp(x,y) x1=np.linspace(-2,11,200) y1=z(x1) plt.plot(x,y,'r') w=np.array([-2,11]) print(z(w)) #[-2. -2.] #plt.plot(x1,y1,'b-') #y2=np.interp(x1,x,y) #plt.plot(x1,y2,'g*') plt.grid() plt.show() x=np.array([0,1,2,3,4,5,6,7,8,9]) y=np.array([2,4,3,3,1,5,6,3,1,0]) z=multiSegLinearIntp(x,y) x1=np.linspace(-2,11,200) y1=z(x1) plt.plot(x,y,'r') w=np.array([-2,4.5,11]) yw=z(w) print(z(w)) #[-2. 3. -2.] plt.plot(w,yw,'b*') plt.grid() plt.show()
运行效果如下:
可以看到,在点处计算的值为,这是相符的,对于不在区间内的点和,可以看到依旧保持了这种线性关系,这就已经是外插了(extrapolation),是否要应用这种关系,需要根据实际情况判断。
动态演示效果如下:
4. 现有工具包
通过前面一节的例子,发现自己实现的多段线性插值还是挺麻烦的,有现场的工具包吗?当然。numpy中,使用numpy. Interp函数实现插值运算,其函数原型为:
numpy.interp(x, xp, fp, left=None, right=None, period=None)
其中x是待估算值的横坐标,xp,fp是已知点序列,left和right是x没有落在插值区间时的值,缺省值是left=x[0],right=x[-1],period是周期型,通常用于角坐标的插值,返回值是与x具有同样长度的多维数组。
测试如下:
x=np.array([2,5]) y=np.array([3,7]) w=np.linspace(3,4,5) print(linear_2p_intp(x,y,w)) print(np.interp(w,x,y)) ''' 输出均为[4.33333333 4.66666667 5 5.33333333 5.66666667] '''
另外,在scipy软件包中,scipy.interpolate.interp1d类也可以实现线性插值,但是该类已经作为遗留代码,不在被更新,在以后得升级中可能会被移除,官方给的建议是使用前面提到的numpy.interp函数。以下是简单的一个示例,供参考:
x=np.array([2,5]) y=np.array([3,7]) w=np.linspace(3,4,5) f=interp1d(x,y) plt.plot(w,f(w),'r*-') plt.grid() plt.show()
运行效果为:
5. 双线性插值
双线性插值(Bilinear interpolation)是有两个变量的插值函数的线性插值扩展,其核心思想是在两个方向分别进行一次线性插值。 假如我们想得到未知函数 在点的值,假设我们已知函数 f 在四个点的值。首先在方向进行线性插值,然后在方向进行线性插值。这种插值方法并不是线性的,而是两个线性函数的乘积。线性插值的结果与插值的顺序无关。首先进行方向的插值,然后进行方向的插值,所得到的结果是一样的。
基本数学原理如下:
先在方向插值:
然后在方向插值:
在现有工具包中,scipy.interpolate.LinearNDInterpolator可以实现该功能。