整理一下numpy和pandas中 axis(軸)的概念
以一個3x3 numpy array當做範例
ndarray = numpy.arange(1,10).reshape(3,3)
[[1, 2, 3],
[4, 5, 6],
[7, 8, 9]]
axis(軸)的基本示意圖:
ndarray[0] 表示取軸0的第0項,也就是ndarray[0][:] 取軸0第一項然後對應的軸1每項都要
ndarray[0][1] 表示先選取軸0的第0項,接著再對應取軸1的第1項
ndarray[:][0:2] 表示軸0的項目全部都要,但只取每一項的軸1的0到1項
ndarray.sum(axis = 1) -> array([ 6, 15, 24])
表示將軸1的各項相加,但不將軸0合併(合併了軸0就等於一般ndarray.sum()的結果了),也就是軸0的各項分別各自將其軸1各項相加(每列各自將其對應軸0各項相加)
在pandas的函式中 axis參數的使用
先建立一個DataFrame及需要用到的lambda函式
frame2 = DataFrame(np.arange(1,10).reshape(3, 3), columns = list((0,1,2)), index = list((0,1,2)))
frame2.apply(f, axis = 0) 表示將函式應用到軸0,
以範例而言就是從軸0各項中取最大項減最小項,不合併軸1 (每行各自從其對應軸0各項中取max減min)
frame2.apply(f, axis = 1) 表示將函式應用到軸1,
也就是每列各自從其對應軸1各項取max減min
Posted by changSeptember 20, 2016
来自 <http://changtw-blog.logdown.com/posts/895468-python-numpy-axis-concept-organize-notes>