Skip to content

Latest commit

 

History

History
69 lines (34 loc) · 1.35 KB

pandas1.md

File metadata and controls

69 lines (34 loc) · 1.35 KB

1. 数据是什么?

数据的本质是什么?

图灵机纸带上的符号。

如果你把世界理解为各种变换,那么语义并不是那么重要,数据与语义无关。

在人类思维这个编码系统里面,数字有着天生的语义,一生二,二生三,三生万物。

从空间的角度,scalar,1维数组,2维数组......

而人的视角是平面的,3维都只能靠想象了。

然而,似乎也不用太担心,各种维度的运算本质上并没有区别。

2. 运算是什么?

有了数据,才能运算。

scalar自身没啥好算的,自加之类其实算是1维数组的运算了。

1维数组,运算可以分为两类:

  • map

运算的过程使用到每一个位置的scalar,运算后,结构不变

  • reduce(aggregate)

对整个数组进行运算,得到一个scalar

高维数组的运算最后都会细化为1维数组的运算。

3. pandas的数据与运算

3.1 Series 和 DataFrame

内部结构分别对应 1维数组 和 二维数组

除了数组下标,其还维护了一个其他数据类型的索引。

3.2 如何找到你要的数据?

你要的数据所对应的 条件 其实是一个 函数.

3.2.1 位置

  • loc

使用索引

  • iloc

使用数组下标

3.2. 位置

  • loc

使用索引

  • iloc

使用数组下标

3.3 计算