目录

基本数据结构

1. 初识Series

创建一个Series

简单访问Series的属性方法

2. 初识DataFrame

创建一个DataFrame

简单访问DataFrame的属性方法

我是总结

基本数据结构

  • Series: 具有轴标签(包括时间序列)的一维数组
  • DataFrame: 具有轴标签, 二维,大小可变, 异构的表格数据。可以视作Series的容器,是pandas主要的数据结构

1. 初识Series

创建一个Series

import pandas as pd
import numpy as np
s = pd.Series(np.random.randint(1,18,size=3),index=['a','b','c'],name='Random int64 Series',dtype='int64')

print(s)
a    17
b     7
c     6
Name: Random int64 Series, dtype: int64

简单访问Series的属性方法

# dir(s) 查看所有属性和方法
print("索引:")
print(s.index)
print("\n取值,根据索引取值:")
print(s['b'])
print("\nvalues: ")
print(s.values)
# 平均值,注意这里Series是random出来的,所以你运行得到的平均值可能不一样
print("\n平均值")
print(s.mean())
索引:
Index(['a', 'b', 'c'], dtype='object')

取值,根据索引取值:
7

values: 
[17  7  6]

平均值
10.0

2. 初识DataFrame

创建一个DataFrame

df = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
...                    columns=['a', 'b', 'c'])
print(df)
   a  b  c
0  1  2  3
1  4  5  6
2  7  8  9

简单访问DataFrame的属性方法

# dir(df) 查看所有属性和方法
print("索引:")
print(df.index)
print("\n取值,根据索引取值:")
print(df['a'])
print("\nvalues: ")
print(df.values)
# 平均值,注意这里Series是random出来的,所以你运行得到的平均值可能不一样
print("\n平均值")
print(df.mean())
索引:
RangeIndex(start=0, stop=3, step=1)

取值,根据索引取值:
0    1
1    4
2    7
Name: a, dtype: int32

values: 
[[1 2 3]
 [4 5 6]
 [7 8 9]]

平均值
a    4.0
b    5.0
c    6.0
dtype: float64

我是总结

  • 认识了pandas两个基本数据结构: Series和DataFrame
  • 学习了Series和DataFrame的基本用法

                                                              

                                                                    扫码关注公众号: 风起帆扬了
                                                                        来一起学习,成长,分享
                                                                          航行在测试的大道上
                                                                               喜欢就点赞吧

本文地址:https://blog.csdn.net/keithsoul/article/details/110881469