目录
一、用法精讲
79、pandas.Series.dtype属性
79-1、语法
# 79、pandas.Series.dtype属性 pandas.Series.dtype Return the dtype object of the underlying data.
79-2、参数
无
79-3、功能
用于获取Series中元素的数据类型。
79-4、返回值
返回Series中数据的数据类型。
79-5、说明
79-5-1、当处理大型数据集时,明确指定dtype可以帮助节省内存,因为不同的数据类型在内存中占用的空间不同。
79-5-2、在某些情况下,Pandas可能无法自动推断出最精确的数据类型(例如,当数据中包含大量整数但某些值为NaN时,Pandas可能将数据类型推断为浮点数),此时,显式指定dtype可以避免这种情况。
79-5-3、dtype属性是只读的,不能直接修改Series的数据类型,如果需要修改数据类型,可以使用astype()方法。
79-6、用法
79-6-1、数据准备
无
79-6-2、代码示例
# 79、pandas.Series.dtype属性 import pandas as pd # 创建一个整数类型的Series s1 = pd.Series([1, 2, 3, 4]) print(s1.dtype) # 创建一个浮点数类型的 Series s2 = pd.Series([1.1, 2.2, 3.3, 4.4]) print(s2.dtype) # 创建一个字符串类型的 Series s3 = pd.Series(['a', 'b', 'c', 'd']) print(s3.dtype) # 显式指定数据类型 s4 = pd.Series([1, 2, 3, 4], dtype='float32') print(s4.dtype)
79-6-3、结果输出
# 79、pandas.Series.dtype属性 # int64 # float64 # object # float32
80、pandas.Series.shape属性
80-1、语法
# 80、pandas.Series.shape属性 pandas.Series.shape Return a tuple of the shape of the underlying data.
80-2、参数
80-3、功能
提供有关Pandas Series对象维度信息的快速访问。
80-4、返回值
返回一个元组,表示Series的维度,在Series中,这个元组只有一个值,即Series的长度,因为Series是一维的数据结构。
80-5、说明
80-6、用法
80-6-1、数据准备
无
80-6-2、代码示例
# 80、pandas.Series.shape属性 import pandas as pd # 使用列表创建Series data = [1, 2, 3, 4, 5] series1 = pd.Series(data) print("Series1 shape:", series1.shape) # 使用字典创建Series data = {'a': 1, 'b': 2, 'c': 3} series2 = pd.Series(data) print("Series2 shape:", series2.shape) # 指定索引 data = [1, 2, 3, 4, 5] index = ['a', 'b', 'c', 'd', 'e'] series3 = pd.Series(data, index=index) print("Series3 shape:", series3.shape) # 使用标量创建Series data = 5 series4 = pd.Series(data, index=['a', 'b', 'c']) print("Series4 shape:", series4.shape)
80-6-3、结果输出
# 80、pandas.Series.shape属性 # Series1 shape: (5,) # Series2 shape: (3,) # Series3 shape: (5,) # Series4 shape: (3,)
81、pandas.Series.nbytes属性
81-1、语法
# 81、pandas.Series.nbytes属性 pandas.Series.nbytes Return the number of bytes in the underlying data.
81-2、参数
无
81-3、功能
用于返回Pandas Series对象在内存中占用的总字节数,该值包括了Series中所有元素(包括索引)的内存占用。
81-4、返回值
返回一个整数,表示Series对象在内存中占用的总字节数,该值是根据Series中元素的数量、数据类型以及索引的存储方式等因素计算得出的。
81-5、说明
81-5-1、数据类型影响:Series中元素的数据类型会直接影响其内存占用。例如,int64类型的数据比float32类型的数据占用更多的内存。
81-5-2、索引也占用内存:虽然索引通常占用的内存相对较小,但在处理包含大量元素的Series时,索引的内存占用也不容忽视。
81-5-3、近似值:nbytes返回的是近似值,因为它依赖于Pandas和NumPy的内部实现,这些实现可能会随着版本的变化而变化。
81-5-4、与 NumPy 兼容性:Pandas旨在与NumPy兼容,并在许多方面模仿NumPy的API,因此,nbytes属性的行为与NumPy数组中的相应属性相似。
81-6、用法
81-6-1、数据准备
无
81-6-2、代码示例
# 81、pandas.Series.nbytes属性 import pandas as pd # 创建一个示例Pandas Series data = pd.Series([10, 20, 30, 40, 50]) # 获取Series所占用的字节数 nbytes = data.nbytes print(f"The Series occupies {nbytes} bytes.")
81-6-3、结果输出
# 81、pandas.Series.nbytes属性 # The Series occupies 40 bytes.
82、pandas.Series.ndim属性
82-1、语法
# 82、pandas.Series.ndim属性 pandas.Series.ndim Number of dimensions of the underlying data, by definition 1.
82-2、参数
无
82-3、功能
用于返回Series对象的维度数。
82-4、返回值
返回一个整数,对于Pandas Series对象,ndim属性的返回值总是 1,表示Series是一维数据结构。
82-5、说明
无
82-6、用法
82-6-1、数据准备
无
82-6-2、代码示例
# 82、pandas.Series.ndim属性 # 82-1、创建一个Pandas Series import pandas as pd s = pd.Series([1, 2, 3, 4, 5]) # 使用ndim属性查看Series的维度数 print(s.ndim) # 82-2、创建一个DataFrame import pandas as pd df = pd.DataFrame({ 'A': [1, 2, 3], 'B': [4, 5, 6] }) print(df.ndim)
82-6-3、结果输出
# 82、pandas.Series.ndim属性 # 82-1、创建一个Pandas Series # 1 # 82-2、创建一个DataFrame # 2
83、pandas.Series.size属性
83-1、语法
# 83、pandas.Series.size属性 pandas.Series.size Return the number of elements in the underlying data.
83-2、参数
无
83-3、功能
用于返回Series对象的元素数量。
83-4、返回值
返回的是数据结构中包含的元素总数。
83-5、说明
无
83-6、用法
83-6-1、数据准备
无
83-6-2、代码示例
# 83、pandas.Series.size属性 import pandas as pd # 创建一个Pandas Series s = pd.Series([1, 2, 3, 4, 5]) # 使用size属性查看Series的元素数量 print(s.size) # 创建一个包含较少元素的Series以作对比 s_short = pd.Series([10, 20]) # 查看较短Series的元素数量 print(s_short.size)
83-6-3、结果输出
# 83、pandas.Series.size属性 # 5 # 2