Python Pandas教程之series 上的转换操作

前言:

转换操作中,我们执行各种操作,例如更改系列的数据类型,将系列更改为列表等。为了执行转换操作,我们有各种有助于转换的功能,例如.astype()等.tolist()。

代码#1:

# 使用 astype 转换 series 数据类型的 Python 程序
 
# importing pandas module  
import pandas as pd 
   
# 从 url 读取 csv 文件  
data = pd.read_csv("nba.csv") 
    
# 删除空值列以避免错误
data.dropna(inplace = True) 
   
# 在转换之前存储 dtype
before = data.dtypes 
   
# 使用 astype 转换 dtypes
data["Salary"]= data["Salary"].astype(int) 
data["Number"]= data["Number"].astype(str) 
   
# 转换后存储 dtype
after = data.dtypes 
   
# 打印出来比较
print("BEFORE CONVERSION\n", before, "\n") 
print("AFTER CONVERSION\n", after, "\n") 

输出:

代码 #2:

# Python程序将 series 转换为列表
 
# 导入 pandas 模块  
import pandas as pd  
   
# 导入 regex 模块 
import re 
     
# 制作数据框 
data = pd.read_csv("nba.csv")  
     
# 删除空值以避免错误
data.dropna(inplace = True)  
   
# 操作前存储 dtype
dtype_before = type(data["Salary"]) 
   
# 转换为列表
salary_list = data["Salary"].tolist() 
   
# 操作后存储dtype
dtype_after = type(salary_list) 
   
# 打印数据类型
print("Data type before converting = {}\nData type after converting = {}"
      .format(dtype_before, dtype_after)) 
   
# 显示列表
salary_list 

输出 :

Pandas series 方法:

功能 描述 Series() 可以使用 Series() 构造函数方法创建熊猫系列。此构造方法接受各种输入 combine_first() 方法用于将两个系列合二为一 count() 返回系列中非 NA/null 观测值的数量 size() 返回基础数据中的元素数 name() 方法允许为 Series 对象(即列)命名 is_unique() 如果对象中的值是唯一的,则方法返回布尔值 idxmax() 提取Series中最高值的索引位置的方法 idxmin() 提取系列中最低值的索引位置的方法 sort_values() 在 Series 上调用方法以按升序或降序对值进行排序 sort_index() 在熊猫系列上调用方法以按索引而不是其值对其进行排序 head() 方法用于从系列的开头返回指定数量的行。该方法返回一个全新的系列 tail() 方法用于从 Series 的末尾返回指定数量的行。该方法返回一个全新的系列 le() 用于将 Caller 系列的每个元素与传递的系列进行比较。对于每个小于或等于传递系列中的元素的元素,它返回 True ne() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个不等于传递系列中的元素的元素返回 True ge() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为大于或等于传递系列中的元素的每个元素返回 True eq() 用于将 Caller 系列的每个元素与传递的系列进行比较。它为每个等于传递系列中的元素的元素返回 True gt() 用于比较两个系列并为每个元素返回布尔值 lt() 用于比较两个系列并为每个元素返回布尔值 clip() 用于剪裁低于和高于传递的最小和最大值的值 clip_lower() 用于裁剪低于传递的最小值的值 clip_upper() 用于剪裁高于传递的最大值的值 astype() 方法用于更改系列的数据类型 tolist() 方法用于将系列转换为列表 get() 在 Series 上调用方法以从 Series 中提取值。这是传统括号语法的替代语法 unique() Pandas unique() 用于查看特定列中的唯一值 nunique() Pandas nunique() 用于获取唯一值的计数 value_counts() 计算每个唯一值在系列中出现的次数的方法 factorize() 方法通过识别不同的值来帮助获得数组的数字表示 map() 将一个对象的值绑定到另一个对象的方法 between() Pandas between() 方法用于系列检查哪些值位于第一个和第二个参数之间 apply() 调用方法并将 Python 函数作为参数提供给每个 Series 值使用该函数。此方法有助于执行 pandas 或 numpy 中未包含的自定义操作 原文地址:https://juejin.cn/post/7139042944064962596
50人参与, 0条评论 登录后显示评论回复

你需要登录后才能评论 登录/ 注册