Pandas快速操作简明列表(一)

前言

Pandas是最常用也是最方便的数据工具,我们可以通过其实现很多快捷的计算。

但是很多Pandas DF的基础操作,如果一段时间不用,总是会因写法过于简单而把他忘掉。

 故此整理了一些简单写法,列举在本文中,方便查阅。

列表

  • 生成随机测试数据

测试数据的生成直接使用numpy生成随机数:

import numpy as np
import pandas as pd

data = np.random.rand(100, 3)
df = pd.DataFrame(data, columns=['A', 'B', 'C'])

生成的DF如下:

In [4]: df
Out[4]:
           A         B         C
0   0.845859  0.537332  0.653460
1   0.124242  0.072076  0.704116
2   0.667226  0.494979  0.370623
3   0.950168  0.683542  0.376995
4   0.492614  0.425973  0.514176
..       ...       ...       ...
95  0.757337  0.628652  0.782910
96  0.306750  0.506534  0.795694
97  0.885727  0.042140  0.799533
98  0.952518  0.772178  0.412604
99  0.525901  0.471315  0.448873

[100 rows x 3 columns]

  • 平均值、最大值、最小值和STD
In [6]: df['A'].mean()
Out[6]: 0.5244544663951448

In [7]:  df['A'].max()
Out[7]: 0.9875023548176057

In [8]: df['A'].min()
Out[8]: 0.02908839373371941

In [13]: df['A'].std()
Out[13]: 0.27547184878079656
  •  分位数
In [10]: df['A'].quantile(0.25)
Out[10]: 0.3062840942610573

In [11]: df['A'].quantile(0.5)
Out[11]: 0.5261774487543152

In [12]: df['A'].quantile(0.75)
Out[12]: 0.7606243945458151
  • 统计符合条件的行数
In [9]: (df['A']>0.5).sum()
Out[9]: 53
  • 符合条件的行抽取成单独的DF
df[df['A'] > 0.5]
  • 丢弃包含空值的行
df.dropna(inplace=True)
  • 追加一行数据
In [22]: df.tail(2)
Out[22]:
            A         B         C
99   0.525901  0.471315  0.448873
100  0.120983  0.319603  0.121863

In [23]: next_index = len(df) if df.empty else df.index.max() + 1

In [24]: new_row = {'A': np.random.rand(), 'B': np.random.rand(), 'C': np.random.rand()}

In [25]: df.loc[next_index] = new_row

In [26]: df.tail(2)
Out[26]:
            A         B         C
100  0.120983  0.319603  0.121863
101  0.494593  0.459435  0.295298
  • 追加一个DF
In [27]: df.tail(2)
Out[27]:
            A         B         C
100  0.120983  0.319603  0.121863
101  0.494593  0.459435  0.295298

In [28]: data = [{'A': 1, 'B': 2, 'C': 3}, {'A': 1, 'B': 2, 'C': 3}]
    ...: df2 = pd.DataFrame(data)

In [29]: df = pd.concat([df, df2], ignore_index=True)

In [31]: df.tail(4)
Out[31]:
            A         B         C
100  0.120983  0.319603  0.121863
101  0.494593  0.459435  0.295298
102  1.000000  2.000000  3.000000
103  1.000000  2.000000  3.000000

  • 按列合并(重名列重命名)
In [32]: df1 = pd.DataFrame([{'A': 1, 'B': 2, 'C': 3}, {'A': 11, 'B': 22, 'C': 33}])
    ...: df1 = pd.DataFrame([{'C': 6, 'D': 7, 'E': 8}, {'C': 66, 'D': 77, 'E': 88}])

In [33]: df_merged = pd.concat([df1, df2.rename(columns={'C': 'C_2'})], axis=1)

In [34]: df_merged
Out[34]:
    C   D   E  A  B  C_2
0   6   7   8  1  2    3
1  66  77  88  1  2    3

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/740247.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

手机数据如何恢复?11 款最佳安卓手机恢复软件

媒体可能由于各种原因而从您的设备中删除,可能是意外或病毒攻击。 在这些情况下,照片恢复应用程序是唯一的解决方案。理想的照片恢复应用程序取决于各种因素,例如存储设备的损坏程度、删除照片后的持续时间以及应用程序使用的恢复算法的有效性…

视频融合共享平台LntonCVS视频监控平台在农场果园等场景的使用方案

我国大江南北遍布着各类果园。传统的安全防范方式主要是建立围墙,但这种方式难以彻底阻挡不法分子的入侵和破坏。因此,需要一套先进、科学、实用且稳定的安全防范报警系统,以及时发现并处理潜在问题。 需求分析 由于果园地处偏远且缺乏有效防…

银联支付,你竟然还不知道它怎么工作?

银联支付咱都用过,微信和支付宝没这么“横行”的时侯,我们取款、转账、付款时用的ATM机、POS机,都是银联支付完成的。 今天,就让咱们了解一下银行卡支付的工作原型。 首先,说说中国银联 中国银联(China U…

骨干教师的评选条件

作为一名教师,我常在思考,什么样的教师才能被称为"骨干"?"骨干"不仅仅是一个荣誉的标签,更是一份沉甸甸的责任和使命。究竟什么样的条件才能成为评选骨干教师的标准呢? 必须具备扎实的专业知识。在…

Vscode lanuch.json

Intro 使用launch.json 能够方便的运行需要传很多参数的代码文件 如下: import math import argparse # 1、导入argpase包def parse_args():parse argparse.ArgumentParser(descriptionCalculate cylinder volume) # 2、创建参数对象parse.add_argument(--rad…

推荐三款必备软件,个个五星好评,你一定不要错过

WiseCare365 WiseCare365是一款由WiseCleaner推出的综合性Windows系统优化和加速工具。它集成了多种功能,旨在帮助用户清理、优化和维护电脑系统,提升电脑性能和安全性。 WiseCare365的主要功能包括: 系统清理:它可以清理各种缓存…

mysql学习——SQL中的DQL和DCL

SQL中的DQL和DCL DQL基本查询条件查询聚合函数分组查询排序查询分页查询 DCL管理用户权限控制 学习黑马MySQL课程,记录笔记,用于复习。 DQL DQL英文全称是Data Query Language(数据查询语言),数据查询语言,用来查询数据库中表的记…

求职经验分享(12):找工作什么最重要?——项目篇

找工作什么最重要?——项目篇 找工作什么最重要?从小粉和老白的视角来看,我们认为最重要的是: 学历 & 实习 & 项目 很多同学经常在说背八股,背八股,其实我认为,八股只是在实习和项目不…

Modbus转Profibus网关在汽车行业的应用

一、前言 在当前汽车工业的快速发展中,汽车制造商正通过自动化技术实现生产的自动化,目的是提高生产效率和减少成本。Modbus转Profibus网关(XD-MDPB100)应用于汽车行业,主要体现在提升自动化水平、优化数据传输以及实…

每日一题——Python代码实现PAT甲级1006 Sign In and Sign Out(举一反三+思想解读+逐步优化)五千字好文

一个认为一切根源都是“自己不够强”的INTJ 个人主页:用哲学编程-CSDN博客专栏:每日一题——举一反三Python编程学习Python内置函数 Python-3.12.0文档解读 目录 我的写法 代码点评 时间复杂度分析 空间复杂度分析 我要更强 优化建议 优化后的…

ONLYOFFICE 8.1:全面升级,PDF编辑与本地化加强版

目录 📘 前言 📟 一、什么是 ONLYOFFICE 桌面编辑器? 📟 二、ONLYOFFICE 8.1版本新增了那些特别的实用模块? 2.1. 轻松编辑器 PDF 文件 2.2. 用幻灯片版式快速修改幻灯片 2.3. 无缝切换文档编辑、审阅和查…

【教程】安装DGL环境

转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~ 关于cuda的安装,可以看这个: 【教程】保姆级安装NVIDIA CUDA、CUDNN环境全纪录解决SSH一段时间自动断开报Destination Host Un…

小型数据中心是什么?如何建设?

在数字化时代,小型数据中心正成为许多企业和组织加强数据管理和服务扩展的理想选择。与传统大型数据中心相比,小型数据中心以其灵活性、高效性和相对较低的运营成本吸引着越来越多的关注。然而,要成功建设一个小型数据中心,并确保…

2024年数据、自动化与智能计算国际学术会议(ICDAIC 2024)

全称:2024年数据、自动化与智能计算国际学术会议(ICDAIC 2024) 会议网址:http://www.icdaic.com 会议地点: 厦门 投稿邮箱:icdaicsub-conf.com投稿标题:ArticleTEL。投稿时请在邮件正文备注:学生投稿&#…

测评:【ONLYOFFICE】版本更迭与AI加持下的最新ONLYOFFICE桌面编辑器8.1

你是否还在为没有一款合适的在线桌面编辑器而苦恼?你是否还在因为办公软件的选择过少而只能使用WPS或者office?随着办公需求的不断变化和发展,办公软件也在不断更新和改进。ONLYOFFICE 作为一款全功能办公软件,一直致力于为用户提…

android-aidl4

转:Android Aidl的使用_android aidl使用-CSDN博客 一.准备 Parcelable,可以理解成只是把car整个对象在aidl中进行传递,就理解成一个car的一个类吧,和其他类使用一样就行了,回调:把接口作为参数放在函数参…

场外期权交易流程以及参与方式是什么?

今天带你了解场外期权交易流程以及参与方式是什么?场外期权,是非标准化的期权合约,由买卖双方私下协商达成,灵活性较高。由于这种合约的条款可以根据双方的具体需求进行定制,因此它提供了比交易所交易的标准化期权更多…

多功能推拉力测试机可实现焊球推力测试

LB-8100A 多功能推拉力测试机广泛应于与 LED 封装测试、IC 半导体封 装测试、TO 封装测试、IGBT 功率模块封装测试、光电子元器件封装测试、汽 车领域、航天航空领域、军工产品测试、研究机构的测试及各类院校的测试 研究等应用。 多功能推拉力测试机设置主要结构:…

医疗器械3D全景展会在线漫游创造数字化时代的展览新篇章

在数字化浪潮的引领下,VR虚拟网上展会正逐渐成为企业展示品牌实力、吸引潜在客户的首选平台。我们与广交会携手走过三年多的时光,凭借优质的服务和丰富的经验,赢得了客户的广泛赞誉。 面对传统展会活动繁多、企业运营繁忙的挑战,许…

【MySQL】数据类型和表的约束

1. 数据类型 分类数据类型解释数值类型BIT (M)位类型。M位数,默认为1范围1-64BOOL01表示真假TINYINT [UNSIGNED]8位整型SMALLINT [UNDIGNED]16位短整型INT [UNSIGNED]32位整型BIGINT [UNSIGNED]64位长整型小数类型FLOAT [ (M, D) ] [UNSIGNED]32位浮点类型&#xf…