惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Security Latest
Security Latest
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
Stack Overflow Blog
Stack Overflow Blog
WordPress大学
WordPress大学
N
Netflix TechBlog - Medium
GbyAI
GbyAI
云风的 BLOG
云风的 BLOG
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
宝玉的分享
宝玉的分享
博客园 - 【当耐特】
C
Cyber Attacks, Cyber Crime and Cyber Security
雷峰网
雷峰网
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
T
Threat Research - Cisco Blogs
NISL@THU
NISL@THU
Spread Privacy
Spread Privacy
P
Proofpoint News Feed
J
Java Code Geeks
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
MyScale Blog
MyScale Blog
T
Tor Project blog
P
Proofpoint News Feed
C
CERT Recently Published Vulnerability Notes
P
Privacy & Cybersecurity Law Blog
MongoDB | Blog
MongoDB | Blog
Simon Willison's Weblog
Simon Willison's Weblog
C
Cybersecurity and Infrastructure Security Agency CISA
L
LINUX DO - 热门话题
小众软件
小众软件
G
GRAHAM CLULEY
P
Privacy International News Feed
AWS News Blog
AWS News Blog
Know Your Adversary
Know Your Adversary
P
Palo Alto Networks Blog
人人都是产品经理
人人都是产品经理
S
Schneier on Security
Scott Helme
Scott Helme
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
B
Blog RSS Feed
T
The Exploit Database - CXSecurity.com
Recent Announcements
Recent Announcements
E
Exploit-DB.com RSS Feed
C
CXSECURITY Database RSS Feed - CXSecurity.com
U
Unit 42
The Register - Security
The Register - Security
S
Securelist
Martin Fowler
Martin Fowler
Project Zero
Project Zero
大猫的无限游戏
大猫的无限游戏
Cisco Talos Blog
Cisco Talos Blog

博客园 - 梦徒

K8s节点NotReady恢复方法 GPU和CPU的知识 K8s 集群巡检项整理 K8s运维的核心能力建设 Ceph 分布式存储系统 VMware备份接口 股市布林线(BOLL)指标三条线的使用技巧 Python 数据分析入门|02:Pandas 数据清洗:缺失值/重复值/异常值处理 Python 数据分析入门|01 Pandas 基础:1 行代码读取 Excel/Csv文件 python f-string格式化输出 Python数据分析利器-Pandas数据处理-筛选与排序 python-分割文件名及后缀 python类及三大特性 Python 类的属性和方法详解 Python 必背内置函数 python常用数据结构之字典 MQ三巨头RocketMQ、Kafka、RabbitMQ 选型 一文搞懂 Redis 的三种集群方案 VMware ESXi 磁盘置备类型详解 Linux 实例:配置 NTP 服务 Kubernetes 运维必备之常用命令总结 Kubernetes + CI/CD 全流程指南!实现自动化部署 Linux Redhat 7.9 下 Docker 离线安装部署
Python数据分析利器-Pandas 简介
梦徒 · 2025-12-29 · via 博客园 - 梦徒

Pandas是什么?  

Pandas是Python中最强大的数据分析库,它的名字来源于"Panel Data"(面板数据)和"Python Data Analysis"(Python数据分析)的组合。Pandas在金融、统计、社会科学、工程等领域都有广泛应用。

Pandas的三大核心优势

  • 高效处理表格数据:轻松应对数百万行的数据集 

  • 灵活的数据操作:支持复杂的数据清洗、转换和分析 

  • 完美的时间序列支持:内置丰富的时间处理功能

Pandas的安装与导入 :

1、安装Pandas  

在命令行中执行以下命令安装最新版Pandas:
# 
pip install pandas
如果需要安装特定版本:
pip install pandas==1.3.4

2、导入Pandas  

标准导入方式(行业惯例):
import pandas as pd  # pd是公认的别名

3、验证安装

# 验证安装是否成功
print("Pandas版本:", pd.__version__)
try:
    pd.Series([1, 2, 3])
    print("Pandas导入成功!")
    
except ImportError:
    print("Pandas导入失败,请检查安装")

Pandas 主要引入了两种新的数据结构:Series 和 DataFrame

Series: 类似于一维数组或列表,是由一组数据以及与之相关的数据标签(索引)构成。Series 可以看作是 DataFrame 中的一列,也可以是单独存在的一维数据结构。

一维数组是最简单的数组形式,可以看作是一个有序的元素列表,只有一个维度(行)。

image

DataFrame: 类似于一个二维表格,它是 Pandas 中最重要的数据结构。DataFrame 可以看作是由多个 Series 按列排列构成的表格,它既有行索引也有列索引,因此可以方便地进行行列选择、过滤、合并等操作。

image

DataFrame 可视为由多个 Series 组成的数据结构:

image

下面这张图展示了两个 Series 对象相加得到一个 DataFrame 对象:

image

DataFrame 由 Index、Key、Value 组成:

image

# 创建两个Series对象
ages = pd.Series([25, 32, 28, 35])
names = pd.Series(['张三', '李四', '王五', '赵六'])

# 将两个Series对象相加,得到DataFrame,并指定列名
s = pd.DataFrame({'姓名': names, '年龄': ages})

# 显示DataFrame
print(s)

# 输出结果为:
   姓名  年龄
0  张三  25
1  李四  32
2  王五  28
3  赵六  35

Pandas是Python数据分析的基石,掌握它将为你打开数据科学的大门,一步步往前走吧.

参考文档:https://www.runoob.com/pandas/pandas-intro.html