扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
本篇文章为大家展示了Python中怎么重写SQL查询,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。
成都创新互联是一家专注于成都网站设计、成都网站制作、外贸网站建设与策划设计,永靖网站建设哪家好?成都创新互联做网站,专注于网站建设十余年,网设计领域的专业建站公司;建站业务涵盖:永靖等地区。永靖做网站价格咨询:18982081108
如果电脑中没有pandas包,则需要先安装一下:
Conda install pandas
在这个阶段,我们将使用著名的Kaggle泰坦尼克数据集:https://www.kaggle.com/c/titanic/data?select=test.csv。
安装软件包并下载数据后,需要将其导入Python环境中:
import pandas as pd titanic_df = pd.read_csv("titanic_test_data.csv")
我们将使用pandas数据框架来存储数据,还将用到各种pandas函数来操作数据框架。
SELECT, DISTINCT, COUNT, LIMIT
让我们从经常使用的简单SQL查询开始。
titanic_df [“ age”]。unique()将在此处返回唯一值的数组,因此需要使用len()来获取唯一值的计数。
SELECT,WHERE,OR,AND,IN(有条件选择)
现在你知道了如何以简单的方式探索数据框架,接着来尝试一些条件吧(在SQL中是WHERE子句)。
如果只想从数据框架中选择特定的列,则可以使用另一对方括号进行选择。注意,如果要选择多列,则需要在方括号内放置数组[“ name”,“ age”]。
isin()与SQL中的IN完全相同。要使用NOT IN,需要在Python中使用negation(〜)来获得相同的结果。
GROUP BY,ORDER BY,COUNT
GROUP BY和ORDER BY也是用来探索数据的流行SQL,让我们在Python中尝试一下。
如果只想对COUNT进行排序,可以将布尔值传递给sort_values函数;如果想对多列进行排序,则必须将布尔数组传递给sort_values函数。sum()函数将提供数据框架中的所有聚合数值总和列,如果只需要特定列,则需要使用方括号指定列名。
MIN,MAX,MEAN,MEDIAN
最后,来尝试一些常见的统计功能,这些功能对于数据探索非常重要。
上述内容就是Python中怎么重写SQL查询,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注创新互联行业资讯频道。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流