JAVA和Nginx 教程大全

网站首页 > 精选教程 正文

Python数据分析新纪元!DuckDB1.0正式版尝鲜~

wys521 2024-12-16 12:13:40 精选教程 24 ℃ 0 评论

在很多时候,SQL已经能很好的满足我的数据分析需求。在学习Pandas的时候,我就在想,这里面API也太多了,Series和Dataframe绕来绕去的真烦人,能用SQL直接查询统计就好了。还真有人做出来了!它就是DuckDB,不久前刚发布1.0正式版(热乎的),Github星数18.4K。

DuckDB简介

DuckDB 是一个分析型进程内 SQL 数据库管理系统(内存SQL数据库)。它的设计目标是快速、可靠、便捷且易于使用。

DuckDB 提供了丰富的 SQL 方言,其支持远远超出了基本 SQL。 DuckDB 支持任意和嵌套的相关子查询、窗口函数、排序规则、复杂类型(数组、结构、映射)以及多种旨在使 SQL 更易于使用的扩展。

DuckDB 可作为独立的 CLI 应用程序使用,并具有 Python、R、Java、Wasm 等客户端,并与 pandas 和 dplyr 等软件包深度集成。

实测尝鲜

安装:pip install duckdb--upgrade。

测试数据准备:创建一个CSV文件。

读一下看看,里面是什么东西。

我滴神啊,这输出格式化的美感,表就是表!再写个SQL测测。

太牛了,太牛了!看了看文档,什么JOIN、CASE等等高级语法一应俱全,值得好好研究研究!

总结

DuckDb的出现无疑让Python数据分析如虎添翼,形成Excel+Pandas+DuckDB+其他DB全新格局,开创数据分析新纪元!

开源地址:https://github.com/duckdb/duckdb

官网:https://duckdb.org/

#python##数据分析##数据库#

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表