10 个值得推荐的数据科学 Python 包

CleanLab

如果您还没有开始使用 Cleanlab,那么您会错过很多东西!

Cleanlab 通过自动检测 ML 数据集中的问题来帮助您清理数据和标签。

它就像一根魔杖!🪄 ✨

地址:https://github.com/cleanlab/cleanlab

LazyPredict

一个 Python 库,让您只需几行代码即可一次训练、测试和评估多个 ML 模型。

支持回归和分类!✨

地址:https://pypi.org/project/lazypredict/

Lux

一个 Python 库,用于快速可视化和分析数据,提供了一种简单高效的数据浏览方式。

地址:https://github.com/lux-org/lux

PyForest

一个节省时间的工具,有助于通过一行代码导入所有必要的数据科学库和函数。

地址:https://pypi.org/project/pyforest/

PivotTableJS

PivotTableJS 允许您以交互方式分析 Jupyter Notebook 中的数据,而无需任何代码

地址:https://pypi.org/project/pivottablejs/

Drawdata

Drawdata 是一个 python 库,允许您在 Jupyter Notebook 中绘制任何形状的二维数据集。

对于学习和理解ML算法的行为非常方便

地址:https://pypi.org/project/drawdata/

black

不折不扣的代码格式化程序

可以说是最好的,我每天都在使用它

地址:http:// pypi.org/project/black/

PyCaret

Python 中的开源低代码机器学习库,可自动执行机器学习工作流程。

地址:https://github.com/pycaret/pycaret

PyTorch-Lightning

如果您喜欢 PyTorch,您一定会喜欢 PyTorch Lightning!

简化您的模型训练,自动化样板代码,并让您专注于重要的事情:研究和创新。

地址:https://lightning.ai/docs/pytorch/stable/

Streamlit (流式)

虽然已经很受欢迎,但很多人还没有尝试过这个

一个用于创建数据科学和机器学习项目的网络应用程序的框架,允许简单且交互式的数据可视化和模型部署。

我的笔记
你可能想看的