панды (программное обеспечение) - pandas (software)

панды
Панды logo.svg
Автор (ы) оригинала Уэс МакКинни
Разработчики) Сообщество
Первый выпуск 11 января 2008 г . ; 13 лет назад ( 2008-01-11 )
Стабильный выпуск
1.3.0 / 2 июля 2021 г . ; 3 месяца назад ( 2 июля 2021 г. )
Репозиторий
Написано в Python , Cython , C
Операционная система Кроссплатформенность
Тип Технические вычисления
Лицензия Новая лицензия BSD
Веб-сайт pandas .pydata .org

pandas - это программная библиотека, написанная для языка программирования Python для обработки и анализа данных . В частности, он предлагает структуры данных и операции для управления числовыми таблицами и временными рядами . Это бесплатное программное обеспечение, выпущенное под лицензией BSD с тремя пунктами . Название происходит от термина « панельные данные », эконометрического термина для наборов данных, которые включают наблюдения за несколько периодов времени за одними и теми же людьми. Его название - игра от самой фразы «анализ данных Python». Уэс МакКинни начал создавать то, что впоследствии стало пандами, в AQR Capital, когда он был там исследователем с 2007 по 2010 год.

Особенности библиотеки

  • Объект DataFrame для обработки данных со встроенной индексацией.
  • Инструменты для чтения и записи данных между структурами данных в памяти и различными форматами файлов .
  • Согласование данных и интегрированная обработка недостающих данных.
  • Изменение формы и изменение наборов данных.
  • Нарезка на основе меток, модное индексирование и разбиение больших наборов данных на подмножества.
  • Вставка и удаление столбца структуры данных.
  • Группировка по механизму, позволяющая выполнять операции разделения-применения-объединения над наборами данных.
  • Объединение и объединение наборов данных.
  • Иерархическая индексация оси для работы с многомерными данными в низкоразмерной структуре данных.
  • Функциональные возможности временных рядов: создание диапазона дат и преобразование частоты, статистика движущегося окна, линейная регрессия движущегося окна , сдвиг даты и запаздывание.
  • Обеспечивает фильтрацию данных.

Библиотека оптимизирована для работы, с критическими кодовых дорожек , записанных в Cython или C .

Фреймы данных

Pandas в основном используется для анализа данных . Pandas позволяет импортировать данные из файлов различных форматов, таких как значения , разделенные запятыми , JSON , SQL и Microsoft Excel . Pandas позволяет выполнять различные операции с данными, такие как слияние, изменение формы, выбор, а также очистку данных и функции обработки данных .

История

Разработчик Уэс МакКинни начал работать над пандами в 2008 году, когда он работал в AQR Capital Management , из-за необходимости в высокопроизводительном и гибком инструменте для выполнения количественного анализа финансовых данных. Перед тем, как покинуть AQR, он смог убедить руководство разрешить ему открыть исходный код библиотеки.

Другой сотрудник AQR, Чанг Ше, присоединился к работе в 2012 году в качестве второго крупного сотрудника библиотеки.

В 2015 году панды подписались на финансово спонсируемый проект NumFOCUS , некоммерческой благотворительной организации 501 (c) (3) в Соединенных Штатах.

Лента новостей:

  • 2008: Развитие панд началась
  • 2009: pandas становится открытым исходным кодом
  • 2012: Публикуется первое издание Python для анализа данных
  • 2015: pandas становится спонсируемым проектом NumFOCUS
  • 2018: Первый очный спринт разработчиков ядра

Смотрите также

использованная литература

дальнейшее чтение

  • МакКинни, Уэс (2017). Python для анализа данных: обработка данных с помощью Pandas, NumPy и IPython (2-е изд.). Севастополь: О'Рейли. ISBN 978-1-4919-5766-0.
  • Молин, Стефани (2019). Практический анализ данных с помощью Pandas: эффективно выполняйте сбор, обработку, анализ и визуализацию данных с помощью Python . Packt. ISBN 978-1-7896-1532-6.
  • Чен, Дэниел Ю. (2018). Панды для всех: анализ данных Python . Бостон: Эддисон-Уэсли. ISBN 978-0-13-454693-3.
  • Вандерплас, Джейк (2016). «Манипуляции с данными с помощью Pandas». Справочник Python по науке о данных: основные инструменты для работы с данными . О'Рейли. С. 97–216. ISBN 978-1-4919-1205-8.
  • Патхак, Чанки (2018). "Поваренная книга панд". Поваренная книга панд . С. 1–8.

внешние ссылки