Python

Matplotlib для науки о данных | Аман Харвал

Matplotlib является популярным визуализация данных библиотека для Python. Он предоставляет функции и инструменты, позволяющие специалистам по данным создавать различные графики и диаграммы. Matplotlib позволяет специалистам по данным создавать высококачественные визуализации, которые эффективно передают идеи и закономерности, скрытые в данных. Если вы хотите изучить Matplotlib для Наука о данных, эта статья для вас. В этой статье я познакомлю вас с полным руководством по Matplotlib для науки о данных.

Что такое Матплотлиб?

Название «Matplotlib» происходит от «Matlab» (среда числовых вычислений) и «графики». Он был разработан, чтобы имитировать функции построения графиков Matlab в Python. Matplotlib предлагает гибкий и интуитивно понятный интерфейс, что делает его доступным для пользователей всех уровней квалификации. Если вам нужно создать простые линейные графики или сложные тепловые карты, Matplotlib предоставляет необходимые инструменты для воплощения ваших данных в жизнь.

Профессионалы в области данных полагаются на Matplotlib, потому что он предлагает широкий спектр типов графиков, включая линейные графики, точечные диаграммы, гистограммы, гистограммы, ящичные диаграммы, тепловые карты и многое другое. Эта универсальность позволяет специалистам по данным визуализировать различные типы данных и выбирать наиболее подходящий график для их анализа.

Matplotlib также интегрируется с другими библиотеками обработки данных, такими как NumPy, Pandas и SciPy. Эта интеграция позволяет специалистам по данным легко отображать данные, облегчая исследовательский анализ данных и визуальное представление статистического анализа.

Чтобы установить Matplotlib в виртуальной среде Python, вы можете выполнить указанную ниже команду в своем терминале или командной строке:

Практическое руководство по Matplotlib для науки о данных

В этом разделе я познакомлю вас с практическим руководством по Matplotlib для науки о данных. Начнем с создания простого линейного графика:

# creating a line plot
import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
plt.plot(x, y)
plt.show()
создание линейного графика

Приведенный выше код создает линейный график для визуализации взаимосвязи между двумя наборами точек данных. Это простой способ представить данные и получить представление о тенденциях или закономерностях.

Теперь давайте посмотрим, как добавить метки и заголовки к графику:

# adding labels and title to the plot
plt.plot(x, y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('My First Plot')
plt.show()
matplotlib для науки о данных: добавление меток и заголовков к графику

Приведенный выше код улучшает линейный график, добавляя метки к оси x и оси y и включая заголовок. Эти дополнения предоставляют важную информацию и контекст, делая сюжет более понятным и содержательным.

Теперь давайте посмотрим, как настроить цвета, стили и маркеры:

# Customizing Colors, Styles, and Markers
plt.plot(x, y, color="red",
         linestyle="--",
         marker="o")
plt.show()
Настройка цветов, стилей и маркеров

Здесь мы указали цвет линии с помощью параметра ‘color’. Мы устанавливаем цвет «красный», что означает, что линия будет отображаться в красном оттенке. Далее мы определяем стиль линии с помощью параметра «стиль линии». В этом примере мы устанавливаем стиль линии «–», что представляет собой пунктирную линию. Кроме того, вы можете выбрать другие стили линий, такие как сплошная (‘-‘), пунктирная (‘.’) или штрихпунктирная (‘-.’). Наконец, мы устанавливаем стиль маркера, используя параметр marker. Маркер — это символ, помещаемый в каждую точку данных, чтобы сделать их более заметными. В этом коде мы устанавливаем маркер на «o», представляющий круговой маркер. Другие варианты маркеров включают квадраты (‘s’), треугольники (‘^’) или кресты (‘x’).

Теперь давайте посмотрим, как создавать подзаголовки:

# subplots

plt.subplot(2, 2, 1)  # First subplot
plt.plot(x, y) # simple line plot

plt.subplot(2, 2, 2)  # Second subplot
plt.scatter(x, y) # scatter plot

categories = ['A', 'B', 'C', 'D']
values = [10, 15, 7, 12]

plt.subplot(2, 1, 2)  # Third subplot
plt.bar(categories, values) # bar plot

plt.show()
matplotlib для науки о данных: подзаголовки

Для создания подграфиков мы используем функцию subplot() в Matplotlib. Эта функция принимает три аргумента: количество строк, столбцов и индекс участка, который мы хотим активировать. В первом подграфике, заданном subplot(2, 2, 1), мы создаем простой линейный график, используя функцию plot(). Этот подграфик будет расположен в верхнем левом положении сетки 2 × 2. Переходя ко второму подграфику, заданному subplot(2, 2, 2), мы создаем точечный график, используя функцию scatter(). Этот участок будет расположен в правом верхнем углу сетки. Для третьего подграфика, заданного subplot(2, 1, 2), мы создаем гистограмму с помощью функции bar(). Этот подграфик занимает весь нижний ряд сетки.

Теперь давайте посмотрим, как аннотировать график:

# Adding Annotations
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
plt.plot(x, y)
plt.annotate('Highest Point', xy=(5, 10),
             xytext=(4, 8),
             arrowprops=dict(facecolor="black",
                             arrowstyle="->"))
plt.show()
Добавление аннотаций

Аннотации — это текст или стрелки, которые предоставляют дополнительную информацию об определенных точках или объектах на графике. Мы добавляем аннотацию к графику с помощью функции annotate(). Функция annotate() позволяет указать текстовое содержимое аннотации и ее положение. Здесь мы отметили самую высокую точку на графике текстом «Самая высокая точка». Мы определили положение аннотации с помощью параметра xy, который принимает координаты точки, которую мы хотим аннотировать. В этом случае наивысшая точка имеет координаты (5, 10).

Кроме того, мы указали положение текста с помощью параметра xytext. Этот параметр определяет, где будет размещена текстовая аннотация относительно аннотируемой точки. В этом примере мы устанавливаем параметр xytext равным (4, 8), что размещает текст немного левее и выше самой высокой точки. Чтобы сделать аннотацию более визуально привлекательной, мы добавили стрелку, указывающую от точки аннотации к тексту. Это делается путем установки параметра «arrowprops», который принимает словарь свойств для стрелки. В этом коде мы устанавливаем для свойства «facecolor» значение «black», чтобы сделать стрелку черной, и для свойства «arrowstyle» значение «->», чтобы придать ей остроконечную стрелку.

Теперь давайте посмотрим, как добавить легенду к нашему графику:

# adding legend

x = [1, 2, 3, 4, 5]
y1 = [2, 4, 6, 8, 10]
y2 = [1, 3, 5, 7, 9]
plt.plot(x, y1, label="Line 1")
plt.plot(x, y2, label="Line 2")
plt.legend()
plt.show()
matplotlib для науки о данных: добавление легенд

Легенда — это ключ, объясняющий значение различных элементов (линий, маркеров и т. д.) на графике. Приведенный выше код создает график с двумя линиями, линией 1 и линией 2. Он добавляет метки к каждой строке и создает легенду, объясняющую значение линий. Легенда представляет собой визуальный ключ, который помогает зрителям понять данные, представленные каждой строкой.

Теперь давайте посмотрим, как изменить размер графика:

# Resizing a graph
plt.figure(figsize=(8, 6))
x = [1, 2, 3, 4, 5]
y1 = [2, 4, 6, 8, 10]
y2 = [1, 3, 5, 7, 9]
plt.plot(x, y1, label="Line 1")
plt.plot(x, y2, label="Line 2")
plt.legend()
plt.show()
Изменение размера графика

Изменение размера графика позволяет настроить его ширину и высоту, гарантируя, что он хорошо впишется в желаемый дисплей или документ. Здесь мы указали желаемый размер графика с помощью функции figure(figsize=(8, 6)) . В этом коде мы устанавливаем ширину 8 дюймов и высоту 6 дюймов.

Теперь давайте посмотрим, как настроить темы:

# customizing themes
plt.style.use('ggplot')
plt.figure(figsize=(8, 6))
x = [1, 2, 3, 4, 5]
y1 = [2, 4, 6, 8, 10]
y2 = [1, 3, 5, 7, 9]
plt.plot(x, y1, label="Line 1")
plt.plot(x, y2, label="Line 2")
plt.legend()
plt.show()
matplotlib для науки о данных: настройка тем

Темы — это предварительно определенные наборы стилей и цветов, которые придают сюжету особый визуальный вид. Здесь мы устанавливаем тему для графика с помощью функции style.use(‘ggplot’). В этом коде мы выбираем тему «ggplot», которая обеспечивает определенный эстетический вид сюжета. Ниже приведены некоторые другие темы, которые вы можете использовать, чтобы сделать ваш сюжет красивым:

  1. ‘классический’
  2. ‘Solarize_Light2’
  3. ‘быстрый’
  4. ‘табло-дальтоник10’
  5. «оттенки серого»
  6. ‘морской яркий’
  7. ‘морская пастель’
  8. ‘темный_фон’
  9. ‘морской темный’
  10. «морской белый»
  11. ‘морские клещи’
  12. ‘приморско-белая сетка’

Итак, это были некоторые из наиболее важных операций Matplotlib, которые вы должны знать, приступая к работе с Matplotlib для науки о данных. Вы можете узнать больше об операциях Matplotlib и о том, как строить различные типы графиков, из официальной документации Matplotlib. здесь.

Также читайте – Руководство Pandas по науке о данных.

Краткое содержание

Название «Matplotlib» происходит от «Matlab» (среда числовых вычислений) и «графики». Он был разработан, чтобы имитировать функции построения графиков Matlab в Python. Matplotlib предлагает гибкий и интуитивно понятный интерфейс, что делает его доступным для пользователей всех уровней квалификации. Если вам нужно создать простые линейные графики или сложные тепловые карты, Matplotlib предоставляет необходимые инструменты для воплощения ваших данных в жизнь. Надеюсь, вам понравилась эта статья о практическом руководстве по Matplotlib для науки о данных. Не стесняйтесь задавать ценные вопросы в разделе комментариев ниже.


Ссылка на источник

Похожие статьи

Кнопка «Наверх»