Python

Анализ рынка с использованием SQL | Аман Харвал

Анализ рынка является популярным SQL вопрос в Наука о данных интервью. Часто требуется понять вашу способность манипулировать данными и анализировать их с помощью операций SQL, таких как фильтрация, агрегирование, сортировка и объединение таблиц. Итак, если вы хотите узнать, как проводить анализ рынка с помощью SQL, эта статья для вас. В этой статье я проведу вас через задачу анализа рынка с использованием SQL.

Анализ рынка: постановка задачи

Компания предоставила данные о продажах, содержащие информацию о покупках клиентов, как показано в таблице ниже.

+------------+-----------+--------------+----------+---------+
| CustomerID | ProductID | PurchaseDate | Quantity | Revenue |
+------------+-----------+--------------+----------+---------+
|          1 | A         | 2023-01-01   |        5 |  100.00 |
|          2 | B         | 2023-01-02   |        3 |   50.00 |
|          3 | A         | 2023-01-03   |        2 |   30.00 |
|          4 | C         | 2023-01-03   |        1 |   20.00 |
|          1 | B         | 2023-01-04   |        4 |   80.00 |
+------------+-----------+--------------+----------+---------+

Ваша задача:

  1. Рассчитать общий доход
  2. Рассчитать общий объем продаж по продукту
  3. Найдите лучших клиентов по доходу

Анализ рынка с использованием SQL

Итак, давайте решим все эти проблемы одну за другой для задачи анализа рынка с помощью SQL. Во-первых, давайте создадим входную таблицу для нашей базы данных SQL (я использую MySql):

CREATE TABLE Sales (
    CustomerID INT,
    ProductID CHAR(1),
    PurchaseDate DATE,
    Quantity INT,
    Revenue DECIMAL(10, 2)
);

INSERT INTO Sales (CustomerID, ProductID, PurchaseDate, Quantity, Revenue)
VALUES
    (1, 'A', '2023-01-01', 5, 100),
    (2, 'B', '2023-01-02', 3, 50),
    (3, 'A', '2023-01-03', 2, 30),
    (4, 'C', '2023-01-03', 1, 20),
    (1, 'B', '2023-01-04', 4, 80);

Расчет общего дохода:

SELECT SUM(Revenue) AS TotalRevenue FROM Sales;
+--------------+
| TotalRevenue |
+--------------+
|       280.00 |
+--------------+
1 row in set (0.01 sec)

Этот запрос вычисляет общий доход, полученный от всех продаж, записанных в таблице «Продажи». Это делается путем добавления значений в столбец «Доход». Результату этого расчета дается название «TotalRevenue» для лучшей идентификации и ссылки.

Расчет общего объема продаж по продукту:

SELECT ProductID, SUM(Quantity) AS TotalQuantity, SUM(Revenue) AS TotalRevenue
FROM Sales
GROUP BY ProductID;
+-----------+---------------+--------------+
| ProductID | TotalQuantity | TotalRevenue |
+-----------+---------------+--------------+
| A         |             7 |       130.00 |
| B         |             7 |       130.00 |
| C         |             1 |        20.00 |
+-----------+---------------+--------------+
3 rows in set (0.00 sec)

Этот запрос извлекает информацию из таблицы «Продажи» и вычисляет общее количество проданных товаров и доход, полученный для каждого продукта. Группируя данные на основе уникальных идентификаторов продуктов, запрос вычисляет сумму количеств и доходов, связанных с каждым продуктом. Результаты представлены с соответствующими идентификаторами продуктов, общим количеством и общим доходом для дальнейшего анализа или отчетности.

Поиск лучших клиентов по доходам:

SELECT CustomerID, SUM(Revenue) AS TotalRevenue
FROM Sales
GROUP BY CustomerID
ORDER BY TotalRevenue DESC
LIMIT 5;
+------------+--------------+
| CustomerID | TotalRevenue |
+------------+--------------+
|          1 |       180.00 |
|          2 |        50.00 |
|          3 |        30.00 |
|          4 |        20.00 |
+------------+--------------+
4 rows in set (0.00 sec)

Этот запрос извлекает информацию из таблицы «Продажи» и вычисляет общий доход, полученный каждым клиентом. Группируя данные на основе уникальных идентификаторов клиентов, запрос вычисляет сумму доходов, связанных с каждым клиентом. Затем результаты сортируются в порядке убывания на основе общего дохода и ограничиваются 5 верхними строками, что позволяет нам определить клиентов с самым высоким общим доходом.

Краткое содержание

Вот как вы можете выполнять анализ рынка с помощью SQL. Это были лишь примеры проблем, с которыми вы столкнетесь при анализе рынка. Можно задать дополнительные вопросы, чтобы проверить вашу способность манипулировать данными и анализировать их с помощью операций SQL, таких как фильтрация, агрегирование, сортировка и объединение таблиц. Надеюсь, вам понравилась эта статья об анализе рынка с использованием SQL. Не стесняйтесь задавать ценные вопросы в разделе комментариев ниже.


Ссылка на источник

Похожие статьи

Кнопка «Наверх»