Отредактировано 3 Несколько недель назад от ExtremeHow Редакционная команда
TableauСмешивание данныхБизнес-аналитикаИнтеграция данныхАналитикаНаборы данныхWindowsMacВизуализация
Перевод обновлен 3 Несколько недель назад
Объединение данных в Tableau — это ключевой метод при работе с данными из нескольких источников. Он позволяет пользователям объединять данные из разных источников в один вид, который можно использовать для сравнения, анализа и визуализации. Понимание того, как правильно объединять данные в Tableau, может помочь получить более глубокие инсайты без необходимости вносить изменения в исходные источники данных. Ниже приведено подробное руководство по объединению данных в Tableau с простыми примерами, чтобы помочь вам пройти через этот процесс.
Объединение данных похоже на создание виртуальной базы данных в Tableau. Вы используете объединение, когда хотите объединить данные из разных источников для создания единого вида. Каждый источник данных сохраняет свою уникальность, и Tableau использует отношения, установленные по общим измерениям, чтобы объединить их вместе. Важно различать объединение данных и соединение данных. Соединение происходит, когда данные из разных таблиц комбинируются внутри одного источника данных, а объединение осуществляется через разные источники данных.
Прежде чем приступить к объединению данных, у вас должно быть как минимум два источника данных в рабочем пространстве Tableau. Это могут быть электронные таблицы, базы данных или даже веб-коннекторы данных. Загрузите эти источники данных в Tableau с помощью панели "Данные". Как правило, объединение данных происходит в отношениях от "основного" к "вторичному" источнику данных. Основной источник данных — это основной набор данных, и обычно он содержит поля, которые определяют вашу визуализацию.
Сначала выберите основной источник данных. Это, как правило, более подробный набор данных или тот, в котором существует большинство полей, представляющих интерес. После того как вы создали визуализацию с использованием основного источника, вы можете добавить поля из ваших вторичных источников данных.
Для объединения данных Tableau нужен общий элемент связи, обычно это измерение, такое как "Дата", "ID" или "Имя", которое существует в обоих наборах данных. Этот элемент связи известен как связующее поле. Это критично для точного объединения. В Tableau вы устанавливаете это поле с помощью перетаскивания. При перетаскивании поля из вторичного источника данных в вид, использующий основной источник данных, Tableau автоматически пытается определить связь с использованием полей с одинаковыми именами.
Вот как вы можете пошагово объединить данные в Tableau:
Начните с загрузки двух источников данных в Tableau. Например, предположим, у вас есть электронная таблица "Заказы на продажу" и другая электронная таблица "Данные о клиентах".
Начните с выбора одного из источников данных в качестве основного. Для этого выберем "Заказы на продажу". Создайте базовую визуализацию, используя поля из таблицы заказов, такие как "Сумма продаж", "Продукт" или "Дата".
После того как ваша базовая визуализация готова, вы можете добавить данные из источника "Данные о клиентах". Перетащите поле из данных о клиентах в вашу визуализацию. Если Tableau обнаружит совпадающие поля данных, он автоматически их объединит.
Обратите внимание на то, как Tableau использует маленькую иконку связи (цепочка) рядом с полями, которые он автоматически связывает. Совмещение этих полей имеет решающее значение для точного объединения.
Если Tableau автоматически не выбирает правильные связующие поля, вы можете установить связь вручную. Для этого перейдите в "Данные" > "Изменить отношения", а затем укажите связывающие поля.
После объединения данных вы можете захотеть дополнительно настроить способ их представления. Вот несколько способов получить более индивидуализированный вид:
Убедитесь, что поля в обоих источниках данных агрегируются на одном уровне. Например, убедитесь, что оба источника содержат ежедневные, ежемесячные или ежегодные данные, если это необходимо.
Создайте вычисляемые поля, которые объединяют основные и вторичные источники данных, чтобы получить новые инсайты. Например, вы можете вычислить 'скидочную цену', используя данные о скидке из вторичного источника.
Несмотря на значительные преимущества объединения данных, имейте в виду следующее:
Помните, что объединение по связывающим полям выполняется на уровне агрегирования. Убедитесь, что связующее поле не влияет неблагоприятно на ограничение или агрегацию записей.
Широкое использование объединения, особенно с большими наборами данных, может повлиять на производительность. Оптимизируйте источники данных, чтобы они были как можно меньше.
Если структура исходного источника данных изменяется, будьте готовы пересмотреть установленные отношения и внести соответствующие изменения.
Представьте, что у вас есть источник данных "Продажи" с полями "ID заказа", "Сумма продажи" и "Дата заказа". У вас также есть источник данных "Доставка" с полями "ID заказа", "Дата доставки" и "Стоимость доставки". Чтобы проанализировать их вместе:
Объединение данных в Tableau — это эффективный способ комбинировать различные источники данных для более комплексного анализа. Оно позволяет пользователям сопоставлять различные аспекты данных в одной визуализации, при этом сохраняя целостность каждого источника. Тщательно настраивая основные и вторичные отношения, обеспечивая правильные связующие поля и зная о ограничениях объединения, вы можете использовать мощные возможности Tableau для безупречного объединения данных и извлечения ценных инсайтов.
Если вы найдете что-то неправильное в содержании статьи, вы можете