Сравнение подходов к крупномасштабному анализу данных


         

Сравнение подходов к крупномасштабному анализу данных

Сравнение подходов к крупномасштабному анализу данных
Предисловие переводчика
Аннотация
Введение
Введение - 2
Введение - 3
Два подхода к крупномасштабному анализу данных
Разделы
MapReduce

Reduce
Параллельные СУБД
Сравнение подходов к крупномасштабному анализу данных
Архитектурные элементы
Поддержка схемы
Поддержка схемы - 2
Индексация
Модель программирования
Распределение данных
Стратегия выполнения

Гибкость
Отказоустойчивость
Сравнение подходов к крупномасштабному анализу данных
Тесты для оценки производительности
Тестовая среда
Hadoop
СУБД-X
Vertica
Конфигурация узлов
Выполнение тестов

Исходная MR-задача
Загрузка данных
Hadoop
СУБД-X
Vertica
Результаты и обсуждение
Команды SQL
Программа MapReduce
Результаты и обсуждение
Сравнение подходов к крупномасштабному анализу данных

Аналитические задачи
Загрузка данных
Hadoop
СУБД-X
Vertica
Результаты и обсуждение
Задача Selection
Команды SQL
Программа MapReduce
Результаты и обсуждение

Задача Aggregation
Команды SQL
Программа MapReduce
Результаты и обсуждение
Задача Join
Команды SQL
Программа MapReduce
Функция Map
Функция Reduce
Функция Reduce

Функция Reduce
Результаты и обсуждение
Задача UDF Aggregation
Команды SQL
Программа MapReduce
Результаты и обсуждение
Сравнение подходов к крупномасштабному анализу данных
Обсуждение
Аспекты системного уровня
Инсталляция, конфигурирование и настройка систем

Инсталляция, конфигурирование и настройка систем - 2
Запуск задач
Сжатие
Загрузка и размещение данных
Стратегии исполнения
Модель отказов
Аспекты пользовательского уровня
Простота использования
Дополнительные инструментальные средства
Сравнение подходов к крупномасштабному анализу данных

Заключение
Заключение - 2
Заключение - 3
Заключение - 4
Благодарности
Литература
Содержание