среда, 6 февраля 2019 г.

Pig и Hive

Давно хотел понять, в чем разница. Попалась хорошая статья на Хабре, где все разложено по полочкам. 

Выделю основное. В Hive запросы пишутся на HQL - аналоге SQL. Внутри проебразуются в MapReduce, за счет чего выборки должны шустро работать на кластере. Однако сложные запросы на языке HQL превращаются в нечто трудночитаемое, поэтому в этом случае есть смысл переходить на Pig.

В Pig более богатый язык запросов PigLatin (который, однако, имеет кое-что общее с SQL). Кроме того, предусмотрено несколько структур данных.

Комментариев нет: