согласно моему пониманию концепций Hive, если мы загрузим набор данных в таблицу улья, файл данных переместится из исходного пути в хранилище улья в HDFS, а для HDFS было установлено три реплики для данных.
эти вопросы могут показаться глупыми, но, поскольку я новичок, я хочу развеять свои сомнения.
мои вопросы:
1) если я удалю таблицу улья, удалит ли она файл данных только из хранилища улья или вместе с двумя другими репликами из HDFS?
2) если мы обрабатываем запрос к таблице улья, будет ли этот запрос выполняться как распределенная обработка? допустим, один файл данных имеет размер 1 ГБ (стажеры 8 блоков x 128 МБ), и, поскольку у нас есть три фактора репликации, для этого файла будет доступно всего 24 блока, будет ли наш запрос улья распределяться между всеми блоками данных, или он будет обрабатываться только на складских блоках-ульях?
Заранее спасибо..