Uso de Hadoop en Sql Server con PDW y Polybase

01.02.2014 17:10

Como se ilustra en la figura, el objetivo del proyecto polybase es permitir a los usuarios de SQL Server PDW ejecutar consultas en los datos almacenados en Hadoop, específicamente en el sistema de archivos distribuidos Hadoop (HDFS). Polybase es polivalente en tanto el tipo de cluster Hadoop (Linux o Windows) y  en si se trata de un grupo aparte, o si los nodos de Hadoop estan co -ubicados con los nodos del sistema PDW. Usando CTAS de PDW (“create table as select”") como sintaxis, polybase proporciona a los usuarios la capacidad de mover los datos en paralelo entre los nodos de los clusters Hadoop y PDW