@zhangyy
2020-09-27T06:03:06.000000Z
字数 2836
阅读 525
大数据运维专栏
一 : Presto 简介
二:CDH 6.3.2 与presto的集成
Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。
Presto支持在线数据查询,包括Hive, Cassandra, 关系数据库以及专有数据存储。 一条Presto查询可以将多个数据源的数据进行合并,可以跨越整个组织进行分析。Presto以分析师的需求作为目标,他们期望响应时间小于1秒到几分钟。 Presto终结了数据分析的两难选择,要么使用速度快的昂贵的商业方案,要么使用消耗大量硬件的慢速的“免费”方案。
硬件架构大内存、万兆网络、高计算能力软件架构presto 查询引擎是一个Master-Slave的拓扑架构

下载prestop工具wget https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.99/presto-server-0.99.tar.gz
在 CDH 的所有节点上都执行tar -zxvf presto-server-0.99.tar.gzmv presto-server-0.99 /opt/cloudera/parcelscd /opt/cloudera/parcels/ln -s presto-server-0.99 presto
在/opt/cloudera/parcels/presto/bin/launcher文件如下位置添加JAVA环境变量vim /opt/cloudera/parcels/presto/bin/launcher---export JAVA_HOME=/usr/java/jdk1.8.0_181-clouderaexport CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jarPATH=$PATH:$HOME/bin:$JAVA_HOME/bin----
1.新建node.properties文件,内容如下:mkdir /root/presto-etcmkdir -p /data/disk1/cd /root/presto-etcvim etc/node.properties----node.environment=flyfishprestonode.id=presto-test01node.data-dir=/data/disk1/prestonode.environment=flyfishprestonode.id=presto-test01node.data-dir=/data/disk1/presto---
配置Presto的JVM参数,创建jvm.config文件,内容如下:vim jvm.config----server-Xmx10G-XX:+UseConcMarkSweepGC-XX:+ExplicitGCInvokesConcurrent-XX:+CMSClassUnloadingEnabled-XX:+AggressiveOpts-XX:+HeapDumpOnOutOfMemoryError-XX:OnOutOfMemoryError=kill -9 %p-XX:ReservedCodeCacheSize=200M-----
vim coordinator-config.properties----coordinator=truenode-scheduler.include-coordinator=falsehttp-server.http.port=9090query.max-memory=4GBquery.max-memory-per-node=1GBdiscovery-server.enabled=truediscovery.uri=http://192.168.11.37:9090----
vim worker-config.properties-----coordinator=falsehttp-server.http.port=8080query.max-memory=4GBquery.max-memory-per-node=1GBdiscovery.uri=http://192.168.11.37:8080----
vim log.properties----com.facebook.presto=INFO-----
所有节点执行:mkdir -p /opt/cloudera/parcels/presto/etcscp node.properties root@192.168.11.38:/opt/cloudera/parcels/presto/etc/scp node.properties root@192.168.11.40:/opt/cloudera/parcels/presto/etc/
准备master 节点的 配置文件192.168.11.37 节点:将coordinator-config.properties并充命名为config.propertiescp coordinator-config.properties /opt/cloudera/parcels/presto/etc/config.properties将worker-config.properties 复制到work 节点 的 /opt/cloudera/parcels/presto/etc/ 下面scp worker-config.properties root@192.168.11.38:/opt/cloudera/parcels/presto/etc/scp worker-config.properties root@192.168.11.40:/opt/cloudera/parcels/presto/etc/登录到 192.168.11.38 与 192.168.11.40 上面cd /opt/cloudera/parcels/presto/etc/mv worker-config.properties config.properties完成presto 的配置
在Presto集群的所有节点执行如下命令启动Presto服务
