一、下载hive提供的依赖包
将hive安装包下的lib/py中的文件拷贝到python的sys.path中的site_packages目录下,否则引用对应的包会报错,这个是使用hive提供的Python接口来调用hive客户端。
二、安装pyhs2
控制台执行命令:pip install pyhs2
如果安装不成功,安装上面提到的依赖包就可以了。
三、启动hive 的thrift
确保以下服务开启,默认端口是10000:
hive --service hiveserver
四、代码演示
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import pyhs2
with pyhs2.connect(host='10.104.111.33',
port=10000,
authMechanism="PLAIN",
user='bestfei',
password='password',
database='default') as conn:
with conn.cursor() as cur:
#Show databases
print "cur.getDatabases"
print cur.getDatabases()
print "-"*40
#Execute query
cur.execute("show databases")
#Return column info from query
print cur.getSchema()
print "-"*40
#Fetch table results
for i in cur.fetch():
print i