知行编程网知行编程网  2022-11-22 15:00 知行编程网 隐藏边栏  19 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python如何连接hive的相关知识,包括hive查询慢的原因总结,以及hive和mysql的区别这些编程知识,希望对大家有参考作用。

python如何连接到hive


一、下载hive提供的依赖包

将hive安装包下的lib/py中的文件复制到python的sys.path中的site_packages目录下,否则引用对应的包会报错。这是使用hive提供的Python接口调用hive客户端。

python如何连接到hive


二、安装pyhs2

控制台执行命令:

pip install pyhs2

如果安装不成功,安装上面提到的依赖即可。

python如何连接到hive


三、启动hive 的thrift

确保以下服务开启,默认端口是10000:

hive --service hiveserver


四、代码演示

#!/usr/bin/python
# -*- coding: UTF-8 -*-
import pyhs2
with pyhs2.connect(host='10.104.111.33',
                   port=10000,
                   authMechanism="PLAIN",
                   user='bestfei',
                   password='password',
                   database='default') as conn:
    with conn.cursor() as cur:
        #Show databases
        print "cur.getDatabases"
        print cur.getDatabases()
        print "-"*40
        
        #Execute query
        cur.execute("show databases")
        #Return column info from query
        print cur.getSchema()
        print "-"*40
        #Fetch table results
        for i in cur.fetch():
            print i

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享