【SQL Server】2. 将数据导入导出到Excel表格当中_业界新闻

发布时间:2024-07-13 22:31

阅读量:1

最开始，博主介绍一下自己的环境：SQL Sever 2008 R2
SQL Sever 大致都差不多

1. 通过自带软件的方式

首先找到下载SQL Sever中提供的导入导出工具

如果开始界面没有找到自己下载的路径
C:\Program Files\Microsoft SQL Server\100\DTS\Binn下的DTSWizard.exe文件

导出

1.1 打开界面

1.2 选择自己的数据源和数据库

1.3 选择导出目标

这里博主导出到Excel文件当中

1.4 选择直接导出数据还是进行查询

查询的话将自己在SSMS上编写的SQL语句直接复制到框中即可(确保SQL正确，可以进行测试！)
这里博主直接导出表中数据

1.5 选择表目标

这里需要切记表的分隔符为：
行：{CR}{LF}
列：制表符
格式不对，可能导出的结构出错
(也就是不按照行列的方式导入到Excel当中！)

1.6 完成导出

1.7 检查是否导出成功

可以看到Excel表格中出现新数据！

导入

1.1 打开界面

1.2 选择数据源

这里博主选择的是Excel表格
这里的标题分隔符选{CR}{LF}
这里博主前面有6行垃圾数据(所以选择跳过6行)

行分隔符{CR}{LF}
列分隔符制表符

1.3 选择导入目标数据库

选择自己的服务器和数据库

1.4 选择表

导入的目标表

1.5 选择数据类型映射

1.6 完成导入

1.7 检查是否导入成功

选择SSMS工具

打开对应的表和数据行

查看数据，可以看到数据导入成功！

SQL Sever 2008 R2 存在的问题：

这是SQLSever2008R2所独有的，其他版本不清楚，自行了解！
对于还未和SQL Sever数据库建立过链接的新建Excel表格无法导入导出数据！
所以咱们需要先让Excel表格和数据库建立连接

1.1 随便找个表查看表中数据

1.2 选择将结果保存到文件

右键SQL语句框出现如下界面

1.3 右键选择执行

1.4 保存结果

1.5 查看文件

可以看到Excel文件中出现了数据，但是这些数据无法分析(无效数据)，将这些数据删除就可以正常进行导入导出。

2. 通过Pycharm(ODBC)的方式

代码如下所示：

import pyodbc import pandas as pd # 创建连接字符串 conn_str = (     r'DRIVER={SQL Server Native Client 10.0};'     r'SERVER=BF-202403241716;'     r'DATABASE=scott;'     r'Trusted_Connection=Yes;' ) # 建立连接 cnxn = pyodbc.connect(conn_str) # 创建游标对象 cursor = cnxn.cursor() # 执行SQL查询 query = "SELECT * FROM dbo.salgrade" cursor.execute(query) # 获取查询结果 data1 = cursor.fetchall() print(type(data1)) print(data1)  # 获取列名 columns1 = [column[0] for column in cursor.description] print(type(columns1)) print(columns1)  # 将元组列表展开为一维数组 data1 = [list(item) for item in data1] print(type(data1)) print(data1)  # 将结果转换为DataFrame df1 = pd.DataFrame(data1, columns=columns1) print(df1)   # 将数据写入Excel文件 df1.to_excel('output.xlsx', index=False)  # 关闭数据库连接 cursor.close() cnxn.close()

关键点1：连接方式

数据库是：SQL Sever 2008 R2 所以这里采用的连接方式是SQL Sever Native Client 10.0 如果是更新的版本应该是16或者其他
(可以问问ChartGPT)

# 创建连接字符串 conn_str = (     r'DRIVER={SQL Server Native Client 10.0};'     r'SERVER=BF-202403241716;'     r'DATABASE=scott;'     r'Trusted_Connection=Yes;' )

具体的服务器和数据库按照自己的来，这里我SQL Sever通过验证的方式是Windows验证，所以这里r'Trusted_Connection=Yes;' 如果有用户密码，请使用用户密码的方式登录。

关键点2：元组列表需要转换为一维数组(???)

# 将元组列表展开为一维数组 data1 = [list(item) for item in data1] print(type(data1)) print(data1)

<class 'list'> [(1, 700, 1200), (2, 1201, 1400), (3, 1401, 2000), (4, 2001, 3000), (5, 3001, 9999)] <class 'list'> [[1, 700, 1200], [2, 1201, 1400], [3, 1401, 2000], [4, 2001, 3000], [5, 3001, 9999]]    grade  losal  hisal 0      1    700   1200 1      2   1201   1400 2      3   1401   2000 3      4   2001   3000 4      5   3001   9999

需要将元组列表展开为一维数组
原因：data1 是一个包含元组的列表，每个元组都是一个行，但是传递给DataFrame的每行数据应该是一维的，如果不进行转换，那么传递的数据就是二维的

会出现如下类型不匹配的报错==(解决了半天，还是有点不理解)==

import pyodbc import pandas as pd  # 假设data是cursor.fetchall()返回的结果，它是一个包含元组的列表 data = [(1, 700, 1200), (2, 1201, 1400), (3, 1401, 2000), (4, 2001, 3000), (5, 3001, 9999)] print(type(data)) print(data) # 获取列名 columns = ['grade', 'losal', 'hisal']  # 确保这些列名与您的表中的列名相匹配 print(type(columns)) print(columns)  # 将结果转换为DataFrame df = pd.DataFrame(list(data), columns=columns) print(df)

code2当中代码如上，同样还是一个包含元组的列表，但是就是可以转换成DataFrame的形式==(很奇怪啊)==

关键点3：import导包

如果直接从官网进行下载的话，速度可能会很慢，而且有时候还会断开连接，所以可以选择一些国内的镜像网站

pip install some-package -i https://pypi.tuna.tsinghua.edu.cn/simple

以下这种方式就很慢：

(.venv) PS D:\code\test_3_29> pip install openpyxl Collecting openpyxl   Downloading openpyxl-3.1.2-py2.py3-none-any.whl.metadata (2.5 kB) Collecting et-xmlfile (from openpyxl)   Downloading et_xmlfile-1.1.0-py3-none-any.whl.metadata (1.8 kB) Downloading openpyxl-3.1.2-py2.py3-none-any.whl (249 kB)    ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 250.0/250.0 kB 547.4 kB/s eta 0:00:00 Downloading et_xmlfile-1.1.0-py3-none-any.whl (4.7 kB) Installing collected packages: et-xmlfile, openpyxl Successfully installed et-xmlfile-1.1.0 openpyxl-3.1.2