mssql数据导入汇总后排编码不规范(mssql数据导入乱码)
处理
正确书写编码格式是十分重要的,尤其是面对大数据时,SQL Server 数据库是基于 mssql 格式,如果排编码不规范,会带来诸多麻烦,那么如何在 mssql 数据汇总后处理不规范的排编码呢?
首先,要安装并正确配置SQL Server,然后安装NumPy包,使用NumPy可以读取不规则的排编码类型,下面是安装NumPy包的代码:
pip install numpy
该代码可以安装NumPy包,用户可以在安装完该包后,使用以下代码将mssql数据库数据导入NumPy包:
import pandas as pd
from sqlalchemy import create_engine
engine = create_engine(“mssql+pymssql://username:password@host/dbname”)
df = pd.read_sql(‘SELECT * FROM YourTableName’,engine)
接下来,使用Series对象将导入的排编码不规则的字段进行处理,下面是数据排编码格式不规则的处理代码:
from pandas import Series
series = Series.from_array(df[“YourColumnName”])
series.str.strip()
str.strip()方法的作用是移除指定字符串的某些字符,包括前后及中间的字符,从而达到正确的排编码格式,最后使用以下代码把整理的排编码数据存入mssql数据库中:
series.to_sql(‘NewTableName’,engine,if_exists=’append’,index=False)
以上代码可以实现mssql数据汇总后排编码不规范处理,只要把NumPy包配置好、安装好,在汇总后使用Series对象处理,上述步骤就可以完成。