Python拆分大型CSV文件代码实例-创新互联

这篇文章主要介绍了Python拆分大型CSV文件代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

在网站设计制作、成都做网站中从网站色彩、结构布局、栏目设置、关键词群组等细微处着手，突出企业的产品/服务/品牌，帮助企业锁定精准用户，提高在线咨询和转化，使成都网站营销成为有效果、有回报的无锡营销推广。创新互联公司专业成都网站建设10多年了，客户满意度97.8%，欢迎成都创新互联客户联系。

#!/usr/bin/env python3
# -*- coding:utf-8 -*-
# @FileName :Test.py
# @Software PyCharm

import os
import pandas as pd

# filename为文件路径，file_num为拆分后的文件行数
# 根据是否有表头执行不同程序，默认有表头的
def Data_split(filename,file_num,header=True):
  if header:
    # 设置每个文件需要有的行数,初始化为1000W
    chunksize=10000
    data1=pd.read_table(filename,chunksize=chunksize,sep=',',encoding='gbk')
    # print(data1)
    # num表示总行数
    num=0
    for chunk in data1:
      num+=len(chunk)
    # print(num)
    # chunksize表示每个文件需要分配到的行数
    chunksize=round(num/file_num+1)
    # print(chunksize)
    # 分离文件名与扩展名os.path.split(filename)
    head,tail=os.path.split(filename)
    data2=pd.read_table(filename,chunksize=chunksize,sep=',',encoding='gbk')
    i=0
    for chunk in data2:
      chunk.to_csv('{0}_{1}{2}'.format(head,i,tail),header=None,index=False)
      print('保存第{0}个数据'.format(i))
      i+=1
  else:
    # 获得每个文件需要的行数
    chunksize=10000
    data1=pd.read_table(filename,chunksize=chunksize,header=None,sep=',')
    num=0
    for chunk in data1:
      num+=len(chunk)
      chunksize=round(num/file_num+1)

      head,tail=os.path.split(filename)
      data2=pd.read_table(filename,chunksize=chunksize,header=None,sep=',')
      i=0
      for chunk in data2:
        chunk.to_csv('{0}_{1}{2}'.foemat(head,i,tail),header=None,index=False)
        print('保存第{0}个数据'.format(i))
        i+=1

filename='文件路径'
#num为拆分为的文件个数
Data_split(filename,num,header=True)

网页标题：Python拆分大型CSV文件代码实例-创新互联
当前路径：http://chengdu.cdxwcx.cn/article/ieope.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

Python拆分大型CSV文件代码实例-创新互联

其他资讯

无线路由器ip冲突路由器ip冲突是怎么回事

linux挂载光驱命令 linux挂载光驱到cdrom

帝国cms7.0模板帝国cms模板教程

钉钉邮箱域名怎么解析不了钉钉企业邮箱域名解析

什么是库管sap操作系统的简单介绍

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

Python拆分大型CSV文件代码实例-创新互联

其他资讯

无线路由器ip冲突 路由器ip冲突是怎么回事

linux挂载光驱命令 linux挂载光驱到cdrom

帝国cms7.0模板 帝国cms模板教程

钉钉邮箱域名怎么解析不了 钉钉企业邮箱域名解析

什么是库管sap操作系统的简单介绍

成都网站建设设计将想法与焦点和您一起共享

无线路由器ip冲突路由器ip冲突是怎么回事

帝国cms7.0模板帝国cms模板教程

钉钉邮箱域名怎么解析不了钉钉企业邮箱域名解析