python对多个csv文件里提取指定列汇总到一个新生成的csv文件

python对多个csv 文件（位于不同目录）提取指定列（例如第二列）的内容，然后把他们放在新生成的一个csv文件里，分别放在不同的列。
另外从来没有用过python，只用过vc++,是不是一样要下载一个软件安装呢？求hello world的例子。

举报该问题

推荐答案 2015-08-20

#!/usr/bin/env python
# coding: utf-8

import os
import re

def parserln(ln, patt):
    """用给定的正则表达式解析行"""
    matched = patt.match(ln)
    if matched:
        return matched.groupdict()

def getdata(filename, parser, callback=None):
    """用指定的解析方法parser解析指定文件,
        用callback进行数据加工过的数据列表
    """
    with open(filename, 'rt') as handle:
        return map(
            callback,
            filter(None, map(parser, handle))
            )

def storage(filename, dataserial, spliter=','):
    """将数据序列按行存储到指定文件,
        每一序列元素间用指定的字符分割"""
    with open(filename, 'wt') as handle:
        handle.writelines([
            "%s\n" % (spliter.join(map(str, item)))
            for item in dataserial
        ])

if __name__ == "__main__":
    patt = re.compile(
        r"""^
        (?P<month>\d+),
        (?P<amount>\d+),
        (?P<usage>\d+)
        \s*$""",
        re.I | re.U | re.X)
    datapath = 'datasource'
    # datasource下所有存在"usage.csv"文件的子目录
    subpaths = [
        os.path.join(datapath, path)
        for path in os.listdir(datapath)
        if (os.path.isdir(os.path.join(datapath, path))
            and os.path.exists(
                os.path.join(datapath, path, "usage.txt"))
            )
        ]
    storage(
        'store.csv',
        zip(*map(
            lambda path: getdata(
                os.path.join(path, "usage.csv"),
                # 解析方法为用patt解析行
                parser=lambda ln: parserln(ln, patt),
                # 数据加工方法是取出"amount"转成整数
                callback=lambda x: int(x["amount"]),
            ),
            subpaths))
        )

$ tail -n 12 datasource/*/*.csv
==> datasource/2014/usage.csv <==
1,4234,423
2,3523,432
3,4352,438
4,4792,458
5,4823,834
6,5093,734
7,4743,832
8,5152,859
9,4932,810
10,4993,802
11,4999,810
12,5052,850

==> datasource/2015/usage.csv <==
1,5234,423
2,4523,432
3,5352,438
4,5792,458
5,6823,834
6,6093,734
7,6743,832
8,7152,859
9,6932,810
10,6993,802
11,6999,810
12,7052,850
(venv)tim@crunchbang:~/workspace/baidu$

$ cat store.csv
4234,5234
3523,4523
4352,5352
4792,5792
4823,6823
5093,6093
4743,6743
5152,7152
4932,6932
4993,6993
4999,6999
5052,7052
$

温馨提示：答案为网友推荐，仅供参考

当前网址：http://44.wendadaohang.com/zd/3VR3YZYWW.html

其他回答

第1个回答推荐于2016-04-23

1.首先下载python 2.7，进行安装
2.教你一个简单的csv操作的例子
如下面为一csv文件：
Title,Release Date,Director
And Now For Something Completely Different,1971,Ian MacNaughton
Monty Python And The Holy Grail,1975,Terry Gilliam and Terry Jones
Monty Python's Life Of Brian,1979,Terry Jones
Monty Python Live At The Hollywood Bowl,1982,Terry Hughes
Monty Python's The Meaning Of Life,1983,Terry Jones
打印发行日期及标题。
逐行处理：
for line in open("samples/sample.csv"):
title, year, director = line.split(",") //以“,”号为分割，按逗号将数据分成三部分；
print year, title
使用csv模块处理：
import csv
reader = csv.reader(open("samples\sample.csv"))
for title, year, director in reader:
print year, title
改变分隔符本回答被提问者采纳

第2个回答 2015-09-01

csv 是可以直接当文本直接读的,他的格式是一行由若干列逗号隔开的
和文本文件一样的读到csv后,用逗号分隔列,然后将您需要的那一列写到新的文件里就可以了
只提供思路,我就不写代码了,可能会用有 open split readline

相似回答

用python读取一个文件夹下的所有CSV文件里某一列数据中最大值,将此最...答：这是csv数据的样式，列数是基于0开始的 coding=gbkimport globimport pandas as pd# 初始化，此变量用来装所有csv数据all_data_frames = []# 使用glog.glob找到所有csv文件并将所有数据放到all_data_frames中for file in glob.glob("*.csv"):all_data_frames.append(pd.read_csv(file,encoding='...

python 读取多个csv文件中某一列,并生成一个新csv文件答：如果是真正的csv文件，我只说一点，python里面有csv模块，专门处理csv文件。如果是空格分割应该也可以，建议你，看一下python的csv模块的API，蛮简单的代码，其实如果不用的话自己写也可以。不是很复杂。代码片段如下：def deal_file(file_in, file_out) with open(file_in, 'r') as f_in: ...

如何用python把多个csv文件数据处理后汇总到新csv文件答：可以用pandas读取数据，首先把文件方同一个文件价里，然后对当前文件价的所有内容循环读取，在对读取到的数据处理一下，判断大于1000米的个数，大循环外面定义两广序列，存放文件名和个数，大循环结束后将两广数组组成Dataframe保持到一个新csv里，思路大概是这样。不明白的可以继续问。

python处理一个csv数据,根据其中一列数据来得到新一列写入同一个文件...答：用pandas库可以实现：import pandas as pdfile = 'your_csv_path.csv'data = pd.read_csv(file)data['sort'] = data['gender'].map(lambda x: 1 if x == 'man' else -1)data.to_csv(file, index=False)

大家正在搜

python提取csv指定列 python读取csv指定行 python读取csv某一列 python读取几个G的csv python提取指定字符 python中csv文件 python读取csv某一行 python删除csv指定行数 python打开csv文件