본문 바로가기

프로그램언어/python

[Python] 폴더에 존재하는 파일 리스트로 저장.

어떠한 자료에 대한 통계를 만들기로 했습니다.


인용)
통계를 내려고 어떠한 폴더에 데이터를 모아놨는데 어떻게 해야되지?


첫 번째로 데이터가 모여 있다는 폴도를 확인합니다. 그러기 위해서는
네이밍 규칙이 있는 통계자료가 있겠죠? 예로 날짜 순이던지 어떠한
규칙에 의해 파일이 생성되었을 거라 판단됩니다. 아닌 경우도 있겠지만,
규칙이 존재한다는 전제를 깔고 시작하겠습니다.

자, 어떻게 처리 해야 될까여? 일단 파일을 읽어 들어야 되지 않을까여?
데이터를 일일이 읽어 들여 사용할 수 있지만, 나중에 규칙을 더 만들 수
있기때문에 일단 파일 이름만 list로 보관하기로 마음을 먹었습니다.



'''
Created on 2010. 6. 10.

@author: tingcobell
'''
#!/usr/bin/env python
# -*- coding: utf-8 -*-

print '-' * 67

import glob 
file_list = glob.glob('D:/RTPatchProcess/devel/0.40/*.log')

for i in file_list:
    print i
#s = os.path.getsize(filename)

print '-' * 67



result:
D:/RTPatchProcess/devel/0.40\2010-06-02-12-45.log
D:/RTPatchProcess/devel/0.40\2010-06-02-12-55.log
D:/RTPatchProcess/devel/0.40\2010-06-02-12-59.log
D:/RTPatchProcess/devel/0.40\2010-06-02-13-09.log
D:/RTPatchProcess/devel/0.40\2010-06-03-11-49.log
D:/RTPatchProcess/devel/0.40\2010-06-04-14-25.log
D:/RTPatchProcess/devel/0.40\2010-06-04-14-26.log
D:/RTPatchProcess/devel/0.40\2010-06-04-14-27.log
D:/RTPatchProcess/devel/0.40\2010-06-04-14-35.log
D:/RTPatchProcess/devel/0.40\2010-06-04-14-47.log
D:/RTPatchProcess/devel/0.40\2010-06-04-15-02.log
D:/RTPatchProcess/devel/0.40\2010-06-04-15-19.log
D:/RTPatchProcess/devel/0.40\2010-06-04-16-16.log
D:/RTPatchProcess/devel/0.40\2010-06-04-16-43.log
D:/RTPatchProcess/devel/0.40\2010-06-04-16-52.log
D:/RTPatchProcess/devel/0.40\2010-06-04-17-04.log
D:/RTPatchProcess/devel/0.40\2010-06-04-17-10.log
D:/RTPatchProcess/devel/0.40\2010-06-04-17-16.log
D:/RTPatchProcess/devel/0.40\2010-06-04-17-22.log
D:/RTPatchProcess/devel/0.40\2010-06-09-12-07.log